Databricksは完全な分析スタックを目指して競争していますか?

Spark Summit Eastは先週ニューヨークで開催されました。私はニューヨーカーですが、私は風邪を強く感じないので、私はバミューダの子供たちと一緒に寒い気温を逃れていました。それは私のプレスリリースを読むことから私を止めませんでした。

昨年水曜日、Databricksから2つの興味深いものが出てきました。 1つは、同社のクラウドサービスの新しい「Community Edition」について話し合った。もう1つは、新しいダッシュボード機能の追加を発表しました。これらの新しい提供は、むしろ戦術的なように見えます。しかし、一緒に考えて、9日間の熟考の恩恵を受けて、私はこれがかなり大事だと決めました。

その理由を理解するために、実際に発表されたものの目録を作成し、Apache Sparkがネイティブに提供するものと、Databricksクラウドサービスが提供するものを理解するようにしましょう。

コミュニティのサポート;多くのオープンソースベースの製品は、無料のコミュニティエディションを提供しています。また、Sparkは既にオープンソースであるため、すでにコミュニティに無料で提供されています。しかし、無料ではないのは、(単純な開発環境であっても)ハードウェアを実行するために必要なハードウェア、またはDatabricksのようなクラウドサービスの場合は、クラウドテナントがそれを手に入れるためです。

Databricksは、このような無料のテナントを提供することによって、このギャップを埋もうとしています。もちろん、その基盤となるインフラストラクチャは、Databricksが「マイクロクラスタ」と呼んでいるものであり、同社は有料層への明示的なアップセルシナリオを呼び出す。しかし、SparkやDatabricksで自由な環境が十分に実感されています。そのような無料の層は、摩擦を採用から取り除くために必要な部分です。

Community Editionは、Spark Summit Eastの参加者が初めてアクセスできる招待型ベータ版として開始されます。ベータ版に参加したいと考えている他の人は、待機リストに登録することができます。それはすべてうまくいいです。しかし、Databricks Community Editionが一般的なアベイラビリティ(GA)を達成したときには、面白いことが起こります。潜在的に、好奇心を抱く開発者やデータパワーユーザーの多くは、直ちにハンズオンを行うことができます。

ダッシュボードに目を向ける;もう1つの発表では、Databricksプラットフォームにダッシュボード機能を追加しました。ここでも、意義は最初の発表よりも大きい。実際に、Databricksがダッシュボーディング機能をまだ持っていないのは不思議かもしれません。今では、セルフサービスクラウドBI製品の数にかかわらず、単にそれに追いついているように見えるかもしれません。

しかし、それは事です:Databricksは、セルフサービス製品ではありません(または少なくともされていない)。これは開発者の製品であり、Apache Sparkの生のコンポーネントにコマンドラインでアクセスできるだけでなく、開発者にとっても激しい「ノートブック」インターフェイスですが、他の人にとっては興味深いものです。

Star Trek:50年にわたる積極的な未来主義と大胆な社会的解説、MicrosoftのSurfaceオールインワンPCが10月のハードウェアの発売を見出し、iPhone 7、新しいApple Watch、AirPodを手がけ、GoogleはApigeeを6億2,500万ドルで買収

しかし、Databricksが現在行ってきたことは、ノートブック・インターフェースを利用して、新しいダッシュボード機能の形でグラフィカル・ビューを追加したものです。さらに、ダッシュボードは、パラメータ値などを選択するためのセルフサービスUIでセットアップすることができ、URLを介して非開発者と共有することができます。これらの非開発者は、アクセスを保護して(Databricksが生のSparkに追加するもの)、限られていても何らかのデータ検索作業を開始することができます。

すべて一緒になりました;コアエンジンを含むSpark、SQLクエリーアクセス、ストリーミングデータ、グラフ処理、機械学習のための組み込みコンポーネントについて考えると、データのための開発者のためのプラットフォームがすべてあります。 Databricksクラウド上にレイヤーを作成する必要があり、ハードウェアインフラストラクチャで悩む必要がなくなります。開発者以外のユーザーと共有できるダッシュボードを追加すると、ビジネスユーザーの機能が未熟になります。

ビッグデータ分析、Big Data Analytics、DataRobotはデータサイエンスの欠点を自動化することを目指している、Big Data Analytics、MapR創設者のJohn Schroederが辞任し、交換するCOO

すべてをローエンドのフリー層に入れれば、Microsoft Power BIやその他のクラウドBI製品と競合し始めても、エンドユーザーは自由に試すことができるサービスを手に入れることができます。確かに、彼らは彼らを助けるために開発者と遠く離れていないだろう…しかし、今アナリストは逆に加えてSparkを開発者に宣伝することができる。

私はDatabricks Community Edition Betaにサインアップしました。私はそれに手を差し伸べたいと思っています。 Databricksがオールインワンのクラウド分析プラットフォームを提供したい場合、ダッシュボード機能はシンプルなチャート作成以上のものにする必要があります。それ以上になるのだろうか? Databricksはそれが欲しいのですか?

私はDatabricksの共同設立者であり、Ion Stoicaのエグゼクティブ会長(また、Apache Kafkaの後継企業であるConfluentの共同創設者兼共同創業者Neha Narkhede)と舞台でチャットをしてみることもできます3月10日にサンフランシスコで開催されたStructure Dataカンファレンスで発表されました。

LinkedInが新しいブログプラットフォームを発表

これはBig OLAPの時代ですか?

DataRobotは、データサイエンスの果実を自動化することを目指しています

MapRの創設者John Schroederが辞任し、COOが辞任