Oracle ExadataでのYouTubeの再現

データ要件の増大、特にビデオなどの非構造化情報の増加により、新興のベンダーが伝統的なソフトウェア力を失っているため、リレーショナルデータベースを企業のスクラップに分類する傾向があります。

これはCowen&Coのアナリスト、Peter Goldmacherの概要です。 Goldmacherは75ページのレポートで、データベースの状況を見て、データの増加が従来のデータベースベンダーを押し上げるというコンセンサスの見方は間違っていると結論づけています。ゴールドマッカーは言った

データの大部分の大部分は、Oracleなどの従来のリレーショナルデータベースベンダーには適していないデータセットの形で発生していると考えられます。従来のRDBMS技術では、データがあまりにも構造化されておらず、膨大すぎるだけでなく、従来のRDBMS技術を使用してこれらの新しいデータセットを処理するために必要なソフトウェアとハ​​ードウェアのコストも高くついています。ビッグデータトレンドを活用するために、新しいハードウェア、オープンソース、および独自のテクノロジを活用して、これらの新しいデータセットをキャプチャして分析する、ビッグデータの新しい企業が登場しました。私たちは、既存ベンダーがビッグデータトレンドの主要な要因であるとは考えにくいと主張しています。これは主に、技術的なノウハウの欠如ではなく、価格の問題によるものです。

オラクルはGoldmacherの買収を買わない。 Oracleの最新の電話会議で、経営幹部は大きなデータと、それがどのように企業に利益をもたらすのかを語った。

大規模なデータが従来のデータベース企業を圧倒するGoldmacherの主張の要点は、コストを中心としています。新興の大型データプレーヤーは、保護すべきマージンを持つOracleのような大規模なデータベースプレーヤーよりも優れた価格で販売することができます。言い換えれば、Oracleはデータの問題を解決するために、大規模データベンダーの混合平均よりも9倍以上の費用を負担しなければなりません。

時間の経過とともに、この価格差は、企業の非構造化データの増加とともに、いわゆるビッグデータプレーヤーが勝つことを意味します。これは、Oracle、IBM、中間層のプレーヤー(HP Vertica、EMC Greenplum、Teradataなど)のような大物がInfobright、1010 Data、Splunk、Clouderaのようなものに対処しなければならないことを意味します。

この点を説明するため、Goldmacherは独自のエンタープライズシステムでYouTubeを複製する方法を説明した興味深い練習をしました。 YouTubeがOracle Exadataマシンと出会ったときの費用はどうなりますか?

最初に、GoldmacherはYouTubeの消費量 – 1日あたり48時間のビデオ、1日あたり30億の動画、1日あたり約45ペタバイトの動画をアップロードすると、米国で少なくとも9台のフルラックのExadataマシンが必要になると推定しましたそれぞれ150万ドル。スパイクを処理するには、少なくとも18台のExadataマシンが必要です。これらのマシンは、最大14台のExalogicデバイスを追加して、システムあたり110万ドルでデータを処理します。 Oracleのソフトウェアスタックには、WebLogicミドルウェア、Oracleデータベース、Exadata最適化ストレージ、およびOracleがオペレーティングシステムとして組み込まれます。オープンソースの比較には、OSとしてJBossミドルウェア、MySQL、Hadoop、Red Hat Enterprise Linuxが含まれていました。

一番下の行はこのように見えます(クリックして拡大)

簡単に言えば、ハードウェアとソフトウェアのOracle Exadataの資本コストは、オープンソースおよびコモディティのハードウェア・コストである1億4,220万ドルと比較して、合計5億8,940万ドルです。 Oracle Exadataの年間支出額(スタッフおよびサポート)は、オープン・ソース・スタックの場合、9,900万ドルです。人件費は元のYouTubeチームのエンジニアスタッフ9人に基づいています。

関連するハードウェアを見てみましょう

オープンソースのハードウェアスタックは、HPサーバラック、Cisco Nexusスイッチを備えたストレージで構成されています。

エンタープライズソフトウェア;?OpenOfficeは死んでいる。 OpenStackのオープンソース企業、Storage、FacebookのオープンソースZstandardのデータ圧縮アルゴリズムは、Zipの背後にある技術を置き換えることを目指しています。

しかし、ハードウェアはかなりシンプルです。オラクルの統合ハードウェア/ソフトウェア・スタックの美しさは、少なくとも同社の場合、ライセンスおよびメンテナンスの収入源です。

ゴールドマッカーは言いました

一見すると、Googleの現在の設備投資額の約5%に相当する約1億5,500万米ドルのハードウェア総コストが妥当であると思われます。この考え方は、データベースとExadataのストレージ・ライセンスだけで4億ドルほどのわずかなものではなく、5億7,000万ドルの初期投資をもたらします。

ここでソフトウェアのコストを見てみましょう

そしてオープンソース側

今、いくつかの警告があります。 Goldmarkherは、Membaseのようなメモリ内のデータベースのための仮定を作成しませんでした。なぜなら、サポート価格はすぐに利用できないからです。ビッグ・データは、確立されたリレーショナル・データベース・プレイヤーにとって大きな不利益を残すための大きな頭痛を意味します。

ウェブサイト経由で

?OpenOfficeが死んでいる。長いライブLibreOffice

一度にMS Officeの挑戦者OpenOffice:サポートが枯渇して停止することがあります

?Red HatはまだOpenStackの会社であることを計画しています

FacebookのオープンソースZstandardのデータ圧縮アルゴリズム、Zipの背後にある技術を置き換えることを目指す