NoSQL を使用してビッグ・データを分析する

スキーマレスなデータ・ストアによって膨大な量の分散データを処理する方法を学ぶ

  1. NoSQL 入門
    NoSQL データ・ストアは、大規模なスケーラビリティーの問題を解決するために重要性が高まっています。スキーマレスなデータ・ストアは、従来のリレーショナル・データベースとは根本的に異なっていますが、それらの活用はお客様が考えていらっしゃるようなことよりも容易です。
    読む: >Java 開発 2.0: NoSQL
     
  2. 人気のある NoSQL データ・ストアをハンズオン形式で学ぶ
    さて、お客様は、NoSQL の基礎をマスターしましたので、その他の人気のあるデータ・ストアを学ぶ時が来ました。MongoDB、CouchDB、Amazon's SimpleDB、そして Google App Engine のマルチ・ストレージ・オプションの入門編をハンズオン形式で学びましょう。
    読む: MongoDB: (適切なすべての) RDBMS の動作をする NoSQL データ・ストア
    聴く: Jim Tommaney 氏のビッグ・データと InfiniDB (英語)
    聴く: Eliot Horowitz 氏の MongoDB (英語)
    見る: MongoDB ビデオ・デモ (英語)
    読む: Amazon の SimpleDB によるクラウド・ストレージ (2部構成の記事)
    読む: Groovy の RESTClient を使用して REST によって CouchDB の操作を行う
    聴く: Aaron Miller 氏と Nitin Borwankar 氏の CouchDB と CouchOne モバイル・プラットフォーム (英語)
    読む: Bigtable、Blobstore、あるいは Google Storage を使用した GAE ストレージ
     
  3. MapReduce で分散データを分析する
    ビッグ・データ革命の鍵となるイネーブリング技術は、MapReduce: 巨大なスケールの分散データ・セットを処理するために Google が開発したプログラミング・モデルと実装です。オープンソースの MapReduce を実装した Apache Hadoop を探りましょう。 それは、ビッグ・データ分析に対する IBM のアプローチに大きな役割を果たしています。
    読む: Hadoop MapReduce によるビッグ・データ分析
    読む: クラウド関連の Big data の問題を MapReduce で解決する
    読む: 既存のデータを Apache Hadoop を使って高速処理する
    読む: IBM の「Mr. Big Data」、Rod Smith 氏との会話 (英語)
     
  4. 次のステップ
    議論する: IBM Big Data InfoCenter (英語)
    聴く: Hadoop と IBM Big Sheet によるビッグ・データへの取り組み (英語)
    見る: IBM Big Insights - Big Data Analytics Made Easy (英語)
    読む: その他の developerWorks Knowledge path
     

この Knowledge Path について

RDBMS モデルは、従来のクライアント-サーバー・アーキテクチャーにおいてデータを格納するための堅実な基盤ですが、複数のノードに容易に、または、安くスケールしません。Facebook や Twitter のような高度にスケーラブルな Web アプリケーションの時代では、スキーマレス・データストア - NoSQL - がソリューションを提供します。この “Knowledge Path” は、Java 開発者に NoSQL 技術とビッグ・データ分析における Apache Hadoop MapReduce の役割を紹介します。

このコンテンツでのアクティビティー

関連リンク