目次


IBM InfoSphere Streams 3.2ハンズオン・ラボ

入門編【概要】

Comments

コンテンツシリーズ

このコンテンツは全#シリーズのパート#です: IBM InfoSphere Streams 3.2ハンズオン・ラボ

このシリーズの続きに乞うご期待。

このコンテンツはシリーズの一部分です:IBM InfoSphere Streams 3.2ハンズオン・ラボ

このシリーズの続きに乞うご期待。

はじめに: InfoSphere Streams 概要

IBM InfoSphere Streams (「Streams」) により、大容量の変動する情報を継続的かつ非常に迅速に分析できるようになり、ビジネス上の洞察と意思決定を改善できるようになります。また、InfoSphere Streams は、データ・ストリーム内に存在する情報の取り込み、フィルタリング、分析、相関を行う、ユーザーが開発したアプリケーションの実行プラットフォームやサービスともなります。

以下は、InfoSphere Streams に含まれている主なコンポーネントです。

Streams ランタイム・エンジン: 連携して機能する、分散したプロセスの集合体です。クラスター内の指定されたホスト・コンピューターにあるストリーム処理アプリケーションの実行を円滑化します。これらを単一インスタンス化したものは、Streams インスタンスと呼ばれています。

Streams Processing Language (SPL): ストリーム処理アプリケーションを作成するための宣言型の言語およびフレームワークです (直接的な SPL プログラミングについては、このラボでは対象範囲外です)。

Streams Studio (「Studio」): Streams アプリケーションの作成、コンパイル、実行、視覚化、およびデバッグを可能にする Eclipse ベースの開発環境です。開発ツールでは、グラフィカル (「ドラッグ・アンド・ドロップ」) な設計と編集、ならびに実行中アプリケーションの迅速なデータ視覚化をサポートしています。Instance Graph 機能により、Sterams インスタンス内で実行中のアプリケーションでさまざまなビューを表示します。これには、ライブ・データのフロー・メトリック表示や、多数の色による強調表示設定が含まれ、データ・フローの迅速な理解や診断を可能にします。

InfoSphere Streams Console: Streams Console は、Streams Web Service (SWS) が提供する Web ベースのグラフィカル・ユーザー・インターフェースです。SWS を実行するサーバーに対して HTTPS 接続を保持する任意のコンピューターから、Streams Console を使用して、Streams インスタンスおよびアプリケーションのモニターと管理を行うことができます。Streams Console は、チャートや表でのデータの視覚化についてもサポートしています。

Streamtool: Streams ランタイム・エンジンに対するコマンド行インターフェースです (このラボでは、コマンド行インターフェースは使用しません)。

目標と目的

このラボの目標は、以下の通りです。

  • 小規模のサンプル・アプリケーションを開発しながら、Streams Studio の多くのコンポーネントおよびフィーチャーに触れてみる機会を提供することが、このラボの目標です。基礎となる SPL コードは常に使用できるようにはなっていますが、このラボにおいて、直接のプログラミングは全く必要ないため、SPL 機能を詳論することはしません。

このラボ (関連資料に加えて) の目的は、以下を実施することです。

  • ストリーム・コンピューティングの基礎に関する説明
  • InfoSphere Streams の基本的な概念の説明
  • InfoSphere Streams ランタイム環境の紹介
  • InfoSphere Streams Studio の紹介
    • IDE のナビゲーションに関する概要紹介
    • プロジェクトの作成
    • ジョブのサブミットとキャンセル
    • Instance Graph におけるジョブ、正常性、メトリック、およびデータの表示
  • Streams Studio のグラフィカルな編集環境の紹介
    • 組み込みオペレーターの一部の適用
    • SPL アプリケーションの設計に挑戦、および設計したアプリケーションの拡張
  • Streams Console におけるデータの視覚化機能の紹介

概要

このハンズオン・ラボでは、InfoSphere Streams のコンポーネントとツールを幅広くご紹介していきます。

図 1. InfoSphere Streams ラボ: 概要
InfoSphere Streams のコンポーネントとツール
InfoSphere Streams のコンポーネントとツール

このラボでは、Smarter Cities の自動車シナリオ「車両ロケーションと速度 (およびその他の変動要素) の取り扱い」の例に基づいて進めていきます。以下のようなテクニックと原則を説明するのにこのシナリオを使います。

  • アプリケーション・グラフのグラフィカル・デザインと、プログラムの詳細を構成するための「プロパティー (Properties)」ビュー
  • Streams アプリケーションおよびデータ・フロー・メトリックの、ランタイムでの視覚化
  • プロパティーに基づいた、データ・ストリームのインポートとエクスポートを使用したアプリケーション統合

図 1 は、完了済みラボの図解です。ラボ環境には 5 つの Eclipse 「ワークスペース」(ディレクトリー) が含まれ、それぞれに 1 から 5 まで番号が振られています。ラボは、ひとつずつ積み重ねていく形で進行していきますが、各ワークスペースには、先行ラボから結果として得られるはずのプロジェクトを既に含めた状態にしてあります (ワークスペース 1 は空の状態ですが、ワークスペース 5 は、編集の指示を出すことを除いて、最終的な状態となっています)。このように準備してあるため、受講者の方にはいろいろとお試しいただいて、いずれかのラボで問題が発生したとしても、次のラボでワークスペースを切り替えるだけで、すべてがあるべき状態でラボを進めていただけます。

ラボは以下 4 つに分割されています。

ラボ 1 : シンプルな Streams アプリケーション: Streams インスタンスを開始します。Streams Studio を開き、ビューを確認します。SPL アプリケーション・プロジェクトを作成します。ここでは、3 つのオペレーターがあるアプリケーション・グラフを作成し、オペレーターを構成します。次に、アプリケーションを実行し、結果を検証します。

ラボ 2 : アプリケーションの機能強化: 指定されたディレクトリーから複数のファイルを読み取る機能を追加し、発生している事象を観察できるようにフローの速度を下げます。ジョブと PE について学びます。Instance Graph を使い、ストリーム・フローをモニタリングし、データを表示します。

ラボ 3 : アプリケーションの機能強化: オペレーターを追加し、5 つの観測毎に平均速度を (2 台の車両別々で) 計算します。Streams Console を使用し、結果を視覚化します。

ラボ 4 : アプリケーションの機能強化: オペレーターを追加して車両 ID フォーマットを確認し、予期していなかった ID 構造を持つ記録を、エラー・ストリームへと分けます。エクスポートしたアプリケーション・ストリームを使用して、モジュラー・アプリケーションを作成します。可能であれば、ライブ・データを取り込みます (この作業には、インターネット接続が必要になります)。

ラボ環境

以下のソフトウェアは、皆さんの VMware イメージにインストールしてあります。

  • Red Hat Enterprise Linux 5.5 (64 ビット)
  • IBM InfoSphere Streams 3.2.0.0
  • InfoSphere Streams Studio 3.2、Eclipse 4.2.1
  • IBM InfoSphere Streams 3.2 Information Center (オフライン)
  • 初心者向けの、SPL 例 50 件
表 1. Streams 3.x ラボ情報: 仮想マシン情報
パラメーター
ホスト名streamsqse, streamslab、streamstrial、bigdata のいずれか (どれでも大丈夫です)
ユーザーおよび管理者の IDstreamsadmin
ユーザー・パスワードpassw0rd (password のアルファベット O を、ゼロにしたもの)
ルート・パスワードpassw0rd

仮想マシン・ホストの要件

  • 64 ビットのホスト、もしくは 64 ビットのゲストをサポートできる 32 ビットのホスト
  • VMware Workstation 8.x 以降、もしくは現行バージョンの VMware Player または VMware Fusion
  • ディスクの空き容量: 12 GB (このうちイメージに必要なのは約 8 GB)
  • RAM: 4 GB (多ければ多いほど良い。イメージは 2 GB に設定)
  • インターネット接続 (ラボ 4 の最後の部分でのみ必要)
    • VMware ネットワーク構成は NAT (VMnet8) に設定してください。
    • ファイアウォールが邪魔にならないかを確認してください。
  • 2 コア CPU: (イメージは 1 CPU に設定されていますが、必要に応じて調整します。多ければ多いに越したことはありませんが、必須ではありません。)

ダウンロード可能なリソース


コメント

コメントを登録するにはサインインあるいは登録してください。

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Information Management, Cloud computing, Linux
ArticleID=968479
ArticleTitle=IBM InfoSphere Streams 3.2ハンズオン・ラボ: 入門編【概要】
publish-date=05072014