チュートリアル: IBM Integrated Analytics System での Data Science Experience の使用方法の概要

このチュートリアルでは、Integrated Analytics System 上で IBM Data Science Experience (DSX) Local を使用してデータ分析を開始する方法について説明します。

このチュートリアルは、以下のタスクの実行方法を示しています。

所要時間

5 分

シナリオ

あなたは Integrated Analytics System へのアクセス権を付与されたデータ・サイエンティストであり、統合された Data Science Experience を使用してデータの分析を実行する方法を習得したいと考えています。

難易度

初心者

対象読者

Integrated Analytics System 上での DSX の探索に関心がある、データ・サイエンティストおよびすべての人。

前提条件

Integrated Analytics System のユーザー・アカウントを持っている必要があります。持っていない場合は、Integrated Analytics System のシステム管理者に連絡して、ユーザー・アカウントの作成を依頼してください。また、ご使用の Integrated Analytics System のコンソール・ログイン・ページへのリンク (URL) も必要になります。

Integrated Analytics System にログインする

IIAS で DSX を起動するには以下の 2 つの方法があります。

手順

  • IIAS Web コンソールから DSX を起動する場合
    1. Integrated Analytics System Web コンソールのログイン・ページの URL をクリックするか入力します。ログイン・ページが表示されたら、ユーザー ID とパスワードを入力します。
      ログインに成功すると、Integrated Analytics System Web コンソールのホーム・ページが表示されます。
      要確認: これはユーザー・アカウント用の Web コンソール・ホーム・ページです。管理者は、管理タスク用の管理ログインを使用します。
    2. 左上隅にある Web コンソール・メニューをクリックし、「分析の開発 (DEVELOP ANALYTICS)」項目をクリックします。
      「分析および機械学習アプリケーションの開発 (Develop analytics and machine learning applications)」ページが開きます。
    3. 「DSX の起動 (Launch DSX)」ボタンをクリックします。
    「Data Science Experience ログイン (Data Science Experience login)」ページが開きます。
  • Web ブラウザーから DSX を起動する場合
    1. ブラウザーのアドレス・フィールドに IIAS の URL を入力します。ただし、ポートは 8444 と指定します。
      以下に例を示します。
      https://9.1.2.3:8444
    2. DSX にログインします。

DSX に初めてログインする

Integrated Analytics System で DSX を使用するには、Integrated Analytics System ログインとは別の資格情報 (ユーザー ID とパスワード) が必要になります。

手順

  • DSX のユーザー ID とパスワードが管理者から割り当てられている場合は、その資格情報をここで入力して DSX を起動します。
  • 自分の DSX ユーザー ID をまだ持っていない場合は、デフォルトの DSX ユーザー ID とパスワード (それぞれ、admin および password) を使用してログインを試行できます。admin ID のパスワードが変更されていることが判明した場合は、システム管理者に連絡して支援を受けてください。

タスクの結果

ログインに成功すると、「DSX コミュニティー (DSX Community)」ページが表示されます。

DSX で自分のユーザー・アカウントを作成する

システムで自分の作業と他のユーザーの作業を分けておくことが最善の方法であるため、IBM Data Platform Manager を使用して、個人用の DSX アカウントを作成します。自分自身の DSX ユーザー ID を既に持っている場合は、このタスクはスキップできます。

手順

  1. DSX ページの上部で、「IBM Data Science Experience Local」ドロップダウンをクリックし、「IBM Data Platform Manager」を選択します。
    「ダッシュボード (Dashboard)」ページが表示されます。
  2. 左上隅のメニューをクリックし、「ユーザー管理 (User Management)」を選択します。
  3. 「ユーザー管理 (User Management)」ページで、「ユーザーの追加 (Add users)」をクリックします。
  4. 「ユーザーの追加 (Add users)」ウィンドウで、要求された情報を入力してから「追加 (Add)」をクリックします。
    制約事項: 「ユーザー名」の値は DSX インスタンスで固有である必要があるため、エラーを受け取る場合は、別の名前を試してください。
    「追加」ボタンをクリックすると、ユーザー ID が作成されたことを示すメッセージが表示されます。
    重要: メッセージに示されている一時パスワードをコピーします。このパスワードは後で必要になります。(ご希望の場合は、後で DSX ユーザー・アカウントを編集してパスワードを変更できます。)
  5. 新規の DSX アカウントにログインするには、デフォルトの DSX 管理者アカウントからログアウトする必要があります。ページの右上隅にある丸で囲まれた「A」をクリックし、ドロップダウン・リストから「サインアウト (Sign Out)」を選択します。
    DSX アカウント・メニューで「サインアウト」を選択したときの図です。
    DSX ログイン・ページが再度開きます。新しいユーザー ID と一時パスワードを入力します。

タスクの結果

ログインに成功すると「DSX コミュニティー (DSX Community)」ページが再び表示されますが、ここでは自分のアカウントを使用してログインしています。

サンプルの分析ノートブックを実行する

手順

  1. 「DSX コミュニティー (DSX Community)」ページからサンプルのノートブックをダウンロードします。
    1. 「コミュニティー」ページで、「Use Spark for Python to load data and run...」 というラベルの付いたサンプル・ノートブックをクリックします。
    2. ページの右上隅にある「ダウンロード」アイコンをクリックします。
      「ダウンロード」アイコン
      「ダウンロード」ウィンドウが開きます。
    3. ノートブック・ファイルを任意の場所に保存します。
  2. プロジェクトを作成します。
    1. ページの左上にあるメインの Web コンソール・ドロップダウン・メニューをクリックし、「マイ・プロジェクト」を選択します。これにより、「マイ・プロジェクト」ページが表示されます。
      まだプロジェクトが存在しないため、ページに次のメッセージが表示されます。
      You currently have no projects. Let's get going.
    2. 「プロジェクトの作成」をクリックします。
      「新規プロジェクト」ページが開きます。
    3. プロジェクトの名前 (例えば、「プロジェクト 1」など) を指定してから、「作成」をクリックします。
  3. プロジェクトにサンプル・ノートブックを追加します。
    1. 新規プロジェクトの「概要」タブが表示されます。ページの「ノートブック」セクションの右側で、「ノートブックの追加 (add notebooks)」をクリックします。
      ヒント: 「ノートブックの追加 (add notebooks)」をクリックする際に、該当するブラウザー操作を使用して、リンクを新しいブラウザー・タブで開きます。こうすることで、複数のノートブックを同時に開いておくことができます。
    2. 「ノートブックの作成 (Create Notebook)」ページで、「ファイルから」タブをクリックします。
    3. 「名前」フィールドにノートブックの名前を入力します。このとき、フルネーム「Use Spark for Python to load data and run SQL queries」または短縮名 (「Notebook1」など) を使用できます。
    4. 「参照」をクリックします。ファイル・ダイアログで、ダウンロードしたノートブック (.ipynb) ファイルを見つけて選択します。
    5. 「ノートブックの作成 (Create Notebook)」ページの右下で「ノートブックの作成 (Create Notebook)」をクリックします。
      これにより、ノートブックが開かれて、Python2 ランタイム・サービスが起動されます。
  4. 「セルを実行、以下を選択 (Run Cell, Select Below)」ボタンをクリックして各セルを順番に実行することによって、サンプル・ノートブックを実行します。

タスクの結果

このノートブックは、Python を使用して、DSX に組み込まれた Spark サービスと対話する方法を実例で示します。自己完結型のこのサンプルは、自動車に関する情報の単純なデータ・セットを使用して、Spark を使用した基本的な分析操作を行う方法を示します。このサンプルには、Spark DataFrame の作成方法、DataFrame での Spark 関数の実行方法、および DataFrame に対する SQL 式の実行方法が示されています。操作結果は表形式で表示されます。以下に例を示します。
サンプル・ノートブックのセル出力の例