Watson Studio

バージョン: 12.1.0       

経験: Cloud Pak for Data watsonx™

説明

Watson Studio のアーキテクチャーは、プロジェクトを中心にしています。 データ・サイエンティストとビジネス・アナリストは、プロジェクトを使用してリソースを編成し、データを分析します。

プロジェクトには以下のタイプのリソースを含めることができます。

  • コラボレーターは、データを処理するチームのメンバーです。
  • データ資産は、アップロードされたファイル内のデータ、またはデータ・ソースへの接続を介してアクセスされるデータを指します。
  • 運用資産は、データに対してコードを実行するために作成するオブジェクト (スクリプトやモデルなど) です。
  • コンポーネント、テンプレート、またはその他の情報を提供するその他のタイプの 資産。
  • ツールは、データから洞察を得るために使用するソフトウェアです。 Watson Studio サービスには、以下のツールが含まれています。
    • Data Refinery: データを準備および視覚化します。
    • Jupyter notebook エディター: Jupyter notebooks をコーディングします。
    • JupyterLab IDE: Git 統合を使用して Jupyter ノートブックと Python スクリプトをコーディングします。 その他のプロジェクト・ツールを使用するには、追加のサービスが必要です。 補足サービスと関連サービスのリストを参照してください。
    • パイプライン: データまたはモデルのエンドツーエンド・フローを自動化します。

Watson Studio プロジェクトは、カタログおよびデプロイメント・スペースと完全に統合されます。

  • カタログは、IBM® Knowledge Catalog サービスによって提供されます。
    • プロジェクトとカタログの間で資産を簡単に移動できます。
    • カタログとプロジェクトは、同じタイプのデータ資産をサポートします。
    • データ保護ルールは、管理対象カタログで適用されるか、または詳細な適用ソリューションによって適用されます。 詳しくは、データ保護ルールの適用を参照してください。
  • IBM Knowledge Catalog サービスを使用しない場合、作成できるカタログは以下の 2 つのみです。
    • プロジェクト 資産 カタログと呼ばれる、ガバナンス機能のない 1 つのカタログ。これを使用して、プロジェクト間で資産を共有できます。
    • IBM Knowledge Catalog サービスによって提供されるものに似ているが、資産のタイプと許可される数にいくつかの制限がある 1 つのカタログ。
  • デプロイメント・スペース
    • 資産はプロジェクトとデプロイメント・スペースの間で簡単に移動できます。

ライセンス情報

このサービスは、以下のライセンスに含まれています。

  • IBM Cloud Pak® for Data Enterprise Edition
  • IBM Cloud Pak for Data Standard Edition
  • IBM watsonx.ai™

詳しくは、ライセンスと資格を参照してください。

クイック・リンク

統合サービス

表 1. 補助サービスこのサービスの機能は、このサービスを必要とする以下の補足サービスを使用して拡張できます。
サービス 機能
Analytics Engine powered by Apache Spark Apache Spark クラスターで分析ジョブ、機械学習ジョブ、および Spark API ジョブを実行します。
SPSS Modeler データを準備し、モデルを作成および管理し、結果を視覚化するためにフローを作成します。 コーディングは不要です。
Watson Machine Learning 幅広いツールを使用して、機械学習モデルを構築、トレーニング、およびデプロイします。
Decision Optimization CPLEX 最適化エンジンを使用して数百万の可能性を評価することで、ビジネスの問題に最適な処方的解決策を見つけます。
Runtime 24.1 on Python 3.11 for GPU GPU 加速 Python 3.11 ライブラリーを使用する Jupyter Notebooks のコンピュート環境にアクセスします。
Runtime 24.1 on R 4.3 計算環境にアクセスして、R 4.3 ライブラリーを使用する Jupyter Notebooks を作成します。
RStudio® Server Runtimes RStudio IDE にアクセスします。
Execution Engine for Apache Hadoop Watson Studio サービスをリモートの Apache Hadoop クラスターと統合します。これにより、リモート・クラスター上でデータを探索したり、モデルを構築およびデプロイしたりすることが可能になります。
Orchestration Pipelines Orchestration Pipelines を使用して、機械学習パイプラインのエンドツーエンド・フローを作成し、モデルを作成してさまざまな機能をカスタマイズします。
watsonx.ai AI モデルをトレーニング、検証、およびデプロイします。
表 2. 関連サービス以下の関連サービスは、このサービスと共に使用されることが多く、補足的な機能を提供しますが、必須ではありません。
サービス 機能
IBM Knowledge Catalog データ・ガバナンス・フレームワークによってサポートされる、このセキュアなエンタープライズ・カタログ管理プラットフォームを使用して、キュレートされた資産のカタログを作成します。
Cognos Dashboards 視覚化を使用してタイムリーかつ効果的な意思決定を行えるように、データ内のパターンを識別します。
Analytics Engine powered by Apache Spark Apache Spark クラスターで分析ジョブ、機械学習ジョブ、および Spark API ジョブを実行します。
Data Virtualization 複数のタイプおよびロケーションにまたがるデータ・ソースを 1 つの論理データ・ビューに統合します。
AI Factsheets AI Factsheets を使用して、各機械学習モデルのライフサイクルのリネージュイベント、ファクト、および詳細を編成して追跡し、モデル・ガバナンスのニーズに対する透明性を高めます。
Data Replication ソースへの影響を低く抑えながら、ほぼリアルタイムのデータ配信を使用して、データを統合および同期化します。
DataStage 組み込みの検索、自動メタデータ伝搬、コンパイル・エラーの同時強調表示を使用して、企業の情報を変換および調整するジョブを作成、編集、ロード、および実行します。
Watson OpenScale AI に信頼と透明性を注ぎ込みます AI モデルが、バイアスを検出して軽減するための決定を行う方法を説明します。