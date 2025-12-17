コード型データ・パイプラインの構築：：IBM watsonx.data integration Python SDKのご紹介
watsonx.data integration Python SDKの一般提供は、AI対応データ基盤に対するIBMのビジョンにおける重要なマイルストーンであり、データ・チームがパイプライン開発を拡張し、高品質なデータでエージェントを強化できるようにします。
watsonx.data integration Python SDKは、既存のPythonスキルを基盤としたコード・ファースト・モデルを導入し、エージェントにコード生成と検証のための一貫したインターフェースを提供します。データ・チームがエージェント型AIの準備を進める際には、パイプライン開発にはLLM生成に適した別のオプションが必要です。
Python SDKは、チームがバッチおよびリアルタイムのストリーミング・パイプラインをコードとして構築、バージョン管理、自動化、管理できるようにすることで、このシフトを可能にし、手動の作業を削減し、スケーラブルなデータ統合を実現します。このリリースは、エージェント・パイプライン作成（プレビュー）への今後の投資とともに、お客様がAI対応のデータ基盤を構築する際のニーズに応えるというIBMの取り組みを強化します。
あらゆる組織が、今日のデータ環境に負担を感じています。ビジネス・チームはより迅速な知見を求め、データ・チームは脆弱で断片化されたシステムによって手薄になり、コンプライアンス・リーダーは機密データが隙間から漏れることを心配しています。エージェント型AIの台頭により、これらの圧力はさらに強まり、成功は強力なモデルだけでなく、その下にあるデータ基盤の強度にも左右されます。
その基盤の中核となるのはデータ統合です。つまり、データを信頼して利用できるように接続、変換、配信するパイプラインです。統合が失敗すると、AIも失敗します。MITの「The Generate AI Divide」によれば、生成AIパイロットの95%が失敗するのは、モデルの欠陥ではなく、データ基盤の準備ができていないことが原因です。同時に、組織の77%が必要なスキルの不足を報告しているにもかかわらず、データ・チームはより多くのデータ型と環境にわたって、より多くのパイプラインを構築および管理することが求められています。
需要と供給のギャップが拡大していることから、パイプライン開発は柔軟性が求められ、ユーザーのニーズに応える必要があることは明らかです。従来の作成方法ではもはや十分ではありません。ビジネス・ユーザーは、自然言語で意図を表現したいと考えており、技術実務者はコードを求めています。また、多くのチームは、迅速な設計のために視覚的なキャンバスに依存しています。
IBMは、watsonx.data integrationが、あらゆるユーザーの好みに応じたワークフローをサポートできるように、このマルチモーダル・アプローチに多額の投資を行っています。
新しいIBM watsonx.data integration Python SDKは、そのビジョンにおける大きな前進であり、開発者やデータ・エンジニア にコードファーストでパイプラインをププログラミングで構築・自動化・保守する強力な方法を提供し、手作業を減らし、価値実現までの時間を加速させます。
データ・エンジニアやETL開発者は、ビジュアル・ノーコード/ローコード・インターフェースの使用や直接的なコード作成など、データ・パイプラインの構築方法の選択肢を長年重視してきました。作成スタイルに関係なく、パイプラインは一度定義すれば、Gitでバージョン管理され、CI/CDワークフローを通じて一貫して展開できます。それぞれのアプローチが、データ・チーム内の異なるニーズとスキル・セットに対応します。
Python SDKを使用すると、チームはデータ・エンジニアリングで最も広く採用されている言語の1つを使用して、データ統合パイプラインを作成および管理できるようになります。データ・エンジニアはPythonコードの読み取り、書き込み、レビューに慣れているため、同じスキルをIBM watswatsonx.data integrationに適用します。コード型パイプラインは、コード再利用のための新しい道を解き放ちます。このPython SDKを利用できるようにすることで、データ・チームは、自分のスキルや好みに合った複数の作成オプションから選択できます。
SDKを使用することで、チームは次のことが可能になります。
これらの機能を組み合わせることで、パイプラインがソフトウェアのように動作し、自動化がデフォルトとなり、将来のAIエージェントが大規模にデータ・フローを推論、最適化、さらには維持できるようになる、データ統合の新時代の基礎が築かれます。
SDKはプログラムによるアプローチをパイプライン開発に導入していますが、その影響は、チームがそれを日常的にどのように適用しているかに最もよく表れます。早期導入者は、より迅速な拡張、重複の削減、一貫性の高い運用を実現する一連の共通パターンを見せつつあります。
一般的な出発点は、シンプルなUIビルドのパイプラインです。たとえば、CSVの取り込み、トランスフォーメーションの適用、クラウドの成果のストレージへの書き込みなどです。需要が高まるにつれて、他のチームはさまざまなインプットを備えた同じロジックを必要とします。
Python SDKを使用すると、その元のパイプラインを、新しいPythonコード生成機能を使用してPythonにエクスポートし、再利用可能なパラメーター化されたテンプレートに変えることができます。新しいパラメーター・セットとValue Sets SDKの機能により、これらの構成をUIからバージョンコ管理に移動できます。フォームに値を手動で入力する代わりに、開発、テスト、および本番環境の構成をプログラムで定義し、一度に組み込むことができます。パイプラインを最初から再設計するのではなく、数行のコードを調整することでバリエーションが作成されるため、配信が高速化され、エラーが減り、チームが標準化できるスケーラブルなパターンが実現します。
もう1つの一般的な課題は、たとえばデータベースやデータ・ストアの移行中など、影響を受ける多くのデータ・ソースや環境でパイプラインを更新しなければならない場合です。チームはUIでパイプラインを更新する代わりに、SDKを使用してプログラムでフローを複製し、コネクターと接続構成を更新し、パラメーターを数秒で調整して更新を公開できます。これは、データ・ソースの変更に応じてパイプラインを迅速に進化させる必要がある環境では特に役立ちます。
SDKは、パブリッククラウド／SaaS環境でもセルフ・マネージド・ソフトウェア環境でも、ハイブリッド環境に安全に接続できます。何十回も手動で編集する代わりに、コードに対する1つの変更をどこにでも一貫して適用できます。
これらのパターンは、手動構成から反復可能なソフトウェア駆動型開発へという、より広範な移行を示しています。パイプラインをコードとして扱うことで、組織はデータ統合をより確実に拡張し、エージェント型AIに必要な堅牢なデータ基盤を構築できます。
watsonx.data integration Python SDKは、AI対応のデータ基盤というIBMのビジョンにおける重要なマイルストーンです。プログラムによる自動化をwatsonx.data integrationに導入することで、チームはソフトウェア開発と同じ厳密さと拡張性を備えたパイプラインを構築および維持できると同時に、ユーザーの好みの方法でデータ・エンジニアリング・スキルのギャップを埋めることができます。
watsonx.dataの広範なポートフォリオの一部として、watsonx.data integrationはwatsonx.data intelligenceとシームレスに連携し、信頼できるエンドツーエンドのデータ基盤となります。これらの製品を組み合わせることで、組織はハイブリッド環境全体でデータを移動、理解、管理、有効化し、AIとエージェント型ワークフローを大規模に強化できるようになります。
IBM watsonx.data integrationでパイプラインをより迅速に構築