生成AIの出現により、複数の著名企業が、内部の機密データの取り扱いミスを理由に、生成AIの使用を制限するよう努めました。CNNによると一部の企業は、テクノロジーの理解を深める一方で、生成AIツールを社内で禁止しており、多くの企業は ChatGPT の社内使用もブロックしています。
企業は依然として、 大規模言語モデル(LLM) を調査する際に社内データを使用するリスクを受け入れることがよくあります。このコンテキスト・データは、LLMが汎用型の知識からドメイン固有の知識に変更できるものだからです。生成AIや従来型のAI開発サイクルでは、データ取り込みがエントリーポイントとして機能します。ここでは、企業の要件に合わせた未加工データを収集、前処理、マスクし、LLMやその他のモデルに適した形式に変換できます。現在、データ取り込みの課題を克服するための標準化されたプロセスは存在しませんが、モデルの精度はそれに依存します。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
データ取り込みを誤ると、新たな問題の多くが生じる可能性があるため、最初から適切に行う必要があります。AIモデルのデータ・トレーニングの基礎は、飛行機の操縦に相当します。離陸角度が 1度ずれている場合、予想よりもまったく新しい大陸に着陸する可能性があります。
生成AIパイプライン全体はそれを可能にするデータ・パイプラインにかかっているため、適切な予防策を取ることが不可欠です。
IBM DataStageは、さまざまなツールを組み合わせてデータ統合を合理化し、ハイブリッドクラウド環境でAIトレーニング・モデルに必要なデータを簡単に取得、整理、変換、保存できるようにします。あらゆるスキル・レベルのデータ実践者が、ノーコードGUIを使用したり、ガイド付きカスタム・コードでAPIにアクセスしたりすることで、ツールを活用できます。
新しいDataStage as a Service Anywhereリモート・ランタイム・オプションにより、データ変換を柔軟に実行できます。パラレルエンジンをどこからでも使用できるようになり、 その場所をかつてないほど自由にコントロールできるようになる。DataStage as a Service Anywhereは軽量コンテナとして出現し、あらゆる環境であらゆるデータ変換機能を実行することができます。これにより、仮想プライベートクラウド内でデータの統合、クリーニング、前処理を実行する際に、データ取り込みが不十分であるという落とし穴の多くを回避できます。DataStageを使用すると、セキュリティー、データ品質、有効性を完全に管理でき、生成AIプロジェクトのあらゆるデータニーズに対応できます。
生成AIで達成できることには事実上制限はありませんが、モデルで使用するデータには制限があり、そのデータがすべての違いを生む可能性があります。
データ・サイロを排除し、複雑さを軽減し、データ品質を向上させることで、卓越した顧客体験と従業員体験を実現するデータ・ストラテジーを設計します。
watsonx.dataを使用すると、オープンでハイブリッド、かつ管理されたデータ・ストアを通じて、データがどこに保存されていても、すべてのデータを使用して分析とAIを拡張できます。
IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築します。