IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
AI推論はAIテクノロジーの進歩に不可欠であり、人気の ChatGPTアプリケーションを支える機能である生成AIなど、最もエキサイティングなアプリケーションの基盤となっています。AIモデルはAI推論を利用して、人間の思考、理屈、プロンプトへの応答方法を模倣します。
AI推論は、意思決定アルゴリズムを使用して大規模なデータセットでAIモデルをトレーニングすることから始まります。AIモデルはニューラル・ネットワーク、つまり人間の脳のように構築された大規模言語モデル(LLM)でトレーニングされた意思決定アルゴリズムで構成されています。例えば、顔認識用に設計されたAIモデルは、何百万もの人間の顔の画像でトレーニングされる場合があります。最終的には、目の色、鼻の形、髪の色などの特徴を正確に識別することを学習し、それらを使って画像内の人物を認識できるようになります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
AIモデルが、そのアプリケーションに適した堅牢なデータ・セットでトレーニングされていない場合、AIモデルはまったく効果的ではありません。このテクノロジーのデリケートな性質と、それが報道機関でどれほど綿密に精査されているかを考えると1、企業は慎重になる必要があります。しかし、さまざまな業界でデジタル・トランスフォーメーションとスケーラブルなイノベーションの可能性を提供するアプリケーションには、次のように多くのメリットがあります。
AI推論のメリットは数多くありますが、まだ急成長中の新しいテクノロジーですから、課題がないわけではありません。AIへの投資を検討している企業が考慮すべき、業界が直面している問題のいくつかをご紹介します。
AI推論は、正確な応答を推論できるようになるまで、適切なデータ・セットでAIモデルをトレーニングする複雑なプロセスです。これは非常に計算負荷の高いプロセスであり、専用のハードウェアとソフトウェアが必要です。AI推論用にAIモデルをトレーニングするプロセスを見る前に、それを可能にする特殊なハードウェアをいくつか見てみましょう。
中央処理装置(CPU)は、コンピューターの最も重要な機能構成要素です。AIのトレーニングと推論では、CPUがオペレーティング・システムを実行し、トレーニングに必要なコンピューティング・リソースの管理を支援します。
画像処理装置(GPU)とは、高性能コンピューター・グラフィックスと画像処理用に構築された電子回路で、ビデオ・カード、マザーボード、携帯電話などのさまざまなデバイスで使用されています。しかし、その並列処理能力によって、AIモデルのトレーニングにも使用されることが増えています。1つの方法は、多数のGPUを単一のAIシステムに接続して、そのシステムの処理能力を高めることです。
フィールド・プログラマブル・ゲート・アレイ(FPGA)は、特定の目的に合わせて再プログラムするには専門知識が必要となる、高度にカスタマイズ可能なAIアクセラレーターです。他のAIアクセラレーターとは異なり、FPGAは特定の機能に適した独自の設計を採用しており、多くの場合、AI推論に不可欠なリアルタイムでのデータ処理に関係しています。FPGAはハードウェア・レベルで再プログラム可能なため、より高度なカスタマイズが可能です。
ASICは、Cerebras社が製造するWSE-3 ASICアクセラレーターのディープラーニングのように、特定の目的またはワークロードを念頭に置いて設計されたAIアクセラレーターです。ASICは、データサイエンティストがAI推論機能を高速化し、コストを削減するのに役立ちます。FPGAとは異なり、ASICは再プログラムできませんが、単一の目的で構築されているため、通常、他の汎用アクセラレーターよりも優れたパフォーマンスを発揮します。その一例が、GoogleのTensor Processing Unit(TPU)です。これは、Googleが独自に開発したTensorFlowソフトウェアを使用して、ニューラル・ネットワーク機械学習のために開発されたものです。
デジタル・トランスフォーメーションの一環としてAIアプリケーションへの投資を検討している企業は、AI推論のメリットと課題について学んでおく必要があります。さまざまなアプリケーションを徹底的に調査し、使用する準備ができている方のために、効果的なAI推論を確立するための5つのステップをご紹介します。
効果的なAIモデルとアプリケーションを作成するには、データの準備が不可欠です。企業は、組織内外のデータを使用してAIモデルをトレーニングするためのデータセットを作成できます。最適な結果を得るためには、両方を組み合わせて使用するのが一般的です。AIをトレーニングするデータを集める上でもう1つの重要な部分は、データのクレンジング、つまり重複するエントリーの削除とフォーマットの問題の解決です。
データ・セットを収集したら、次のステップはアプリケーションに適したAIモデルの選択です。モデルは単純なものから複雑なものまでさまざまで、複雑なモデルは、それほど複雑でないモデルよりも多くの入力に対応し、微妙なレベルで推論することができます。このステップでは、ニーズを明確にすることが重要です。複雑なモデルをトレーニングするには、単純なモデルをトレーニングするよりも多くの時間、費用、その他のリソースが必要になる場合があるためです。
AIアプリケーションから望ましい出力を得るには、企業は通常、精密なAIトレーニングを何度も行う必要があります。モデルのトレーニングが進むにつれて、推論の精度は向上し、それらの推論に到達するために必要な計算能力やレイテンシーなどの計算リソースの量は減少します。モデルが成熟するにつれて、モデルは新しい段階に移行し、学習したデータに基づいて新しいデータに関する推論を開始できるようになります。モデルが設計どおりに動作し始めていることを確認できるため、これは刺激的なステップです。
モデルが運用可能と判断する前に、その出力に不正確さ、バイアス、またはデータ・プライバシーの問題がないか確認して監視することが重要です。このフェーズは後処理と呼ばれることもありますが、モデルの精度を確保するための段階的なプロセスを作成するフェーズです。後処理フェーズは、必要とする答えをAIが提供し、意図したとおりに機能することを保証するための方法論を構築する時期です。
厳格な監視と後処理が完了すると、AIモデルをビジネス用に展開する準備が整います。この最後のステップには、AIモデルを機能させるためのアーキテクチャーとデータ・システムの実装のほか、日常業務におけるAIアプリケーションの使い方を利害関係者に教育するための変更管理手順の作成なども含まれます。
企業が必要とするAIアプリケーションの種類に応じて、選択できるAI推論にはさまざまな種類があります。企業がモノのインターネット(IoT)アプリケーションで使用するAIモデルの構築を検討している場合、ストリーミング推論(測定機能付き)が、おそらく最も適切な選択肢です。しかし、AIモデルが人間と対話するように設計されている場合は、(LLM機能を備えた)オンライン推論の方が適しています。ここでは、3種類のAI推論と、それぞれを際立たせる特性について説明します。
動的推論はオンライン推論とも呼ばれ、最速のAI推論であり、OpenAIのChatGPTなど、最も一般的なLLM AIアプリケーションで使用されています。動的推論では、要求された瞬間に出力と予測を行い、その後、機能するために低遅延と高速なデータ・アクセスが必要となります。動的推論のもう1つの特徴は、出力があまりにも早く届くため、エンドユーザーに届く前に確認する時間がないことです。そのため、一部の企業では、品質管理を確実にするために、アウトプットとエンドユーザーの間に監視レイヤーを追加しています。
バッチ推論は、大規模なデータ・バッチを使用し、オフラインでAI予測を生成します。バッチ推論のアプローチでは、以前に収集されたデータがMLアルゴリズムに用いられます。数秒以内に出力が必要な状況には適していませんが、販売やマーケティングのダッシュボード、リスク評価など、1日中または1週間にわたって定期的に更新されるAI予測には、バッチ推論が最適です。
ストリーミング推論では、通常はセンサーからの定期的な測定を通じて提供されるデータのパイプラインから、データをアルゴリズムに与えます。アルゴリズムはそのデータを使って計算と予測を継続的に行います。インターネットに接続されたセンサーを介して、都市の発電所や交通の監視に使用されるAIなどのIoTアプリケーションは、ストリーミング推論を使って意思決定を行います。
AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。
1“Why Companies Are Vastly Underprepared For The Risks Posed By AI”, Forbes, June 15, 2023
2“Onshoring Semiconductor Production: National Security Versus Economic Efficiency”, Council on Foreign Relations, April 2024