例を使って汎用人工知能に備える

メモを勉強する眼鏡をかけた人

著者

Tim Mucci

IBM Writer

Gather

Cole Stryker

Staff Editor, AI Models

IBM Think

機械が事前にプログラムされたタスクに限定されず、人間のような自律性と能力を持って動作する世界を想像してみてください。コンピューターの頭脳が自動運転車を操縦し、複雑な科学研究に取り組み、パーソナライズされたカスタマー・サービスを提供し、さらには未知の世界を探索する世界。

これが、人間の生活と仕事のほぼすべての側面に革命を起こす可能性のある仮説上の技術、人工汎用知能(AGI)の可能性です。AGIはまだ理論上のものですが、組織は堅牢なデータ・インフラストラクチャーを構築し、人間とAIがシームレスに連携できるコラボレーション環境を育成することで、AGIの到来に備えて積極的な対策を講じることができます。

AGIは、強いAIとも呼ばれ、人工機械知能が人間レベルの学習、知覚、認知の柔軟性を実現する、人工知能(AI)のSF版です。しかし、人間とは異なり、AGIは疲労を感じたり、生物学的ニーズを持たず、想像を絶するスピードで継続的に学習し、情報を処理することができます。複雑な問題を学習して解決できる人工の心を開発できるという見通しは、機械知能が、かつては人間の知能と認知能力の独占領域だと考えられていたタスクを引き受け続けるにつれて、多くの産業に革命と混乱をもたらすことが期待されています。

AGIが操縦する自動運転車を想像してみてください。空港から乗客を迎え、見知らぬ道を進むだけでなく、対話をリアルタイムで適応させることもできます。地元の文化や地理に関する質問に答えたり、乗客の興味に基づいてパーソナライズしたりすることもできるかもしれません。好みや現在の人気度に基づいてレストランを提案することもあるでしょう。乗客が以前に乗車したことがある場合、AGIは過去の対話を使用して体験をさらにパーソナライズし、以前の旅行で楽しんだものを推奨することもできます。

LaMDAやGPT-3などのAIシステムは、人間のようなテキストの生成、特定のタスクの達成、必要に応じた言語の翻訳、さまざまな種類のクリエイティブ・コンテンツの作成に優れています。これらの大規模言語モデル(LLM)テクノロジーは、時にはそう見えるかもしれませんが、SFで約束されているような思考マシンではないことを理解することが重要です。

これらの偉業は、洗練されたアルゴリズム、自然言語処理(NLP)、およびコンピューター・サイエンスの原理の組み合わせによって達成されます。ChatGPTのようなLLMは、膨大な量のテキスト・データでトレーニングされており、言語内のパターンと統計的な関係を認識できます。NLP技術は、文法、構文、文脈など、人間の言語のニュアンスを解析するのに役立ちます。複雑なAIアルゴリズムとコンピューター・サイエンスの手法を使用することで、これらのAIシステムは人間のようなテキストを生成し、驚くほど正確に言語を翻訳し、さまざまなスタイルを模倣したクリエイティブなコンテンツを作成できます。

生成AIを含む今日のAIは、多くの場合、特化型AIと呼ばれ、膨大なデータセットをふるいにかけてパターンを識別し、ワークフローに自動化を適用し、人間品質のテキストを生成することに優れています。しかし、これらのシステムには真の理解が欠けており、トレーニング以外の状況に適応することができません。このギャップは、現在のAIとAGIの可能性の間にある大きな違いを浮き彫りにしています。

進歩は素晴らしいものですが、弱いAIから真のAGIへの飛躍は大きな課題です。研究者たちは、機械内での人工意識、一般的な問題解決、常識的な推論を積極的に研究しています。真のAGIの開発スケジュールは依然として不確実ですが、組織は今日、強固なデータ・ファーストのインフラストラクチャーを構築することで、将来の進歩に対応するための技術インフラストラクチャーを準備することができます。

AGIに備えるために組織にできること

AGIの理論的な性質により、組織が必要とするテクノロジー・スタックを正確に特定することが困難になります。ただし、AGI開発で狭義のAIと同様の構成要素が使用される場合、既存のツールやテクノロジが採用に非常に重要になる可能性があります。

AGIにおける汎用知能の正確な性質は、AI研究者の間で依然として議論の的となっています。コンピューターサイエンティストのGoertzel氏やPennachin氏のように、AGIには自己理解と自己制御機能があると示唆する人もいます。Microsoft社とOpenAI社は、GPT-4の能力が人間レベルのパフォーマンスに驚くほど近いと主張しています。ほとんどの専門家は、これを強力だが特化型のAIモデルとして分類しています。

現在のAIの進歩は、特定の分野で素晴らしい能力を発揮しています。自動運転車は道路を走行するのに優れており、IBM® Watsonなどのスーパーコンピューターは膨大な量のデータを分析できます。いずれにせよ、これらは特化型AIの例です。これらのシステムは特定の領域では優れていますが、AGIに想定される一般的な問題解決スキルが欠けています。

いずれにせよ、AGIの到来については2030年から2050年以降まで幅広い予測があることを考えると、期待を管理し、現在のAIアプリケーションの価値を活用することから始めることが重要です。リーダーたちは現在のAIのメリットについて多少の懸念を抱いていますが、組織は生成AIのデプロイメントに積極的に投資し、予算を大幅に増やし、ユースケースを拡大し、プロジェクトを実験段階から本番段階に移行しています。

エンジニア出身のIT起業家であるAndreessen Horowitz氏によると、2023年には、調査対象企業全体の基盤モデルアプリケーション・プログラミング・インターフェース(API)、セルフホスティング、微調整モデルへの平均支出は700万米ドルに達しました。ほぼすべての回答者が、生成AI実験の初期結果が有望であると報告し、生産ワークロードをサポートするために2024年に支出を増やす予定であると回答しました。興味深いことに、2024年にはソフトウェア項目を通じた資金のシフトが見られ、イノベーション基金から予算を割り当てるリーダーが減少しており、生成AIが急速に不可欠なテクノロジーになりつつあることを示唆しています。

より小規模な組織では、特にカスタマー・サービス部門において、人員削減に向けて生成AIの予算を再配分しているところもあります。ある組織は、LLMを活用したカスタマー・サービス・システムにより、通話1件あたり約6米ドルを節約できたと報告しており、これは90%のコスト削減に相当し、生成AIへの投資を増やす大きな根拠となっています。

コスト削減を超えて、組織はユースケースに応じて、収益の創出、コスト削減、効率性の向上、精度の向上などの要素に焦点を当て、生成AIの投資収益率(ROI)を測定する具体的な方法を模索しています。重要なトレンドは、生産において複数のモデルを採用することです。このマルチモデル・アプローチでは、複数のAIモデルの長所を組み合わせ、全体的な出力を向上させます。このアプローチは、特定のユースケースに合わせてソリューションをカスタマイズし、ベンダーロックインを回避し、分野の急速な進歩を活用することにも役立ちます。

2024年の調査回答者の46%がオープンソース・モデルを好むと回答しました。コストが主な要因ではなかったものの、生成AIによって生み出される価値が価格を上回るという確信が高まっていることを反映しています。これは、正確な回答を得ることはお金をかける価値があるということを経営者の考え方がますます認識しつつあることを示しています。

企業は引き続きモデルのカスタマイズに関心を持っていますが、高品質のオープンソース・モデルの増加により、ほとんどの企業はLLMをゼロからトレーニングしないことを選択しています。代わりに、特定のニーズに合わせて、検索拡張生成またはオープンソース・モデルのファイン・チューニングを使用しています。

モデル・アクセスにAPIを使用する企業の大多数(72%)は、クラウド・サービス・プロバイダーでホストされているモデルを使用しています。また、テキスト生成にLLMだけに依存するのではなく、他のテクノロジーと統合して完全なソリューションを作成し、エンタープライズ・ワークフローと独自のデータの使用を大幅に再考するアプリケーションも、市場で好調なパフォーマンスを示しています。

世界的な経営コンサルティング会社のDeloitte社は、2,800名を超えるビジネス・リーダーを対象に、生成AIによって生み出される成果物の価値を調査しました。組織がROIを実現している領域は以下のとおりです。

  • テキスト(83%):生成AIは、レポートの作成、ドキュメントの要約、マーケティング・コピーの生成などのタスクの自動化を支援します。
  • コード(62%):生成AIは、開発者がより効率的に、より少ないエラーでコードを記述できるように支援します。
  • 音声(56%):リアルな音声を備えた生成AIコールセンターが顧客と従業員をサポートします。
  • 画像(55%):生成AIは、製品が顧客の自宅でどのように見えるかをシミュレートしたり、事故現場を再現して保険金請求や賠償責任を評価したりすることができます。
  • その他の潜在的な分野:動画生成(36%)と3Dモデル生成(26%)により、マーケティング資料、仮想レンダリング、製品モックアップを作成できます。

生成AI開発におけるスキルギャップは大きな障害です。企業内で適切な人材を獲得することが難しいため、社内でのAI開発を簡素化するツールを提供するスタートアップは、より早く導入される可能性が高いでしょう。

AGIは、生成AIをはるかに超える機械の自律性を約束しますが、最も高度なシステムであっても、効果的に機能するには人間の専門知識が必要です。AI、ディープラーニング機械学習(ML)、データサイエンスのスキルを備えた社内チームを構築することは戦略的な動きです。最も重要なのは、AIの強度(弱いか強いか)に関係なく、データサイエンティスト、AIエンジニア、コンピューター・サイエンティスト、MLスペシャリストがこれらのシステムの開発とデプロイメントに不可欠であるということです。

これらの利用分野は、AI技術の進歩とともに確実に進化していきます。ただし、これらの中核領域に重点を置くことで、組織はAIの進歩が実現したときにその力を活用できるようになります。

人工知能(AGI)に到達するためのAIの改善

AIは近年大きな進歩を遂げていますが、人間レベルの知能を備えた機械である真のAGIを実現するには、依然として大きなハードルを克服する必要があります。現在のAIが苦手とし、AGIが習得する必要がある7つの重要なスキルは以下のとおりです。

  1. 視覚認識:コンピューター・ビジョンは顔認識や物体検出における大きなハードルを克服しましたが、人間の能力には程遠いものです。現在のAIシステムは、コンテキスト、色、および部分的に隠れたオブジェクトにどのように反応するかを理解することに苦労しています。
  • 音声認識:AIは音声認識において進歩を遂げていますが、アクセント、皮肉、その他の感情的な話し方のトーンを確実に理解することはできません。また、重要でない背景雑音を除去するのも難しく、ため息や笑い声、音量の変化といった非言語表現を理解するのも困難です。
  • 細かい運動能力:AGIソフトウェアをロボットのハードウェアと組み合わせることは考えられます。その場合、AGIには壊れやすい物体を扱い、現実世界の環境でツールを操作し、新しい物理的なタスクに素早く適応できる能力が必要になります。
  • 問題解決:弱いAIは特定の明確に定義された問題を解決することに優れていますが、AGIは推論と批判的思考によって人間と同じように問題を解決する必要があります。AGIは不確実性を処理し、不完全な情報に基づいて意思決定を行う必要があります。
  • ナビゲーション:自動運転車は優れた能力を発揮しますが、人間のようなナビゲーションには複雑な環境への即時適応が必要です。人間は混雑した道路、不均一な地形、変化する環境を簡単に移動できます。
  • 創造性:AIはある程度創造的なテキスト形式を生成できますが、真の創造性には独創性と斬新さが求められます。新しいアイデア、コンセプト、ソリューションを生み出すことは、人間の創造性の特徴です。
  • 社会的および感情的な関与:人間の知性は、社会的および感情的な能力と深く絡み合っています。AGIは、表情、ボディランゲージ、声のトーンの解釈を含め、感情を認識し理解する必要があります。感情に適切に対応するには、AGIは他者の感情状態に基づいてコミュニケーションと行動を調整する必要があります。

AGIの例

しかし、理論上のAGIが上記を達成して実際のAGIになると、その潜在的な用途は広大になります。AGIテクノロジーがさまざまな業界にどのような革命を起こす可能性があるか、いくつかの例を挙げて説明します。

カスタマー・サービス

AGIを活用したカスタマー・サービス・システムを想像してみてください。膨大な顧客データにアクセスし、それをリアルタイム分析と組み合わせることで、効率的でパーソナライズされたサービスを提供します。包括的な顧客プロファイル(人口統計、過去の経験、ニーズ、購入習慣)を作成することで、AGIは問題を予測し、対応を調整し、解決策を提案し、さらにはフォローアップの質問を予測することもできます。

:これまでで最高のカスタマー・サービス体験を想像してみてください。AGIは、潜在的な問題を予測し、トーン分析を使用して顧客の気分をよりよく理解し、最も具体的なケース解決の詳細を思い出すことができる鋭い記憶力を備えた認識システムを通じてこれを実現できます。AGIは人間の言語の微妙なニュアンスを理解することで、有意義な対話をしたり、複雑な問題に取り組んだり、トラブルシューティングの手順を進めたりすることもできるでしょう。また、感情的知性により、共感的で支援的なコミュニケーションを適応させ、顧客にとってよりポジティブなやりとりを生み出すことができます。

コーディング・インテリジェンス

AGIはコード分析を超えて、既存のコードベースのロジックと目的を把握し、人間の仕様に基づいて改善を提案し、新しいコードを生成します。AGIは、アーキテクチャー、依存関係、変更履歴をハードコードされた形で理解できるようにすることで、生産性を向上させることができます。

例: eコマース機能を構築しているときに、プログラマーはAGIに「場所、重量、方法に基づいて配送料を計算する機能が必要です」と伝えたとします。AGIは関連コードを分析し、ロジックを説明するコメント付きのドラフト関数を生成し、プログラマーがそれをレビュー、最適化、統合できるようにします。

ナビゲーション、探査、自律システム

現在の自動運転車や自律システムは、事前にプログラムされた地図とセンサーに大きく依存しています。AGIは周囲の状況を単に認識するだけでなく、理解するようになります。カメラ、LiDAR、その他のセンサーからのリアルタイム・データを分析して、物体を識別し、リスクを評価し、突然の天候の変化や予期しない障害物などの環境の変化を予測する可能性があります。応答オプションが限られている現在のシステムとは異なり、AGIは複雑な決定をリアルタイムで行うことができるかもしれません。

また、交通の流れ、気象条件、さらにはセンサーの直接の範囲外の潜在的な危険など、複数の要因を考慮することも可能かもしれません。AGI搭載システムは、事前にプログラムされたルートに限定されません。これらのシステムは経験から学び、新しい状況に適応し、未知の領域を探索する可能性があります。複雑な洞窟系を進む自律型探査車両や、絶えず変化する環境での捜索救助活動を支援するドローンを想像してみてください。

例: AGI搭載の自動運転車が通常のルートで予期せぬ交通渋滞に遭遇したとします。AGIは、事前にプログラムされた指示に厳密に従うのではなく、他の接続された車両からのリアルタイムの交通データを分析します。次に、距離、推定移動時間、工事現場などの潜在的な危険などの要素を考慮して、代替ルートを特定します。最後に、最も効率的で安全なルートをリアルタイムで選択し、乗客に情報を提供して旅程全体を通して快適に過ごしてもらいます。

ヘルスケア

今日生成される膨大な量の医療データの大部分は未活用のままです。AGIは、医療画像、患者記録、遺伝子データを分析して、人間の注意を逃れる可能性のある微妙なパターンを識別する可能性があります。AGIは、過去のデータと医療の傾向を分析することで、患者が特定の病気を発症する潜在的なリスクを予測できる可能性があります。AGIは患者の遺伝子構成や病歴を分析して治療計画をカスタマイズする可能性もあります。この個別化されたアプローチは、副作用の少ない、より効果的な治療につながる可能性があります。

:患者が気になる症状を訴えて医師の診察を受けたとします。医師は患者の病歴と最近の検査結果をAGI搭載の医療分析システムにアップロードします。AGIはデータを分析し、特定の病気に関連するまれな遺伝子変異を特定します。この情報は、より的を絞った診断と個別の治療計画を可能にし、患者の転帰を改善する可能性があるため、医師にとって非常に重要です。

教育

情報を提示するのではなく、学習の過程をパーソナライズするAGIチューターを想像してみてください。AGIは、生徒のパフォーマンス、学習スタイル、知識のギャップを分析して、カスタマイズされた学習パスを作成します。すべての生徒を同じように扱うわけではありません。AGIは、生徒の理解度に基づいて、教材のペースと難易度をリアルタイムで調整できるかもしれません。概念の理解に苦労していれば、AGIは他の説明や例を提供するでしょう。トピックを習得したと判断すれば、より難しい素材を導入するはずです。AGIは講義や教科書だけにとどまらないかもしれません。生徒のやる気を維持するために、インタラクティブなシミュレーションや、パーソナライズされた練習問題、さらにはゲーム化された学習エクスペリエンスを作成することもできます。

例:ある生徒が複雑な数学の概念に苦しんでいるとします。AGIチューターは難易度を識別し、アプローチを調整します。退屈な講義ではなく、インタラクティブなシミュレーションを使用して概念を視覚的に提示し、より小さく管理しやすいステップに分解します。生徒は、特定の知識のギャップに対応する個別の演習で練習し、AGIはプロセス全体を通じてフィードバックと励ましを提供します。

製造とサプライチェーン・マネジメント

AGIは、プロセスのすべてのステップを最適化することで製造業に革命をもたらす可能性があります。AGIは、生産ライン全体のセンサーから得られる膨大な量のデータを分析してボトルネックを特定し、機械設定の調整を推奨して、生産スケジュールをリアルタイムで最適化し、効率を最大化します。履歴データとセンサーの読み取り値を分析することで、AGIは機器の故障を事前に予測できるようになります。この積極的なアプローチにより、コストのかかるダウンタイムを防ぎ、スムーズな運用を実現できます。AGIは複雑な物流ネットワークをリアルタイムで管理し、配送ルートを最適化し、潜在的な遅延を予測し、在庫レベルを調整してジャストインタイム配送を保証し、廃棄物と保管コストを最小限に抑えることができます。

例:AGIシステムが工場の組立ラインを監視しているとします。重要な機械のわずかな振動を検出し、摩耗の可能性を示します。AGIは履歴データを分析し、今後24時間以内に発生する可能性のある障害を予測します。保守担当者に警告が送られ、生産に支障が出る前に問題に積極的に対処できるようになります。これにより、スムーズで効率的な操作が可能になり、コストのかかるダウンタイムを回避できます。

金融サービス

AGIは従来の方法を超えて財務分析に革命をもたらす可能性があります。AGIは、金融ニュース、SNSの感情、さらには衛星画像までを網羅する膨大なデータ・セットを分析し、人間のアナリストが気付かない可能性のある複雑な市場動向や潜在的な混乱を特定できます。すでにスタートアップ企業や金融機関が、こうしたテクノロジーの限定版に取り組んでおり、それを活用しています。

AGIは膨大な量の履歴データを処理できるため、リスクを評価し、より情報に基づいた投資判断を行うためのさらに正確な財務モデルを作成できる可能性があります。AGIは、市場データ、リアルタイムのニュース、SNSの感情を考慮した複雑な取引アルゴリズムを開発し、実行する可能性があります。しかし、最終的な意思決定と倫理的考慮においては、人間による監督が依然として重要となるでしょう。

例:ヘッジファンドがAGIシステムを使用して金融市場を分析しているとします。AGIは、特定の業界に対するSNSの感情の微妙な変化を検出し、潜在的な低迷を特定します。過去のデータとニュース記事を分析し、市場の調整の可能性を確認します。この情報を活用することで、ファンドマネージャーは十分な情報に基づいた意思決定を行い、ポートフォリオを調整してリスクを軽減することができます。

研究開発

AGIは膨大なデータセットと科学文献を分析し、新しい仮説を立て、前例のない規模で実験を設計し、さまざまな分野で科学的な進歩を加速する可能性があります。膨大な科学的データセットと文献を分析してデータを調べ、人間の研究者が見逃す可能性のある微妙なパターンやつながりを特定することで画期的なアイデアを生み出すことができる科学パートナーを想像してみてください。これにより、まったく新しい仮説や研究の道筋が構築される可能性があります。

複雑なシステムをシミュレートし、膨大な量のデータを分析することで、AGIは前例のない規模で高度な実験を設計できるようになります。これにより、科学者は仮説をより効率的に検証し、これまで想像もできなかった研究の最先端を探求できるようになります。AGIは休みなく働き、研究者がデータをふるいにかけたり、複雑なシミュレーションを管理したり、新しい研究の方向性を提案したりするのを支援するかもしれません。この協力により、科学の進歩のペースが大幅に加速されるでしょう。

例:天体物理学者のチームが初期宇宙における銀河の形成を研究しているとします。AGIは望遠鏡やシミュレーションからの膨大なデータセットを分析します。この研究は、暗黒物質の分布と星団の形成との間に、これまで見過ごされてきた相関関係があることを明らかにするでしょう。これに基づいて、AGIは銀河形成に関する新しい仮説を提唱し、その妥当性をテストするための一連の革新的なシミュレーションを提案します。この新たな知識は、宇宙の起源についてのより深い理解への道を開くはずです。

AGIの種類

AGIは、医療や製造業などの業界のビジネスのやり方を永久に変える、影響力のあるテクノロジーとなるでしょう。大手テクノロジー企業や研究機関は開発にリソースを投入しており、さまざまな学派が機械で真の人間レベルの知能を実現するという課題に取り組んでいます。以下に、主な研究領域をいくつか紹介します。

  1. シンボリックAI:このアプローチは、知識と推論を表現するためにシンボルとロジックを操作するシステムの構築に重点を置いています。人間が論理を使用するのと同様に、ルールに従って問題を理解し解決できるシステムを作成することを目的としています。
  • コネクショニストAI(人工ニューラル・ネットワーク):このアプローチは、人間の脳の構造と機能にヒントを得ています。膨大なデータに基づいて情報を学習し、処理するために、相互接続されたノードを持つ人工ニューラル・ネットワークを構築します。
  • 人工意識: この分野では、機械に主観的な経験と自己認識を吹き込むことを探求します。これは非常に理論的な概念ですが、真の知性の重要な要素となる可能性があります。
  • 全脳エミュレーション方式:この野心的なアプローチは、生物学的脳の詳細なコンピューター・シミュレーションを作成することを目的としています。人間の脳の構造と機能を模倣することで、シミュレーション内で意識と知性が生まれる可能性があるという理論です。
  • 具現化されたAIと身体性認知:このアプローチは、知能の形成におけるエージェントの物理的な身体と環境との相互作用の役割に焦点を当てています。これは、真の知能を得るには、エージェントが物理的な身体を通じて世界を体験し、学ぶことが必要であるという考えです。

AGI研究分野は常に進化しています。これらは研究が進んでいるアプローチのほんの一部です。おそらく、これらの技術の組み合わせ、あるいはまったく新しいアプローチが、最終的にはAGIの実現につながるでしょう。

AIの運用こそビジネスの未来

AGIは今のところSFかもしれませんが、組織は、コア・ワークフローにおける生成AIの影響を加速して生産性を向上させるAI製品ポートフォリオであるIBM watsonxを使用してビジネス向けのAI戦略を構築することで、将来に備えることができます。AIモデルのトレーニング、検証、チューニング、デプロイを行い、信頼できるデータでビジネス全体にAIのインパクトを拡大して、推進しましょう。

 
関連ソリューション
IBM watsonx.ai

AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。

watsonx.aiをご覧ください。
人工知能ソリューション

業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。

AIソリューションはこちら
AIコンサルティングとサービス

AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。

AIサービスはこちら
次のステップ

AI開発ライフサイクル全体にわたる機能にワンストップでアクセスできます。使いやすいインターフェース、ワークフロー、業界標準のAPIやSDKを利用して、強力なAIソリューションを構築できます。

watsonx.aiの詳細はこちら デモを予約