人間のような思考マシン、つまり幅広い課題に推論し、適応し、対処できるAIシステムを開発するという主張が話題をさらい、テクノロジーの議論が再構築されています。しかし、IBMのチーフ・サイエンティストであるRuchir Puriは、異なる種類のブレークスルーを推し進めています。将来の仮想的な日付ではなく、今、役に立つことで利益を得るAIです。
人間のように考察する機械というアイデアは、半世紀以上にわたり技術文化の一部として浸透してきました。近年、それはコンピューター・サイエンス会議の周縁部から公共の、そして政治的な会話の中心へと移行しています。汎用人工知能（AGI）は、現代のAIの可能性と危険性の両方を包括する要因になっています。
IBM ThinkでのインタビューでAIについて語っているPuriは、「マイルストーンを達成するたびに、その境界線を前方に押し広げようとする傾向があります。「私たちはチェスこそAGIだと思いました。次に、それは言語だと考えました。今はコーディングまたは推論です。しかし、汎用インテリジェンスは依然として定義されていません。」
「汎用人工知能」というフレーズは、狭いAIシステム（1つのタスクを非常にうまく実行するように設計されたシステム）と、人間に見られる広範で適応可能な知能と区別する方法として2000年代に初めて注目を集めました。数十年もの間、その目標は主流の工学よりも理論的研究やサイエンス・フィクションのトピックのあまり注目されていない領域に留まっていました。
それは、2010年代にディープラーニングが登場し、基盤モデル、つまり広範なデータセットで訓練された大規模なニューラル・ネットワークが出現したことで変化し始めました。これらのモデルは何の意味も持ちませんでしたが、説得力のあるテキストを生成し、パターンを特定し、かつては機械には手が届かないと思われたタスクを実行することができました。
近年、そのような開発は加速しています。GPT-4、Claude 3、Gemini、その他のモデルは、標準化されたテストに合格し、コードを書き、研究論文を要約し、さらにジョークを説明できるようになりました。彼らは依然として不安定で、答えを誤ることが多く、本当の理解が不足しています。しかし、それらは狭いAIとより柔軟なAIとの境界を曖昧にし、一部の研究者にとっては、これは初期段階のAGIのように感じられます。一方で、これはまだ能力の幻想であり、「AGI」という用語は技術的なものではなく修辞的なものにとどまっていると警告する人々もいます。
最も基本的には、AGIとは、人間ができるあらゆる知的タスク（学習、推論、問題解決など）を同じ適応性と一般化能力で実行できるマシンのことを指します。狭い範囲で高度に専門化された現在のAIシステムとは異なり、AGIはそれぞれのドメインについて明示的にプログラムする必要がなく、幅広い分野で柔軟に動作します。
過去1年間には、ますます高性能なモデルが登場し、期待を煽るばかりでした。OpenAI社のCEOであるSam Altman氏は、AGIは差し迫っていると述べました。同氏の声明と同社の戦略的方向性は、幅広い能力で推論できるマシンの構築という明確な取り組みを示唆しています。Google DeepMind社とAnthropic社に続いて、より一般的な推論、メモリ、ツールの使用向けに最適化されたシステムをリリースしました。
著名な投資家や研究機関がAGIのビジョンを支持しており、5～10年以内に実現可能だと宣言する人もいます。立法者や監視当局は、定義上は歴史的前例のないテクノロジーをどのように規制するかについて懸念を提起しており、政策議論も主流になりました。その未来は非常に近いと感じる人もいれば、危険なほど時期尚早であると感じる人もいます。
Puriの返答は、その野心を完全に無視するのではなく、本当のフロンティアがすべてを実行できるマシンではなく、いくつかの重要なことをうまく実行できるマシンを構築している場合はどうなるのか、という質問です。
Puriは、IBM® Watsonとwatsonx.aiプラットフォームを支えるシステムの構築に尽力し、機械が達成できることのベンチマークを設定しました。今日、この分野には、新しい組織化原則、つまり俗説に惑わされず、より実践的なものが必要だと信じています。Puriが有用人工知能（AUI）と呼んでいるこの考え方は、IBMや他の研究機関が取り組みを構成する方法に影響を与え始めています。
「『人工知能を有用にしよう』というこの視点が気に入っています。AIを有用にすれば、反対する人はいないでしょう」と彼は言います。
あらゆる領域で人間の知能に匹敵するかそれ以上の機械を意味するAGIとは異なり、AUIはより低い目標を掲げているが、より即時の成果が得られる可能性があります。交響曲を作曲したり、哲学者に代わる存在を作ることが重要なのではありません。重要なのは、コードの試験運用、コンプライアンス・チェッカー、ワークフロー・オプティマイザーなど、明確に定義されたコンテキストで確実に機能するツールを構築することです。
ニューヨーク州ヨークタウン・ハイツにあるIBMのThomas J. Watson Research Centerにある彼のオフィスから、Puriは私に語りました。マンハッタンから北に約1時間のところにある木々に囲まれた丘陵地帯に囲まれた広大で近代的な構造を備えたこの建物には、科学的開発が目の前で行われる場所の静かな重みがあります。訪問者の通り道には、数式が描かれた青いネームプレートと、半分解かれた方程式が描かれたホワイトボードがあります。1960年代初頭に近代建築家のEero Saarinen氏によって設計されたこの研究所は、IBMの最も有名なブレークスルーの一部が生まれた場所です。Puriはここで何十年も働いてきました。
長い廊下と森林の風景は、長期的な思考が可能であるだけでなく、期待されていると感じられる場所です。Puriの仕事への取り組み方にぴったりの環境です。彼の言葉によれば、AUIへの移行は、方向性の転換ではなく、彼が長年追求してきた問いの継続でもありません。彼は、ソフトウェア開発用のAIツールなど、大規模で実用的な価値を示すシステムに長年にわたって惹きつけられており、そのようなシステムは、専門家だけでなく、コーディングを学ぶ初心者にとっても「驚くほど便利」だと語っています。このような幅広いアクセシビリティは、AIの本当の可能性を反映していると彼は主張します。
そして、モデルが現実世界の業務に組み込まれる場合、リスクは高いとPuriは言います。たとえば、銀行、運輸、医療では、小さなエラーが急速に連鎖する可能性があります。
「一般の人々は、次々と展開されたデモから誤ったアイデアを得たと思います」とPuriは言います。「ChatGPT、Midjourney、Sora、どれも素晴らしいものです。しかし、企業の世界では、数字のハルシネーションを起こしたり、規制を誤解することは許されません。正しくなければならないのです。」
この懸念により、IBMはハイブリッド・モデルを採用することになりました。不確実なシステムだけに依存するのではなく、モデルを計算器、検索API、構造化データ検証器などの検証済みツールと組み合わせてリスクを最小限に抑えています。これらのアプローチは人間のような認知を約束するものではありません。彼らは一貫性を目指しています。目標は、創造や会話の感性よりも、精度と監査可能性が重要な環境でAIシステムが信頼できるようにすることです。
「創造性が資産となるユースケースもあれば、それが負債であるユースケースもあります」と彼は言います。
Puriは、概念実証として、ソフトウェア開発と自動化におけるIBMの経験を挙げています。AIについて「驚くほど便利になっています」と言います。「これが日常生活の中で便利だと感じている開発者から、コーディングや何かを学んでいる学生まで、自動化されたコーディング・エージェントの助けを借りています。これは専門家だけでなく、あらゆる人々にとっても有用なものとなっています。」
彼は、多くの場合、非常に創造的で複雑なタスクと見なされるソフトウェア開発には、機械が取り組むのが難しいのではないかという一部の研究者の当初の疑問を思い出しました。「それは非常に困難な作業だと考えられていました」と彼は言います。しかし、ChatGPTのようなLLMや社内の専門モデルのおかげで、その前提は成立しませんでした。「それは私だけでなく、多くの人にとっても驚くべきことでした。」
Puriは、より大きな意味は、「現在ではすべての企業がソフトウェア企業である」ため、コーディングにおけるAIの有用性が、業界全体で幅広い関連性を持つことにつながる可能性があるということです。
AIを取り巻くあらゆるノイズ（その約束、落とし穴、俗説など）に対して、Puriは多くの場合、より地に足の着いたアイデア、信頼に回帰することが多いと語っています。それは倫理的な意味だけでなく、機械的な意味でも同様です。システムは期待どおりに機能できるでしょうか。誰も見ていないときでも、信頼できるでしょうか。
彼は、Meta社のLlama、Mistral社の専門家混合（MoE）システム、IBM独自のGraniteラインなど、オープンソース・モデルの普及と、透明性の高い共同研究への広範な移行に言及しています。これらのシステムは見世物として構築されているわけではありません。それらはテストされ、調整され、挑戦されることを目的としています。それらは精査を可能にし、修正を促します。
たとえば、IBMは、自社のGraniteモデルを汎用性の高いモデルとして売り込んでいます。代わりに、モデルは企業顧客を念頭に置いて開発され、財務、物流、その他の高度に構造化された領域における特定のタスクを処理するために最適化されたツールです。Puriは、意図的な焦点とターゲットを絞った利便性を強調しています。
「これらのモデルは人間に取って代わるものではありません」と彼は言います。「これらは、人々がより多くのことを行えるように設計されています。」
彼は、人間の知性を大規模に模倣するのではなく、AIが人々や組織にとって重要な結果を、一貫して、予測可能に、大規模に提供するかどうかにかかっていると強調しています。
Puriは、今後を見据えて、AIの未来は、トップダウンのブレークスルーではなく、コラボレーション、実験、共有インフラストラクチャーによって推進される、広範で反復的な進歩によって形作るものだと考えています。
特に、最も重要な進歩は、封じ込められた研究所や秘密のデモからではなく、公開されたコミュニティーの構築からもたらされると信じています。彼は次のように述べています。「これは、イノベーションが真に公開されている最初のテクノロジー・セットの1つです。」
AIの投資対効果を高めるために、主要な分野で生成AIの活用を拡大することで、どのように革新的な新規ソリューションの構築、提供を支援し、変化をもたらすかを紹介します。
IBM Graniteは、ビジネス向けにカスタマイズされ、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能、かつ信頼性の高いAIモデル・ファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。
AI開発ライフサイクル全体にわたる機能にワンストップでアクセスできます。使いやすいインターフェース、ワークフロー、業界標準のAPIやSDKを利用して、強力なAIソリューションを構築できます。