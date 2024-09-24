OpenAIの最新のo1-previewモデルは、複雑な問題を段階的に分割して解決し、業種・業務が課題に取り組む方法を変える可能性を秘めています。
思考推論の連鎖として知られるこのアプローチは、推論を説明せずに答えを生成することが多かった以前のAIモデルからの大きな変化を示しています。こうした進歩によって、企業や研究者が複雑な問題解決に取り組む方法が再構築される可能性があります。
IBM特別エンジニアのChris Hayは、「これらのモデルは、問題を考えるのに時間がかかるため、より多くの論理的推論を必要とするタスクに適しています」と述べています。まるで自分たちの仕事を、順を追って示しているようです。」
思考連鎖アプローチにより、ユーザーはAIがどのようにして結論に達するかを確認できます。Hayはそのプロセスについて次のように説明しました。「たとえば、子供に、25に10+5を掛けたものを尋ねると、そこには3つのステップがあります。あいまいな回答を返すだけかもしれません。しかしあなたは、いいえ、いいえ、これを分解する必要があると言いました。これは学校で自分の仕事を披露するのと同じようなものです。」
IBMのAIセキュリティー担当シニア・リサーチ・サイエンティストのNathalie Baracaldoは、この開発の重要性を次のように強調しています。「主な違いは、モデルがどのようにして決定に到達したかをどのように知ることができるかに関係しています。エージェントの行動については、何かが起こった理由を理解するのに非常に役立つ説明が用意されています。」
このレベルの透明性は、さまざまな業種・業務に広範囲に影響を与える可能性があります。たとえば、ソフトウェア開発では、モデルはエラーを減らしてコーディング能力を向上させています。Hayは、AIが妥当な情報を生成する一方で、誤った情報を生成するインスタンスについて、「コーディングの精度が上がり、ハルシネーション（幻覚）が少なくなっている」と指摘しています。
新しいモデルでは、トレーニング・プロセスに強化学習も組み込まれています。Hayは次のように説明します。「基本モデルのトレーニング方法も変更しました。彼らは、モデルを教えてトレーニングするために強化学習をどのように使用しているかについて話しています。」
これらの高度なAIモデルを最も効果的に使用するには、人間の専門知識と機械の機能の連携が必要となるでしょう。「人間は常にインプットを提供し、計画に問題がないことを確認し、これらをVerifyする必要があります」とHayは言います。
Hayは、モデルの能力を過大評価することを注意しました。「素晴らしいアウトプットが得られると思います。AGIという言葉を聞くと、みんなクラウドの上の巨大な脈打つ頭を考察すると思いますが…実際、考察すると、モデルは、次のトークン予測や適切なトレーニング・データ、計画などを備えており、かなり良い仕事をします。かなり多くのタスクで人間よりも優れています。」
これらのモデルの開発は、人工知能の性質とそれを人間の認知との比較について疑問を提起します。新しいモデルは、特定の分野では目覚ましい能力を発揮しており、司法試験やSATなどの標準化されたテストでは人間を上回るパフォーマンスを発揮しました。しかし、ほとんどの人間が直感的に見つけるタスクでは依然として苦労しています。
Hayは、モデルが人間が単純と考えるタスクでは苦労する可能性があることを指摘しました。「このモデルは、特定の個別のタスクに優れています。しかし、現時点では、会話のさまざまな部分を区別することが困難です。これにより、複数の概念を同時に処理する能力に混乱が生じます。このモデルはコンテキストを強調しすぎて、リクエストを処理する際に無関係な情報を考慮しすぎることがよくあります。」
Baracaldoは次のように注意書きを付けました。「このモデルは非常に素晴らしいものですが、時として間違いを犯すこともあります。もし技術報告を読むなら、実際の専門家、つまり人間が実現不可能だと思うような解決策を生み出すこともあるが、モデルはすべての前提条件を知っているわけではありません。
こうした進歩の影響は、業種・業務にとどまりません。研究や学術界では、複雑なデータ分析や仮説の生成を支援することで、発見のペースを加速させることがあります。医療や法律などの分野では、人間の専門知識を強化するツールとして機能し、より正確な診断やより包括的な法的分析につながる可能性があります。
Hayは、企業にとっての新しいモデルの実際的な価値について、「以前よりもはるかに優れたコーダーです」と要約しています。