今日、AIで注目されているのは、アウトプット、つまりモデルが何を生成するか、どれだけ正確か、どれだけ説得力があるか、どれだけベンチマークに対して優れているか、に集中しています。しかしHagertyにとって、真の倫理的緊張はそれ以前の基盤モデルのレベルから始まります。これは最新のAIの生のインフラストラクチャーであり、Webからかき集めた膨大なデータセットでトレーニングされた機械学習の基盤層です。これは、ChatGPT や Claude のような大規模言語モデル(LLM) の原動力です。

「基盤こそが重要な場所です」とHagerty氏は言います。「システムが最初に学ぶのはそこであり、もしそこがガラクタでいっぱいなら、そのガラクタは消えません。」

これらの基盤モデルは汎用性を目的に設計されています。それこそが強力であり、危険でもあるのだとHagertyは言います。特定のタスクや制約を念頭に置いて構築されていないため、貴重な意味構造から有害なインターネットごみまで、あらゆるものを吸収する傾向があります。そして、一度トレーニングされたモデルを監査するのは困難です。モデルの作成者でさえ、モデルが何を知っているか、与えられたプロンプトにどのように応答するかについて確信が持てないことはよくあります。

Hagertyは、これを超高層ビルで欠陥のあるコンクリート基礎を作ることに例えました。最初から配合が間違っていれば、ひび割れはすぐには見えないかもしれません。しかし、時間が経つにつれて、構造は不安定になります。AIにおいては、システムがデプロイされた後の脆弱な動作、意図しないバイアス、または壊滅的な誤用がこれに相当します。初期段階で慎重に形成しないと、モデルはトレーニング中に吸収したリスクを下流のすべてのアプリケーションに持ち込むことになります。

こうした懸念を抱いているのは彼だけではありません。スタンフォード大学のCenter for Research on Foundation Models (CRFM)の研究者たちは、大規模トレーニングの新たなリスク、例えばバイアス伝播、知識のハルシネーション、データ汚染、失敗の特定の困難さについて繰り返し警告しています。これらの問題は軽減することはできますが、排除することはできません。そのため、データ、キュレーション、フィルタリング、ガバナンスなどの初期の設計選択がより重要になります。

Hagerty の見解では、意味のある進展に対する最大の倫理的障壁の一つは、企業が「AI」と言うときの意味が非常に曖昧であることです。5つのプロダクトチームに「AI搭載」とは何か尋ねれば、おそらく5つの異なる答えが返ってくるでしょう。Hagerty は、この定義の曖昧さが現代の根本的な倫理的欠陥の 1 つであると考えています。

「ほとんどの場合、人々がAIと言えば、自動化を意味します。あるいは決定木。あるいはif/else文かもしれません」と彼は言います。

用語の曖昧さは単なる学問的な言い争いではありません。企業が決定論的ソフトウェアを知的推論として提示すると、ユーザーはそれを信頼する傾向があります。スタートアップ企業が基本的な検索およびフィルターツールを生成モデルとして売り込むとき、投資家たちは幻想に資金を投じています。Hagertyはこれを「ハイプ・リーケージ（Hype Leakage）」と呼び、混乱と評判の低下の増大する原因であると見ています。

金融や医療などの規制の厳しい業界では、結果がより深刻になる可能性があります。ユーザーが、システムが実際よりも深い知識を持っていると誤解した場合、人間が行うべき決定を委任してしまう可能性があります。ツールとエージェントの境界線が曖昧になり、それに伴い説明責任も曖昧になります。

この問題は、無駄な労力にもつながります。Hagertyは、時系列予測におけるLLMの誤用に関する研究を引き合いに出しています。時系列予測とは、過去のデータに基づいて将来の値を予測するために使われる統計的手法です。しかし、一部の企業は、目新しさを追い求めたり、革新性を示したりするために、とにかく LLM を使用しようとしています。

「人々はGPUを燃やしてまで間違った答えを得ています」と彼は言います。「さらに悪いことに、それを進歩と呼んでいるのです。」

倫理的問題は非効率性だけではありません。虚偽表示も問題です。チームは、ほとんど理解していないテクノロジーを中心に製品を構築し、自社の機能を誇張するマーケティングを追加し、使用しているものを評価する手段を持たないユーザーに展開しています。