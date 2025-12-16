AIモデルはより多くのデータを処理するだけでなく、従来型システムとは異なる方法でデータを扱います。従来のソフトウェアが誤って機密情報を漏えいさせた場合、エンジニアはコードをデバッグして修正できます。しかしAIモデル（ChatGPTのような大規模言語モデルを含む）は、コードで記述するというより、機械学習と呼ばれるプロセスを通じて進化するように作られます。その仕組みを作成者自身が正確に把握しているわけではないため、「デバッグ」は対応が難しく、不可能な場合もあります。

意図しない出力は懸念事項の1つですが、組織は意図的で悪意のある攻撃にも警戒する必要があります。研究者は、AIツールには巧妙なハッカーが悪用できる新たな種類の脆弱性が含まれることを示しており、この分野は敵対的機械学習と呼ばれています。

例えば近年では、サイバーセキュリティーの専門家が、AIモデルのある特性を悪用することで、特定のデータがトレーニング・セットに含まれていたかどうかを推測できることを示しています。その特性とは、学習したデータに応答する場合に、出力により高い確信度スコアが付与されるという点です。状況によっては、こうした推測は重大なプライバシー侵害となります。例えば、HIV陽性患者の非公開の医療記録で学習したことが分かっているAIモデルがあるとします。

別の有名な事例では、研究者はデータがトレーニング・セットに含まれていたかどうかを推測するだけにとどまりませんでした。研究者は、モデルの学習に使用された実データを実質的に逆解析できるアルゴリズム攻撃を作り出しました。AIモデルの“勾配”と呼ばれる側面を悪用することで、研究者はノイズが混ざった画像を反復的に改善し、顔認識モデルの学習に使用された実際の顔に近い画像へと近づけることができました。2

データ保護を巡るリスクは依然として高い状況です。IBMの2025年データ侵害のコストに関する調査では、こうした侵害の平均コストはUSD 440万とされています。（こうした侵害は、ブランドに対する社会的信頼の毀損という、定量化しにくいコストも伴います。）

これらのデータ侵害の多くはAIが原因ではありませんが、AIが関与する事例は増加しています。Stanfordの2025 AI Index Reportでは、AIのプライバシーおよびセキュリティー関連インシデントが1年で56.4％増加し、2024年には233件が報告されたとしています。3