現時点では、悪意のある攻撃者を遠ざける数少ない要素の1つは、AIモデルを悪用から保護するために開発者が設置したガードレールです。ChatGPTが意図的にフィッシングメールを生成したり、Midjourneyが攻撃的な画像を作成したりすることはありません。ただし、これらのモデルは完全なクローズドソース・エコシステムに属しており、その背後にいる開発者が、何が使用でき、何が使用できないかを決定する力を持っています。

ChatGPTが一般公開されてからわずか2か月で ユーザーは1億人に到達しました。それ以来、数え切れないほどのユーザーがそのガードレールを突破し、「ジェイルブレイク」して自分の望むことを何でもしようとしてきましたが、成功の度合いはさまざまです。

オープンソースモデルの止められない台頭により、これらのガードレールは時代遅れになるでしょう。従来、クローズドソースモデルに遅れを取ってきましたが、オープンソースモデルの性能向上が確実であることに疑いの余地はありません。理由は単純です。開発者は好きなデータをトレーニングに使用できるからです。プラス面としては、AIを大企業や規制当局だけに委ねるのではなく、透明性と競争を促進すると同時に、AIの民主化を支援することができます。

しかし、安全対策がなければ、生成AIはサイバー犯罪の新たな標的となります。FraudGPTやWormGPTなどの不正AIは、ダークウェブ市場で広く入手可能です。どちらも2021年にEleutherAIが開発したオープンソースの大規模言語モデル(LLM) GPT-Jをベースにしています。

悪意のある攻撃者は、Stable Diffusionのようなオープンソースの画像合成装置を使用して、不正なコンテンツを生成できる特殊なモデルを構築しています。AI生成動画コンテンツは目前に迫っています。その能力は現在、高性能なオープンソースモデルの可用性と、それらを実行するために必要な膨大な計算能力によってのみ制限されています。