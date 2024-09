このモデルは、Google Brain のチーム、およびトロント大学のグループである Ashish Vaswani 氏による 2017 年の論文「Attending is All You Need」で初めて説明されました。 現在、LLM のトレーニングなどのアプリケーションでトランスフォーマーが広く使用されていることを考えると、この論文の発表は、この分野における分岐点と考えられています。

これらのモデルは、テキストと音声をほぼリアルタイムで翻訳できます。 たとえば、旅行者が第一言語で路上で地元の人々とコミュニケーションできるようになったアプリがあります。 これらは、研究者が DNA をより深く理解し、医薬品設計をスピードアップするのに役立ちます。 異常を検出し、金融やセキュリティにおける不正行為を防ぐことができます。 ビジョン トランスフォーマーは、コンピューター ビジョン タスクにも同様に使用されます。

OpenAI の人気のある ChatGPT テキスト生成ツールは、モデルが入力テキストの最も関連性の高いセグメントに焦点を当てることができるため、予測、要約、質問応答などにトランスフォーマー アーキテクチャを利用しています。 ツールのさまざまなバージョンで見られる「GPT」(例: GPT-2、GPT-3) は「Generative Pre-Trained Transformer」の略です。 ChatGPT などのテキストベースの生成 AI ツールは、大規模で複雑なデータ セットに基づいて、一連のテキスト内の次の単語をより容易に予測できるため、トランスフォーマー モデルの恩恵を受けます。

BERT モデル、つまりトランスフォーマーの双方向エンコーダー表現は、トランスフォーマー アーキテクチャに基づいています。 2019年現在、BERTはほぼすべての英語のGoogle検索結果に使用されており、他の70以上の言語に展開されている1。