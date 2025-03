Il modello è stato descritto per la prima volta in un documento del 2017 intitolato "Attention is All You Need" di Ashish Vaswani, un team di Google Brain, e un gruppo dell'Università di Toronto. La pubblicazione di questo documento è considerata un punto di svolta nel settore, dato che i trasformatori sono ora ampiamente utilizzati in applicazioni come l'addestramento degli LLM.

Questi modelli sono in grado di tradurre testo e voce quasi in tempo reale. Ad esempio, ci sono app che ora consentono ai turisti di comunicare con le persone del posto nella loro lingua madre. Aiutano i ricercatori a comprendere meglio il DNA e ad accelerare la progettazione dei farmaci. Possono aiutare a rilevare le anomalie e a prevenire le frodi nei settori della finanza e della sicurezza. I trasformatori visivi sono simili a quelli utilizzati per le attività di computer vision.

Il popolare strumento di generazione di testo ChatGPT di OpenAI utilizza architetture trasformative per la previsione, il riepilogo, la risposta alle domande e molto altro, perché consentono al modello di concentrarsi sui segmenti più rilevanti del testo di input. Il "GPT" visualizzato nelle varie versioni dello strumento (ad es. GPT-2, GPT-3) è l'acronimo di "trasformatore generativo pre-addestrato". Gli strumenti di AI generativa basati su testo come ChatGPT beneficiano dei modelli di trasformazione perché possono prevedere più facilmente la parola successiva in una sequenza di testo, sulla base di set di dati ampi e complessi.

Il modello BERT, o Bidirectional Encoder Representations from Transformers, si basa sull'architettura trasformativa. A partire dal 2019, BERT è stato utilizzato per quasi tutti i risultati di ricerca di Google in lingua inglese ed è stato implementato in oltre 70 altre lingue.1