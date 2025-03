El modelo fue descrito por primera vez en un artículo de 2017 titulado "Attention is All You Need" de Ashish Vaswani, un equipo de Google Brain y un grupo de la Universidad de Toronto. La publicación de este documento se considera un momento decisivo en este campo, dado lo extendido que está el uso de transformadores en aplicaciones como la formación de LLM.

Estos modelos pueden traducir texto y voz casi en tiempo real. Por ejemplo, hay aplicaciones que ahora permiten a los turistas comunicarse con los lugareños en la calle en su idioma principal. Ayudan a los investigadores a comprender mejor el ADN y acelerar el diseño de fármacos. Pueden ayudar a detectar anomalías y prevenir fraudes en las finanzas y la seguridad. Los transformadores de visión se utilizan de manera similar para tareas de visión por ordenador.

La conocida herramienta de generación de texto ChatGPT de OpenAI utiliza arquitecturas de transformadores para la predicción, el resumen, la respuesta a preguntas y mucho más, ya que permiten al modelo centrarse en los segmentos más relevantes del texto de entrada. El “GPT” visto en las distintas versiones de la herramienta (p. ej. GPT-2, GPT-3) significa "transformador generativo preentrenado". Las herramientas de IA generativa basadas en texto, como ChatGPT, se benefician de los modelos de transformadores porque pueden predecir más fácilmente la siguiente palabra en una secuencia de texto, basándose en conjuntos de datos grandes y complejos.

El modelo BERT, o Bidirectional Encoder Representations from Transformers, se basa en la arquitectura del transformador. A partir de 2019, BERT se utilizó para casi todos los resultados de búsqueda de Google en inglés y se ha implementado en más de 70 idiomas.1