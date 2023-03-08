Como o nome sugere, a IA generativa gera imagens, música, fala, código, vídeo ou texto, enquanto interpreta e manipula dados preexistentes. A IA generativa não é um conceito novo: as técnicas de aprendizado de máquina por trás da IA generativa evoluíram ao longo da última década. A abordagem mais recente é baseada em uma arquitetura de redes neurais, chamada de “transformadores”. Combinando a arquitetura de transformação com aprendizado não supervisionado, surgiram modelos de base que superam os benchmarks existentes capazes de lidar com várias modalidades de dados.

Esses grandes modelos são chamados de modelos de base, pois servem como ponto de partida para o desenvolvimento de modelos mais avançados e complexos. Ao desenvolver um modelo de base, podemos criar modelos mais especializados e sofisticados, adaptados a casos de uso ou domínios específicos. Exemplos iniciais de modelos, como GPT-3, BERT, T5 ou DALL-E, mostraram o que é possível: insira um prompt, e o sistema gera um ensaio inteiro ou uma imagem complexa, com base em seus parâmetros.

Os grandes modelos de linguagem (LLMs) foram explicitamente treinados em grandes quantidades de dados de texto para tarefas de NLP e continham um número significativo de parâmetros, geralmente excedendo 100 milhões. Eles facilitam o processamento e a geração de texto de linguagem natural para tarefas diversas. Cada modelo tem seus pontos fortes e fracos, e a escolha de qual utilizar depende da tarefa específica de NLP e das características dos dados que estão sendo analisados. Escolher o LLM correto para usar em um trabalho específico requer experiência em LLMs.

O BERT foi projetado para entender relações bidirecionais entre palavras em uma frase e é usado principalmente para classificação de tarefas, resposta a perguntas e named entity recognition. O GPT, por outro lado, é um modelo unidirecional baseado em transformador usado principalmente para tarefas de geração de texto, como tradução de idiomas, resumo e criação de conteúdo. O T5 também é um modelo baseado em transformador, no entanto, difere do BERT e do GPT porque é treinado usando uma abordagem de texto para texto e pode ser ajustado para várias tarefas de processamento de linguagem natural, como tradução de idiomas, sumarização e resposta a perguntas.