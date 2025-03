Fevereiro

Google lança o Gemini 1.5 em beta limitado, modelo de linguagem avançado capaz de lidar com comprimentos de contexto de até 1 milhão de tokens.42 O modelo pode processar e entender grandes quantidades de informações em um único prompt, melhorando sua capacidade de manter o contexto em conversas e tarefas complexas sobre texto estendido. O Gemini 1.5 representa um salto notável no processamento de linguagem natural, disponibilizando recursos aprimorados de memória e compreensão contextual em relação a inputs longos.

A OpenAI anuncia publicamente Sora, modelo de texto para vídeo capaz de gerar vídeos de até um minuto de duração a partir de descrições textuais.43 Essa inovação expande o uso de conteúdo gerado por IA para além das imagens estáticas, possibilitando que os usuários criem videoclipes dinâmicos e detalhados com base nos prompts. Espera-se que Sora abra novas possibilidades na criação de conteúdo de vídeo.

A StabilityAI anuncia o Stable Diffusion 3, seu mais recente modelo de conversão de texto em imagem. Como o Sora, o Stable Diffusion 3 utiliza uma arquitetura semelhante para gerar conteúdo detalhado e criativo a partir de prompts de texto.44

Maio

O Google DeepMind revela uma nova extensão do AlphaFold que ajuda a identificar câncer e doenças genéticas, oferecendo uma ferramenta poderosa para diagnóstico genético e medicina personalizada.45

A IBM apresenta a família Granite, modelos de IA generativa como parte do seu portfólio de produtos de IA watsonx. Com uma gama de 3 a 34 bilhões de parâmetros, os modelos Granite são projetados para tarefas como geração de código, forecasting e processamento de documentos. Com código aberto e disponíveis sob a licença Apache 2.0, esses modelos são leves, econômicos e personalizáveis, tornando-os ideais para uma ampla gama de aplicações de negócios.

Junho

A Apple anuncia o Apple Intelligence, integração do ChatGPT aos novos iPhones e Siri.46 Essa integração permite que a Siri realize tarefas mais complexas, mantenha conversas mais naturais e compreenda e execute comandos com mais nuances.

Setembro

A NotebookLM apresenta o DeepDive, nova IA multimodal capaz de transformar materiais de origem em apresentações de áudio envolventes estruturadas como um podcast.47 A capacidade do DeepDive de analisar e resumir informações de diversos formatos, incluindo páginas da web, texto, áudio e vídeo, abre novas oportunidades para a criação de conteúdo personalizado e automático em várias plataformas. Esse recurso faz dele uma ferramenta versátil para produção de mídia e Educação.



As tendências atuais de IA apontam para novas evoluções da IA generativa operando em modelos básicos menores e mais eficientes e para o surgimento da IA agêntica, em que modelos específicos de IA trabalham juntos para concluir as solicitações dos usuários com mais rapidez. No futuro, veículos autônomos cruzarão as rodovias, a IA multimodal criará áudio, vídeo, texto e imagens em uma única plataforma e os assistentes de IA ajudarão os usuários a navegar em suas vidas pessoais e carreiras.