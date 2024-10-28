A IBM está lançando seus modelos Granite 3.0 como software de código aberto sob a licença Apache 2.0, adotando uma abordagem marcadamente diferente dos desenvolvedores que mantêm seus sistemas de IA privados. A empresa construiu seus modelos usando conjuntos de dados públicos como GitHub Code Clean e StarCoder, permitindo que eles evitassem questões de direitos autorais que levaram a processos contra empresas de IA que treinam seus modelos em conteúdo protegido, como o caso atual da News Corp contra Perplexity.

A versão inclui modelos de linguagem 8B e 2B focados em tarefas empresariais, como geração, geração aumentada de recuperação e classificação, juntamente com variantes especializadas para instruções e monitoramento de segurança. Suportando 116 linguagens de programação e treinados com 3 a 4 terabytes de tokens, os modelos estão disponíveis em várias plataformas, incluindo Hugging Face, GitHub e IBM watsonx.ai. Os modelos variam de 3 a 34 bilhões de parâmetros e podem ser usados para pesquisa e aplicação comercial sem restrições em lançamentos nominalmente "código aberto".

"Ter essa diversidade de pensamento e contribuições como parte desse ecossistema aberto é uma proposta muito mais empolgante do que manter nossos modelos fechados em uma caixa", diz Kate Soule, Diretora de Programa de Dados e Fábrica de Modelos na IBM pesquisa. “Queremos que a comunidade o use.”

O movimento de código aberto também ganhou impulso na Europa, onde Mistral IA surgiu como líder dos setores. A startup sediada em Paris lançou modelos cada vez mais capazes que os desenvolvedores podem baixar e modificar livremente.

A estratégia de código aberto cria uma troca de mão de obra bidirecional: as empresas compartilham modelos de IA que somente bolsos profundos poderiam construir, ao mesmo tempo em que obtêm insights de milhares de desenvolvedores à medida que encontram novos usos para a tecnologia. Restringir o acesso, muitos argumentam agora, significa perder essa inovação coletiva.

"Imagine que existe algum pequeno e inovador ajuste na arquitetura do seu modelo que, mesmo deixando todo o resto inalterado, melhoraria significativamente o desempenho geral", diz Dave Bergmann, Escritor Sênior do IBM Think. "Se você liberar seu modelo como apenas um peso aberto e se recusar a divulgar informações e código para sua arquitetura, talvez nunca perceba a oportunidade que existe. Mas se 20.000 pessoas mexerem com o código do seu modelo, alguém o identificará.”