À medida que as empresas de tecnologia investem bilhões em inteligência artificial, uma estratégia contraintuitiva está ganhando força: fornecer o código. A migração para código aberto modelos de IA reflete a crescente pressão para controlar os custos de desenvolvimento, ao mesmo tempo em que acelera avanços em um campo onde o talento e o poder de computação têm um preço alto.
O cenário da IA está mudando à medida que empresas como a IBM, Meta e Mistral AI adotam o desenvolvimento de código aberto, disponibilizando tecnologias de IA sofisticadas para desenvolvedores e pesquisadores. Embora essa abordagem possa democratizar o acesso e acelerar os avanços por meio da colaboração, os críticos alertam que isso pode permitir que agentes mal-intencionados usem mal ou modifiquem a tecnologia para fins prejudiciais.
Os defensores afirmam que o desenvolvimento de IA de código aberto permite que pesquisadores e desenvolvedores de todo o mundo inspecionem, modifiquem e aprimorem a tecnologia. Essa abordagem colaborativa já produziu avanços significativos na eficiência do modelo. Por exemplo, os novos modelos de IA Granite 3.0 da IBM alcançam desempenho comparável a sistemas maiores, exigindo apenas uma fração dos recursos de computação.
A IBM está lançando seus modelos Granite 3.0 como software de código aberto sob a licença Apache 2.0, adotando uma abordagem marcadamente diferente dos desenvolvedores que mantêm seus sistemas de IA privados. A empresa construiu seus modelos usando conjuntos de dados públicos como GitHub Code Clean e StarCoder, permitindo que eles evitassem questões de direitos autorais que levaram a processos contra empresas de IA que treinam seus modelos em conteúdo protegido, como o caso atual da News Corp contra Perplexity.
A versão inclui modelos de linguagem 8B e 2B focados em tarefas empresariais, como geração, geração aumentada de recuperação e classificação, juntamente com variantes especializadas para instruções e monitoramento de segurança. Suportando 116 linguagens de programação e treinados com 3 a 4 terabytes de tokens, os modelos estão disponíveis em várias plataformas, incluindo Hugging Face, GitHub e IBM watsonx.ai. Os modelos variam de 3 a 34 bilhões de parâmetros e podem ser usados para pesquisa e aplicação comercial sem restrições em lançamentos nominalmente "código aberto".
"Ter essa diversidade de pensamento e contribuições como parte desse ecossistema aberto é uma proposta muito mais empolgante do que manter nossos modelos fechados em uma caixa", diz Kate Soule, Diretora de Programa de Dados e Fábrica de Modelos na IBM pesquisa. “Queremos que a comunidade o use.”
O movimento de código aberto também ganhou impulso na Europa, onde Mistral IA surgiu como líder dos setores. A startup sediada em Paris lançou modelos cada vez mais capazes que os desenvolvedores podem baixar e modificar livremente.
A estratégia de código aberto cria uma troca de mão de obra bidirecional: as empresas compartilham modelos de IA que somente bolsos profundos poderiam construir, ao mesmo tempo em que obtêm insights de milhares de desenvolvedores à medida que encontram novos usos para a tecnologia. Restringir o acesso, muitos argumentam agora, significa perder essa inovação coletiva.
"Imagine que existe algum pequeno e inovador ajuste na arquitetura do seu modelo que, mesmo deixando todo o resto inalterado, melhoraria significativamente o desempenho geral", diz Dave Bergmann, Escritor Sênior do IBM Think. "Se você liberar seu modelo como apenas um peso aberto e se recusar a divulgar informações e código para sua arquitetura, talvez nunca perceba a oportunidade que existe. Mas se 20.000 pessoas mexerem com o código do seu modelo, alguém o identificará.”
O lançamento dos modelos Llama de código aberto pela Meta foi um ponto de inflexão significativo. Isso significou que uma das maiores empresas de tecnologia deu aos pesquisadores e organizações menores acesso a tecnologia de IA avançada que eles nunca poderiam construir de forma independente.
"Estamos convencidos de que a IA de código aberto é boa para todos, começando pelos desenvolvedores que podem pegar esses modelos e ajustá-los finamente, treiná-los, destilá-los e usá-los onde quiserem", diz Amit Sangani, diretor sênior de parceria com a IA da Meta, durante um recente encontro da AI Alliance. “Quanto mais de código aberto a IA for, mais transparente e segura ela será. Ela é amplamente examinada, e isso é bom, porque quando há problemas, as pessoas, inclusive a Meta, fazem as correções."
Apesar das vantagens, a tecnologia de IA de código aberto pode trazer riscos. Alguns observadores afirmam que os modelos de IA de código aberto podem ser modificados com mais facilidade para fins prejudiciais, como gerar desinformação ou criar malware. A falta de controle centralizado significa que, mesmo que os desenvolvedores originais adiram a altos padrões éticos, as versões modificadas de seus modelos podem não.
No entanto, os ganhos de eficiência demonstrados por modelos como o Granite 3.0 apontam para um futuro potencial no qual os recursos de IA se tornarão mais acessíveis para Organizações com Recursos limitados. As pequenas empresas que não podem se dar ao luxo de executar grandes modelos de linguagem podem implementar alternativas menores, mais eficientes e de código aberto, adaptadas às suas necessidades específicas.
"O código aberto permitirá mais inovação em mais lugares", diz Dave Nielsen, diretor da comunidade da AI Alliance. "E isso só vai gerar mais entusiasmo para mais empreendedores e mais clientes, e isso criará mais receita."
