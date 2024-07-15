En la carrera por dominar IA, más grande suele ser mejor. Más datos y más parámetros crean sistemas de IA más grandes, que no solo son más poderosos sino también más eficientes y rápidos, y generalmente crean menos errores que los sistemas más pequeños.

Las empresas tecnológicas que aprovechan los titulares de las noticias refuerzan esta tendencia. "El sistema que acabamos de desplegar es, en cuanto a escala, casi tan grande como una ballena", dijo el director de tecnología de Microsoft, Kevin Scott, sobre la supercomputadora que impulsa Chat GPT-5. Scott estaba hablando sobre la última versión del chatbot de IA generativa de Open AI en el reciente evento Build de la empresa a finales de mayo. “Y resulta que puedes construir una gran cantidad de IA con una supercomputadora del tamaño de una ballena”.

Mientras tanto, la capitalización bursátil de Nvidia alcanzó la marca de 3 billones de USD en junio. El fabricante de chips ha estado creciendo a un ritmo vertiginoso a medida que sus chips impulsan modelos de lenguaje cada vez más grandes, supercomputadoras y centros de datos que se multiplican en todo el mundo.

Pero, ¿más grande siempre es mejor? Depende de su perspectiva. Para las empresas que desarrollan modelos lingüísticos de gran tamaño, la escala es una ventaja en la mayoría de los casos. Pero a medida que las empresas buscan separar la exageración de donde la IA puede agregar verdadero valor, no está claro que los modelos de lenguaje cada vez más grandes siempre conduzcan a mejores soluciones para las empresas.

En el futuro, "no necesitaremos modelos que sean 100 veces mayores que los que tenemos hoy para extraer la mayor parte del valor", dijo Kate Soule, directora del programa de investigación de IA generativa de IBM en un episodio reciente del podcast Mixture of Experts de IBM. Muchas compañías que ya obtienen un retorno de sus inversiones en IA la emplean para tareas como la clasificación y la resumen, que ni siquiera emplean toda la capacidad de los modelos de lenguaje actuales.