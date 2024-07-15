En la carrera por dominar la IA, lo más grande suele ser mejor. Más datos y más parámetros crean sistemas de IA más grandes, que no solo son más potentes, sino también más eficientes y rápidos, y generalmente generan menos errores que los sistemas más pequeños.

Las empresas tecnológicas que acaparan los titulares de las noticias refuerzan esta tendencia. "El sistema que acabamos de implementar es, en cuanto a escala, casi tan grande como una ballena", dijo el director de tecnología de Microsoft, Kevin Scott, sobre el superordenador que impulsa Chat GPT-5. Scott estaba hablando sobre la última versión del chatbot de IA generativa de Open AI en el reciente evento Build de la compañía a finales de mayo. “Y resulta que se puede construir una cantidad increíble de IA con una supercomputadora del tamaño de una ballena”.

Mientras tanto, la capitalización bursátil de Nvidia alcanzó la marca de 3 billones de USD en junio. El fabricante de chips ha crecido a un ritmo vertiginoso, ya que sus chips alimentan modelos de lenguaje cada vez mayores, superordenadores y los centros de datos que proliferan en todo el mundo.

Pero, ¿más grande es siempre mejor? Depende de su perspectiva. Para las empresas que desarrollan modelos de lenguaje de gran tamaño, la escala es una ventaja en la mayoría de los casos. Pero a medida que las empresas tratan de separar el bombo publicitario de los aspectos en los que la IA puede aportar un verdadero valor añadido, no está claro que unos modelos de lenguaje cada vez más grandes vayan a conducir siempre a mejores soluciones para las empresas.

En el futuro, "no necesitaremos modelos 100 veces superiores a los que tenemos hoy para extraer la mayor parte del valor", dijo Kate Soule, directora del programa de investigación de IA generativa de IBM en un episodio reciente del pódcast Mixture of Experts de IBM. Muchas empresas que ya obtienen un retorno de sus inversiones en IA la utilizan para tareas como la clasificación y la resumen, que ni siquiera emplean toda la capacidad de los modelos de lenguaje actuales.