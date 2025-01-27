DeepSeek-R1, el modelo de IA de la startup china DeepSeek, se disparó a lo más alto de las listas de los modelos más descargados y activos en la plataforma de código abierto de IA Hugging Face horas después de su lanzamiento la semana pasada. También causó conmoción en los mercados financieros, ya que llevó a los inversionistas a reconsiderar las valoraciones de fabricantes de chips como NVIDIA y las colosales inversiones que los gigantes estadounidenses de la inteligencia artificial (IA) están realizando para ampliar sus negocios en este sector.

¿Por qué tanto revuelo? Llamado "modelo de razonamiento", DeepSeek-R1 es un asistente digital que funciona tan bien como o1 de OpenAI en ciertos puntos de referencia de IA para tareas matemáticas y de programación, fue entrenado con muchos menos chips y es aproximadamente un 96 % más barato de usar, según la empresa.

“DeepSeek definitivamente está transformando el panorama de la IA, desafiando a los gigantes con ambición de código abierto e innovaciones de última generación”, afirma Kaoutar El Maghraoui, científico investigador principal y gerente de hardware de IA en IBM.

Mientras tanto, ByteDance, el gigante tecnológico chino propietario de TikTok, anunció recientemente su propio agente de razonamiento, UI-TARS, que según afirma supera a GPT-4o de OpenAI, Claude de Anthropic y Gemini de Google en ciertos puntos de referencia. El agente de ByteDance puede leer interfaces gráficas, razonar y tomar medidas autónomas paso a paso.

Desde startups hasta gigantes establecidos, las empresas chinas de IA parecen estar cerrando la brecha con sus rivales estadounidenses, en gran parte gracias a su voluntad de trabajar con código abierto o compartir el código de software subyacente con otras empresas y desarrolladores de software. "DeepSeek ha podido proliferar algunos modelos bastante potentes en toda la comunidad", dice Abraham Daniels, gerente técnico sénior de productos del modelo Granite de IBM. DeepSeek-R1 se ofrece en Hugging Face bajo una licencia del MIT que permite el uso comercial sin restricciones. “DeepSeek realmente podría acelerar la democratización de la IA”, afirma.

El verano pasado, la empresa china Kuaishou presentó una herramienta de generación de video que era similar a Sora de OpenAI, pero estuvo disponible para el público desde el principio. Sora se presentó el pasado mes de febrero, pero no se lanzó por completo hasta diciembre, e incluso entonces solo aquellos con una suscripción a ChatGPT Pro podían acceder a todas sus características. Los desarrolladores de Hugging Face también han adquirido nuevos modelos de código abierto de los gigantes tecnológicos chinos Tencent y Alibaba. Mientras que Meta ha convertido sus modelos Llama en código abierto, tanto OpenAI como Google han seguido un enfoque predominantemente de código cerrado para el desarrollo de sus modelos.

Además de la ventaja del código abierto, los ingenieros de DeepSeek también utilizaron solo una fracción de los chips NVIDIA altamente especializados utilizados por sus competidores estadounidenses para entrenar sus sistemas. Por ejemplo, los ingenieros de DeepSeek afirmaron que solo necesitaban 2000 GPU (unidades de procesamiento gráfico), o chips, para entrenar su modelo DeepSeek-V3, según un artículo de investigación que publicaron con el lanzamiento del modelo.