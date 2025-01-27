DeepSeek-R1, el modelo de IA de la startup china DeepSeek, se disparó hasta lo más alto de las listas de modelos más descargados y activos en la plataforma de código abierto de IA Hugging Face horas después de su lanzamiento la semana pasada. También impactó a los mercados financieros, ya que dio instrucciones a los inversores para que reconsideraran las valoraciones de fabricantes de chips como NVIDIA y las colosales inversiones que los gigantes estadounidenses de la IA están haciendo para escalar sus negocios de IA.

¿Por qué tanto alboroto? El llamado "modelo de razonamiento", DeepSeek-R1 es un asistente digital que funciona tan bien como el o1 de OpenAI en ciertos puntos de referencia de IA para tareas matemáticas y de codificación, se entrenó con muchos menos chips y es aproximadamente un 96 % más barato, según la empresa.

"DeepSeek está, sin duda, remodelando el panorama de la IA, desafiando a los gigantes con su ambición de código abierto y sus innovaciones de vanguardia", afirma Kaoutar El Maghraoui, investigador científico principal y director de IBM AI Hardware.

Mientras tanto, ByteDance, el gigante tecnológico chino propietario de TikTok, anunció recientemente su propio agente de razonamiento, IU-TARS, que según afirma supera a GPT-4o de OpenAI, Claude de Anthropic y Gemini de Google en ciertas referencias. El agente de ByteDance puede leer interfaces gráficas, razonar y emprender acciones autónomas paso a paso.

Desde startups hasta gigantes establecidos, las empresas chinas de IA parecen estar cerrando la brecha con sus rivales estadounidenses, en gran parte gracias a su voluntad de compartir el código abierto con otras empresas y desarrolladores de software. "DeepSeek ha sido capaz de proliferar algunos modelos bastante potentes en toda la comunidad", afirma Abraham Daniels, director técnico sénior de productos para el modelo Granite de IBM. DeepSeek-R1 se ofrece en Hugging Face con una licencia del MIT que permite un uso comercial sin restricciones. “DeepSeek realmente podría acelerar la democratización de la IA”, afirma.

El verano pasado, la empresa china Kuaishou presentó una herramienta de generación de vídeo que era similar a Sora de OpenAI, pero disponible para el público desde el principio. Sora se presentó el pasado febrero, pero no se lanzó completamente en diciembre y, aun así, solo quienes tenían una suscripción a ChatGPT Pro podían acceder a todas sus características. Los desarrolladores de Hugging Face también han adquirido nuevos modelos de código abierto de los gigantes tecnológicos chinos Tencent y Alibaba. Mientras que Meta ha puesto en código abierto sus modelos Llama, tanto OpenAI como Google han seguido un enfoque predominantemente de código cerrado para el desarrollo de sus modelos.

Además de la ventaja del código abierto, los ingenieros de DeepSeek también utilizaron solo una fracción de los chips NVIDIA altamente especializados que utilizan los de sus competidores estadounidenses para entrenar sus sistemas. Por ejemplo, los ingenieros de DeepSeek afirmaron que solo necesitaban 2000 GPU (unidades de procesamiento gráfico), o chips, para entrenar su modelo DeepSeek-V3, según un artículo de investigación que publicaron con el lanzamiento del modelo.