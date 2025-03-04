Si leyó los titulares del 20 de enero de 2025, podría haber pensado que el cielo se estaba cayendo. Esto se debe a que DeepSeek, con sede en China, lanzó su modelo de lenguaje de gran tamaño (LLM) R1, que rápidamente se convirtió en uno de los LLM más descargados y activos poco después de su lanzamiento.

Lo que desencadenó el entusiasmo fue el hecho de que el laboratorio de investigación de IA con sede en Hangzhou (China), que lanza modelos con su nombre, creó uno a un coste mucho menor (5,6 millones de dólares) y con muchos menos recursos informáticos y acceso a chips NVIDIA que los principales modelos estadounidenses.

Como era de esperar, la gente expresó abiertamente su preocupación por que algunas de las empresas estadounidenses de IA con gran financiación estuvieran a punto de quedarse atrás. Como DeepSeek utilizaba menos chips NVIDIA que esas otras empresas, el precio de las acciones de la compañía bajó. Sin embargo, se trató más de una reacción instintiva a la noticia que de algo materialmente preocupante sobre la fortuna del fabricante de chips.

Los periodistas tecnológicos y empresariales consideraron esta noticia como un shock para el sistema. Sin embargo, para otros expertos en IA y para mí, la única sorpresa del anuncio de R1 de DeepSeek fue lo sorprendidos que parecían estar todos.

Aunque el modelo era nuevo, DeepSeek está lejos de ser un nuevo participante en el mercado. Tiene un amplio historial de producción de valiosos modelos de código abierto en el mercado chino, especialmente el modelo V3 lanzado en diciembre. De hecho, publicó un documento técnico adjunto, que ofrece formación para cualquiera que quiera profundizar en cómo crear estos laboratorios. El modelo V3 fue más una sorpresa, pero aparentemente pasó desapercibido.

El modelo R1 de DeepSeek, por supuesto, es otro ejemplo de una herramienta de IA generativa que puede convertirse en la base del futuro de la IA agéntica, en la que las herramientas de IA no solo responden a las peticiones de sus usuarios, sino que trabajan de forma independiente para prestar servicios a esos usuarios.

Si bien IBM, por diseño, se asocia con todos estos modelos y los utiliza, también somos grandes defensores e ingenieros del movimiento de código abierto. Ver un modelo de código abierto como R1 recibir elogios muy merecidos es genial para el sector.

Es comprensible que a los grandes actores les disgustara un poco ver que DeepSeek producía un modelo a la par o mejor que sus modelos, pero creado por una fracción del coste de los modelos más conocidos. Sin embargo, eso es para lo que está diseñada la comunidad de código abierto.

El anuncio de DeepSeek R1 muestra dos mundos diferentes: los mercados financieros pronosticaban turbulencias, mientras que los expertos en IA estaban entusiasmados con el avance tecnológico y con la forma en que podría dar lugar a modelos nuevos más eficientes y potentes.