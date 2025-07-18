Cuando se lanzó DeepSeek-R1 el 20 de enero, el potente pero rentable modelo de razonamiento de IA electrificó tanto a Silicon Valley como a Wall Street. ¿Por qué? Podía razonar tan bien como los mejores modelos de OpenAI y Anthropic, pero, según se informa, utilizaba muchos menos recursos informáticos y costaba una fracción de lo que costaba entrenarlo y utilizarlo. Sólo el mes pasado, el modelo fue descargado más de 800 000 veces en Hugging Face.
"Fue una llamada de atención", recordó Larry Li, fundador y socio gerente de la firma de inversión AMINO Capital con sede en Palo Alto, en una entrevista reciente con IBM Think. Las nuevas tecnologías suelen ser objeto de “ingeniería inversa”, afirmó. "Pero nadie esperaba que pudiera hacerse tan bien".
"Simplemente estaba cambiando la narrativa de que EE. UU. es el único lugar del mundo donde se puede innovar", dijo Matthieu Soulé, director de C.Lab de Cathay Innovation, un fondo que invierte en innovación de IA en toda la UE y Asia, incluyendo China.
Muchos predijeron que el éxito de DeepSeek revolucionaría el sector y la carrera mundial por la IA en general. Seis meses después, queríamos comprobar y ver: ¿sucedió esto realmente?
Hablamos con algunos de los mismos expertos que entrevistamos en las horas posteriores al lanzamiento de DeepSeek-R1, así como con varios otros expertos para obtener una visión global.
En los días posteriores al lanzamiento de DeepSeek-R1, muchos expresaron su preocupación sobre si la empresa había contado e informado con precisión los costes totales (no solo entrenando el modelo casi final) y qué componentes habían utilizado de qué empresas. En otras palabras, ¿realmente habían hecho algo revolucionario o se trataba de un progreso más gradual?
Algunos, como Kaoutar El Maghraoui, científico investigador principal de IBM, creen que la verdadera innovación puede haber sido lo que ella llama "eficiencia arquitectónica" o la combinación de técnicas que incluyen "la mezcla de expertos, una estrategia de aprendizaje por refuerzo, el codiseño de hardware y software y otros trucos de optimización". Se trata sobre todo de una implementación inteligente y eficaz de técnicas ya existentes", dijo en una reciente entrevista con IBM Think.
Aun así, los expertos coinciden en que DeepSeek-R1 cambió el panorama mundial de la IA en algunos aspectos clave. Por un lado, muchos daban por sentado que las empresas estadounidenses de IA tenían un "foso" o plomo que sería casi imposible de recuperar. DeepSeek desmintió esa suposición al reducir la barrera para que los desarrolladores y las pequeñas empresas accedieran a las herramientas para desarrollar sus propios LLM.
“Los desarrolladores y usuarios ahora tienen acceso al mismo tipo de capacidades que o1 de OpenAI por una fracción del costo”, afirmó Abraham Daniels, gerente sénior de productos técnicos de IBM, en una entrevista.
El hecho de que DeepSeek abriera sus modelos de código libre jugó un papel importante a la hora de aumentar la accesibilidad. "Hemos visto un aumento del interés en el código abierto desde DeepSeek y en la contribución a la AI Alliance", dijo Anthony Annunziata, director de estrategia abierta de IA en IBM y AI Alliance. La AI Alliance es una red internacional de empresas y organizaciones que trabajan para crear IA abierta y segura, fundada por IBM y Meta.
"En toda Europa, en Vietnam, India y Japón, hay todas estas empresas regionales de IA que quieren asegurarse de mantener el control soberano de su IA, de que pueden moldearla de la manera que quieran para que se adapte a sus necesidades culturales, sociales y económicas. , que son diferentes de los EE. UU. y otros lugares", dijo Annunziata.
Proteger la investigación local de la IA es lo más importante. "Hay un verdadero impulso de soberanía digital en el que los gobiernos están tratando de descubrir cómo pueden evitar la influencia extranjera de la IA", dijo El Maghroui.
La creación de LLM basados en idiomas locales motiva a muchos emprendedores. “La IA se dirige en esa dirección en la que, como servicio público, cada país o región quiere tener su propio modelo de lenguaje para al menos tener voz y voto en términos de influir en el comportamiento”, dijo Li.
Japón, por ejemplo, promulgó hace poco la Ley de Promoción de la IA para apoyar notablemente la promoción de esta tecnología. A finales de junio, la AI Alliance lanzó un nuevo capítulo en Japón para centrarse en dos áreas de gran interés para los empresarios locales: la soberanía de la IA y la IA en la fabricación. El idioma desempeña un papel importante en el control de los sistemas de IA, por lo que a finales de 2024, por ejemplo, un grupo de más de 1500 investigadores del mundo académico y de los sectores se han unido para desarrollar modelos sólidos y abiertos del idioma japonés.
Muchos modelos de IA y emprendedores autóctonos también priorizan los intereses económicos locales. En el caso de Japón, muchas de las empresas que se unieron a la AI Alliance, incluidas Mitsubishi Electric y Panasonic, están desarrollando modelos de IA dirigidos a aplicaciones industriales y de fabricación, un segmento particularmente grande de la economía japonesa.
Por otro lado, también hay un creciente apetito por los modelos locales, dijo Daisuke Okanohara, CTO y cofundador de Preferred Networks, una empresa japonesa de hardware y software que desarrolla software avanzado utilizando deep learning e IA. En mayo, Preferred Networks lanzó su segunda versión de PLaMo, un modelo compacto que puede funcionar en local y está entrenado en japonés e inglés.
"Su rendimiento no es tan competitivo como el de los modelos fronterizos en general, pero sobresale en ciertas tareas específicas", dijo Okanohara durante una entrevista con IBM Think. “En casos de uso de modelos pequeños, como modelos con entre ocho y treinta mil millones de parámetros, supera a CLANG, GPT-4o mini y modelos similares en varias tareas en japonés”.
Vietnam también ha experimentado una oleada de actividad empresarial de LLM, y la AI Alliance lanzó un capítulo allí en junio de este año. Además de desarrollar un modelo de lengua vietnamita, los empresarios se centran en utilizar modelos de IA para desarrollar nuevos tipos de chips que potencien la IA, dijo Annunziata.
Otra razón por la que DeepSeek inspiró a tantos empresarios locales fue el hecho de que varios países prohibieron o restringieron el uso de DeepSeek-R1, citando preocupaciones de seguridad y privacidad. Italia, Australia, Corea del Sur y Canadá prohibieron DeepSeek, y también estaba restringido en varios estados de EE. UU., especialmente en sitios de gobierno. Esto tuvo un interesante efecto dominó al motivar a los empresarios locales a utilizar herramientas de código abierto para crear modelos más seguros que pudieran utilizarse en sus geografías específicas.
La última empresa tecnológica del emprendedor tecnológico y capitalista de riesgo Kai-Fu Lee, 01.AI, quiere explorar el mercado B2B de la IA empresarial, un sector notoriamente difícil en China, donde la mitad de las empresas son estatales y las empresas privadas más grandes pueden depender del gobierno a medida que escalan. Lee lanzó previamente Rhymes AI, una empresa que lanzó varios productos el otoño pasado, incluyendo un motor de búsqueda y Allegro, un modelo de generación de vídeo de código abierto.
"Lo analizamos con un enfoque pragmático: los modelos son lo suficientemente buenos. Sin embargo, todavía no es fácil de usar para muchos negocios y empresas, y ese es el problema que estamos intentando abordar", afirma Anita Huang, cofundadora de 01.AI, en una entrevista con IBM Think. "Creemos que la pieza que falta, especialmente para el mercado empresarial chino, es esa capa de middleware que se convierte en el modelo de Windows o lenguaje grande". Actualmente, su plataforma empresarial utiliza modelos como DeepSeek y Qwen de Alibaba.
Inmediatamente después de DeepSeek, muchos predijeron que había allanado el camino para que dominara el razonamiento de cadena de pensamiento. Sin embargo, desde entonces, el sector ha cambiado. Una nueva investigación ha demostrado que los modelos de razonamiento consumen muchos costes y recursos y no son necesarios para muchas tareas cuando se busca utilidad a partir de estos modelos.
Quizás el área más exagerada fue la adopción empresarial de DeepSeek, dados sus bajos costes de licencia (se obtuvo a través de la permisiva licencia MIT).
"En realidad, la adopción empresarial sigue siendo muy limitada, principalmente debido a la falta de garantías de privacidad de datos, falta de cumplimiento, gobierno y seguridad", dijo El Maghraoui.
La mayoría de las empresas, al menos en EE. UU., se quedaron con proveedores que ofrecían soluciones gestionadas o auditables.
Así que, aunque es bueno que "la gente vea que las innovaciones vienen de lugares sorprendentes", dijo Annunziata, el sector de la IA y el mercado en general no han cambiado como algunos predijeron. En cambio, "las empresas de código abierto han redoblado su apuesta por este modelo, mientras que las grandes empresas propietarias se centran en adquirir talento y, en ocasiones, en debilitar a sus competidores, y están invirtiendo cada vez más dinero en sus modelos".
En última instancia, la mayor herencia de DeepSeek podría estar en defender modelos pequeños y aptos para su propósito, dijo Daniels.
"DeepSeek abrió la carrera de la IA e hizo de los modelos de lenguaje pequeños el nuevo campo de batalla", dijo. "Los modelos de lenguaje pequeños y altamente capaces podrían entrenarse de manera más eficiente que los modelos más grandes y podrían abordar mejor los casos de uso empresarial".
Los agentes de IA, sistemas de IA autónomos que pueden razonar, planificar y ejecutar tareas, se han disparado en todas las empresas en 2025 y son uno de esos casos de uso. Los modelos más pequeños suelen ser más adecuados para los sistemas de IA agéntica porque son más eficientes, requieren menos recursos y pueden adaptarse a tareas específicas.
Como dijo el distinguido ingeniero de IBM Chris Hay en un episodio reciente de Mixture of Experts: "Cuando ejecuta agentes, quiere que sus modelos sean pequeños, rápidos y ágiles".
