La IA física se refiere a los sistemas de inteligencia artificial (IA) que operan en el mundo físico e interactúan con él, en lugar de existir solo en entornos de software o digitales.
La IA física suele consistir en la combinación de modelos de IA con sensores, actuadores y otros sistemas de control que permiten a los modelos actuar en entornos del mundo real, trasladándolos así del ámbito de los bits al de los átomos. Con la IA, los sistemas físicos avanzados pueden ahora percibir el entorno, razonar con la potencia de un modelo de lenguaje de gran tamaño (LLM), actuar en consecuencia y luego aprender del resultado de esa acción.
Otra forma de entender la IA física es considerar que se trata, sencillamente, de modelos basados en IA aplicados a sistemas en el espacio físico. Por ejemplo, la robótica se centra en la mecánica y el control de máquinas físicas. Antes de la IA, el comportamiento de los robots solía basarse en reglas o guiones, y los robots solo podían realizar tareas limitadas dentro de entornos específicamente diseñados. Piense en un brazo robótico que suelda la misma junta 1000 veces al día en una línea de producción de automóviles, o en una aspiradora robótica de primera generación que sigue reglas de navegación preestablecidas.
Por el contrario, los agentes de IA robóticos equipados con la comprensión general de los LLM tienen un “sentido común” limitado pero aún poderoso sobre el mundo. Estos modelos pueden combinarse con técnicas de aprendizaje por refuerzo en arquitecturas híbridas de alto rendimiento para que los robots puedan poseer tanto conocimientos generales como una comprensión especializada de un caso de uso específico.
Además, la IA física va mucho más allá de robots individuales para llegar a fábricas enteras con IA, redes inteligentes eficientes energéticamente o flotas de vehículos automatizados. Muchos de los sistemas que existen en el espacio físico pueden mejorarse con la inteligencia artificial.
Se están superando al mismo tiempo varios obstáculos que antes impedían una revolución física en el campo de la inteligencia artificial. La primera y más importante es la llegada de la IA generativa, con modelos fundacionales. Los actuales modelos de visión artificial y multimodales de gran tamaño son capaces de reconocer objetos, comprender relaciones espaciales y generalizar en distintos contextos. Esto reduce la cantidad de entrenamiento específico necesario para cada tarea y permite que los sistemas reutilicen la inteligencia en todas ellas.
El segundo reto se está superando gracias al potencial de la simulación moderna, que combina modelos físicos de alta fidelidad, renderizado fotorrealista y paralelización. Esto reduce drásticamente los tiempos de entrenamiento del modelo y hace que la simulación sea útil no solo para las pruebas, sino también como campo de entrenamiento principal. Una tendencia relacionada es la explosión de la disponibilidad de cómputo. Los avances en las GPU y los centros de datos han hecho posible el entrenamiento a escala.
Por fin, el hardware es mejor que nunca. Los robots modernos tienen mejores sensores y materiales más ligeros. Pueden aprovechar los recientes avances en IA en el edge y las mejores capacidades de comunicación. Estas innovaciones han hecho viable la experimentación, incluso para pequeñas startups. El resultado es un renacimiento de las iniciativas de automatización física, desde vehículos autónomos hasta robots industriales y bots sanitarios que realizan cirugías y otros procedimientos complicados.
A Jensen Huang, CEO de Nvidia, se le atribuye haber popularizado el término ”IA física” y haberlo presentado como la próxima gran ola de innovación impulsada por la IA. Durante una entrevista en un pódcast de enero de 2026, Huang predijo un futuro con "mil millones de robots"1. Esta visión implica una nueva economía global en torno al desarrollo y mantenimiento de todos estos nuevos robots, que podrían convertirse en uno de los sectores más grandes del planeta, nada menos que en una segunda revolución industrial.
Ese mismo mes, Nvidia lanzó una colección de modelos abiertos, marcos e infraestructura de IA avanzada para la IA física2. En el comunicado se destacaban nuevas tecnologías destinadas a agilizar los flujos de trabajo a lo largo de “todo el ciclo de vida del desarrollo de robots”.
“Ha llegado el momento ChatGPT a la robótica”, dijo Huang.
La versión incluye modelos mundiales abiertos y totalmente personalizables que permiten la generación de datos sintéticos basados físicamente y la evaluación de políticas de robots en simulación para IA física, un modelo de lenguaje de visión de razonamiento abierto y un modelo de acción de lenguaje de visión de razonamiento abierto. Esto vino acompañado de nuevos marcos de simulación y computación.
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
Imagine que el objetivo es entrenar una red de robots móviles (AMR) que puedan recoger de forma autónoma la basura de las aceras, los parques y las calles sin dañar a las personas ni a sí mismos. La tarea no se define simplemente como “recoger objetos”, sino como detectar basura entre lo que no es basura, navegar por entornos abarrotados, elegir caminos seguros, recoger objetos de forma y tamaño variables y otras preocupaciones.
Una vez definidos los objetivos, el robot debe diseñarse con la morfología adecuada. ¿Debería ser un robot humanoide o algo más? ¿Utiliza ruedas o patas? ¿Necesita una pinza que agarre los objetos o un sistema de vacío que los aspire? ¿Qué tipo de cámaras y sensores necesita para orientarse en su entorno?
Después, normalmente se crea un entorno simulado. Este entorno puede incluir terreno, basura, objetos aleatorios (rocas, bancos, vallas, etc.), personas, efectos de iluminación y diversas condiciones meteorológicas.
En este entorno de entrenamiento simulado, el modelo que rige el comportamiento del robot aprende el aspecto de la basura, desde botellas y latas hasta trozos de papel y pequeños envoltorios de caramelos. Aprende a mantener el equilibrio en terrenos irregulares y con vientos fuertes. Aprende a evitar mejor los choques con la gente y a agarrar las botellas de cristal con la fuerza suficiente para cogerlas pero no tanto como para hacerlas añicos.
Cada ejecución de entrenamiento cambia las cualidades de los componentes involucrados: trozos de basura más grandes, diferentes condiciones climáticas, más personas caminando. El robot “nunca ve dos veces la misma acera”.
Cuando el robot realiza correctamente una tarea definida, su comportamiento es “recompensado” con una puntuación alta, lo que refuerza los mejores comportamientos. A través de muchas iteraciones, el robot aprende a hacer su trabajo.
Una vez que el robot supera un determinado umbral de éxito, se implementa en un entorno de entrenamiento del mundo real, como una calle tranquila sin demasiada gente. El robot está programado para hacer frente a nuevas situaciones imprevistas que no se dieron en la simulación, como el viento que arrastra pequeños restos de basura.
Esta información se utiliza para mejorar el entorno de entrenamiento simulado para entrenamiento adicional. A continuación, el robot puede someterse a pruebas de estrés en entornos más complejos con multitudes densas, con poca iluminación o en superficies húmedas y resbaladizas.
El mecanismo de recompensa descrito anteriormente forma parte del aprendizaje por refuerzo, un tipo de proceso de machine learning en el que los agentes autónomos aprenden a tomar decisiones a partir de interacciones de prueba y error con su entorno. El aprendizaje por refuerzo es crucial para la robótica porque los agentes aprenden el comportamiento a través de la interacción a lo largo del tiempo, que es lo que deben hacer los robots en el mundo físico.
El mundo es desordenado: las superficies difieren, los objetos se deforman, los datos de los sensores son ruidosos y los humanos se comportan de forma impredecible. La escalabilidad no puede lograrse escribiendo reglas rígidas para cada situación. El aprendizaje por refuerzo permite a los robots descubrir estrategias por sí mismos experimentando dentro de las limitaciones. En lugar de que se le diga cómo moverse, el robot aprende qué comportamientos funcionan mejor en condiciones reales.
El aprendizaje por refuerzo sobresale donde otros métodos de machine learning fallan. Por ejemplo, agarrar basura implica acercarse a ella, alinear un manipulador, ajustar la fuerza y levantarla, todo ello mientras se responde al feedback en tiempo real. Los métodos de aprendizaje supervisado pueden, en teoría, describir cómo se ve un “buen agarre”, pero no pueden enseñar fácilmente cómo recuperarse de un resbalón o adaptarse a mitad del movimiento. El aprendizaje por refuerzo, en cambio, optimiza secuencias completas de acciones basándose en resultados a largo plazo.
Este es solo un ejemplo de cómo se podría entrenar un robot. Existen muchos otros métodos para los sistemas de IA física, como el aprendizaje supervisado y no supervisado, el aprendizaje por imitación y el aprendizaje por demostración (LfD).
El entrenamiento de la IA física funciona de forma diferente al entrenamiento de sistemas autónomos no físicos por varias razones.
Los datos son caros
La física es difícil
El tiempo es esencial
Apuestas reales
Mientras que los modelos de IA tradicionales se entrenan con conjuntos de datos estáticos, que incluyen texto, imágenes y audio, la IA física suele requerir datos de robots que interactúan con entornos reales. En el entrenamiento tradicional del machine learning, los datos se pueden recopilar, copiar y reutilizar fácilmente y a bajo coste. No es así con la IA física. Por lo general, no se puede simplemente “descargar un conjunto de datos”.
La recopilación de datos lleva tiempo. Cada punto de datos requiere que un robot mueva su cuerpo, manipule objetos o simplemente observe las cosas que suceden en su entorno en tiempo continuo. En el mundo real, las máquinas se estropean. Las juntas suelen fallar, lo que complica la recopilación de datos de entrenamiento fiables.
La IA física debe enfrentarse a la física. La gravedad, la fricción, la temperatura, el par motor, el equilibrio, la sincronización, el impulso, el desgaste, el ruido, el retraso... El mundo real es infinitamente complejo, y por eso los modelos que parecen perfectos en entornos simulados suelen fallar cuando se prueban sobre el terreno.
Para afrontar las incertidumbres y complejidades de la física, el entrenamiento podría incorporar modelos basados en la física o sistemas híbridos en los que unos algoritmos de control más sencillos garanticen la estabilidad y los modelos de aprendizaje se limiten a gestionar la percepción y la toma de decisiones.
Los sistemas físicos operan en tiempo continuo. En muchos casos de uso, se requieren bucles de feedback estrechos con latencia mínima entre la percepción, la decisión y la acción. Los pequeños retrasos pueden provocar fallos. A menudo, la velocidad es tan importante o incluso más importante que la precisión. En otros ámbitos de la IA, lo que se suele buscar es obtener el resultado más preciso, pero tener en cuenta la necesidad de velocidad supone un importante reto de ingeniería.
En la mayoría de los entornos de entrenamiento de IA, los errores son inofensivos y se descartan fácilmente. Pero en el mundo real, lo que está en juego es mucho. Si un LLM hace una predicción incorrecta en un entorno digital, un humano puede optar por actuar en consecuencia o no. En cambio, si un coche autónomo predice incorrectamente la velocidad del coche que tiene delante, los resultados pueden ser catastróficos. El entrenamiento suele implicar limitaciones y aumentos graduales de la autonomía, lo que a veces requiere supervisión humana y otras formas de monitorización.
Para abordar los inconvenientes anteriores, los investigadores dependen en gran medida de entornos simulados y datos sintéticos, generados por robots, a menudo virtuales, que interactúan con entornos virtuales.
El uso de modelos fundacionales mundiales (WFM) es cada vez más común en robótica. Un WFM es un potente sistema de IA que ha aprendido la dinámica del mundo físico (geometría, movimiento, física) a partir de grandes cantidades de datos del mundo real, lo que le permite generar escenarios realistas y conscientes de la física para entrenar la IA física.
Esta simulación implica a menudo la creación de un gemelo digital de un sistema o entorno, como una fábrica. En este espacio virtual, las máquinas autónomas realizan tareas, generando datos sintéticos sobre el rendimiento de estas máquinas en el espacio virtual.
Técnicas como la aleatorización de dominios, en la que las características de los entornos simulados se generan intencionadamente de formas aleatorias muy diversas, pueden ayudar a producir datos sintéticos más útiles, lo que da lugar a modelos más robustos capaces de trasladar sus capacidades a una realidad compleja y muy variable. Sin embargo, confiar demasiado en los datos sintéticos puede llevar a un sobreajuste.
Permita a los desarrolladores crear, implementar y monitorizar agentes de IA con el estudio IBM watsonx.ai.
Cree una productividad sin precedentes con uno de los conjuntos de capacidades más completos del sector para ayudar a las empresas a crear, personalizar y gestionar agentes y asistentes de IA.
Ahorre más de un 90 % en costes con los modelos más pequeños y abiertos de Granite, diseñados para la eficiencia de los desarrolladores. Estos modelos listos para uso empresarial ofrecen un rendimiento excepcional frente a los puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde la ciberseguridad hasta RAG.
Jensen Huang. Entrevista en el podcast de enero de 2026 (vídeo). No Priors: AI, Machine Learning, Tech, & Startups. YouTube.com. 8 de enero de 2026.
NVIDIA Newsroom: NVIDIA Releases New Physical AI Models as Global Partners Unveil Next-Generation Robots. Nvidia.com. 5 de enero de 2026.