El machine learning ha llegado a dominar el campo de la IA, constituyendo la columna vertebral de la mayoría de los sistemas modernos, desde modelos de previsión hasta vehículos autónomos, pasando por modelos de lenguaje de gran tamaño (LLM) y otras herramientas de IA generativa.

La premisa central del ML es que si se optimiza el rendimiento de un modelo en un conjunto de datos de tareas que se asemejan adecuadamente a los problemas del mundo real para los que se utilizará, a través de un proceso llamado entrenamiento de modelos, el modelo puede hacer predicciones precisas sobre los nuevos datos que ve en su caso de uso final.

El entrenamiento es simplemente un medio para alcanzar un fin: la generalización, es decir, la capacidad de traducir un buen rendimiento en los datos de entrenamiento en resultados útiles en escenarios del mundo real. Este es el objetivo fundamental del machine learning. En esencia, un modelo entrenado aplica patrones que aprendió de los datos de entrenamiento para inferir el output correcto para una tarea del mundo real: la implementación de un modelo de IA es por lo tanto llamada inferencia de IA.

El deep learning, el subconjunto del machine learning impulsado por grandes redes neuronales artificiales, o más bien "profundas", ha surgido en las últimas décadas como la arquitectura de modelos de IA de última generación en casi todos los dominios en los que se utiliza la IA. A diferencia de los algoritmos explícitamente definidos del machine learning tradicional, el deep learning se basa en "redes" distribuidas de operaciones matemáticas que le confieren una capacidad sin igual para aprender los matices intrincados de datos muy complejos. Dado que el deep learning requiere cantidades muy grandes de datos y recursos computacionales, su llegada ha coincidido con la creciente importancia del "big data" y las unidades de procesamiento gráfico (GPU).

La disciplina del machine learning está estrechamente entrelazada con la de la ciencia de datos. En cierto sentido, el machine learning puede entenderse como una colección de algoritmos y técnicas para automatizar el análisis de datos y (lo que es más importante) aplicar los aprendizajes de ese análisis a la ejecución autónoma de tareas relevantes.

Aunque el concepto central no se le atribuye a él, sí se le suele atribuir el origen del término. En 1959, publicó en la revista IBM Journal el artículo "Some Studies in Machine Learning Using the Game of Checkers" ("Algunos estudios sobre el machine learning utilizando el juego de damas"). En la introducción del artículo, Samuel articula claramente el resultado ideal del machine learning: "un ordenador puede programarse para que aprenda a jugar mejor a las damas que la propia persona que escribió el programa".1