El modelado mediante machine learning existe debido a la incertidumbre. Si pudiéramos correlacionar perfectamente las entradas con las salidas, no serían necesarios los modelos. Pero los datos del mundo real son desordenados, incompletos y ruidosos, por lo que modelamos probabilidades en lugar de certezas. Aprender sobre probabilidades sienta las bases de todo lo relacionado con el machine learning y la inteligencia artificial (IA). Las teorías de las probabilidades nos permiten comprender los datos que utilizamos para modelar de una manera hermosa y elegante. Desempeña un papel crítico en el modelado de incertidumbres en las predicciones de los modelos de ML. Nos ayuda a cuantificar la probabilidad, la probabilidad y las certezas de un modelo estadístico para que podamos medir con confianza los modelos de resultados que creamos. Sumergirse en el mundo de las probabilidades y aprender los fundamentos le ayudará a comprender la base de todos los modelos de aprendizaje estadístico y cómo se realizan sus predicciones. Aprenderá cómo podemos hacer inferencias y producir resultados probabilísticos.
Para aprender las distribuciones populares y modelar sus datos con confianza, vayamos a lo básico y aclaremos algunas terminologías.
Variable aleatoria: representación numérica del resultado de un fenómeno aleatorio. Es una variable cuyos valores posibles son resultados numéricos de un proceso aleatorio.
Variable aleatoria discreta: una variable aleatoria que puede tomar un número finito o infinito contable de valores distintos. Por ejemplo, el resultado de un lanzamiento de moneda (cara = 1, cruz = 0) o el número de correos electrónicos no deseados recibidos en una hora.
Variable aleatoria continua: una variable aleatoria que puede tomar cualquier valor dentro de un rango determinado. Por ejemplo, la altura de una persona, la temperatura en una habitación o la cantidad de lluvia.
Evento: conjunto de uno o más resultados de un proceso aleatorio. Por ejemplo, lanzar un número par en un dado (resultados: 2, 4, 6) o la pérdida de clientes.
Resultado: un único resultado posible de un experimento aleatorio. Por ejemplo, al lanzar una moneda al aire, el resultado es "cara" o "cruz".
Probabilidad : Una medida numérica de la probabilidad de que un evento ocurra, que van de 0 (imposible) a 1 (seguro).
Probabilidad condicional : La probabilidad de que el evento ocurra, dado que este ya ha tenido lugar previamente. Este paso es crucial en el ML, ya que a menudo queremos predecir un resultado dadas características específicas.
La probabilidad es una medida de la probabilidad de que ocurra un evento, de 0 (imposible) a 1 (seguro).
En el machine learning, esto suele adoptar la forma de probabilidad condicional
Ejemplo: un modelo de regresión logística podría decir
> "Dada la edad = 45 años, los ingresos = 60 000 dólares y el historial previo,
> la probabilidad de abandono es del 0,82".
Este ejemplo no significa que el cliente abandonará, es una creencia basada en los patrones estadísticos de los datos de entrenamiento.
En la era moderna de la IA generativa, los modelos probabilísticos, como la regresión, desempeñan un papel muy importante a la hora de determinar los Resultados y el output de un modelo. Este papel suele adoptar la forma de una función de activación en las capas de las redes neuronales.