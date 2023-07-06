Estos términos informáticos a menudo se usan indistintamente, pero ¿qué diferencias hacen que cada tecnología sea única?
La tecnología se está integrando cada vez más en nuestra vida diaria. Para seguir el ritmo de las expectativas de los consumidores, las empresas confían más en los algoritmos de machine learning para facilitar las cosas. Puede ver su aplicación en las redes sociales (a través del reconocimiento de objetos en fotos) o al hablar directamente con dispositivos (como Alexa o Siri).
Si bien la inteligencia artificial (IA), el machine learning (ML), el aprendizaje profundo y las redes neuronales son tecnologías relacionadas, los términos a menudo se usan indistintamente, lo que a menudo genera confusión sobre sus diferencias. Esta entrada en el blog aclara parte de la ambigüedad.
La forma más fácil de pensar en IA, machine learning, aprendizaje profundo y redes neuronales es como una serie de sistemas de IA de mayor a menor, cada uno de los cuales abarca al siguiente.
La IA es el sistema general. El machine learning es un subconjunto de la IA. El aprendizaje profundo es un subcampo del machine learning, y las redes neuronales constituyen la columna vertebral de los algoritmos de aprendizaje profundo. Es la cantidad de capas de nodos, o profundidad, de redes neuronales que distinguen una única red neuronal de un algoritmo de aprendizaje profundo, que debe tener más de tres.
La inteligencia artificial o IA, el término más amplio de los tres, se utiliza para clasificar las máquinas que imitan la inteligencia humana y las funciones cognitivas humanas, como la resolución de problemas y el aprendizaje. La IA utiliza predicciones y automatización para optimizar y resolver tareas complejas que los humanos han realizado históricamente, como el reconocimiento facial y de voz, la toma de decisiones y la traducción.
Las tres categorías principales de IA son:
La ANI se considera IA "débil", mientras que los otros dos tipos se clasifican como IA "fuerte". Definimos la IA débil por su capacidad para completar una tarea específica, como ganar un juego de ajedrez o identificar a una persona en particular en una serie de fotos. El procesamiento de lenguaje natural y la visión artificial, que permiten a las empresas automatizar tareas y respaldar chatbots y asistentes virtuales como Siri y Alexa, son ejemplos de ANI. La visión artificial es un factor en el desarrollo de automóviles autónomos.
Las formas más fuertes de IA, como AGI y ASI, incorporan comportamientos humanos de manera más prominente, como la capacidad de interpretar el tono y la emoción. La IA fuerte se define por su capacidad en comparación con los humanos. La AGI funcionaría a la par con otro humano, mientras que ASI, también conocida como superinteligencia, superaría la inteligencia y la capacidad de un humano. Aún no existe ninguna forma de IA fuerte, pero la investigación en este campo está en curso.
Un número cada vez mayor de empresas, alrededor del 35 % a nivel mundial, utiliza IA, y otro 42 % está explorando la tecnología. El desarrollo de la IA generativa, que utiliza potentes modelos fundacionales que se entrenan con grandes cantidades de datos sin etiquetar, puede adaptarse a nuevos casos de uso y aportar flexibilidad y escalabilidad que probablemente aceleren significativamente la adopción de la IA. En las primeras pruebas, IBM ha observado que la IA generativa aporta el tiempo de creación de valor hasta un 70 % más rápido que la IA tradicional.
Ya sea que utilice aplicaciones basadas en machine learning (ML) o modelos fundacionales, la IA puede dar a su empresa una ventaja competitiva. La integración de modelos de IA personalizados en sus flujos de trabajo y sistemas, y la automatización de funciones como la atención al cliente, la gestión de la cadena de suministro y la ciberseguridad, pueden ayudar a una empresa a cumplir con las expectativas de los clientes, tanto hoy como a medida que aumenten en el futuro.
La clave es identificar los conjuntos de datos correctos desde el principio para ayudar a garantizar que utiliza datos de calidad para lograr la ventaja competitiva más sustancial. También deberá crear una arquitectura híbrida preparada para la IA que pueda utilizar con éxito los datos dondequiera que se encuentren, en mainframes, centros de datos, nubes privadas y nubes públicas y en el borde.
Su IA debe ser confiable porque cualquier cosa menos significa arriesgarse a dañar la reputación de una empresa y generar multas regulatorias. Los modelos engañosos y los que contienen sesgos o alucinaciones pueden tener un alto costo para la privacidad, los derechos de datos y la confianza de los clientes. Su IA debe ser explicable, justa y transparente.
El machine learning es un subconjunto de la IA que permite la optimización. Cuando se configura correctamente, le ayuda a hacer predicciones que minimizan los errores que surgen de simplemente adivinar. Por ejemplo, empresas como Amazon utilizan el machine learning para recomendar productos a un cliente específico en función de lo que han visto y comprado antes.
El machine learning clásico o "no profundo" depende de la intervención humana para permitir que un sistema informático identifique patrones, aprenda, realice tareas específicas y proporcione resultados precisos. Los expertos humanos determinan la jerarquía de características para comprender las diferencias entre las entradas de datos, que generalmente requieren datos más estructurados para aprender.
Por ejemplo, supongamos que le mostré una serie de imágenes de diferentes tipos de comida rápida: "pizza", "hamburguesa" y "taco". Un experto humano que trabaja en esas imágenes determinaría las características que distinguen cada imagen como un tipo específico de comida rápida. El pan en cada tipo de alimento podría ser una característica distintiva. Alternativamente, podrían usar etiquetas, como “pizza”, “hamburguesa” o “taco” para agilizar el proceso de aprendizaje a través del aprendizaje supervisado.
Si bien el subconjunto de IA llamado machine learning profundo puede aprovechar conjuntos de datos etiquetados para informar su algoritmo en el aprendizaje supervisado, no necesariamente requiere un conjunto de datos etiquetados. Puede ingerir datos no estructurados en su forma sin procesar (por ejemplo, texto, imágenes) y puede determinar automáticamente el conjunto de características que distinguen "pizza", "hamburguesa" y "taco" entre sí. A medida que generamos más big data, los científicos de datos utilizan más el machine learning. Para profundizar en las diferencias entre estos enfoques, consulte Aprendizaje supervisado frente a aprendizaje no supervisado: ¿cuál es la diferencia?
Una tercera categoría de machine learning es el aprendizaje por refuerzo, en el que una computadora aprende interactuando con su entorno y obteniendo feedback (recompensas o penalizaciones) por sus acciones. Y el aprendizaje en línea es un tipo de ML en el que un científico de datos actualiza el modelo de ML a medida que hay nuevos datos disponibles.
Para aprender más sobre el machine learning, vea el siguiente video:
Como explica nuestro artículo sobre aprendizaje profundo, el aprendizaje profundo es un subconjunto del machine learning. La principal diferencia entre machine learning y aprendizaje profundo es cómo aprende cada algoritmo y cuántos datos utiliza cada tipo de algoritmo.
El aprendizaje profundo automatiza gran parte de la extracción de características del proceso, eliminando parte de la intervención humana manual requerida. También permite el uso de grandes conjuntos de datos, lo que le valió el título de machine learning escalable. Esa capacidad es emocionante a medida que exploramos más a fondo el uso de datos no estructurados, especialmente porque se estima que más del 80 % de los datos de una organización no están estructurados.
La observación de patrones en los datos permite que un modelo de aprendizaje profundo agrupe las entradas de manera adecuada. Tomando el mismo ejemplo anterior, podríamos agrupar imágenes de pizzas, hamburguesas y tacos en sus respectivas categories en función de las similitudes o diferencias identificadas en las imágenes. Un modelo de aprendizaje profundo requiere más puntos de datos para mejorar la precisión, mientras que un modelo de machine learning se basa en menos datos dada su estructura de datos subyacente. Las empresas suelen utilizar el aprendizaje profundo para tareas más complejas, como asistentes virtuales o detección de fraudes.
Las redes neuronales, también llamadas redes neuronales artificiales o redes neuronales simuladas, son un subconjunto del machine learning y son la columna vertebral de los algoritmos de aprendizaje profundo. Se llaman "neuronales" porque imitan la forma en que las neuronas del cerebro se señalan entre sí.
Las redes neuronales se componen de capas de nodos, una capa de entrada, una o más capas ocultas y una capa de resultados. Cada nodo es una neurona artificial que se conecta a la siguiente, y cada una tiene un peso y un valor umbral. Cuando la salida de un nodo está por encima del valor umbral, ese nodo se activa y envía sus datos a la siguiente capa de la red. Si está por debajo del umbral, no se transmiten datos.
Los datos de entrenamiento enseñan redes neuronales y ayudan a mejorar su precisión con el tiempo. Una vez que los algoritmos de aprendizaje se ajustan, se convierten en poderosas herramientas informáticas y de IA porque nos permiten clasificar y agrupar rápidamente datos en clúster. Mediante el uso de redes neuronales, reconocimiento de voz e imágenes, las tareas pueden realizarse en minutos en lugar de las horas que llevan cuando se realizan manualmente. El algoritmo de búsqueda de Google es un ejemplo bien conocido de redes neuronales.
Como se mencionó en la explicación de las redes neuronales anteriormente, pero vale la pena señalarlo de manera más explícita, lo "profundo" en el aprendizaje profundo se refiere a la profundidad de las capas en una red neuronal. Una red neuronal de más de tres capas, incluidas las entradas y los resultados, puede considerarse un algoritmo de aprendizaje profundo. Esto se puede representar mediante el siguiente diagrama:
La mayoría de las redes neuronales profundas son de progresión, lo que significa que solo fluyen en una dirección desde la entrada hasta los resultados. Sin embargo, también puede entrenar su modelo a través de la retropropagación, lo que significa moverse en la dirección opuesta, de salida a entrada. La retropropagación nos permite calcular y atribuir el error asociado a cada neurona, lo que nos permite ajustar y ajustar el algoritmo adecuadamente.
Si bien todas estas áreas de la IA pueden ayudar a optimizar áreas de su negocio y mejorar la experiencia del cliente, lograr los objetivos de la IA puede ser un desafío porque primero deberá asegurarse de tener los sistemas adecuados para construir algoritmos de aprendizaje para administrar sus datos. La gestión de datos es más que simplemente crear los modelos que utiliza para su negocio. Necesita un lugar para almacenar sus datos y mecanismos para limpiarlos y controlar los sesgos antes de poder comenzar a construir cualquier cosa.
En IBM estamos combinando el poder del machine learning y la IA en nuestro nuevo estudio para modelos fundacionales, IA generativa y machine learning, IBM® watsonx.ai.
