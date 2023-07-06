Estos términos informáticos suelen utilizarse indistintamente, pero ¿qué diferencias hacen que cada uno sea una tecnología única?
La tecnología está cada vez más integrada en nuestra vida cotidiana. Para seguir el ritmo de las expectativas de los consumidores, las empresas confían cada vez más en los algoritmos de machine learning para facilitar las cosas. Puede ver su aplicación en las redes sociales (a través del reconocimiento de objetos en fotos) o al hablar directamente con dispositivos (como Alexa o Siri).
Aunque la inteligencia artificial (IA), el machine learning (ML), el deep learning y las redes neuronales son tecnologías relacionadas, los términos suelen utilizarse indistintamente, lo que a menudo genera confusión sobre sus diferencias. Esta entrada de blog aclara parte de la ambigüedad.
La forma más fácil de pensar en la IA, el machine learning, el deep learning y las redes neuronales es pensar en ellos como una serie de sistemas de IA de mayor a menor, cada uno de los cuales abarca al siguiente.
La IA es el sistema global. El machine learning es un subconjunto de la IA. El deep learning es un subconjunto del machine learning, y las redes neuronales constituyen la columna vertebral de los algoritmos de deep learning. El número de capas de nodos, o profundidad, de las redes neuronales es lo que distingue una red neuronal simple de un algoritmo de deep learning, que debe tener más de tres.
La inteligencia artificial o IA, el término más amplio de los tres, se utiliza para clasificar las máquinas que imitan la inteligencia humana y las funciones cognitivas humanas, como la resolución de problemas y el aprendizaje. La IA utiliza predicciones y automatización para optimizar y resolver tareas complejas que los humanos han realizado históricamente, como el reconocimiento facial y de voz, la toma de decisiones y la traducción.
Las tres categorías principales de IA son:
La IA se considera IA "débil", mientras que los otros dos tipos se clasifican como IA "fuerte". Definimos la IA débil por su capacidad para completar una tarea específica, como ganar una partida de ajedrez o identificar a un individuo concreto en una serie de fotos. El procesamiento del lenguaje natural y la visión artificial, que permiten a las empresas automatizar tareas y respaldar chatbots y asistentes virtuales como Siri y Alexa, son ejemplos de ANI. La visión artificial es un factor en el desarrollo de los coches autónomos.
Las formas más fuertes de IA, como AGI y ASI, incorporan comportamientos humanos de manera más prominente, como la capacidad de interpretar el tono y la emoción. La IA fuerte se define por su capacidad en comparación con los humanos. La AGI funcionaría a la par que otro humano, mientras que la ASI, también conocida como superinteligencia, superaría la inteligencia y la capacidad de un humano. Todavía no existe ninguna forma de IA fuerte, pero la investigación en este campo está en curso.
Un número cada vez mayor de empresas, alrededor del 35 % en todo el mundo, utiliza la IA, y otro 42 % está explorando la tecnología. El desarrollo de la IA generativa, que utiliza potentes modelos fundacionales que se entrenan con grandes cantidades de datos sin etiquetar, puede adaptarse a nuevos casos de uso y aportar una flexibilidad y escalabilidad que probablemente acelere significativamente la adopción de la IA. En las primeras pruebas, IBM ha observado que la IA generativa aporta el tiempo de obtención de valor hasta un 70 % más rápido que la IA tradicional.
Tanto si utiliza aplicaciones de IA basadas en ML como en modelos fundacionales, la IA puede aportar a su empresa una ventaja competitiva. La integración de modelos de IA personalizados en sus flujos de trabajo y sistemas, y la automatización de funciones como el servicio de atención al cliente, la gestión de la cadena de suministro y la ciberseguridad, pueden ayudar a una empresa a cumplir con las expectativas de los clientes, tanto hoy como a medida que aumenten en el futuro.
La clave es identificar los conjuntos de datos correctos desde el principio para garantizar que utiliza datos de calidad para lograr la ventaja competitiva más sustancial. También deberá crear una arquitectura híbrida preparada para la IA que pueda utilizar con éxito los datos dondequiera que se encuentren, en mainframes, centro de datos, nube pública y privada y en el edge.
Su IA debe ser fiable porque cualquier cosa menos significa arriesgarse a dañar la reputación de una empresa y acarrear multas reglamentarias. Los modelos engañosos y los que contienen sesgos o alucinaciones pueden tener un alto coste para la privacidad, los derechos de los datos y la confianza de los clientes. Su IA debe ser explicable, justa y transparente.
El machine learning es un subconjunto de la IA que permite la optimización. Cuando se configura correctamente, le ayuda a hacer predicciones que minimizan los errores que surgen de las meras conjeturas. Por ejemplo, empresas como Amazon utilizan el machine learning para recomendar productos a un cliente específico en función de lo que han visto y comprado antes.
El machine learning clásico o "nondeep" depende de la intervención humana para permitir que un sistema informático identifique patrones, aprenda, realice tareas específicas y proporcione resultados precisos. Los expertos humanos determinan la jerarquía de características para comprender las diferencias entre las entradas de datos, lo que suele requerir datos más estructurados para aprender.
Por ejemplo, supongamos que le he mostrado una serie de imágenes de diferentes tipos de comida rápida: "pizza", "hamburguesa" y "taco". Un experto humano que trabajara con esas imágenes determinaría las características que distinguen cada imagen como un tipo específico de comida rápida. El pan de cada tipo de alimento puede ser una característica distintiva. Como alternativa, pueden utilizar etiquetas como "pizza", "hamburguesa" o "taco" para agilizar el proceso de aprendizaje mediante el aprendizaje supervisado.
Aunque el subconjunto de IA denominado deep machine learning puede aprovechar conjuntos de datos etiquetados para informar su algoritmo en el aprendizaje supervisado, no requiere necesariamente un conjunto de datos etiquetados. Puede consumir datos no estructurados en su forma sin procesar (por ejemplo, texto, imágenes) y puede determinar automáticamente el conjunto de características que distinguen "pizza", "hamburguesa" y "taco" entre sí. A medida que generamos más big data, los científicos de datos utilizan más el machine learning. Para profundizar en las diferencias entre estos enfoques, consulte Aprendizaje supervisado frente a aprendizaje no supervisado: ¿cuál es la diferencia?
Una tercera categoría de machine learning es el aprendizaje por refuerzo, en el que un ordenador aprende interactuando con su entorno y obteniendo comentarios (recompensas o penalizaciones) por sus acciones. Y el aprendizaje en línea es un tipo de ML (machine learning) en el que un científico de datos actualiza el modelo de ML a medida que hay nuevos datos disponibles.
Para obtener más información sobre el machine learning, consulte el siguiente vídeo:
Como explica nuestro artículo sobre deep learning, el deep learning es un subconjunto del machine learning. La principal diferencia entre el machine learning y el deep learning es cómo aprende cada algoritmo y cuántos datos utiliza cada tipo de algoritmo.
El deep learning automatiza gran parte de la extracción de características del proceso, eliminando parte de la intervención humana manual necesaria. También permite el uso de grandes conjuntos de datos, lo que le ha valido el título de machine learning escalable. Esa capacidad es emocionante a medida que exploramos más a fondo el uso de datos no estructurados, sobre todo porque se estima que más del 80 % de los datos de una organización no están estructurados.
La observación de patrones en los datos permite que un modelo de deep learning clúster las entradas adecuadamente. Tomando el mismo ejemplo anterior, podríamos agrupar imágenes de pizzas, hamburguesas y tacos en sus respectivas categorías en función de las similitudes o diferencias identificadas en las imágenes. Un modelo de deep learning requiere más puntos de datos para mejorar la precisión, mientras que un modelo de machine learning se basa en menos datos dada su estructura de datos subyacente. Las empresas suelen utilizar el deep learning para tareas más complejas, como asistentes virtuales o detección de fraudes.
Las redes neuronals, también llamadas redes neuronales artificiales o redes neuronales simuladas, son un subconjunto del machine learning y son la columna vertebral de los algoritmos de deep learning. Se llaman "neuronales" porque imitan la forma en que las neuronas del cerebro se señalan entre sí.
Las redes neuronales se componen de capas de nodos, una capa de entrada, una o más capas ocultas y una capa de output. Cada nodo es una neurona artificial que se conecta a la siguiente, y cada uno tiene un peso y un valor umbral. Cuando el output de un nodo está por encima del valor umbral, ese nodo se activa y envía sus datos a la siguiente capa de la red. Si está por debajo del umbral, no se transfieren datos.
Los datos de entrenamiento enseñan redes neuronales y ayudan a mejorar su precisión con el tiempo. Una vez que los algoritmos de aprendizaje están ajustados, se convierten en potentes herramientas informáticas y de IA porque nos permiten clasificar y clúster rápidamente datos. Mediante el uso de redes neuronales, las tareas de reconocimiento de voz e imágenes pueden realizarse en minutos en lugar de las horas que tardan cuando se realizan manualmente. El algoritmo de búsqueda de Google es un ejemplo bien conocido de redes neuronales.
Como ya se ha mencionado en la explicación de las redes neuronales, pero vale la pena señalarlo de manera más explícita, lo "deep" en el deep learning se refiere a la profundidad de las capas en una red neuronal. Una red neuronal de más de tres capas, incluidas las entradas y el output, puede considerarse un algoritmo de deep learning. Esto se puede representar mediante el siguiente diagrama:
La mayoría de las redes neuronales profundas son feed-forward, lo que significa que solo fluyen en una dirección de entrada a output. Sin embargo, también puede entrenar su modelo mediante retropropagación, es decir, moverse en la dirección opuesta, de output a entrada. La retropropagación nos permite calcular y atribuir el error asociado a cada neurona, lo que nos permite ajustar el algoritmo adecuadamente.
Si bien todas estas áreas de la IA pueden ayudar a racionalizar áreas de su negocio y mejorar la experiencia del cliente, alcanzar los objetivos de la IA puede ser un desafío porque primero deberá asegurarse de contar con los sistemas adecuados para construir algoritmos de aprendizaje para administrar sus datos. La gestión de datos es más que simplemente crear los modelos que utiliza para su negocio. Necesita un lugar para almacenar sus datos y mecanismos para limpiarlos y controlar el sesgo antes de poder comenzar a construir cualquier cosa.
En IBM estamos combinando el poder del machine learning y la IA en nuestro nuevo estudio para modelos fundacionales, IA generativa y machine learning, IBM® watsonx.ai.
