Inicio topics ¿Qué es el deep learning? ¿Qué es el deep learning?
Deep learning intenta imitar el cerebro humano, aunque está lejos de igualar su capacidad, permitiendo a los sistemas agrupar datos y hacer predicciones con una precisión increíble
Fondo degradado negro y azul
¿Qué es el deep learning?

El deep learning es un subconjunto del machine learning, que es esencialmente una red neuronal con tres o más capas. Estas redes neuronales intentan simular el comportamiento del cerebro humano, aunque lejos de igualar su capacidad, lo que les permite "aprender" de grandes cantidades de datos. Si bien una red neuronal de una sola capa puede aun así realizar predicciones aproximadas, las capas ocultas adicionales ayudan a optimizar y refinar la precisión.

Deep learning impulsa muchas aplicaciones y servicios de inteligencia artificial (IA) que mejoran la automatización, realizando tareas analíticas y físicas sin intervención humana. La tecnología de deep learning se encuentra detrás de los productos y servicios cotidianos (como los asistentes digitales, los controles remotos de TV habilitados por voz y la detección de fraudes con tarjetas de crédito), así como de las tecnologías emergentes (como los vehículos autónomos).

Deep learning frente a machine learning

Si deep learning es un subconjunto de machine learning, ¿en qué se diferencian? Deep learning se distingue del machine learning clásico por el tipo de datos con los que trabaja y los métodos con los que aprende.

Los algoritmos de machine learning aprovechan los datos estructurados y clasificados para realizar predicciones, lo que significa que las características específicas se definen a partir de los datos de entrada para el modelo y se organizan en tablas. Esto no significa necesariamente que no utilice datos no estructurados. Solo significa que si lo hace, generalmente pasan por un procesamiento previo para organizarlos en un formato estructurado.

Deep learning elimina parte del procesamiento previo de datos que normalmente conlleva el machine learning. Estos algoritmos pueden ingerir y procesar datos no estructurados, como texto e imágenes, lo que automatiza la extracción de características, eliminando parte de la dependencia de los expertos humanos. Por ejemplo, digamos que tenemos un conjunto de fotos de diferentes mascotas y queremos clasificarlas en las categorías "gato", "perro", "hámster", etc. Los algoritmos del deep learning pueden determinar qué características (por ejemplo, orejas) son más importantes para distinguir a un animal de otro. En machine learning, esta jerarquía de características la establece manualmente un experto humano.

Luego, a través de los procesos de descenso de gradiente y retropropagación, el algoritmo de deep learning se ajusta y adapta para obtener precisión, lo que le permite hacer predicciones sobre la foto de un animal nuevo con mayor exactitud.  

Los modelos de machine learning y de deep learning también son capaces de diferentes tipos de aprendizaje, que generalmente se clasifican como aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado. El aprendizaje supervisado utiliza conjuntos de datos etiquetados para categorizar o hacer predicciones. Esto requiere algún tipo de intervención humana para garantizar que los datos de entrada sean etiquetados correctamente. Por el contrario, el aprendizaje no supervisado no requiere conjuntos de datos etiquetados y, en cambio, detecta patrones en los datos y los agrupa según sus características distintivas. El aprendizaje reforzado es un proceso en el que un modelo aprende a ser más preciso para realizar una acción en un entorno basado en la retroalimentación con el fin de maximizar la recompensa.

Para profundizar en las diferencias matizadas entre las diferentes tecnologías, consulte "IA frente a machine learning frente a deep learning frente a redes neuronales: ¿cuál es la diferencia?"

Para ver más de cerca las diferencias específicas entre el aprendizaje supervisado y no supervisado, consulte "Aprendizaje supervisado frente a no supervisado: ¿cuál es la diferencia?"

Cómo funciona el deep learning

Las redes neuronales de deep learning, o redes neuronales artificiales, intentan imitar el cerebro humano mediante una combinación de entradas de datos, pesos y sesgos. Estos elementos funcionan juntos para reconocer, clasificar y describir con precisión los objetos dentro de los datos.

Las redes neuronales profundas constan de múltiples capas de nodos interconectados, cada uno de los cuales se basa en la capa anterior para refinar y optimizar la predicción o categorización. Esta progresión de cálculos a través de la red se denomina propagación directa. Las capas de entrada y salida de una red neuronal profunda se denominan capas visibles.  La capa de entrada es donde el modelo de deep learning ingiere los datos para su procesamiento, y la capa de salida es donde se realiza la predicción o clasificación final.

Otro proceso llamado retropropagación usa algoritmos, como  el descenso de gradiente, para calcular errores en las predicciones y luego ajusta los pesos y sesgos de la función moviéndose hacia atrás a través de las capas con el objetivo de entrenar el modelo. Juntas, la propagación directa y la retropropagación permiten que una red neuronal haga predicciones y corrija los errores según corresponda. Con el tiempo, el algoritmo se vuelve gradualmente más preciso.

Lo anterior describe el tipo más simple de red neuronal profunda en los términos más sencillos. Sin embargo, los algoritmos del deep learning son sumamente complejos y existen diferentes tipos de redes neuronales para abordar problemas o conjuntos de datos específicos. Por ejemplo,

  • Las redes neuronales convolucionales (CNN), utilizadas principalmente en aplicaciones de clasificación de imágenes y visión artificial, pueden detectar características y patrones dentro de una imagen, lo que permite tareas como la detección o el reconocimiento de objetos. En 2015, una CNN superó a un humano en un desafío de reconocimiento de objetos por primera vez.
  • Las redes neuronales recurrentes (RNN) se utilizan normalmente en aplicaciones de reconocimiento de voz y lenguaje natural, ya que aprovechan los datos secuenciales o de series temporales.
Aplicaciones de deep learning

Las aplicaciones de deep learning en el mundo real son parte de nuestra vida diaria, pero en la mayoría de los casos, están tan bien integradas a los productos y servicios que los usuarios no son conscientes del complejo procesamiento de datos que se ejecuta en segundo plano. Entre estas tareas se incluyen las siguientes:

Seguridad pública
 

Los algoritmos del deep learning pueden analizar y aprender de los datos transaccionales para identificar patrones peligrosos que indican una posible actividad fraudulenta o delictiva. El reconocimiento de voz, la visión artificial y otras aplicaciones del deep learning pueden mejorar la eficiencia y efectividad del análisis de investigación al extraer patrones y evidencia de grabaciones de sonido y video, imágenes y documentos, lo que ayuda a las fuerzas del orden a analizar grandes cantidades de datos de manera más rápida y precisa.

Servicios financieros
 

Las instituciones financieras utilizan con frecuencia analítica predictiva para impulsar la negociación algorítmica de acciones, evaluar los riesgos comerciales para la aprobación de préstamos, detectar fraudes y ayudar a administrar las carteras de crédito e inversión de los clientes.

Servicio al cliente
 

Muchas organizaciones incorporan tecnología de deep learning en sus procesos de servicio al cliente. Los chatbots, usados en diversas aplicaciones, servicios y portales de servicio al cliente, son una forma sencilla de IA. Los chatbots tradicionales utilizan el lenguaje natural e incluso el reconocimiento visual, que se encuentra comúnmente en los menús similares a los de los centros de atención telefónica. Sin embargo, las soluciones de chatbot más sofisticadas intentan determinar, a través del aprendizaje, si hay múltiples respuestas a preguntas ambiguas. Según las respuestas que recibe, el chatbot intenta responder estas preguntas directamente o transferir la conversación a un usuario humano.

Los asistentes virtuales como Siri de Apple, Amazon Alexa o Google Assistant amplían la idea de un chatbot al habilitar la funcionalidad de reconocimiento de voz. Esto crea un nuevo método para involucrar a los usuarios de forma personalizada.

Cuidado de la salud
 

La industria de la salud se ha beneficiado enormemente de las funcionalidades del deep learning desde que se digitalizaron los registros e imágenes de los hospitales. Las aplicaciones de reconocimiento de imágenes pueden respaldar el trabajo de los especialistas en diagnóstico por imágenes y los radiólogos, ayudándolos a analizar y evaluar más imágenes en menos tiempo.

Requisitos de hardware del deep learning

Deep learning requiere una enorme cantidad de potencia informática. Las unidades de procesamiento gráfico (GPU) de alto rendimiento son ideales porque pueden manejar un gran volumen de cálculos en múltiples núcleos con abundante memoria disponible. Sin embargo, administrar varias GPU en las instalaciones puede crear una gran demanda de recursos internos y su escalado puede ser sumamente costoso.

Soluciones relacionadas
IBM Watson es IA para empresas más inteligentes

Watson es un portafolio de herramientas, aplicaciones y soluciones listas para el negocio, diseñadas para reducir los costos y los obstáculos de la adopción de IA, además de optimizar los resultados y el uso responsable de la IA.

Explore IBM Watson: IA para negocios más inteligentes
Watson Assistant: chatbot con IA

Watson Assistant es el chatbot con IA para empresas. Esta tecnología de inteligencia artificial empresarial permite a los usuarios crear soluciones de inteligencia artificial conversacional.

Explore Watson Assistant
Watson Studio

Cree, ejecute y gestione modelos de IA. Prepare datos y cree modelos en cualquier nube utilizando código fuente abierto o modelado visual. Prevea y optimice sus resultados.

Explore Watson Studio
Recursos E-book de inteligencia artificial Una introducción al deep learning

Explore esta rama del machine learning que se entrena con grandes cantidades de datos y procesa unidades computacionales que trabajan en conjunto para realizar predicciones

Arquitecturas de deep learning

El auge de la inteligencia artificial

Dé el siguiente paso

Durante décadas, IBM ha sido pionera en el desarrollo de tecnologías de inteligencia artificial y deep learning, entre las que se destaca el desarrollo de IBM Watson, el chatbot con IA de IBM. Watson, uno de los primeros logros en la tecnología de deep learning, es hoy una solución confiable para las empresas que buscan aplicar técnicas avanzadas de procesamiento de lenguaje natural y machine learning a sus sistemas utilizando un enfoque por niveles comprobado para la adopción e implementación de IA.

Comience a utilizar IBM Watson® Studio hoy mismo