Deep learning

menu icon

Deep learning

El deep learning intenta emular el cerebro humano —aunque queda lejos de poder igualarse en capacidades— con el fin de permitir que los sistemas agrupen datos y realicen predicciones con una precisión increíble.

¿Qué es el deep learning?

El deep learning es un subconjunto del machine learning que consiste básicamente en una red neuronal con tres o más capas. Estas redes neuronales pretenden simular el comportamiento del cerebro humano —aunque quedan lejos de poder igualarse en capacidades— ya que permiten que la red "aprenda" a partir de grandes cantidades de datos. Aunque una red neuronal con una única capa aún puede realizar predicciones aproximadas, las capas ocultas adicionales pueden ayudar a optimizar y mejorar la exactitud.

El deep learning impulsa muchas aplicaciones y servicios de inteligencia artificial (IA) que mejoran la automatización, lo que permite realizar tareas analíticas y físicas sin intervención humana. La tecnología deep learning subyace bajo servicios y productos de la vida diaria (como los asistentes digitales, mandos a distancia de televisores con reconocimiento de voz y detección de fraudes de tarjetas de crédito), así como también bajo tecnologías emergentes (como los coches sin conductor).

Deep learning frente a machine learning

Si el deep learning es un subconjunto del machine learning, ¿en qué se diferencian? El deep learning se distingue del machine learning clásico por el tipo de datos con los que trabaja y los métodos con los que aprende.

Los algoritmos de machine learning aprovechan los datos etiquetados y estructurados para realizar predicciones, es decir, se definen características específicas a partir de los datos de entrada para el modelo y se organizan en tablas. Esto no significa necesariamente que no se utilicen datos no estructurados, significa simplemente que, si lo hiciera, por lo general pasaría por cierto procesamiento previo para organizarse en un formato estructurado.

El deep learning elimina parte del procesamiento previo de los datos que tradicionalmente es necesario con el machine learning. Estos algoritmos pueden consumir y procesar datos no estructurados, como texto e imágenes, y el deep learning automatiza la extracción de funcionalidades, lo que permite suprimir parte de la dependencia de expertos humanos. Digamos que tenemos una serie de fotos de distintas mascotas y que queremos categorizarlas como "gato", "perro", "hámster", etc. Los algoritmos de deep learning pueden determinar qué características (por ejemplo, las orejas) son las más importantes para distinguir a cada animal de los demás. En machine learning, esta jerarquía de características viene establecida de forma manual por un experto humano.

A continuación, gracias a los procesos de pendiente de gradiente y propagación inversa, el algoritmo de deep learning se ajusta y encaja por sí solo para mayor precisión, lo que le permite realizar pronósticos sobre una nueva foto de un animal con una precisión aumentada.  

Los modelos de machine learning y deep learning son también capaces de realizar distintos tipos de aprendizaje, que se categorizan habitualmente como aprendizaje supervisado (supervised learning), aprendizaje sin supervisión (unsupervised learning) y aprendizaje de refuerzo (reinforcement learning). El aprendizaje supervisado utiliza conjuntos de datos etiquetados para categorizar o realizar pronósticos; esto requiere algún tipo de intervención humana para etiquetar correctamente los datos de entrada. Por el contrario, el aprendizaje no supervisado no requiere conjuntos de datos etiquetados y, en su defecto, detecta patrones en los datos y los agrupa con base en características diferenciadoras. El aprendizaje de refuerzo es un proceso en el que un modelo aprende a ser más preciso para realizar una acción dentro de un entorno basado en comentarios con el objetivo de maximizar la recompensa.

Para ahondar aún más en las pequeñas diferencias entre las distintas tecnologías, consulte "AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?"

Para examinar más detenidamente las diferencias específicas entre el aprendizaje supervisado y el no supervisado, consulte "Supervised vs. Unsupervised Learning: What's the Difference?"

Cómo funciona el deep learning

Las redes neuronales de deep learning o las redes neuronales artificiales intentan emular el cerebro humano a través de una combinación de ponderaciones, sesgos y entradas de datos. Estos elementos funcionan de forma conjunta para reconocer, clasificar y describir con precisión objetos incluidos dentro de los datos.

Las redes neuronales profundas constan de múltiples capas de nodos interconectados, cada uno de ellos creado sobre la capa anterior para refinar y optimizar el pronóstico o categorización. Esta progresión de computaciones a través de la red recibe el nombre de propagación hacia delante. Las capas de entrada y de salida de una red neuronal se llaman "capas visibles ". La capa de entrada es donde el modelo de deep learning consume datos para su procesamiento y la capa de salida es donde se lleva a cabo la clasificación o el pronóstico final.

Otro proceso llamado "propagación inversa" utiliza algoritmos, como la  pendiente de gradiente, para calcular errores en pronósticos y, a continuación, ajustar las ponderaciones y los sesgos de la función retrocediendo por las capas en un esfuerzo por entrenar el modelo. Juntas, la propagación hacia delante y la propagación inversa permiten que una red neuronal realice pronósticos y corrija errores en consecuencia. Con el tiempo, el algoritmo va haciéndose gradualmente más preciso.

Hemos descrito arriba el tipo más sencillo de red neuronal profunda de la forma más fácil posible. Sin embargo, los algoritmos de deep learning son increíblemente complejos y existen distintos tipos de redes neuronales para hacer frente a problemas o conjuntos de datos específicos. Por ejemplo:

  • Las redes neuronales convolucionales (CNN) se utilizan principalmente en aplicaciones de computer vision y de clasificación de imágenes; además, pueden detectar características y patrones dentro de una imagen, lo que permite realizar tareas, como el reconocimiento o la detección de un objeto. En 2015, una CNN obtuvo, por primera vez, mejor resultado que un humano en un reto de reconocimiento de objetos.
  • Las redes neuronales recurrentes (RNN) se usan habitualmente en aplicaciones de lenguaje natural y de reconocimiento de voz, ya que aprovechan los datos de series temporales o secuenciales.

Aplicaciones del deep learning

Las aplicaciones del deep learning en el mundo real forman parte de nuestra vida diaria pero, en la mayoría de los casos, están tan integradas en los productos y servicios que los usuarios no son conscientes del complejo procesamiento de datos que se está llevando a cabo en segundo plano. Sirvan como ejemplo las aplicaciones siguientes:

Aplicación de las leyes

Los algoritmos de deep learning pueden analizar y aprender a partir de datos transaccionales para identificar patrones peligrosos que indiquen una posible actividad fraudulenta o delictiva. El reconocimiento del discurso, computer vision y otras aplicaciones del deep learning pueden mejorar la eficiencia y efectividad del análisis de investigación gracias a que extraen patrones e indicios de grabaciones de vídeo y sonido, de imágenes y documentos; esto ayuda a los agentes de la ley a analizar grandes cantidades de datos de forma más rápida y precisa.

Servicios financieros

Las instituciones financieras utilizan con frecuencia el análisis predictivo para llevar a cabo la negociación algorítmica de valores, evaluar los riesgos empresariales para la aprobación de préstamos, detectar el fraude y ayudar a gestionar las carteras de crédito e inversión de sus clientes.

Servicio al cliente

Muchas organizaciones incorporan tecnología de deep learning en sus procesos de servicios de atención al cliente. Los chatbots, que se utilizan en distintas aplicaciones, servicios y portales de atención al cliente, son una forma muy directa de inteligencia artificial. ​ Los chatbots tradicionales utilizan lenguaje natural, e incluso reconocimiento visual, y se encuentran habitualmente en menús como los de los call centers. Sin embargo, existen soluciones de chatbot más sofisticadas que intentan determinar, mediante el aprendizaje, si existen varias respuestas a preguntas ambiguas. Basándose en las respuestas que recibe, el chatbot intenta responder a estas preguntas directamente o desviar la conversación a un usuario humano.

Los asistentes virtuales, como Siri de Apple, Alexa de Amazon o el Asistente de Google, amplían la idea del chatbot al permitir la funcionalidad de reconocimiento de voz. De esta forma se crea un nuevo método para que el usuario participe de una forma personalizada.

Asistencia sanitaria

El sector sanitario se ha beneficiado enormemente de las capacidades del deep learning ya desde la digitalización de las imágenes y registros hospitalarios. Las aplicaciones de reconocimiento de imágenes sirven de apoyo a especialistas y radiólogos, ya que les ayudan a analizar y evaluar más imágenes en menos tiempo.

Requisitos de hardware para el deep learning

El deep learning requiere de una potencia computacional enorme. Las unidades de procesamiento gráfico (GPU) de alto rendimiento son ideales, ya que pueden manejar un gran volumen de cálculos en múltiples núcleos con abundante memoria disponible. Sin embargo, la gestión de múltiples GPU en las instalaciones puede generar una enorme demanda de recursos internos y puede suponer costes enormes a la hora de escalar.

Deep learning e IBM

Durante décadas, IBM ha sido pionera en el desarrollo de tecnologías de inteligencia artificial y de deep learning, lo cual quedó muy patente con el desarrollo de IBM Watson, el chatbot de IA de IBM. Fue uno de los primeros logros en tecnología de deep learning, pero ahora Watson es una solución de confianza para empresas que buscan la aplicación de técnicas avanzadas de procesamiento del lenguaje natural y de machine learning en sus sistemas gracias al enfoque de adopción e implementación de la IA por capas de eficacia demostrada.

Watson utiliza el marco Apache Unstructured Information Management Architecture (UIMA) y el software DeepQA de IBM para que las aplicaciones cuenten con prestaciones de deep learning potentes. Mediante el uso de herramientas como IBM Watson Studio, su empresa puede sacar partido a su big data y llevar sus proyectos de ciencia de datos a la práctica, al mismo tiempo que se implementan y ejecutan modelos en cualquier cloud.

Para obtener más información sobre cómo ponerse en marcha con la tecnología de deep learning, explore IBM Watson Studio.

Regístrese para conseguir un IBMid y cree su propia cuenta en IBM Cloud.