menu icon

Machine Learning

Esta introducción a machine learning proporciona una visión general de su historia, definiciones importantes, aplicaciones y preocupaciones dentro de las empresas hoy en día.

¿Qué es machine learning?

El machine learning es una rama de la inteligencia artificial (IA) y la ciencia de computación que se centra en el uso de datos y algoritmos para imitar la forma en que los seres humanos aprenden, con una mejora gradual de su precisión.

IBM tiene una amplia historia con machine learning. Uno de los suyos, Arthur Samuel, es acreditado por acuñar el término "machine learning" con su investigación (PDF, 481 KB) (enlace externo a IBM) en torno al juego de las damas. Robert Nealey, el autoproclamado maestro de damas, jugó el juego en una computadora IBM 7094 en 1962, y perdió ante la computadora. En comparación con lo que se puede hacer hoy, esta hazaña casi parece trivial, pero se considera un hito importante dentro del campo de la inteligencia artificial. En el próximo par de décadas, los desarrollos tecnológicos sobre almacenamiento y potencia de procesamiento habilitarán algunos productos innovadores que conocemos y amamos hoy, como el motor de recomendación de Netflix o los coches de conducción autónoma.

Machine learning es un componente importante del creciente campo de la ciencia de datos. Mediante el uso de métodos estadísticos, los algoritmos se capacitan para hacer clasificaciones o predicciones, descubriendo conocimientos clave dentro de los proyectos de minería de datos. Estos conocimientos posteriores impulsan la toma de decisiones dentro de aplicaciones y empresas, lo que es ideal para influir en las métricas. A medida que los big data continúan expandiéndose y creciendo, la demanda del mercado de los científicos de datos aumentará, requiriendo que ayuden en la identificación de las preguntas de negocios más relevantes y posteriormente los datos para responderlas.

Machine Learning vs. Deep Learning vs. Redes neuronales

Como deep learning y machine learning tienden a utilizarse indistintamente, es interesante señalar las diferencias entre ambos. Machine learning, deep learning y las redes neuronales son todos subcampos de la inteligencia artificial. Sin embargo, deep learning es en realidad un subcampo de machine learning, y las redes neuronales son un subcampo de deep learning.

La diferencia entre deep learning y machine learning es cómo aprende cada algoritmo. Deep learning automatiza gran parte de la fase de extracción de características del proceso, lo que elimina parte de la intervención humana necesaria y permite el uso de conjuntos de datos más grandes. Deep learning puede considerarse un "aprendizaje automático escalable" como explica Lex Fridman en esta conferencia del MIT (00:30) (enlace externo a IBM). El machine learning tradicional, o "non-deep", depende más de la intervención humana para aprender. Los expertos humanos determinan el conjunto de características para comprender las diferencias entre las entradas de datos, por lo general requieren más datos estructurados para aprender.

El "deep" machine learning puede utilizar los conjuntos de datos etiquetados, también conocidos como aprendizaje supervisado, para informar a su algoritmo, pero no requiere necesariamente un conjunto de datos etiquetados. Puede ingerir datos no estructurados en su forma sin procesar (por ejemplo, texto, imágenes) y puede determinar automáticamente el conjunto de características que distinguen diferentes categorías de datos entre sí. A diferencia de machine learning, no requiere intervención humana para procesar datos, lo que permite escalarlo de maneras más interesantes. El deep learning y las redes neuronales se atribuyen principalmente a la aceleración del progreso en áreas, como, por ejemplo, la visión por computadora, el procesamiento del lenguaje natural y el reconocimiento del habla.

Las redes neuronales, o redes neuronales artificiales (ANN), se componen de capas de nodos, que contienen una capa de entrada, una o más capas ocultas, y una capa de salida. Cada nodo, o neurona artificial, se conecta a otro y tiene un peso y un umbral asociados. Si la salida de cualquier nodo individual está por encima del valor de umbral especificado, dicho nodo se activa, enviando datos a la siguiente capa de la red. De lo contrario, no se pasan datos a la siguiente capa de la red. El "deep" (profundo) en deep learning se refiere sólo a la profundidad de las capas en una red neuronal. Una red neuronal que consta de más de tres capas, que sería inclusiva de las entradas y la salida, puede considerarse un algoritmo de deep learning o una red neuronal profunda. Una red neuronal que sólo tiene dos o tres capas es sólo una red neuronal básica.

Vea la publicación de blog “IA vs. machine learning vs. deep learning vs. redes neuronales: ¿Cuál es la diferencia?” para tener una idea más clara de cómo se relacionan los diferentes conceptos.

Cómo funciona el machine learning

UC Berkeley (enlace externo a IBM) interrumpe el sistema de aprendizaje de un algoritmo de machine learning en tres partes principales.

  1. Un proceso de decisión: en general, los algoritmos de machine learning se utilizan para realizar una predicción o clasificación. Basándose en los datos de entrada, que pueden estar etiquetados o no, el algoritmo generará una estimación sobre un patrón en los datos.
  2. Una función de error: una función de error sirve para evaluar la predicción del modelo. Si hay ejemplos conocidos, una función de error puede hacer una comparación para evaluar la precisión del modelo.
  3. Un proceso de optimización de modelos: Si el modelo puede ajustarse mejor a los puntos de datos del conjunto de entrenamiento, las ponderaciones se ajustan para reducir la discrepancia entre el ejemplo conocido y la estimación del modelo. El algoritmo repetirá este proceso de evaluación y optimización, actualizando los pesos de forma autónoma hasta que se haya cumplido un umbral de precisión.

Métodos de machine learning

Los clasificadores de machine learning se dividen en tres categorías principales.

Machine learning supervisado

El aprendizaje supervisado, también conocido como Machine Learning supervisado, se define por su uso de los conjuntos de datos etiquetados para entrenar los algoritmos para clasificar datos o predecir resultados con precisión. A medida que se introducen datos de entrada en el modelo, adapta sus pesos hasta que el modelo se haya ajustado correctamente. Esto se produce como parte del proceso de validación cruzada para asegurarse de que el modelo evite sobreinstalación o ajuste. El aprendizaje supervisado permite a las organizaciones resolver una amplia variedad de problemas del mundo real a escala como, por ejemplo, la clasificación de spam en una carpeta distinta de la bandeja de entrada. Algunos métodos utilizados en el aprendizaje supervisado son las redes neuronales, Naïve Bayes, la regresión lineal, la regresión logística, el bosque aleatorio, la máquina de vectores de soporte (SVM), etc.

Machine learning no supervisado

El aprendizaje no supervisado, también conocido como machine learning no supervisado, utiliza algoritmos de machine learning para analizar y agrupar conjuntos de datos sin etiquetar. Estos algoritmos descubren patrones ocultos o agrupaciones de datos sin necesidad de intervención humana. Su capacidad de descubrir similitudes y diferencias en la información lo convierten en la solución ideal para el análisis de datos exploratorios, estrategias de venta cruzada, segmentación de clientes, reconocimiento de imágenes y patrones. También se utiliza para reducir el número de características en un modelo a través del proceso de reducción de la dimensionalidad; el análisis de componentes principales (PCA) y la descomposición del valor singular (SVD) son dos enfoques comunes para esto. Otros algoritmos utilizados en el aprendizaje no supervisado incluyen redes neuronales, k-means clustering, métodos de agrupación probabilística y más.

Aprendizaje semisupervisado

El aprendizaje semisupervisado ofrece un término medio entre el aprendizaje supervisado y no supervisado. Durante el entrenamiento, utiliza un conjunto de datos etiquetado más pequeño para guiar la clasificación y la extracción de características de un conjunto de datos más grande y sin etiquetar. El aprendizaje semisupervisado puede resolver el problema de no tener suficientes datos etiquetados (o no poder permitirse etiquetar suficientes datos) para entrenar un algoritmo de aprendizaje supervisado.

Para profundizar en las diferencias entre estos enfoques, consulte “Aprendizaje supervisado vs. aprendizaje no supervisado: ¿cuál es la diferencia?

Machine learning por refuerzo

El machine learning de refuerzo es un modelo de machine learning de comportamiento que es similar al aprendizaje supervisado, pero el algoritmo no se entrena utilizando datos de muestra. Este modelo aprende a medida que utiliza el método de prueba y error. Se reforzará una secuencia de resultados satisfactorios para desarrollar la mejor recomendación o política para un problema determinado.

El sistema IBM Watson®, que ganó el desafío Jeopardy! en 2011, es un buen ejemplo. El sistema utilizó machine learning por refuerzo para decidir si intentaba dar una respuesta (o pregunta, por así decirlo), qué cuadrado seleccionar en el tablero y cuánto apostar, especialmente en los dobles diarios.

Más información sobre el aprendizaje de refuerzo.

Casos de uso de machine learning en el mundo real

Estos son solamente algunos ejemplos de machine learning que puede encontrar todos los días:

Reconocimiento de voz: también denominado reconocimiento automático de voz (ASR), reconocimiento de voz por computadora o conversión de voz a texto, y es una funcionalidad que utiliza el procesamiento del lenguaje natural (NLP) para procesar el habla humana en un formato escrito. Muchos dispositivos móviles incorporan el reconocimiento de voz en sus sistemas para realizar búsquedas de voz, por ejemplo, Siri, o proporcionar más accesibilidad en relación con los mensajes de texto.

Servicio al cliente: los chatbots en línea están sustituyendo a los agentes humanos por la ruta del cliente. Responden a preguntas frecuentes de diferentes temas (como el envío) o proporcionan asesoramiento personalizado, realizan venta cruzada de productos o sugieren tallas para los usuarios, cambiado la forma de interactuar con los clientes en los sitios web y las plataformas de redes sociales. Algunos ejemplos incluyen bots de mensajería en sitios de comercio electrónico con agentes virtuales, aplicaciones de mensajería (como Slack y Facebook Messenger) y tareas generalmente realizadas por asistentes virtuales y asistentes de voz.

Visión artificial: esta tecnología de IA permite que las computadoras y los sistemas obtengan información significativa de imágenes digitales, videos y otras entradas visuales, y que actúen con base en ellas. Esta capacidad de proporcionar recomendaciones lo distingue de las tareas de reconocimiento de imágenes. Impulsada por redes neuronales convolucionales, la visión artificial se puede aplicar en el etiquetado de fotos en redes sociales, las imágenes radiológicas en la salud y los vehículos autónomos en la industria automotriz.

Motores de recomendaciones: utilizando datos del comportamiento pasado de los consumidores, los algoritmos de IA pueden ayudar a descubrir tendencias de datos para desarrollar estrategias de venta cruzada más eficaces. Esto se usa para que los minoristas en línea puedan hacer recomendaciones adicionales relevantes a los clientes durante el proceso de compra.

Comercio de acciones automatizado: diseñado para optimizar las carteras de acciones, las plataformas de comercio de alta frecuencia impulsadas por IA hacen miles o incluso millones de operaciones por día sin intervención humana.

Desafíos de machine learning

A medida que la tecnología de machine learning avanza, sin duda ha hecho que nuestras vidas sean más fáciles. Sin embargo, implementar machine learning dentro de las empresas también ha planteado una serie de preocupaciones éticas en torno a las tecnologías de IA. Algunas de estas incluyen:

Singularidad tecnológica

Aunque este tema ofrece mucha atención al público, muchos investigadores no están preocupados por la idea de que la IA supere la inteligencia humana en un futuro cercano o inmediato. Esto también se conoce como superinteligencia, que Nick Bostrum define como "cualquier intelecto que supere ampliamente a los mejores cerebros humanos en prácticamente todos los campos, incluyendo la creatividad científica, la sabiduría general y las habilidades sociales". A pesar del hecho de que la IA y la superinteligencia fuerte no son inminentes en la sociedad, la idea de ello plantea algunas preguntas interesantes, ya que consideramos el uso de sistemas autónomos, como los automóviles que se auto-conducen. No es realista pensar que un automóvil sin conductor nunca se metería en un accidente de coche, pero ¿quién es responsable bajo esas circunstancias? ¿Deberíamos ir tras vehículos autónomos, o limitarnos a la integración de esta tecnología para crear sólo vehículos semiautónomos que promuevan la seguridad entre los conductores? El jurado está todavía en este punto, pero estos son los tipos de debates éticos que se están produciendo a medida que se desarrolla una nueva tecnología de IA innovadora.

Impacto de la IA en los trabajos:

Aunque gran parte de la percepción pública sobre la inteligencia artificial se centra en la pérdida de empleos, esta preocupación probablemente debería reformularse. Con cada nueva tecnología disruptiva, vemos que la demanda del mercado para roles de trabajo específicos cambia. Por ejemplo, cuando vemos a la industria automotriz, muchos fabricantes, como GM, están cambiando para centrarse en la producción de vehículos eléctricos para alinearse con las iniciativas ecológicas. La industria energética no va a desaparecer, pero la fuente de energía está cambiando de una economía basada en el combustible a otra eléctrica. La inteligencia artificial debe ser vista de una manera similar, donde la inteligencia artificial cambiará la demanda de empleos a otras áreas. Se necesitarán personas para gestionar estos sistemas a medida que los datos crezcan y cambien cada día. Aún es necesario que haya recursos para abordar problemas más complejos dentro de las industrias que son más propensas a ser afectadas por turnos de demanda de trabajo, como el servicio al cliente. El importante aspecto de la inteligencia artificial y su efecto en el mercado de trabajo ayudará a las personas a pasar a estas nuevas áreas de demanda del mercado.

Privacidad:

La privacidad tiende a ser discutida en el contexto de la privacidad de los datos, la protección de datos y la seguridad de los datos, y estas preocupaciones han permitido a los legisladores hacer más avances en los últimos años. Por ejemplo, en 2016, la legislación de GDPR se creó para proteger los datos personales de las personas en la Unión Europea y el Espacio Económico Europeo, dando a las personas un mayor control de sus datos. En los Estados Unidos, los estados individuales están desarrollando políticas, como la Ley de Privacidad del Consumidor de California (CCPA), que requieren que las empresas informen a los consumidores sobre la recopilación de sus datos. Esta reciente legislación ha obligado a las empresas a replantearse cómo almacenan y utilizan datos de identificación personal (PII). Como resultado, las inversiones dentro de la seguridad se han convertido en una prioridad cada vez mayor para las empresas, ya que buscan eliminar cualquier vulnerabilidad y oportunidad de vigilancia, piratería y ciberataques.

Sesgo y discriminación:

Los casos de sesgo y discriminación en varios sistemas inteligentes han planteado muchas preguntas éticas sobre el uso de la inteligencia artificial. ¿Cómo podemos protegernos contra el sesgo y la discriminación cuando los propios datos de entrenamiento pueden estar sesgados? Si bien las empresas suelen ser bienintencionadas en torno a sus esfuerzos de automatización, Reuters (enlace externo a IBM) destaca algunas de las consecuencias imprevistas de incorporar la IA en las prácticas de contratación. En su esfuerzo por automatizar y simplificar un proceso, Amazon involuntariamente sesgó los posibles candidatos a un trabajo por género para puestos técnicos libres y, en última instancia, tuvieron que desechar el proyecto. A medida que eventos como este surgen, Harvard Business Review (enlace externo a IBM) ha planteado otras cuestiones señaladas en torno al uso de la IA dentro de las prácticas de contratación como, por ejemplo, qué datos se pueden utilizar al evaluar un candidato para un puesto.

El sesgo y la discriminación tampoco se limitan a la función de recursos humanos; se puede encontrar en una serie de aplicaciones del software de reconocimiento facial a los algoritmos de redes sociales.

A medida que las empresas se vuelven más conscientes de los riesgos con la IA, también se han vuelto más activas en esta discusión alrededor de la ética y los valores de la IA. Por ejemplo, el año pasado el CEO de IBM, Arvind Krishna, dijo que IBM ha limitado sus productos de reconocimiento y análisis facial de IBM, enfatizando que "IBM se opone firmemente y no tolera los usos de ninguna tecnología, incluyendo la tecnología de reconocimiento facial ofrecida por otros vendedores, para la vigilancia masiva, el perfil racial, las violaciones de los derechos humanos y las libertades básicas, o cualquier propósito que no sea consistente con nuestros valores y principios de confianza y transparencia".

Para leer más sobre esto, consulte el blog de políticas de IBM, retransmitiendo su punto de vista sobre "Un método de regulación de precisión para controlar las exportaciones de tecnología de reconocimiento facial".

Responsabilidad

Dado que no hay una legislación significativa para regular las prácticas de IA, no existe ningún mecanismo de ejecución real para garantizar prácticas éticas de IA. Los incentivos actuales para que las empresas se adhieran a estas directrices son las repercusiones negativas de un sistema de IA poco ético en el resultado final. Para cubrir esta carencia, han emergido marcos éticos como parte de una colaboración entre expertos en ética e investigadores para gestionar la construcción y distribución de modelos de IA dentro de la sociedad. No obstante, por ahora, solo sirven como guía, y un estudio (enlace externo a IBM) (PDF, 984 KB) muestra que la combinación de la responsabilidad distribuida y falta de previsión de las posibles consecuencias no es necesariamente propensa a prevenir el daño en la sociedad.

Para leer más sobre la posición de IBM en torno a la ética de la IA, lea más aquí.

Machine learning e IBM Cloud

IBM Watson Machine Learning da soporte al final del ciclo de vida del machine learning. Está disponible en una gama de ofertas que le permiten crear modelos de machine learning en cualquier lugar donde estén sus datos e implementarlos en cualquier lugar del entorno de multinube híbrida.

IBM Watson Machine Learning on IBM Cloud Pak for Data ayuda a la ciencia de datos empresariales y a los equipos de IA a acelerar el desarrollo y la implementación de IA en cualquier lugar, en una plataforma de datos e IA nativa de la nube. IBM Watson Machine Learning Cloud, un servicio administrado en el entorno de IBM Cloud, es la forma más rápida de mover modelos desde la experimentación en el escritorio hasta la implementación para cargas de trabajo de producción. Para los equipos más pequeños que buscan escalar implementaciones de machine learning, IBM Watson Machine Learning Server ofrece una instalación sencilla en cualquier nube privada o pública.

Para empezar, regístrese para obtener un IBMid y cree su cuenta de IBM Cloud.