Un motor de recomendaciones, también llamado recomendador, es un sistema de IA que sugiere artículos a un usuario. Los sistemas de recomendación se basan en algoritmos de análisis de big data y machine learning para encontrar patrones en los datos de comportamiento del usuario y recomendar artículos relevantes basados en esos patrones.
Los motores de recomendaciones ayudan a los usuarios a descubrir contenidos, productos o servicios que quizá no encontraron por sí mismos. Estos sistemas forman parte fundamental de la generación de ventas y el fomento de la participación en muchas empresas en línea, como sitios web de comercio electrónico, plataformas de transmisión multimedia, motores de búsqueda y redes sociales.
Un recomendador sugiere la próxima película o video para ver, una canción similar para escuchar, resultados de búsqueda relevantes o un producto que complementa un determinado pedido.
Las sugerencias creadas por los sistemas de recomendación también desempeñan un papel vital en la personalización de las experiencias de los usuarios. Según una investigación de la consultora de gestión McKinsey , la personalización puede aumentar los ingresos entre un 5 % y un 15 %. Además, el 76 % de los clientes se sienten frustrados cuando no experimentan interacciones personalizadas.
El mercado de los sistemas de recomendación está creciendo. En 2024, el mercado de motores de recomendación se estima en USD 6.88 mil millones, y se proyecta que este tamaño de mercado se triplique en 5 años.
Para ofrecer sugerencias adecuadas a los usuarios, un motor de recomendaciones combina ciencia de datos y aprendizaje automático.
Los recomendadores suelen operar en 5 fases para predecir las recomendaciones más precisas:
Los datos son la base de un sistema de recomendación, por lo que recopilarlos es un primer paso vital. Los 2 tipos clave de datos que se recopilan incluyen datos explícitos y datos implícitos.
Los datos explícitos abarcan acciones y actividades del usuario, como comentarios, me gusta, calificaciones y comentarios. Los datos implícitos comprenden el comportamiento del usuario, como el historial de navegación, los eventos del carrito de compras, los clics, las compras anteriores y el historial de búsqueda.
Los recomendadores también emplean otros datos de los clientes, como datos demográficos (edad o sexo) y psicográficos (intereses o estilo de vida) para encontrar usuarios similares, y datos de características (como rango de precios o tipo de artículo) para determinar productos o servicios relacionados.
Una vez recopilados los datos, el siguiente paso es almacenarlos. El tipo de sistema de almacenamiento depende de los tipos de datos recopilados.
Un almacén de datos puede agregar datos de diferentes fuentes para respaldar el análisis de datos y el aprendizaje automático, mientras que los data lakes pueden almacenar datos estructurados y no estructurados.
Un lakehouse de datos combina los mejores aspectos de los almacenes de datos y los data lakes en una única solución de gestión de datos.
La fase de análisis emplea algoritmos de aprendizaje automático para procesar y examinar conjuntos de datos. Estos algoritmos detectan patrones, identifican correlaciones y sopesan la fuerza de esos patrones y correlaciones. Los modelos de aprendizaje automático se pueden entrenar en grandes conjuntos de datos para hacer recomendaciones adecuadas.
El paso final es filtrar los datos, con lo cual se muestran los artículos más relevantes de la etapa de análisis anterior. El filtrado de datos implica la aplicación de ciertas reglas y fórmulas matemáticas a los datos dependiendo del tipo de motor de recomendaciones empleado.
Se podría agregar un paso de perfeccionamiento opcional para evaluar de manera regular los resultados de un sistema de recomendaciones y optimizar aún más el modelo para mejorar continuamente su precisión y calidad.
Los recomendadores difieren en función del método de filtrado que emplean. En general, hay 3 tipos de motores de recomendaciones:
Un sistema de filtrado colaborativo filtra sugerencias en función de la similitud de un usuario particular con otros. Los sistemas de recomendación colaborativos se basan en datos explícitos e implícitos y suponen que los usuarios con preferencias comparables probablemente estarán interesados en los mismos artículos y potencialmente interactuarán con ellos de maneras similares en el futuro.
Amazon , por ejemplo, emplea filtrado colaborativo para sus recomendaciones de productos, al igual que Spotify lo hace para su contenido de audio.
Los recomendadores de filtrado colaborativo pueden ofrecer sugerencias efectivas y, por lo general, no necesitarán descripciones detalladas de los artículos. Sin embargo, el filtrado colaborativo también es propenso al problema del arranque en frío, que ocurre cuando el sistema tiene datos históricos limitados para extraer, especialmente para los nuevos usuarios.
Hay 2 tipos principales de sistemas de filtrado colaborativos: basados en memoria y basados en modelos.
Los sistemas basados en memoria representan a los usuarios y artículos como una matriz. Son una extensión del algoritmo k-vecinos más cercanos (KNN) porque buscan encontrar a sus “vecinos más cercanos”, que pueden ser usuarios o artículos similares. Los sistemas basados en memoria se subdividen en 2 tipos:
De manera alternativa, los sistemas basados en modelos crean un modelo predictivo de aprendizaje automático de los datos. La matriz usuario-artículo sirve como conjunto de datos de entrenamiento para el modelo, que luego produce predicciones de Missing Values, es decir, artículos que un usuario aún no ha encontrado y, por lo tanto, serán recomendados.
Uno de los algoritmos de filtrado colaborativo basado en modelos más empleados es la factorización de matrices. Este método de reducción de dimensionalidad descompone la matriz de usuario-artículo, a menudo grande, en dos matrices más pequeñas, una para usuarios y otra para artículos, que tienen unas pocas dimensiones seleccionadas. Luego, las 2 matrices se multiplican para predecir los Missing Values (o las recomendaciones) en la matriz más grande.
Una implementación más avanzada de la factorización de matrices aprovecha el aprendizaje profundo de las Neural Networks. Otros sistemas basados en modelos emplean algoritmos de machine learning como clasificadores Bayes, agrupación en clústeres y decision trees.
Un sistema de filtrado basado en contenido filtra las recomendaciones en función de las características de un artículo. Los sistemas de recomendación basados en contenido asumen que si a un usuario le gusta un artículos en particular, también le gustará otro artículo similar. El filtrado basado en contenido considera las descripciones de los artículos, como el color, las categorías, el precio y otros metadatos asignados por palabras clave y etiquetas, junto con datos explícitos e implícitos.
Los sistemas de filtrado basados en contenido representan artículos y usuarios como vectores en un espacio vectorial. La proximidad se emplea para determinar la similitud entre los artículos. Cuanto más cerca estén 2 vectores en el espacio, más similares se considerarán. Se recomendarán al usuario vectores similares a los artículos anteriores de acuerdo con las características suministradas.
Los recomendadores basados en contenido aplican un clasificador basado en el usuario o un modelo de regresión. Las descripciones y características de los artículos en los que un usuario está interesado actúan como el conjunto de datos de entrenamiento del modelo, que luego arroja predicciones para los artículos recomendados.
Los sistemas de recomendación basados en contenido se pueden mejorar aún más mediante el uso de etiquetas de procesamiento de lenguaje natural. Sin embargo, este proceso de etiquetado puede resultar tedioso para grandes volúmenes de datos.
A diferencia del filtrado colaborativo, el problema del arranque en frío es un problema menor, ya que el filtrado basado en contenido se basa en las características de los metadatos y no en la interacción anterior del usuario. Sin embargo, el filtrado basado en contenido puede ser limitado en la exploración de nuevos artículos, ya que a menudo sugiere aquellos similares a lo que a los usuarios les gustó anteriormente.
Como su nombre lo indica, un sistema de recomendación híbrido fusiona el filtrado colaborativo y el filtrado basado en contenido.
Como resultado, un enfoque híbrido puede mejorar enormemente el rendimiento de un motor de recomendaciones, pero requiere arquitecturas avanzadas y una potencia computacional intensiva.
Netflix, por ejemplo, emplea un sistema de recomendación híbrido para sus recomendaciones de películas y programas de televisión.
Un motor de recomendaciones puede aportar valor tanto a las empresas como a los usuarios. Presentamos algunos beneficios que las organizaciones pueden obtener al invertir en sistemas de recomendación:
Recomendar el producto o servicio adecuado ahorra a los usuarios el tiempo de desplazarse interminablemente por un extenso catálogo. Por ejemplo, el 80 % de lo que ven los espectadores en Netflix proviene de sugerencias impulsadas por algoritmos de recomendación. Además, sugerir contenido relevante conduce a experiencias personalizadas.
Según una investigación de McKinsey, una experiencia de cliente mejorada se traduce en una mayor satisfacción del cliente, 20% mayor, para ser exactos. Los clientes satisfechos se involucran más y desarrollan lealtad hacia una marca, lo que permite a las empresas generar confianza y retener a más clientes.
Ofrecer recomendaciones personalizadas anima a los usuarios a ver y hacer clic en más artículos, lo que eventualmente podría convertir a los lectores en compradores. McKinsey encontró un aumento del 10% al 15% en las tasas de conversión de ventas a partir de experiencias de cliente más positivas y personalizadas.
Las conversiones de clientes impulsan las ventas, y las ventas impulsan los ingresos. McKinsey señala que el 35% de lo que los compradores compran en Amazon proviene de recomendaciones de productos. Mientras tanto, Netflix estima un ahorro de más de mil millones de dólares gracias a su sistema de recomendaciones.
Los sistemas de recomendaciones tienen sus limitaciones y plantean desafíos para las organizaciones. Estos son algunos de los más comunes:
Los motores de recomendaciones implican analizar y filtrar cantidades masivas de datos. Esto requiere arquitecturas complejas y una inversión significativa en recursos informáticos.
Los sistemas de recomendaciones deben ser lo suficientemente rápidos para determinar y mostrar las recomendaciones correctas en tiempo real. Esto se vuelve aún más difícil cuando las sugerencias en tiempo real se proporcionan simultáneamente a cientos o miles de usuarios, y ni qué decir si son millones.
Optimizar los algoritmos de aprendizaje automático en torno a las métricas equivocadas puede dar lugar a recomendaciones irrelevantes. Los artículos más valorados pueden sugerirse con más frecuencia que los nuevos, los menos conocidos o los menos valorados. Sin embargo, los artículos más populares o más comprados pueden no ser los que interesan a los clientes.
Los algoritmos de aprendizaje automático pueden aprender los sesgos sociales presentes en los datos, ya sean los datos recopilados, los datos etiquetados, los datos de entrenamiento o las fuentes de datos externas, o de evaluadores humanos que ajustan el modelo. Esto puede dar lugar a recomendaciones inexactas.
Algunos usuarios pueden optar por no participar en las iniciativas de recopilación de datos de una empresa para los sistemas de recomendaciones debido a problemas de privacidad. Es posible que las empresas también deban considerar los requisitos normativos y las normas de cumplimiento al recopilar y almacenar datos.
Estas son algunas formas en que las empresas pueden emplear los sistemas de recomendaciones. A medida que evolucione la tecnología de recomendación, podrían surgir otros casos de uso y aplicaciones:
Los minoristas y los vendedores en línea pueden usar motores de recomendaciones para aumentar las ventas. Los recomendadores pueden sugerir artículos que otros compradores también compraron o productos que van bien con lo que un comprador ya pidió.
Los sistemas de recomendaciones se pueden emplear para hacer recomendaciones basadas en la ubicación o estacionales, y para promocionar nuevos productos o artículos con descuento. Estos sistemas también se pueden emplear para aumentar el alcance de los artículos que se compran con poca frecuencia, recomendándolos como un paquete o como productos comprados con frecuencia junto con los más populares.
Amazon es un excelente ejemplo de una empresa de comercio electrónico que emplea motores de recomendaciones.
Basados en datos históricos y en las preferencias de los usuarios, los sistemas de recomendaciones pueden sugerirles contenidos relevantes que probablemente les interesen y disfruten.
Ya sea la próxima serie de televisión, un libro electrónico, un cantante, un juego de video o un concierto, estos sistemas mejoran la experiencia de los usuarios al proporcionar recomendaciones personalizadas.
Netflix, Spotify y YouTube son empresas del sector de medios y entretenimiento que emplean recomendadores.
En el ámbito de los viajes y la hospitalidad, los motores de recomendaciones pueden sugerir opciones de hoteles y alojamiento, restaurantes, actividades y experiencias de acuerdo con el presupuesto y el historial de viajes de una persona.
Estas recomendaciones de viaje personalizadas mejoran la satisfacción del cliente al abordar las necesidades de los viajeros.
Las organizaciones pueden emplear motores de recomendaciones para ampliar sus clientes potenciales calificados. Los recomendadores pueden sugerir contenidos, como entradas de blog, estudios de casos, seminarios web o informes técnicos, para presentar nuevos servicios y atraer a posibles clientes.
Los equipos de marketing pueden enviar estas sugerencias a través de boletines, anuncios en redes sociales y mensajes de correo electrónico dirigidos.
AIOps o inteligencia artificial para operaciones de TI, aplica IA para automatizar y optimizar la gestión de servicios de TI y los flujos de trabajo operativos.
Los motores de recomendaciones se pueden emplear en AIOps para sugerir soluciones, lo que ayuda a los equipos de operaciones de TI a actuar con rapidez y responder adecuadamente a los problemas técnicos.