¿Qué es un data lake?

Los data lakes son soluciones de gestión de datos híbridos de última generación que pueden hacer frente a los retos de big data y que impulsan nuevos niveles de analítica en tiempo real. Su entorno altamente escalable soporta volúmenes de datos extremadamente grandes, y acepta datos en su formato nativo a partir de varios orígenes de datos. Como complementos para su data warehouse, proporcionan la plataforma para machine learning y analítica avanzada en tiempo real en un entorno colaborativo.  

La asociación de IBM con Cloudera ofrece productos y servicios de nivel empresarial que le ayudan a crear un data lake y, a continuación, a gestionar, gobernar, acceder y descubrir big data. Estas soluciones combinan tecnología de código abierto rentable y de nivel empresarial con recursos analíticos en tiempo real. Aproveche el tremendo potencial de los datos no analizados previamente y tome decisiones más inteligentes, ágiles y basadas en los datos.

Más recursos para la gestión de datos

En destaque

Únase al Foro de Datos e IA 2019 en Miami, del 21 al 24 de octubre

Soluciones para optimizar el potencial de un data lake

Elija entre opciones de computación y almacenamiento que están diseñadas para dar soporte a la IA y al big data

IBM Power Systems

Aumente la eficiencia de computación y almacenamiento y maximice el rendimiento al crear su data lake de Hadoop.

Almacenamiento de datos

Optimice su capacidad de almacenamiento y proteja y mueva de forma eficiente los datos en su entorno híbrido.

Acelere los resultados y mejore la precisión con un data lake bien gobernado

Distribución de IBM y Cloudera Hadoop

Optimice la plataforma de su data lake utilizando una distribución de Hadoop de nivel empresarial líder en la industria, ofrecida por IBM y Cloudera.

Gobierno de data lake

Garantice la integridad de su data lake utilizando soluciones de gobierno comprobadas que impulsen la integración, la calidad y la seguridad de los datos.

Utilice herramientas comprobadas que aportan velocidad, inteligencia artificial y machine learning a su analítica del big data

IBM Db2 Big SQL

Utilice un motor de SQL en Hadoop, híbrido y que está en conformidad con el ANSI de nivel empresarial para obtener procesamiento masivamente paralelo (MPP) y consulta de datos avanzada.

IBM Big Replicate

Replique los datos a medida que se transmiten al data lake, sin necesidad de escribir ni cerrar los archivos antes de la transferencia.

IBM Watson® Studio

Cree y entrene modelos de IA y de machine learning, además de preparar y analizar datos, todo en un entorno de nube híbrida flexible.

Casos de uso de la industria de data lakes

Comercio minorista

  • Determine cuál es el cliente que probablemente compre en línea y proporcione recomendaciones
  • Identifique la "ruta hacia la compra" de un cliente para comprender los patrones de compra y aplicar marketing micro-dirigido
  • Pronostique o identifique de forma proactiva las actividades fraudulentas de dentro y fuera de la organización

Banca

  • Pronostique el éxito o el fracaso de los descuentos
  • Identifique el "próximo producto a comprar" y promociónelo a sus clientes
  • Identifique qué clientes pueden reducir su negocio bancario y emplee actividades de marketing proactivas

Hotelería y viajes

  • Rastree y pronostique las preferencias del cliente para guiar a la venta proactiva
  • Mejore la experiencia del cliente y aumente su lealtad a la marca mediante la personalización
  • Realice análisis y tarificaciones en tiempo real

Deloitte

El uso de Big SQL como nuestro motor principal nos dio confianza de que podríamos tener éxito en el uso de un data lake de Hadoop como plataforma empresarial.

Raj Ramani, Director de Gestión de la Información, Deloitte Canada

Recursos sobre data lakes

Póngase en contacto con un experto

Planifique una llamada gratuita con un experto calificado de IBM

Conozca más acerca de los productos, soluciones y servicios disponibles de IBM para ayudarle a crear y ampliar un data lake con éxito.