Los data lakes y lakehouses de datos proporcionan un repositorio centralizado para gestionar grandes volúmenes de datos. Sirven de base para recopilar y analizar datos estructurados, semiestructurados y no estructurados en su formato nativo para su almacenamiento a largo plazo y para impulsar conocimientos y predicciones. A diferencia de los almacenes de datos tradicionales, pueden procesar vídeos, audios, registros, textos, redes sociales, datos de sensores y documentos para impulsar aplicaciones, análisis e IA. También pueden integrarse en una arquitectura de data fabric para proporcionar los datos adecuados en el momento oportuno, con independencia de dónde residan.
Los data lakes basados en Hadoop fueron un intento de hacer frente a estas nuevas cargas de trabajo, pero requerían conocimientos difíciles de encontrar para desarrollar aplicaciones y gestionar las plataformas. Los data lakes están siendo sustituidos en gran medida por un nuevo método arquitectónico denominado lakehouse de datos.
Cómo resolver los retos actuales de los datos con una arquitectura lakehouse
Reduzca el coste y el tiempo de obtención de información, y mejore la confianza en los datos utilizados para aplicaciones, análisis e IA con una arquitectura de datos moderna. Identifique nuevos patrones y tendencias para mejorar las operaciones y ofrecer nuevas ofertas.
Acceda a los data lakes y almacenes de datos existentes en entornos locales o en la nube, e intégrelos con nuevos datos para desbloquear conocimientos y oportunidades con un enfoque moderno de lakehouse de datos y data fabric.
Aporte valor empresarial y reduzca la complejidad de la gestión de datos. Empiece poco a poco y escale los casos de uso y las implementaciones (en entornos de nube, híbridos y locales).
Controle la privacidad y la seguridad de los datos con el gobierno y la gestión de metadatos integrados. Gestione de forma centralizada e implemente a escala global con soluciones de gobierno para toda la empresa.
Asóciese con IBM para acelerar las implementaciones en entornos híbridos y multinube. Dé soporte a todo tipo de datos y casos de uso con código abierto, estándares abiertos e interoperabilidad con IBM y servicios de terceros.
Aproveche el menor coste de los recursos informáticos y de almacenamiento, así como los motores de análisis adaptados que aumentan y disminuyen dinámicamente, combinando la carga de trabajo adecuada con el motor analítico correcto.
Watsonx.data hace posible que las empresas escalen los análisis y la IA con un almacén de datos adaptado a sus necesidades, construido sobre una arquitectura de lakehouse abierta, respaldada por consultas, gobierno y formatos de datos abiertos para acceder a ellos y compartirlos. Gracias a watsonx.data, puede conectarse a los datos en cuestión de minutos, obtener rápidamente conocimientos fiables y reducir los costes de su almacén de datos. Ahora disponible como servicio en IBM Cloud y AWS y como software contenedorizado.