¿Está creando lagos de datos o pantanos de datos?

El envío de datos a una plataforma de datos Hadoop o Hortonworks por sí solo no acelerará los esfuerzos de analítica. Sin un gobierno o una calidad adecuados, los data lakes pueden convertirse rápidamente en pantanos de datos ingobernables. Los usuarios de datos saben que los datos que necesitan se encuentran en estos pantanos, pero sin una estrategia clara de gobierno de datos no podrán encontrarlos, confiar en ellos o utilizarlos.
Un data lake gobernado contiene datos limpios y relevantes de fuentes estructuradas y no estructuradas que se pueden encontrar, acceder, gestionar y proteger fácilmente. La plataforma en la que residen los datos es rica en seguridad y es confiable. Los datos que se encuentran en el data lake se limpian, clasifican y protegen adecuadamente en los canales de datos controlados y puntuales que se completan y documentan con activos de información y metadatos confiables.

Ventajas

Faculte a los usuarios de datos
Permita que todos los consumidores de datos de su organización tomen decisiones inteligentes y basadas en datos con un acceso de autoservicio a datos confiables y listos para el negocio.

 

Gestione los datos y los costos
A medida que sus datos aumentan, puede escalarlos y asimilarlos en el data lake independientemente de su tipo y estructura. Ahorre costos alejándose del almacenamiento tradicional.

Prepare y transforme datos más rápidamente
Mediante el traslado de datos estructurados y no estructurados a data lakes,se puede ahorrar tiempo y recursos en la preparación y transformación de datos. Faculte a sus equipos de TI para que se enfoquen en la innovación.

Implemente la seguridad y la conformidad de datos
Aplique el gobierno a los datos en el data lake y esté en una mejor posición para cumplir los requisitos de conformidad y normas cada vez más estrictos.

Mejore la agilidad y el tiempo en obtener valor
Acelere la toma de decisiones fiable. Faculte los usuarios de datos con el acceso de autoservicio a los datos y ejecute analíticas exploratorias para obtener resultados mejorados.

 

Capacidades

Asimilación de datos
Los datos de la empresa se almacenan en varios sistemas y repositorios. Se necesita de datos continuos en tiempo real para que fluyan hacia su data lake desde estos sistemas. Mantenga los datos frescos en el lago mediante la asimilación de datos estructurados y no estructurados de todos los orígenes de datos.

Empezar

→ IBM InfoSphere® DataStage

→ IBM InfoSphere Data Replication

→ IBM BigInsights® BigIntegrate

→ IBM BigInsights BigReplicate

El ícono representa la asimilación de datos.

Datos de catálogo
Un catálogo de datos empresarial facilita el inventario de todos los activos de información empresarial estructurados y no estructurados. Al utilizar un catálogo de metadatos inteligentes, se puede definir los datos en términos empresariales, realizar un seguimiento del linaje de los datos y explorarlos visualmente para comprender mejor los datos en el data lake.

Empezar

→ IBM InfoSphere Information Governance Catalog

→ Modelos de la industria

→ IBM Watson® Knowledge Catalog

El icono representa datos de catálogo

Gobierno de datos
Proteja la integridad y confiabilidad de sus datos mediante políticas de gobierno. Mantenga la conformidad y preparación para auditorías de sus datos al desarrollar un data lake limpio y gobernado.

Empezar

→ IBM InfoSphere Information Governance Catalog 

→ Modelos de la industria

Icono que representa las capacidades de gobierno de datos

Proporcione acceso de autoservicio a los datos
El propósito de un data lake fracasa cuando sus consumidores de datos no tienen acceso de autoservicio a él. Proporcione datos confiables y de alta calidad a científicos de datos, administradores de datos, así como a equipos de gobierno y de conformidad, y facúltelos para lograr las metas analíticas de la organización. Haga que los datos gobernados en el data lake sean más útiles con las soluciones de analítica de IBM.

Empezar

→ IBM Watson Knowledge Catalog

→ IBM Cognos® Analytics 

→ IBM Data Science

Icono que representa el acceso de autoservicio a las capacidades de datos

Recursos

Controle el data lake con modelos de la industria y gobierno unificado
Descubra por qué los vocabularios empresariales y la gestión de metadatos son cruciales para el éxito de un data lake gobernado.

 

¿Cómo iniciar en el data lake?
Si está emprendiendo los primeros pasos en el desarrollo de un data lake, este libro de Little Bee puede ayudarlo.

Inicie ahora con los modelos de la industria de IBM
Obtenga más información acerca de los términos empresariales específicos del sector y la conformidad a medida que crea su propio data lake gobernado.

El proceso de cambio continua: Desde el data lake hasta la organización controlada por datos
Obtenga información sobre el proceso de cambio de un data lake de ING hacia una organización controlada por datos.