El envío de datos a una plataforma de datos Hadoop o Hortonworks por sí solo no acelerará los esfuerzos de analítica. Sin un gobierno o una calidad adecuados, los data lakes pueden convertirse rápidamente en pantanos de datos ingobernables. Los usuarios de datos saben que los datos que necesitan se encuentran en estos pantanos, pero sin una estrategia clara de gobierno de datos no podrán encontrarlos, confiar en ellos o utilizarlos.
Un data lake gobernado contiene datos limpios y relevantes de fuentes estructuradas y no estructuradas que se pueden encontrar, acceder, gestionar y proteger fácilmente. La plataforma en la que residen los datos es rica en seguridad y es confiable. Los datos que se encuentran en el data lake se limpian, clasifican y protegen adecuadamente en los canales de datos controlados y puntuales que se completan y documentan con activos de información y metadatos confiables.