El almacenamiento de datos basado en la nube para datos empresariales, especialmente big data, es lo más importante hoy en día, ya sea que dependa de él para realizar negocios diarios o para realizar tareas específicas.
Los datos impulsan muchas funciones empresariales , desde la creación de programas específicos para clientes y prospectos, hasta la optimización de los procesos de fabricación y operaciones, pasando por el desarrollo, las pruebas, la distribución y el seguimiento de las pruebas de virus y la vacunación. Las empresas modernas confían en la disponibilidad de los datos que necesitan, cuando los necesitan. Sin embargo, encontrar la mejor opción para satisfacer sus necesidades no es una tarea fácil y puede implicar varios tipos diferentes de repositorios para diferentes categories de datos.
Comencemos con lo básico y profundicemos en algunos ejemplos de cómo un repositorio de datos o muchos tipos de repositorios de datos pueden ser necesarios para satisfacer las necesidades de su negocio.
Hoy en día existen tres tipos distintos de repositorios de almacenamiento en la nube, cada uno con un propósito diferente para abordar una necesidad específica:
Un lago de datos es un gran repositorio de datos sin procesar, ya sea no estructurados o semiestructurados. Estos datos se agregan de varias fuentes y simplemente se almacenan. No se modifican para adaptarse a un propósito específico o encajar en un formato particular. Preparar estos datos para el análisis implica una preparación, limpieza y reformateo de datos que requieren mucho tiempo para lograr uniformidad. Los lagos de datos son excelentes recursos para los municipios u otras organizaciones que almacenan información relacionada con interrupciones del servicio, tráfico, delincuencia o datos demográficos. Los datos podrían utilizarse en una fecha posterior para actualizar los presupuestos y recursos del DPW o de los servicios de emergencia.
Un almacén de datos es una agregación de datos de muchas fuentes en un único repositorio centralizado que unifica las cualidades y el formato de los datos, lo que lo hace útil para que los científicos de datos lo utilicen en minería de datos, inteligencia artificial (IA), machine learning y, en última instancia, analytics y business intelligence. Una gran ciudad podría utilizar el almacenamiento de datos para agregar transacciones electrónicas de varios departamentos, incluidas multas por exceso de velocidad, licencias para perros, pagos de impuestos especiales y otras transacciones. La ciudad analizaría estos datos estructurados para emitir facturación de seguimiento y actualizar los datos del censo y los registros policiales. También podría ser utilizado por un desarrollador para agregar terabytes de datos generados por sensores en automóviles para ayudar en el proceso de toma de decisiones para una solución de conducción autónoma.
Un mercado de datos es un subconjunto de un almacén de datos que beneficia a un conjunto específico de usuarios dentro de la unidad de negocio. El departamento de marketing de una empresa manufacturera podría utilizar un mercado de datos para determinar el perfil demográfico o persona objetivo ideal para ayudar en el desarrollo de planes de marketing. También podría ser utilizado por un departamento de fabricación para analizar el rendimiento y las tasas de error para permitir la mejora continua. Los conjuntos de datos dentro de un mercado de datos a menudo se utilizan en tiempo real, para análisis actuales y resultados aplicables en la práctica.
Si bien los tres tipos de repositorios de datos en la nube contienen datos, existen diferencias muy claras entre ellos. Por ejemplo, un almacén de datos y un lago de datos son grandes agregaciones de datos, pero un lago de datos suele ser más rentable de implementar y mantener porque en gran medida no está estructurado.
La arquitectura del lago de datos ha evolucionado en los últimos años para admitir mayores volúmenes de datos y computación basada en la nube. Se reciben grandes cantidades de datos de varias fuentes de datos en una ubicación central.
Un almacén de datos podría estructurarse de una de estas tres maneras:
Los datos dentro de un almacén de datos se pueden utilizar más fácilmente para diversos fines que los datos dentro de un lago de datos. La razón es que un almacén de datos está estructurado y se puede extraer o analizar más fácilmente.
Un mercado de datos, por otro lado, contiene una cantidad menor de datos en comparación con un lago de datos y un almacén de datos, y los datos se clasifican para un uso específico o por una unidad demográfica o de negocio específica. Un mercado de datos puede existir en muchos formatos diferentes (estrella, copo de nieve o bóveda) definidos por la estructura lógica de los datos, siendo una estructura de bóveda más ágil, flexible y escalable que los otros formatos.
Hay tres tipos de mercados de datos:
El tipo de repositorio de datos que elija y su estructura dependen en gran medida de las necesidades y demandas de su negocio. Si tiene sentido para su negocio, use el beneficio del almacenamiento basado en la nube híbrida para obtener flexibilidad, escalabilidad y un enfoque más amplio e informado para la resolución de problemas y la toma de decisiones.
Una gran empresa multinacional de fabricación genera grandes volúmenes de datos para diversos usos. Algunos de los datos son importantes, mientras que otros datos pueden o no tener un propósito en el futuro. La empresa utiliza un almacén de datos basado en la nube para el almacenamiento de datos masivos, que es menos costoso que otras opciones de almacenamiento de datos. Sin embargo, la empresa también cuenta con mercados de datos dependientes para áreas específicas de la empresa, lo que proporciona valor a los usuarios empresariales en departamentos como finanzas, fabricación y marketing. Cada uno de estos mercados contiene datos destinados a un uso específico, formateados para facilitar su análisis. Por ejemplo:
Un municipio grande necesita una solución asequible que proporcione datos de una manera asequible y algo utilizable. El municipio utiliza un lago de datos en la nube para mantener los datos de tráfico. No puede permitirse analizar y tomar medidas sobre esos datos en este momento, pero estará listo para cuando llegue la financiación. También utiliza un almacén de datos de software on premises para rastrear el estado de las facturas de impuestos. Además, el municipio utiliza un mercado de datos híbrido para rastrear la propagación de un virus entre los residentes, agregando datos de varios hospitales y servicios de salud municipales a un único repositorio para ser analizados y utilizados por el departamento de estado.
Hay muchos conceptos erróneos con respecto a los repositorios de datos basados en la nube. Algunos de los conceptos erróneos más comunes incluyen los siguientes:
Su empresa es única, con recursos, objetivos y desafíos específicos. Evalúe sus opciones cuidadosamente para determinar qué solución se adaptará mejor a sus necesidades. Considere lo siguiente:
Estas consideraciones le ayudarán a determinar qué solución, o combinación de soluciones, le ayudará a alcanzar sus objetivos.
IBM ofrece varias soluciones para ayudarle con sus necesidades de almacenamiento en la nube y ciencia de datos.