La arquitectura de plataformas de datos tiene una historia interesante. Hacia el cambio de milenio, las empresas empezaron a darse cuenta de que la carga de trabajo de informes e inteligencia empresarial requería una nueva solución en lugar de las aplicaciones transaccionales. Surgió una plataforma de lectura optimizada que puede integrar datos de múltiples aplicaciones. Era Datawarehouse.

En otra década, Internet y los dispositivos móviles comenzaron a generar datos de volumen, variedad y velocidad imprevistos. Requería una solución de plataforma de datos diferente. Así surgió el data lake, que maneja datos estructurados y no estructurados con un gran volumen.

Pasó otra década más. Y quedó claro que el data lake y el datawarehouse ya no son suficientes para gestionar la complejidad empresarial y la nueva carga de trabajo de las empresas. Es demasiado caro. El valor de los proyectos de datos es difícil de entender. Las plataformas de datos son difíciles de cambiar. El tiempo exigió una nueva solución, una vez más.

¿Adivina qué? Esta vez, están surgiendo al menos tres soluciones de plataforma de datos diferentes: lakehouse de datos, data fabric y data mesh. Aunque esto es alentador, también está generando confusión en el mercado. Los conceptos y valores se superponen. A veces surgen diferentes interpretaciones en función de a quién se pregunte.

Este artículo trata de aliviar esas confusiones. Se explicarán los conceptos. Y luego se introducirá un marco que mostrará cómo estos tres conceptos pueden conducir el uno al otro o usarse juntos.