Las empresas han estado generando datos desde la era del ábaco, pero los analytics modernos solo fueron posibles con la llegada de la computadora digital y el almacenamiento de datos.
Un gran paso adelante llegó en la década de 1970, con el paso a bases de datos centralizadas más grandes. Luego, ETL se introdujo como un proceso para integrar y cargar datos para su cálculo y análisis, convertir finalmente en el método principal para procesar datos para proyectos de almacenamiento de datos.
A fines de la década de 1980, los data warehouses y la transición de bases de datos transaccionales a bases de datos relacionales que almacenaban la información en formatos de datos relacionales crecieron en popularidad. Las bases de datos transaccionales más antiguas almacenaban información transacción por transacción, y con cada transacción se almacenaba información duplicada del cliente, por lo que no había una manera sencilla de acceder a los datos del cliente de forma unificada a lo largo del tiempo. Con las bases de datos relacionales, el análisis se convirtió en la base de la business intelligence (BI) y en una herramienta importante en la toma de decisiones.
Hasta la llegada del software ETL más sofisticado, los primeros intentos fueron en gran medida manuales por parte del equipo de TI para extraer datos de varios sistemas y conectores. Luego transformaron los datos en un formato común y los cargaron en tablas interconectadas. Aun así, los primeros pasos de ETL valieron la pena, ya que los algoritmos avanzados, además del auge de las redes neuronales, produjeron oportunidades cada vez más profundas para obtener insights analíticos.
La era del big data llegó en la década de 1990 a medida que las velocidades informáticas y la capacidad de almacenamiento continuaron creciendo rápidamente. Luego se extrajeron grandes volúmenes de datos de nuevas fuentes, como las redes sociales y el Internet de las cosas (IoT). Seguía existiendo un factor limitante, ya que los datos a menudo se almacenaban en data warehouses on premises.
El siguiente gran paso tanto en computación como en ETL fue la computación en nube, que se popularizó a finales de los noventa. Gracias al uso de almacenes de datos como Amazon Web Services (AWS), Microsoft Azure y Snowflake, ahora se puede acceder a los datos desde cualquier parte del mundo. Estas plataformas también pueden escalar rápidamente para permitir que las soluciones ETL ofrezcan insights notablemente detallados y una nueva ventaja competitiva.
La última evolución son las soluciones ETL a través de la transmisión de datos para ofrecer insights actualizados al segundo a partir de grandes cantidades de datos.