Data ingestion es el movimiento de datos de varias fuentes a un único ecosistema. Estas fuentes pueden incluir bases de datos, plataformas de computación en la nube como Amazon Web Services (AWS), dispositivos IoT, data lakes y almacenes de datos, sitios web y otros puntos de contacto con los clientes. Los ingenieros de datos utilizan API para conectar muchos de estos puntos de datos a sus pipelines.

Cada fuente de datos almacena y da formato a los datos de una manera específica, que puede ser estructurada o no estructurada. Si bien los datos estructurados ya están formateados para un acceso eficiente, los datos no estructurados no lo están. A través de la ingesta de datos, estos se unifican en un sistema de datos organizado, listo para un mayor refinamiento.