La data ingestion è la prima fase della pipeline RAG di LlamaIndex. In LlamaIndex, questa fase è nota come caricamento dei dati e utilizza i caricatori di dati, o connettori di dati, per recuperare ed elaborare i dati. LlamaIndex copre oltre 160 tipi di formati di dati e supporta le strutture dati, inclusi i dati strutturati, semi strutturati e non strutturati .

Quando si utilizza LlamaIndex per attività di recupero non coperte da un'unica fonte di dati, gli utenti possono rivolgersi a LlamaHub: un pool versatile e open source di caricatori di dati che copre una serie di esigenze specifiche. Gli utenti di LlamaHub possono combinare più fonti di dati, come API , database SQL e persino Google Workspaces, in un solo workflow. Alcuni connettori LlamaHub supportano anche file audio e video.