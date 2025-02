I dati provengono da molte fonti in molti formati; spetta al framework dei dati acquisire, trasformare e organizzare i dati da utilizzare per gli LLM. Spesso i dati sono isolati e non strutturati. Per ottenerli e strutturarli, un framework di dati come LlamaIndex deve farli passare attraverso un processo comunemente chiamato ingestion pipeline.

Una volta che i dati sono stati acquisiti e trasformati in un formato che l'LLM può utilizzare, il passaggio successivo è convertire le informazioni in una struttura di dati per l'indicizzazione. La procedura comune è la conversione dei dati non strutturati in incorporamenti vettoriali. Questo processo è chiamato "creazione di un incorporamento" nell'elaborazione del linguaggio naturale (NLP) ma viene definito "indicizzazione" nella terminologia dei dati.1 L'indicizzazione è necessaria perché consente all'LLM di interrogare e recuperare i dati acquisiti tramite l'indice vettoriale. I dati possono essere indicizzati in base alla strategia di query scelta.

L'integrazione dei dati facilita la context augmentation, integrando i dati privati nella finestra di contesto o "base di conoscenza" dell'LLM. La lunghezza della finestra di contesto dei modelli Granite 3B e 8B di IBM è stata recentemente estesa a 128.000 token.2 Una finestra di contesto più ampia consente al modello di conservare una maggiore quantità di testo nella memoria di lavoro, migliorando la sua capacità di tenere traccia dei dettagli chiave durante conversazioni estese, analisi di testi lunghi e utilizzo di grandi basi di codice. Questa funzionalità consente ai chatbot LLM di produrre risposte coerenti sia nel breve termine che in un contesto più esteso.

Tuttavia, anche con una finestra di contesto ampia, un modello ottimizzato potrebbe comportare costi considerevoli sia per l'addestramento che per l'inferenza. L'ottimizzazione dei modelli con dati specifici o privati richiede trasformazioni dei dati e sistemi che promuovano metodi di recupero dati efficienti per il prompting LLM. La metodologia RAG è considerata un'opzione promettente per facilitare la modellazione linguistica con contesto ampio.3