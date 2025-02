Les données proviennent de nombreuses sources et se présentent sous de nombreux formats. C’est au cadre de données qu’il revient de les ingérer, de les transformer et de les organiser pour qu’elles puissent être utilisées par les LLM. Les données sont souvent cloisonnées et non structurées. Pour les recueillir et les structurer, un cadre de données tel que LlamaIndex doit les faire passer par un processus communément appelé pipeline d’ingestion.

Une fois les données ingérées et converties dans un format utilisable par le LLM, l’étape suivante consiste à transformer les informations en une structure de données pour l’indexation. Pour ce faire, la procédure courante est la conversion des données non structurées en plongements vectoriels. Ce processus est appelé « création d’un plongement » dans le traitement automatique du langage naturel (NLP) mais se nomme « indexation » dans la terminologie des données.1 L’indexation est nécessaire car elle permet au LLM d’interroger et d’extraire les données ingérées grâce à l’index vectoriel. Les données peuvent être indexées en fonction de la stratégie de requête adoptée.

L’intégration des données facilite l’augmentation du contexte en intégrant des données privées dans la fenêtre contextuelle ou la « base de connaissances » du LLM. La longueur de la fenêtre contextuelle des modèles Granite 3B et 8B d’IBM a récemment été étendue à 128 000 jetons.2 Une fenêtre contextuelle plus large permet au modèle de conserver davantage de texte dans sa mémoire de travail, ce qui améliore sa capacité à suivre des détails clés tout au long de conversations prolongées et de longues bases de code. Cette capacité permet aux chatbots LLM de produire des réponses cohérentes à la fois à court terme et dans un contexte plus large.

Cependant, même avec une fenêtre contextuelle étendue, un modèle affiné peut entraîner des coûts considérables à la fois pour l’entraînement et pour l’inférence. Le réglage fin des modèles avec des données spécifiques ou privées exige des transformations de données et des systèmes qui favorisent des méthodes efficaces d’extraction de données pour les prompts LLM. La méthodologie RAG est considérée comme une option prometteuse pour faciliter la modélisation du langage en contexte long.3