Ajouter des extracteurs de documents
Vous pouvez ajouter des extracteurs de documents personnalisés aux flux de travail agentic pour extraire des champs ou des entités tels que des dates, des noms et autres à partir de documents.
Lorsque vous configurez un extracteur de documents, vous pouvez choisir un modèle dans la liste des modèles disponibles. Vous pouvez également ajouter votre propre modèle personnalisé via AI Gateway. Pour plus d'informations, consultez la section Ajout de modèles d'IA via AI Gateway.
Pour ajouter un extracteur de documents à un flux de travail agentique :
Ouvrez le workflow agentique dans le générateur de workflows.
Cliquez sur l'icône « Ajouter des éléments
de flux ».Sélectionnez l'onglet Nœuds de flux.
Faites glisser l' extracteur de documents vers le flux de travail agentique.
Sélectionnez l'une de ces options d'outils pour extraire des champs de vos documents : Structuré ou Non structuré. Pour plus d'informations et des conseils sur l'option d'outil adaptée à votre cas d'utilisation d'extraction de données, consultez la section Choisir une option d'outil pour extraire des champs à partir de documents.
Sinon, pour ajouter un extracteur de documents, cliquez sur la ligne de connexion entre les nœuds de début et de fin, puis sélectionnez Ajouter une activité de flux > Extracteur de documents.
Choisir une option d'outil pour extraire des champs à partir de documents
Vous pouvez choisir entre deux options d'outils pour extraire des champs à partir de documents : Structuré et Non structuré. Ces outils diffèrent dans leur manière de traiter les informations, mais les étapes à suivre sont pratiquement identiques dans les deux cas.
Non structuré : utilise un modèle linguistique basé sur le texte pour extraire les champs de niveau supérieur des documents. Il fonctionne mieux pour les contenus riches en texte, mais n'extrait pas les valeurs des colonnes des tableaux.
Structuré : utilise un modèle linguistique multimodal basé sur la vision pour extraire à la fois les champs de niveau supérieur et les données du tableau. Comme il s'appuie sur un modèle plus volumineux, il fonctionne généralement plus lentement.
Quand utiliser chaque option de l'outil
Utilisez l'option Non structuré pour les documents comportant beaucoup de texte et s'étendant sur plusieurs pages, tels que les contrats, les e-mails ou les manuels, dans lesquels les champs apparaissent dans les en-têtes ou dans le corps du texte. Pour plus d'informations, consultez la section Configuration d'un extracteur de documents après avoir sélectionné l'option Non structuré.
Utilisez Structured pour les documents structurés ou à mise en page fixe, généralement d'une à trois pages, tels que les factures, les bons de commande ou les formulaires fiscaux. Il est idéal lorsque vous devez extraire des informations à partir de tableaux. Pour plus d'informations, consultez la section Configuration d'un extracteur de documents après avoir sélectionné l'option Structuré.
Configuration d'un extracteur de documents après avoir sélectionné l'option Non structuré
Le modèle « watsonx/ibm/granite-3-3-8b-instruct » est obsolète depuis le 24 novembre 2025 et sera supprimé le 22 février 2026. Utilisez le modèle par défaut ou un autre modèle pris en charge pour l'extracteur de documents non structurés.
Pour configurer l'extracteur de documents afin d'identifier et d'extraire un ensemble de champs à partir de documents non structurés :
Sélectionnez l'extracteur de documents que vous avez ajouté au flux de travail agentique.
Cliquez sur l'icône « Modifier
les champs ».- Sélectionnez un modèle à utiliser pour l'extracteur de documents dans la liste Modèle.
Une boîte de dialogue permettant de télécharger les documents et d'ajouter des champs s'affiche.
Dans la liste des modèles, cliquez sur « Afficher tous les modèles de base » pour ouvrir la boîte de dialogue de sélection des modèles, qui répertorie tous les modèles disponibles. Pour sélectionner un modèle, effectuez une recherche ou choisissez-en un dans la liste. Une fois que vous avez sélectionné un modèle, cliquez sur Enregistrer. Toutes les notifications associées au modèle sélectionné, telles que les avis de dépréciation ou les exigences en matière de licence de tiers, s'affichent.
Certains modèles comportent une balise d'état dans la boîte de dialogue pour indiquer des statuts tels que « Recommandé » ou « Tiers ». Une icône d'avertissement indique qu'un modèle pourrait être supprimé ou obsolète dans une version ultérieure.
Remarque :Vous pouvez télécharger des documents ou ajouter des champs dans l'ordre que vous souhaitez. L'extraction commence lorsque le système dispose d'au moins un document et un champ.
Procédez comme suit :
Téléchargez vos documents
Les documents types téléchargés aident à créer les champs. Ces documents n'entraînent pas le modèle et ne font pas non plus partie de l'agent en cours de configuration.
Le téléchargement des documents peut prendre un certain temps.
Lorsque le téléchargement est terminé, vous pouvez voir un aperçu du document dans lequel vous pouvez effectuer les actions suivantes en utilisant les options de la barre d'outils :
Sélectionnez un document téléchargé à afficher dans la liste
Parcourir les pages d'un document que vous êtes en train de consulter
Adapter la largeur et la hauteur de la page à l'affichage
Zoomer et dézoomer une page pour la visualiser
Recherche d'un champ dans un document

Dans l'exemple précédent, un utilisateur télécharge des documents types et l'aperçu de ces documents s'affiche.
- Ajouter des champs
Cliquez sur « Ajouter un champ » pour ajouter les champs correspondant aux informations que vous souhaitez extraire des documents, telles que les dates, les noms, etc.
L'extracteur de documents recherche les valeurs associées aux champs dans l'ensemble des documents.

Dans l'exemple précédent, un utilisateur a ajouté les champs « Prix », « Durée » et « Date », qui font l'objet d'une recherche et s'affichent dans le volet d'aperçu du document.
Pour modifier les détails d'un champ, passez la souris dessus, puis cliquez sur l'icône «
Afficher les détails du champ ». Vous pouvez modifier le nom du champ, sa description et son type de données. Vous pouvez ajouter des exemples du champ pour aider le modèle à comprendre les informations que vous souhaitez extraire, et cliquer sur Afficher sur le document pour obtenir les résultats. Vous pouvez également supprimer le champ s'il n'est plus nécessaire.
Pour télécharger d'autres documents et supprimer des documents existants, sélectionnez l'option Gérer les documents dans la liste de la barre d'outils de l'aperçu du document.
Parcourez les différents documents à partir de la barre d'outils de prévisualisation des documents pour vérifier si les informations sont extraites comme vous le souhaitiez.
Configurez les paramètres qui déclenchent un examen par l'utilisateur. Pour plus d'informations, consultez la section Configuration d'un avis utilisateur.
Après avoir vérifié et obtenu les résultats escomptés, fermez la boîte de dialogue de l'extracteur de documents.
Configuration d'un extracteur de documents après avoir sélectionné l'option Structuré
La possibilité d'extraire tous les éléments d'une ligne à partir de documents structurés tels que les bons de commande et les factures réduit les efforts manuels et améliore la précision du traitement des documents.
Pour configurer l'extracteur de documents afin d'identifier et d'extraire un ensemble de champs à partir de documents structurés :
Sélectionnez l'extracteur de documents que vous avez ajouté au flux de travail agentique.
Cliquez sur l'icône « Modifier
Une boîte de dialogue permettant de télécharger les documents et d'ajouter des champs s'affiche.
les champs ».- Sélectionnez ou indiquez un modèle à utiliser pour l'extracteur de documents dans la liste Modèles.
Dans la liste des modèles, cliquez sur « Afficher tous les modèles de base » pour ouvrir la boîte de dialogue de sélection des modèles, qui répertorie tous les modèles disponibles. Pour sélectionner un modèle, effectuez une recherche ou choisissez-en un dans la liste. Une fois que vous avez sélectionné un modèle, cliquez sur Enregistrer. Toutes les notifications associées au modèle sélectionné, telles que les avis de dépréciation ou les exigences en matière de licence de tiers, s'affichent.
Certains modèles comportent une balise d'état dans la boîte de dialogue pour indiquer des statuts tels que « Recommandé » ou « Tiers ». Une icône d'avertissement indique qu'un modèle pourrait être supprimé ou obsolète dans une version ultérieure.
Remarque :Vous pouvez télécharger des documents ou ajouter des champs dans l'ordre que vous souhaitez. L'extraction commence lorsque le système dispose d'au moins un document et un champ.
- Procédez comme suit :
- Utiliser un schéma issu d'une liste de schémas prédéfinis
Vous pouvez sélectionner un type de document et ajouter plusieurs champs associés à ce type, au lieu de les ajouter manuellement un par un. Plusieurs types de documents, tels que les relevés bancaires, les factures, les déclarations de sinistre et autres, sont disponibles pour la sélection des schémas.
Pour ajouter des champs à partir d'un schéma prédéfini, procédez comme suit :- Cliquez sur « Définir le schéma ».
- Sélectionnez un type de document dans les schémas prédéfinis.
Une description du type de document sélectionné et de tous les champs associés permettant d'extraire des données s'affiche.
- Cliquez sur Créer.
L'extracteur de documents recherche les valeurs associées aux champs dans l'ensemble des documents.

Dans l'exemple précédent, les champs extraits d'une facture s'affichent dans la boîte de dialogue.
Pour modifier les détails d'un champ, passez la souris dessus, puis cliquez sur l'icône «
Afficher les détails du champ ». Vous pouvez modifier le nom du champ, le type de données et la description. Vous pouvez ajouter des exemples du champ pour aider le modèle à comprendre les informations que vous souhaitez extraire, et cliquer sur Afficher sur le document pour obtenir les résultats. Vous pouvez également supprimer ce champ s'il n'est pas nécessaire.Téléchargez vos documents
Les documents types téléchargés aident à créer les champs. Ces documents n'entraînent pas le modèle et ne font pas non plus partie de l'agent en cours de configuration.
Le téléchargement des documents peut prendre un certain temps.
Lorsque le téléchargement est terminé, vous pouvez voir un aperçu du document dans lequel vous pouvez effectuer les actions suivantes en utilisant les options de la barre d'outils :
Sélectionnez un document téléchargé à afficher dans la liste
Parcourir les pages d'un document que vous êtes en train de consulter
Adapter la largeur et la hauteur de la page à l'affichage
Zoomer et dézoomer une page pour la visualiser
Recherche d'un champ dans un document

Dans l'exemple précédent, un utilisateur télécharge un exemple de facture et l'aperçu du document s'affiche. L'aperçu affiche également les tableaux détectés automatiquement dans le document à partir desquels vous pouvez extraire des données.
Ajouter les tables détectées automatiquement
Pour ajouter un tableau détecté automatiquement dans le document afin d'en extraire des données, cliquez sur l'icône Ajouter un
tableau.Les données du tableau sont ajoutées aux champs à extraire sous un nom de tableau. Pour modifier le nom du tableau, passez la souris dessus, puis cliquez sur l'icône Modifier
. Pour supprimer le tableau, vous pouvez cliquer sur l'icône
Supprimer.Vous pouvez également réorganiser les colonnes dans les tableaux extraits. Pour plus d'informations, consultez la section Réorganiser les colonnes.
Ajouter des tableaux personnalisés
Pour ajouter une table personnalisée et définir les champs à partir desquels extraire les données, cliquez sur « Définir le schéma », sélectionnez « Schéma défini par l'utilisateur », puis cliquez sur « Créer ».
Procédez comme suit pour ajouter un tableau personnalisé :
a. Cliquez sur l'icône « Ajouter un
tableau » dans le panneau latéral, indiquez un nom pour votre tableau personnalisé, puis appuyez sur Entrée.b. Cliquez sur Ajouter une colonne, indiquez le nom de la colonne pour votre tableau personnalisé, puis appuyez sur Entrée. Répétez cette étape pour ajouter d'autres colonnes à votre tableau personnalisé.
Le système recherche les valeurs de colonne dans le document. La première valeur trouvée pour une colonne s'affiche dans le panneau latéral et toutes les autres valeurs de cette colonne sont mises en surbrillance dans l'aperçu du document.
Si aucune valeur n'est trouvée pour une colonne, aucune valeur n'est affichée dans le panneau latéral correspondant à cette colonne. Dans ce cas, vous pouvez cliquer sur l'icône « Afficher les
détails de la colonne » pour que le système vous indique la valeur attendue dans le document. Cette action aide le système à comprendre quelles informations vous souhaitez extraire pour la colonne.Pour demander une valeur, sélectionnez le type de données, activez le commutateur Description, entrez ou décrivez la valeur, puis cliquez sur Afficher dans le document. Le système recherche les valeurs dans le document en fonction de votre description. Si une valeur est trouvée, elle s'affiche dans le panneau latéral. Vous pouvez également supprimer la colonne si elle n'est plus nécessaire.
Vous pouvez également réorganiser les colonnes dans les tableaux extraits. Pour plus d'informations, consultez la section Réorganiser les colonnes.
c. Pour afficher votre tableau personnalisé avec un aperçu des données extraites, cliquez sur Afficher à côté du nom du tableau.

Ajouter des champs
Pour ajouter des champs supplémentaires destinés aux informations que vous souhaitez extraire des documents (dates, noms, etc.), cliquez sur « Définir le schéma », sélectionnez « Schéma défini par l'utilisateur », puis cliquez sur « Créer » -> « Ajouter un champ ».
Une fois que vous avez saisi un nom de champ, l'extracteur de documents recherche les valeurs associées à ces champs dans l'ensemble des documents.
Pour modifier les détails d'un champ, passez la souris dessus, puis cliquez sur l'icône « Afficher les détails
du champ ». Vous pouvez modifier le nom du champ, le type de données et la description. Vous pouvez ajouter des exemples du champ pour aider le modèle à comprendre les informations que vous souhaitez extraire, et cliquer sur Afficher sur le document pour obtenir les résultats. Vous pouvez également supprimer le champ s'il n'est plus nécessaire. Pour ajouter d'autres documents ou supprimer des documents existants, cliquez sur
l'icône « Gérer les documents » dans la liste de la barre d'outils d'aperçu des documents.Parcourez les différents documents à partir de la barre d'outils de prévisualisation des documents pour vérifier si les informations sont extraites comme vous le souhaitiez.
Configurez les paramètres qui déclenchent un examen par l'utilisateur. Pour plus d'informations, consultez la section Configuration d'un avis utilisateur.
Après avoir vérifié et obtenu les résultats escomptés, fermez la boîte de dialogue de l'extracteur de documents.
Réorganisation des colonnes
Vous pouvez réorganiser les colonnes des tableaux en les faisant glisser et en les déposant. Cette action est utile, par exemple, lorsque vous souhaitez vous assurer que l'ordre des colonnes correspond à celui du tableau d'origine dans le document.
Par défaut, l'ordre des colonnes dans le schéma correspond à l'ordre dans la table extraite. Cependant, si une colonne est omise lors de la détection automatique et ajoutée manuellement ultérieurement, elle apparaît à la fin du tableau.
Pour réorganiser les noms des colonnes dans les tableaux :
Passez la souris sur le nom de la colonne dans le panneau latéral et faites-la glisser en cliquant sur l'icône de glissement
.Cliquez sur Afficher à côté du nom du tableau. Le nouvel ordre des colonnes dans le tableau s'affiche dans l'aperçu.
Mise en correspondance des données et des entrées
Par défaut, la cartographie automatique est activée. Toutefois, vous pouvez associer des valeurs aux entrées.
Pour associer des valeurs à des entrées, procédez comme suit :
Sélectionnez le nœud de l'extracteur de documents, puis cliquez sur Modifier le mappage des données.
Spécifiez les valeurs d'entrée pour le mappage des données. Pour plus d'informations sur le mappage des données, voir Mappage des données.
Mappage des tables extraites d'un nœud extracteur de documents vers d'autres nœuds dans un flux de travail
Vous pouvez désormais mapper une sortie de type table à partir d'un nœud d'extraction de document dans un workflow. Vous pouvez effectuer l'une des opérations suivantes :
Pour afficher l'intégralité du tableau dans une conversation, mappez le tableau extrait dans le workflow à l'aide du type d'interaction liste sous un nœud extracteur de document.

Pour afficher les données d'une ligne d'un tableau dans une discussion, vous pouvez parcourir les lignes d'un tableau extrait à l'aide d'une boucle « For each » dans le flux de travail. Pour ce faire, vous pouvez combiner une boucle « For each » avec un nœud d'activité utilisateur et une sortie « Message ». Ensuite, pour afficher chaque ligne, vous pouvez sélectionner les colonnes dans le mappage de données de la boucle « Pour chaque ».

De plus, pour utiliser toute sortie de table extraite dans un nœud en aval du flux de travail, vous pouvez utiliser ce même processus de mappage de données de boucle « For each ». Cela permet d'effectuer des traitements supplémentaires, tels que l'application d'une logique conditionnelle dans un flux de travail.
Configuration d'un avis utilisateur
Aperçu
Vous pouvez configurer les paramètres qui déclenchent un examen par l'utilisateur.
Si le score de confiance de l'extraction du système est inférieur au seuil de confiance d'extraction défini (pour l'option non structurée ) ou si l'extraction renvoie des valeurs vides (pour l'option structurée ), une tâche de révision utilisateur est créée et attribuée à l'utilisateur.
Pour configurer un avis utilisateur :
Sélectionnez l'extracteur de documents dans le flux de travail agentique.
Activez le commutateur « Avis utilisateur ».
Effectuez l'une des actions suivantes :
Pour l'option non structurée : cliquez sur l'icône Modifier
dans le champ « Si le niveau de confiance de l'extraction est inférieur à ». Définissez le seuil de confiance d'extraction pour tous les champs ou pour des champs spécifiques pouvant déclencher une vérification par l'utilisateur. Pour sélectionner les champs spécifiques qui déclenchent une vérification par l'utilisateur, cliquez sur l'icône Modifier
, sélectionnez les champs souhaités, puis cliquez sur Terminé. Le score de confiance de l'extraction reflète le degré de correspondance entre les résultats extraits et les valeurs attendues.Pour l'option structurée : cliquez sur l'icône Modifier
dans le champ « Si l'extraction renvoie des valeurs vides ».Dans la liste Attribuer à, sélectionnez l'une des options suivantes :
Option |
Description |
|---|---|
Initiateur de flux |
Seul l'utilisateur qui lance le flux peut réviser le document. |
Utilisateur spécifié |
Seul un utilisateur désigné peut consulter l' document.If ucun utilisateur n'est attribué; cliquez sur « Attribuer un utilisateur » pour sélectionner un utilisateur. L'utilisateur sélectionné s'affiche dans le champ « Utilisateur attribué ». Pour changer d'utilisateur, cliquez sur l'icône Modifier |
Utilisateur à partir d'une variable |
Seul un utilisateur spécifié dans une variable peut réviser le document. |
Le système informe l'utilisateur dans le chat qu'une vérification est nécessaire en fonction du score de confiance de l'extraction ou des valeurs vides.

L'utilisateur peut cliquer sur la notification de chat pour afficher l'activité d'évaluation.

L'utilisateur peut ensuite examiner les valeurs extraites, apporter les modifications nécessaires et soumettre la révision. Après la soumission, le flux de travail se poursuit avec les valeurs mises à jour.

Limites et restrictions de l'extracteur de documents
Les extracteurs de documents sont soumis aux limites et restrictions suivantes.
Zone |
Description |
|---|---|
Taille de fichier maximale |
10 Mo |
Nombre maximum de fichiers téléchargés |
5 dossiers |
Types de fichiers acceptés |
.doc,.docx,.jpeg.jpg,.pdf,.png,.ppt,.pptx,.tif,.tiff |
nombre maximum de pages |
600 pages |
Nombre maximum de champs |
25 champs |
Les restrictions suivantes s'appliquent également à l'extracteur de documents :
Valeurs de confiance pour les champs extraits
Contrairement à l'extracteur de documents non structurés, l'extracteur de documents structurés ne fournit pas de scores de confiance pour les valeurs de champ extraites. Par conséquent, les règles d'évaluation des utilisateurs basées sur la confiance ne peuvent pas être configurées.
Extraction à mention unique
L'extracteur de documents ne capture qu'une seule occurrence d'une valeur de champ dans un document, généralement la première occurrence. Par exemple, si un numéro de facture apparaît plusieurs fois, une seule occurrence est extraite. Pour saisir plusieurs valeurs, définissez des champs avec des étiquettes sémantiques distinctes, telles que numéro de téléphone fixe et numéro de téléphone portable.
Création de flux de travail autonomes
Un flux de travail agentique définit un ensemble d'activités et de contrôles liés qui sont conçus pour atteindre un but ou un objectif commercial spécifique. En savoir plus sur les flux de travail agentiques.