Utilisation du noeud Liste fichiers dans Text Mining
Le noeud Liste fichiers est utilisé lorsque les données textuelles résident dans des documents non structurés externes dans des formats tels que Microsoft Word, Microsoft Excel et Microsoft PowerPoint, ainsi que Adobe PDF, XML et HTML (entre autres).
Supposons que l'on connecte un noeud Liste fichiers à un noeud Text Mining afin de fournir des données texte depuis des documents externes :
- Noeud Liste fichiers (onglet Paramètres). Nous avons tout d'abord ajouté ce noeud au flux pour indiquer l'emplacement de stockage des documents texte. Nous avons sélectionné le répertoire contenant tous les documents sur lesquels nous souhaitons effectuer l'exploration de texte.
- Noeud Text Mining (onglet Champs). Nous avons ensuite ajouté et connecté un noeud Text Mining au noeud liste fichiers. Dans ce noeud, nous avons défini le format d'entrée, le modèle de ressources et le format de sortie. Nous avons choisi le nom de champ créé à partir du noeud liste fichiers, le champ de texte et d'autres paramètres. Pour plus d'informations, voir Utilisation du noeud Text Mining dans un flux.
Pour plus d'informations sur l'utilisation du noeud Text Mining, voir Noeud de modélisation Text Mining.