在流中使用文本挖掘节点

“文本挖掘”建模节点用于访问数据和抽取流中的概念。 您可以使用任何源节点来访问数据,例如数据库节点、变量 文件节点、Web 订阅源节点或固定文件节点。 对于驻留在外部文档内的文本,可使用“文件列表”节点。

示例 1:文件列表节点和文本挖掘节点,用于直接构建概念模型块

以下示例显示了如何使用“文件列表”节点和“文本挖掘”建模节点来生成概念模型块。 有关使用 "文件列表" 节点的更多信息,请参阅 "文件列表" 节点

  1. 文件列表节点(“设置”选项卡)。 首先,我们将此节点添加到流中以指定文本文件的存储位置。 我们选择了包含要对其执行文本挖掘的所有文档的目录。
  2. “文本挖掘”节点(“字段”选项卡)。 接下来,我们将一个“文本挖掘”节点添加并连接到“文件列表”节点。 在此节点中,我们定义了输入格式、资源模板和输出格式。 我们选择了从“文件列表”节点生成的字段名称,并选择了文本字段和其他设置。 有关更多信息,请参阅 在流中使用 "文本挖掘" 节点 主题。
  3. “文本挖掘”节点(“模型”选项卡)。 接下来,在“模型”选项卡上,我们选择了构建方式以从该节点直接生成概念模型块。 您可以选择其他资源模板或者保留基本资源。

示例 2:“Excel 文件”节点和“文本挖掘”节点,用于以交互方式构建类别模型

此示例显示了“文本挖掘”节点如何能够另外启动交互式工作台会话。 有关交互式工作台的更多信息,请参阅 交互式工作台方式

  1. “Excel 源”节点(“数据”选项卡)。 首先,我们将此节点添加到流中以指定文本存储位置。
  2. “文本挖掘”节点(“字段”选项卡)。 接下来,我们添加并连接了一个“文本挖掘”节点。 在此第一个选项卡上,我们定义了输入格式。 我们从源节点选择了字段名称。
  3. 文本挖掘节点(“模型”选项卡)。 接下来,在“模型”选项卡上,我们选择了以交互方式构建类别模型块,并使用抽取结果来自动构建类别。 在此示例中,我们从文本分析包装入了资源副本和一组类别。
  4. 交互式工作台会话。 接下来,我们执行了流并打开了交互式工作台界面。 执行抽取之后,我们开始探索数据并改进类别。