在流中使用概念模型块

使用“文本挖掘”建模节点时,您可以生成概念模型块或类别模型块(通过交互式工作台会话)。以下示例显示了如何在简单的流中使用概念模型。

示例:含概念模型块的“Statistics 文件”节点

以下示例显示了如何使用“文本挖掘”概念模型块。

图 1. 示例流:含“文本挖掘”概念模型块的“Statistics 文件”节点。
示例流:含“文本挖掘”概念模型块的“Statistics 文件”节点。
  1. “Statistics 文件”节点(“数据”选项卡)。首先,我们将此节点添加到流中以指定文本文件的存储位置。
    图 2. “Statistics 文件”节点对话框:“数据”选项卡
    “Statistics 文件”节点对话框:“数据”选项卡
  2. “文本挖掘”概念模型块(“模型”选项卡)。接下来,我们将一个概念模型块添加并连接到“Statistics 文件”节点。选中要用于对数据进行评分的概念。
    图 3. “文本挖掘”模型块对话框:“模型”选项卡
    “文本挖掘”模型块对话框:“模型”选项卡
  3. “文本挖掘”概念模型块(“设置”选项卡)。然后,定义输出格式并选择概念作为字段。在“模型”选项卡中将为选中的每个概念创建一个新字段。每个字段名称将由概念名称和前缀“Concept_”组成
    图 4. “文本挖掘”概念模型块对话框:“设置”选项卡
    “文本挖掘”概念模型块对话框:“设置”选项卡
  4. “文本挖掘”概念模型块(“字段”选项卡)。然后,选择文本字段 Q2_What_do_you_like_least_about_this_portable_music_player,即来自“Statistics 文件”节点的字段名称。我们还选择了选项文本字段表示:实际文本
    图 5. “文本挖掘”概念模型块对话框:“字段”选项卡
    “文本挖掘”概念模型块对话框:“字段”选项卡
  5. 表节点。然后,附加一个表节点以查看结果并执行流。这样会在屏幕上打开表输出。
图 6. 滚动表输出以显示概念标记
滚动表输出以显示概念标记