构建和部署模型

完成调整抽取过程后,可以根据定制和构建的类别生成类别模型。

  1. 单击 生成模型 以生成类别模型。
    图 1。 生成新模型
    显示 "生成模型" 按钮的图像。
    图 2。 构建类别模型
    生成类别模型对话框。 该对话框显示 " 这将使用当前设置创建类别模型,并将其导出到 Modeler 流程。 要生成模型吗? " 对话框中的其中一个按钮表示 "构建"。
  2. 如果要保存文本分析工作台会话,请单击 返回到流 ,然后单击 保存并退出
    图 3。 保存会话
    保存并退出对话框。 该对话框询问您是否要将更改保存到流中的 "文本挖掘" 节点。
    生成的类别模型块将显示在流画布上。
    图 4: 生成的类别模型块
    生成的类别模型块。 显示具有 "文本挖掘" 节点和类别模型块的流。
    在文本分析工作台中验证并生成类别模型后,可以将其部署到流中,并对相同数据集进行评分或对新数据集进行评分。
    图 5。 使用两种方式进行评分的示例流
    使用两种方式进行评分的示例流
    此示例流介绍用于评分的两种方式:
    • 类别作为字段。 借助该选项,输出记录数量与输入中的记录数量相同。 但是,每个记录现在都包含在模型选项卡上选择的每个类别的一个新字段。 对于每个字段,输入 true 和 false 的标记值,例如,True/False1/0。 在此流中,值设置为 10 以聚集结果并统计正面、负面、混合(正面和负面)或者无评分(无意见)答案的数量。
      图 6。 模型结果 - 类别为字段
      将结果类别建模为字段。 它是一个包含 "标识" , "注释" , "性别" , "原因" , "Neg" , "Pos" , "Cont" 和 "观点" 列的表。 标识列的条目是数字。 "注释" 列的条目显示从文本中抽取的简短短语。 例如,一个条目表示非常安静,但非常昂贵。 "原因" 列的条目显示此行是否用于商务或休闲。 Neg 和 Pos 显示每个简短短语的负面和正面情绪计数。 观点显示复审是正面 (仅 "Pos" 列中的数字) ,负面 (仅 "Neg" 列中的数字) 还是混合 ("Neg" 和 "Pos" 列中的数字)。
    • 作为记录的类别。 使用此选项,为每个 category, document 对创建一个新记录。 通常,输出中的记录数量多于输入中的记录数量。 除输入字段外,还会根据模型的种类向数据添加新字段。
      图 7。 模型结果 - 类别为记录
      对结果进行建模-将类别作为记录。 它是一个包含 "标识" , "注释" , "性别" , "原因" , "类别" 和 "观点" 列的表。 标识列的条目是数字。 "注释" 列的条目显示从文本中抽取的简短短语。 例如,一个条目表示非常安静,但非常昂贵。 "原因" 列的条目显示此行是否用于商务或休闲。 Neg 和 Pos 显示每个简短短语的负面和正面情绪计数。 观点显示复审是正面 (仅 "Pos" 列中的数字) ,负面 (仅 "Neg" 列中的数字) 还是混合 ("Neg" 和 "Pos" 列中的数字)。
  3. 您可以在 DeriveSentiment 超级节点后添加一个选择节点 ,设置包括 Sentiments=Pos ,并添加一个图表节点 ,以便快速了解客人对酒店的满意之处:
    图 8。 正面意见图表
    正面意见图表。 它显示术语和短语,例如位置,预算和酒店设施。 这些术语的大小因其重要性而异。 他们安排了中心最重要的名词,是在中心,是最大的。