文本挖掘建模节点
“文本挖掘”节点使用语言和频率技术来从文本中抽取关键概念,并使用这些概念和其他数据创建类别。 此节点可用于探索文本数据内容或者生成概念模型块或类别模型块。 执行此建模节点时,内部语言抽取引擎会使用自然语言处理方法抽取和组织概念、模式和/或类别。
您可以使用直接生成选项执行“文本挖掘”节点并自动生成概念或类别模型块。 或者,您可以使用以交互方式构建方式来使用更加实践性和探索性的方法,通过这种方式,您可以抽取概念、创建类别和优化您的语言资源,并且可以执行文本链接分析和探索集群。 请参阅主题 文本挖掘节点: "模型" 选项卡 以获取更多信息。
您可以在 IBM SPSS Modeler 窗口底部的节点选用板的 IBM® SPSS® Modeler Text Analytics 选项卡上找到此节点。 请参阅主题 IBM SPSS Modeler Text Analytics 节点 ,了解更多信息。
需求。 文本挖掘建模节点接受来自 Web 订阅源节点、文本列表节点或者任何标准源代码的文本数据。 此节点随 IBM SPSS Modeler Text Analytics 一起安装,可在 IBM SPSS Modeler Text Analytics 选用板上访问。
注: 此节点将替换在产品的旧版本中提供的 "文本抽取" 节点。 如果您拥有使用这些旧节点或模型块的较旧的流,那么必须使用“文本挖掘”节点来重新构建自己的流。