读入源文本
您可以使用“语言标识”节点来标识源数据中文本字段的自然语言。 此节点的输出是一个包含检测到的语言代码的派生字段。

文本挖掘的数据可以采用任何标准格式, SPSS Modeler 流程使用的任何标准格式,包括数据库或其他以行和列表示数据的“矩形”格式。
- 要读取文本,使用 SPSS Modeler 的任何标准数据格式,例如包含一个或多个文本字段用于客户评论的数据库,您可以使用导入节点。
- 处理大量数据(可能包含多种不同语言的文本)时,请使用“语言标识”节点来标识特定字段中使用的语言。
您可以使用“语言标识”节点来标识源数据中文本字段的自然语言。 此节点的输出是一个包含检测到的语言代码的派生字段。

文本挖掘的数据可以采用任何标准格式, SPSS Modeler 流程使用的任何标准格式,包括数据库或其他以行和列表示数据的“矩形”格式。