Mineração de dados de texto com análise de texto
SPSS Modeler oferece nós especializados no manuseio de texto. Os nós do Text Analytics oferecem recursos avançados de análise de texto que usam tecnologias linguísticas avançadas e processamento de linguagem natural (NLP). Eles podem processar rapidamente uma grande variedade de dados de texto não estruturados e extrair os principais conceitos. O Text Analytics também pode organizar e agrupar esses conceitos em categorias.
Cerca de 80% dos dados mantidos em uma organização estão na forma de documentos de texto - por exemplo, relatórios, páginas da web, e-mails e notas de call center. O texto é um fator chave para permitir que uma organização compreenda melhor o comportamento de seus clientes. Um sistema que incorpora o NLP pode extrair conceitos de maneira inteligente, incluindo frases compostas. Além disso, o conhecimento do idioma subjacente permite a classificação de termos em grupos relacionados, como produtos, organizações ou pessoas, usando significado e contexto. Como resultado, é possível determinar rapidamente a relevância das informações para suas necessidades. Esses conceitos e categorias extraídos podem ser combinados com dados estruturados existentes, como dados demográficos, e aplicados à modelagem no SPSS Modeler para produzir decisões melhores e mais focadas.
Os sistemas linguísticos são sensíveis ao conhecimento — quanto mais informações estão contidas em seus dicionários, mais alta será a qualidade dos resultados. A análise texto fornece um conjunto de recursos linguísticos, como dicionários para termos e sinônimos, bibliotecas e modelos. Esses nós permitem ainda que você desenvolva e refine esses recursos linguísticos para o seu contexto. O ajuste dos recursos linguísticos geralmente é um processo interativo e é necessário para a categorização e a recuperação de um conceito preciso. Modelos customizados, bibliotecas e dicionários para domínios específicos, como CRM e genoma, também estão incluídos.
- Assista ao vídeo a seguir para obter uma visão geral do Text Analytics.
- Consulte o texto Analisar a satisfação do hotel.
Este vídeo oferece um método visual para aprender os conceitos e as tarefas desta documentação.
Isenção de responsabilidade do vídeo: algumas etapas e elementos gráficos menores neste vídeo podem ser diferentes de sua plataforma.
Aplicativos
Em geral, qualquer pessoa que precisa revisar rotineiramente grandes volumes de documentos para identificar os elementos-chave para uma exploração posterior pode se beneficiar do uso da Análise de texto. Exemplos de alguns aplicativos específicos incluem:
- Pesquisa científica e médica. Explore materiais de pesquisa secundários, como relatórios de patentes, artigos de diários e publicações de protocolos. Identifique associações anteriormente desconhecidas (como um médico associado a um determinado produto) apresentando possibilidades para uma exploração adicional. Minimize o tempo gasto no processo de descoberta de drogas. Use-o como um auxílio em pesquisas genômicas.
- Pesquisa de investimento. Revise relatórios de analistas diários, artigos de notícias e press releases da empresa para identificar os principais pontos estratégicos ou mudanças de mercado. A análise de tendência dessas informações revela problemas emergentes ou oportunidades para uma firma ou indústria em um período de tempo.
- Detecção de fraude. Use em fraudes financeiras e de assistência médica para detectar anomalias e descobrir sinalizadores vermelhos em grandes quantidades de texto.
- Pesquisa de mercado. Use em esforços de pesquisa de mercado para identificar os principais tópicos nas respostas às pesquisas de opinião abertas ilimitadas.
- Análise de blogs e feeds da web. Explore e construa modelos usando as principais ideias localizadas em feeds de notícias, blogs, etc.
- CRM. Construa modelos usando dados de todos os pontos de contato do cliente, como email, transações e pesquisas de opinião.
Nós
- O nó Identificador de linguagem é um nó de processo que verifica o texto de origem para determinar em qual linguagem humana ele está escrito e, em seguida, marca isso em um novo campo. Projetado principalmente para ser usado com grandes quantidades de dados, esse nó é particularmente útil quando você tem mais de um idioma em suas fontes de dados e deseja processar apenas um idioma.
- O nó Análise de Link de Texto extrai conceitos e também identifica relacionamentos entre conceitos com base em padrões conhecidos no texto. É possível usar a extração de padrão para descobrir relacionamentos entre seus conceitos, bem como quaisquer opiniões ou qualificadores anexados a esses conceitos. O nó Análise de link de texto (TLA) oferece uma maneira mais direta de identificar e extrair padrões de seu texto e, em seguida, adicionar os resultados do padrão ao conjunto de dados no fluxo. Mas você também pode executar o TLA usando uma sessão do Text Analytics Workbench por meio do nó de modelagem Text Mining.
- O nó de mineração de texto usa métodos linguísticos para extrair conceitos-chave do texto, permite criar categorias com esses conceitos e outros dados e oferece a capacidade de identificar relacionamentos e associações entre conceitos com base em padrões conhecidos (chamada análise de link de texto). É possível usar este nó para explorar o conteúdo de dados de texto ou para produzir um modelo de conceito ou modelo de categoria. Os conceitos e as categorias podem ser combinados com dados estruturados existentes, como demográficos, e aplicados à modelagem.