Antes de iniciar
O InfoSphere Streams é uma plataforma que possibilita analítica em tempo real de dados em movimento. A família de produtos IBM SPSS fornece a capacidade de criar modelos de analítica de prevenção. Esta série "Integrando o SPSS Model Scoring no InfoSphere Streams" é para desenvolvedores Streams que precisam aproveitar os eficientes modelos de previsão em um ambiente de pontuação em tempo real.
Este tutorial descreve como criar um operador do InfoSphere Streams que pode ser usado a partir de aplicativos Streams para executar modelos de previsão do SPSS. Ele fornece um operador de amostra e dados que demonstram essa integração. Segue descrevendo como a amostra pode ser ajustada para uso com qualquer modelo adequado do SPSS. Na Parte 2, você aprenderá como esse operador não genérico é estendido para usar os metadados XML do modelo de previsão para permitir o uso de um modelo de previsão do SPSS em Streams sem necessidade de habilidades em C++ para customizar.
Neste tutorial, saiba o que um analista de dados precisa fazer no SPSS Modeler para preparar um modelo de previsão para pontuação em Streams. Veja como um desenvolvedor de componente do Streams pode criar um operador para executar esse modelo. E saiba, também, como um aplicativo Streams pode usar esse operador para produzir os resultados pontuados em tempo real a partir de dados de transmissão.
Este tutorial foi escrito para desenvolvedores de componente do Streams e programadores de aplicativos que possuem habilidades na linguagem de programação Streams e em C++. Use o tutorial como uma referência, ou as amostras aqui podem ser examinadas e executadas para demonstrar as técnicas descritas. Para executar as amostrar, você deve ter um conhecimento geral do uso de shell de linha de comando UNIX® e um conhecimento de trabalho de programação em Streams.
Para executar os exemplos, é preciso ter uma caixa Red Hat Enterprise Linux® com o InfoSphere Streams V2.0 ou posterior e o IBM SPSS Modeler Solution Publisher 14.2 fix pack 1, mais a correção do Solution Publisher, que está deve estar disponível a partir de 14 de outubro de 2011.
