Автоматическая подготовка данных (АПД)
В любом проекте подготовка данных для анализа - один из важнейших шагов в любом проекте исследования данных; именно этот шаг традиционно требовал наибольших затрат времени. Узел Инструмент Автоматическая подготовка данных (АПД) решает эту задачу, для чего анализирует данные и находит решения выявленных проблем, выявляет проблемные и малополезные поля, создает при необходимости производные атрибуты и повышает производительность, применяя интеллектуальные методы скрининга. Этот узел можно использовать в полностью автоматическом режиме, позволив ему выбирать и применять исправления или предварительно просматривать изменения перед тем, как они сделаны и приняты, а при желании применять или исправлять их.
Благодаря узлу автоматической подготовки данных вы сможете легко и быстро подготовить данные для исследования, даже если не были раньше знакомы с используемыми при этом понятиями статистики. Если запустить этот узел с параметрами по умолчанию, модели скорее всего будут построены быстрее и быстрее выполнится их скоринг.
В этом примере используется поток ADP_basic_demo.str, содержащий ссылки на файл данных telco.sav, чтобы продемонстрировать повышение точности, свойственное использованию параметров узла АПД по умолчанию при построении моделей. Эти файлы находятся в каталоге Demos любой установки IBM® SPSS Modeler. Доступ к ним можно получить из группы программ IBM SPSS Modeler в меню Пуск Windows. Файл ADP_basic_demo.str находится в каталоге streams.