Что такое IBM SPSS Data Preparation?

Благодаря использованию комплекса передовых методов IBM® SPSS® Data Preparation упрощает процесс подготовки данных, ускоряя получение результатов анализа и повышая их точность. Полностью автоматизированная процедура подготовки данных позволяет аналитикам максимально быстро получить результаты; в случае же особенно сложных наборов данных можно использовать другие методы. Легко определяйте подозрительные или недопустимые записи, переменные и значения. Просматривайте закономерности в недостающих данных, обобщайте результаты распределения переменных и более точно работайте с алгоритмами, разработанными для номинальных атрибутов.

Этот модуль включен в издание SPSS Professional для локальных сред и в издание Base для тарифов по подписке.

Полезные сведения

Вкладка Переменные

Диалоговое окно Проверка данных служит для проверки данных. На вкладке Переменные отображается список переменных из выбранного файла. Для начала необходимо выбрать переменные, которые следует перенести в список Переменные анализа.

Базовые проверки

К переменным и записям файла можно применить базовые проверки. Например, можно получить отчет по переменным с высоким процентом недостающих значений или пустых записей.

Стандартные и пользовательские правила

К отдельным переменным, обозначающим недопустимые значения (значения, выходящие за пределы диапазона, или недостающие значения), можно применять правила. Также можно создавать собственные правила, задавать перекрестные правила и применять готовые правила.

Рекомендации

С помощью автоматизированных процедур подготовки данных можно получить детализированные рекомендации.

Автоматическая подготовка данных за один шаг

Подготовка данных вручную требует больших усилий и затрат времени. Когда же результаты нужны срочно, процедура ADP позволяет обнаружить и исправить качественные ошибки и ввести недостающие значения за одну операцию. С помощью функции ADP можно получить понятные отчеты с подробными рекомендациями и визуализацией результатов, что облегчает выбор данных для анализа.

Дополнительные параметры подготовки данных

Автоматическая проверка данных позволяет избавиться от продолжительных и утомительных проверок, выполняемых вручную. В автоматическом режиме можно задать правила выполнения проверки данных в зависимости от уровня оценки каждой переменной (по категориям или непрерывно). Затем можно определить достоверность данных и удалить/исправить подозрительные записи.

Доступ к широкому ряду функций

Программное обеспечение SPSS Data Preparation обладает рядом функций, среди которых — проверка и автоматическая подготовка данных, оптимальное группирование и обнаружение аномалий.

Группировка большого числа переменных

Оптимизированная процедура группировки позволяет более точно использовать алгоритмы, разработанные для номинальных атрибутов (например, наивный байесовский классификатор и логистическая регрессия). Оптимальные методы группирования позволяют сгруппировать или задать точки отсечения для переменных масштаба.

Три варианта оптимальной группировки

Прежде чем приступить к построению модели, выберите один из вариантов оптимальной группировки для предварительной обработки данных. 1) Неконтролируемый метод: создание групп с одинаковым числом элементов.
2) Контролируемый метод: определение точек отсечения в зависимости от целевой переменной. Этот метод более точен, однако предусматривает больший объем вычислений.
3) Гибридный метод: сочетает контролируемый и неконтролируемый методы. Этот метод особенно удобен в случае большого объема различающихся значений.

Изображения продукта

Техническая информация

Как купить SPSS Data Preparation

  • Для локальных сред: приобретите издание Professional
  • Для тарифов по подписке: приобретите издание Base

Требования к аппаратному обеспечению

  • Процессор: тактовая частота не менее 2 ГГц
  • Монитор: разрешение не менее 1024 x 768
  • Память: требуется 4 ГБ, рекомендуется 8 ГБ и более
  • Свободное место на диске: не менее 2 ГБ

Next Steps

Попробуйте SPSS Statistics бесплатно

Купите сейчас и начните работу