Технологии моделирования
Технологии моделирования основаны на алгоритмах, то есть последовательностях инструкций по решению конкретных задач. При помощи различных алгоритмов можно создавать различные типы моделей. Есть три основных класса технологий моделирования, и IBM® SPSS Modeler поддерживает ряд экземпляров для каждого из этих классов:
- Отслеживаемые
- Взаимосвязь
- Сегментация (другое название - “кластеризация”)
Контролируемые модели используют значения одного или нескольких входных полей для предсказания значения одного или нескольких выходных полей, то есть полей назначения. Некоторые примеры таких способов следующие: деревья решений (алгоритмы дерева C&R, QUEST, CHAID и C5.0), регрессии (линейная, логистическая, обобщенная линейная и Кокса), нейронные сети, модели опорных векторов и Байесовские сети.
Модели связывания находят структуры в ваших данных, в которых один или несколько объектов (таких как события, покупки или атрибуты) связаны с одним или несколькими другими объектами. Модели конструируют наборы правил, определяющие эти взаимосвязи. Здесь поля среди данных могут быть и входными полями, и полями назначения. Вы могли бы найти эти связи вручную, но алгоритмы правил связывания делают это гораздо быстрее и могут изучить более сложные структуры. Модели Априори и CARMA - это примеры использования таких алгоритмов. Еще один тип модели связывания - это модель обнаружения последовательностей, которая находит последовательные шаблоны в структурированных по времени данных.
Модели сегментации делят данные на сегменты, или кластеры, записей с одинаковыми структурами входных полей. Так как эти модели работают только с входными полями, у них нет отношения к выходным полям (полям назначения). Примеры моделей сегментации - это сети Коонена, кластеризация K-средних, двухшаговая кластеризация и выявление аномалий.