Правила отбора наблюдений и скоринга

Вкладка Правила дает возможность генерировать правила выбора или классификации/прогнозирования в виде командного синтаксиса, операторов SQL или простого (на упрощенном английском языке) текста. Вы можете выводить эти правила в программе просмотра и/или сохранять их во внешнем файле.

Синтаксис. Управляет формой правил отбора как выводимых в программе просмотра, так и сохраняемых во внешнем файле.

  • IBM® SPSS Statistics. Командный язык. Правила описываются в виде набора команд, которые определяют условия отбора, которые определяют условия отбора, которые используются при отборе подмножеств наблюдений или в операторах скоринга наблюдений COMPUTE .
  • SQL. Стандартные правила языка SQL применяются при выборе и выделении записей из базы данных или при установке значений этих записей. Созданные правила SQL не содержат имен таблиц или других сведений об источнике данных.
  • Простой текст. Псевдокод на упрощенном английском языке. Правила выражаются как набор логических условий "if...then", которые описывают классификацию или прогнозы модели для каждого узла. Правила в этой форме могут использовать определенные метки переменных и значений или же имена переменных и значения данных.

Тип. Для правил IBM SPSS Statistics и SQL управляет типом генерируемых правил - правила выбора или скоринга.

  • Присвоение значений. При присвоении значений предсказаний модели наблюдениям могут использоваться правила, которые удовлетворяют критериям принадлежности к узлу. Отдельное правило создается для каждого узла, который удовлетворяет критерию принадлежности.
  • Отбор наблюдений. При отборе наблюдений могут использоваться правила, которые удовлетворяют критериям принадлежности к узлу. При использовании IBM SPSS Statistics и правил SQL создается единое правило, которое отбирает все наблюдения по заданным критериям.

Включать суррогаты в правила IBM SPSS Statistics и SQL. При использовании CRT и QUEST пользователь может включать суррогатные предикторы из модели в правила. Правила с включенными суррогатными предикторами могут быть достаточно сложными. В общем случае, если необходимо получение только принципиальных сведений из дерева, не включайте суррогаты. Если некоторые наблюдения имеют незавершенные независимые переменные (предикторы) и необходимо создать структуру, имитирующую это дерево, включите суррогаты. Дополнительную информацию смотрите в разделе Суррогаты.

Узлы. Управляет областью действия сгенерированных правил. Отдельное правило создается для каждого узла, входящего в область действия.

  • Все терминальные узлы. Генерирует правила для каждого терминального узла.
  • Наилучшие терминальные узлы. Генерирует правила для n лучших терминальных узлов на основе значений индекса. Если это число превышает число терминальных узлов в дереве, правила генерируются для всех терминальных узлов. (Смотрите примечание ниже.)
  • Наилучшие терминальные узлы (содержащие не более заданного процента значений). Генерирует правила терминальных узлов первых n процентов наблюдений на основе значений индекса. (Смотрите примечание ниже.)
  • Терминальные узлы со значением индекса не менее заданного порога. Генерирует правила для всех терминальных узлов со значением индекса, большим или равным заданному значению. Значения индекса больше 100 означают, что процент наблюдений в целевой категории для того узла превосходит процент для корневого узла. (Смотрите примечание ниже.)
  • Все узлы Генерирует правила для всех узлов.

Примечание 1: Выбор узлов на основе значений индекса доступен только для категориальных зависимых переменных, для которых определены целевые категории. Если у вас определены несколько целевых категорий, для каждой целевой категории генерируется отдельный набор правил.

Примечание 2: Для правил IBM SPSS Statistics и SQL отбора наблюдений (не для правил назначения значений) Все узлы и Все терминальные узлы фактически генерируют правило, которые выбирает все используемые в анализе наблюдения.

Экспортировать правила в файл. Сохраняет правила во внешнем текстовом файле.

Вы можете также сгенерировать и сохранить правила выбора или скоринга интерактивно на основе выбранных узлов в итоговом дереве модели. Дополнительную информацию смотрите в разделе Правила отбора наблюдений и скоринга.

Примечание: Если вы применяете правила, выраженные командным языком, к другому файлу данных, этот файл данных должен содержать переменные с точно такими же именами, как независимые переменные, содержащиеся в конечной модели, измеренные в той же метрике с теми же пользовательскими значениями отсутствия (если они есть).

Чтобы задать правила отбора наблюдений и скоринга

Для этой функции требуется модуль Деревья решений.

  1. Выберите в меню:

    Анализ > Классификация > Дерево...

  2. В главном диалоговом окне Дерево решений щелкните по Вывод.
  3. Щелкните по вкладке Правила.