Оптимальное разделение на интервалы
Если поле, которое вы хотите разделить на интервалы, прочно связано с другим категориальным полем, можно выбрать категориальное поле в качестве поля "инспектора", чтобы создать интервалы способом, при котором прочность исходной связи между двумя полями сохранится.
Например, при помощи кластерного анализа вы сгруппировали состояния на основе штрафных ставок за просроченные платежи, с наивысшей ставкой в первом кластере. В этом случаев качестве полей интервалов можно выбрать Процент просроченности и Процент лишения права выкупа, а в качестве поля инспектора - поле принадлежности к кластерам, сгенерированное моделью.
Расширение имени Задайте расширение, которое следует использовать для сгенерированных полей, и укажите, добавлять ли это расширение в начало имени поля (Префикс) или в его конец (Суффикс). Например, вы можете сгенерировать новое поле с именем pastdue_OPTIMAL и еще одно, с именем inforeclosure_OPTIMAL.
Поле супервизора Категориальное поле, используемое для построения интервалов.
Предварительно разбитые на категории поля для повышения производительности при работе с большими наборами данных Указывает, следует ли использовать обработку для ускорения оптимального разделения на интервалы. Эта опция распределяет значения шкалы в большое число интервалов при помощи одного метода неконтролируемого разделения на интервалы, представляет значения в каждом интервале средним и корректирует соответствующим образом вес наблюдений перед операцией неконтролируемого разделения на интервалы. В реальных условиях этот метод повышает за счет степени точности скорость и рекомендуется для больших наборов данных. При использовании этой опции можно также задать максимальное количество интервалов для каждой переменной после предварительной обработки.
Объединить категории, содержащие относительно мало наблюдений по сравнению с соседней категорией. Эта опция, если она включена, указывает, что слияние интервала выполняется, если отношение его размера (количества наблюдений) к размеру соседнего интервала меньше указанного порогового значения; большие пороговые значения приводят к увеличению числа слияний.