Функции плотности (симуляция)

Эти настройки позволяют настроить вывод для функций плотности вероятности и кумулятивных функций распределения для количественных целей, а также столбчатые диаграммы прогнозных значений для категориальных целей.

Функция плотности вероятности (Probability Density Function, PDF). Эта функция показывает распределение целевых значений. Для количественных целевых значений она позволяет определять вероятность того, что они находятся в данной области. Для категориальных целевых значений (целевые значения с количественной или порядковой шкалой измерения) создается столбчатая диаграмма, в которой показан процент наблюдений, которые относятся к каждой из категорий целевого значения. Для категориальных значений доступны дополнительные параметры категориальных целей моделей PMML для описанной далее настройки отчета.

При использовании двухэтапного кластерного анализа и кластерного анализа методом k-средних создается столбчатая диаграмма принадлежности к кластеру.

Кумулятивная функции распределения (CDF). Кумулятивная функция распределения показывает вероятность того, что целевое значение меньше указанного значения либо равно ему. Она доступна только для количественных целевых значений.

Положения ползунка. Вы можете задать начальные положения подвижных опорных линий на диаграммах PDF и CDF. Задаваемые значения для нижней и верхней линий относятся к положениям по горизонтальной оси, а не к процентилям. Можно удалить нижнюю линию, выбрав -Infinity, или верхнюю линию, выбрав Infinity. По умолчанию эти линии располагаются на 5-й и 95-й процентилях. Если на одной диаграмме показаны несколько функций распределения (из-за нескольких целевых значений или результатов из итераций анализа чувствительности), значения по умолчанию относятся к функции распределения для первой итерации или первого назначения.

Опорные линии (количественные). Для функции плотности вероятности и кумулятивных функций распределения для количественных целевых значений можно добавить различные вертикальные опорные линии.

  • Сигмы. Можно добавить опорные линии с амплитудой указанного количества стандартных отклонений от среднего целевого значения.
  • Процентили. Можно добавить опорные линии в одном или двух значениях процентилей распределения для целевого значения в текстовых полях Нижняя и Верхняя. Например, значение 95 в текстовом поле Верхняя представляет 95-ый процентиль, который является значением, ниже которого попадают 95 % наблюдений. Точно так же, значение 5 в текстовом поле Нижняя представляет 5-ый процентиль, который является значением, ниже которого попадают 5% наблюдений.
  • Настраиваемые опорные линии. Можно добавить опорные линии в указанных значениях цели.
Прим.: Если на одной диаграмме показаны несколько функций распределения (из-за нескольких целевых значений или результатов из итераций анализа чувствительности), опорные линии применяются только к функции распределения для первой итерации или первого назначения. Вы можете добавить опорные линии к другим распределениям в диалоговом окне Параметры диаграмм, к которому можно обратиться с диаграммы PDF или CDF.

Перекрыть результаты из отдельных количественных целевых значений. При наличии нескольких количественных целевых значений определяет вывод на экран функций распределения для всех таких целевых значений на одной диаграмме: одна диаграмма для функций плотности вероятности, другая - для функций кумулятивного распределения. Если этот параметр не выбран, результаты для каждого целевого значения будут показаны на отдельной диаграмме.

Значения категории для отчета. Для моделей PMML с категориальными целевыми значениями результатом модели является набор прогнозных вероятностей (по одной для каждой категории) того, что целевое значение попадает в каждую из категорий. Категория с наивысшей вероятностью выбирается в качестве предсказанной и используется при генерировании столбчатой диаграммы, описанной для настройки Функция плотности вероятности выше. Если выбрано Предсказанная категория, будет создана столбчатая диаграмма. Если выбрать Предсказанные вероятности, для каждой из категорий назначения будут сгенерированы гистограммы распределения.

Группирование для анализа чувствительности. Имитации, которые включают анализ чувствительности, создают независимый набор предсказанных целевых значений для каждой итерации, определенной анализом (варьируется одна итерация для каждого значения входных данных). При наличии итераций столбчатая диаграмма предсказанной категории для категориального целевого значения показывается в качестве кластеризованной столбчатой диаграммы, которая включает результаты для всех итераций. Категории или итерации можно сгруппировать.