Объединение в контейнеры (группировка) значений данных

Значения данных можно показывать как по отдельности, так и в группах. Под объединением в контейнеры подразумевается группировка отдельных значений данных в одном графическом элементе. Контейнер может быть точкой, показывающей число наблюдений в контейнере. Или это может быть линейчатая гистограмма, чья высота означает число наблюдений в контейнере.

Если на диаграмме так много отдельных графических элементов, что их трудно отличить друг от друга, используйте группировку. Процесс группировки происходит следующим образом:

  • Область данных делится сеткой контейнеров определенного размера. Для точек и маркеров можно также указать форму контейнера.
  • Вычисляет количество наблюдений в каждом из контейнеров.
  • Присваивает цвет или размер, соответствующий количеству.
  • На контейнере рисуется графический элемент. Для точек и маркеров можно также указать положение маркера относительно контейнера (средняя точка против центроида).

Группировка маркеров или точек всегда доступна. Группировка других элементов обычно доступна только для гистограммы, или если данные не собраны.

Объединение элемента в контейнер

  1. Выберите в меню:

    Параметры > Поместить элемент в группу

  2. При необходимости используйте вкладку Группировка, чтобы изменить параметры группировки.

Без выделения группируются все доступные оси. Чтобы изменить число группируемых осей, воспользуйтесь вкладкой Группировка. Можно также выделить отдельную ось или элемент, чтобы объединить в контейнер эту ось или элемент.

Удаление контейнера

  1. Выберите в меню:

Параметры > Вывести элемент из группы

При удалении контейнера для гистограммы, результат может оказаться непригодным. Останется по одному столбцу для каждого уникального значения на оси x. Потому как значения перекрываются нечасто, на каждом из столбцов будет показано количество 1.

Использование вкладки Группировка для элементов точек и маркеров

Индикатор количества наблюдений. Выберите цвет или размер, чтобы задать, каким образом маркеры будут показывать количество точек в каждой группе. Если выбрать размер, лучше всего подходят круглые маркеры. При выборе цвета следует иметь в виду, что при первой группировке данных используется цвет границ маркеров. Поскольку границы маркера обычно черные, используйте вкладку Маркер, чтобы изменить этот цвет. Не следует использовать для маркеров очень темные и очень светлые цвета. Различия в интенсивности таких цветов будут мешать различать размеры групп.

Позиция маркера. Позволяет выбрать место, в котором будут выводиться символы. Центральная точка - это графический центр группы, использование которого уменьшает вероятность того, что группы будут перекрываться. При выборе параметра Центроид символ располагается в центроидном положении точек в группе. Координаты центроида - это взвешенные средние для каждой оси. Пропущенное значение в какой-либо из переменных исключает наблюдение из расчетов. Изменение масштаба не влияет на расчет центроида.

Сегменты группировки. Позволяет задать форму групп. При выборе параметра Прямоугольники рамка данных делится на прямоугольники, задающие группы. При выборе параметра Соты рамка данных делится на соты, задающие группы. Точки данных, попадающие в группы каждой из форм, группируются.

Количество сегментов. Нажмите кнопку Авто, чтобы позволить редактору диаграмм выбрать цвет контейнеров, основываясь на исходных данных. Нажмите кнопку Настраиваемый, чтобы задать определенное число контейнеров для каждого измерения.

Использование вкладки Группировка для других элементов

Выбор оси. Выберите оси, на которых будут создаваться контейнеры.

Для каждой из осей можно установить следующие параметры.

Автоматически. Позволить редактору диаграмм установить размеры и ширину контейнеров, основываясь на исходных данных.

Пользовательский. Указание своих значений для размеров и ширины контейнеров. Можно задать число интервалов или ширину интервала. Ширина также влияет на количество интервалов. Например, если диапазон шкалы 0-100 и задана ширина 5, интервалов будет 20. Чем больше интервалов, тем более детальной будет гистограмма. Однако, большое количество интервалов могут сделать гистограмму слишком изрезанной, чтобы увидеть форму распределения. Примечание: Если разбиваемая переменная - дата, в качестве единиц ширины интервалов используется дни. Поэтому, если указать для ширины значение 30 , это будет означать 30 дней.

Настраиваемое значение для привязки. Задается начальное значение для контейнера. По умолчанию, первый интервал включает наименьшее значение в данных. Привязка задается таким образом, что границы интервалов устанавливаются в "хороших" значениях. Если указать значение меньше минимального значения данных, начальным значением будет первый контейнер. Например, необходимо включить в первый контейнер значения от 0 до 5, хотя минимальное значение равно 6. В этом случае можете задать Настраиваемое значение для привязки, равное 0. Примечание: Если контейнеры создаются по переменной даты, начальное значение должно быть в формате, указанном для этой переменной в редакторе данных на вкладке Переменные (например, 01/01/2001).