Статистики процедуры Подытожить наблюдения
Можно выбрать одну или несколько из следующих статистик для подгрупп, рассчитываемых для переменных внутри внутри каждой отдельной категории каждой группирующей переменной: сумма, число наблюдений, среднее значение, медиана, медиана группы, среднеквадратическая ошибка среднего значения, минимальное и максимальное значения, диапазон, значение группирующей переменной для первой категории, значение группирующей переменной для последней категории, стандартное отклонение, дисперсия, эксцесс, стандартная ошибка эксцесса, асимметрия, стандартная ошибка асимметрии, процент от общей суммы, процент от общего N, процент от суммы в, процент от N в, среднее геометрическое, среднее гармоническое. В выводе статистики располагаются в том порядке, в котором они указаны в списке Статистики в ячейках. Итожащие статистики также выводятся для каждой переменной по всем категориям.
Первое. Выводит первое значение данных, встреченное в файле данных.
Геометрическое среднее. Корень n-й степени из произведения n значений наблюдений.
Группированная медиана. Медианы, вычисленные для данных, закодированных по принадлежности к группам. Например, для данных о возрасте каждое значение для 30-летних кодируется как 35, каждое значение для 40-летних кодируется как 45 и т.д.; групповая медиана - это медиана, вычисленная по закодированным данным.
Гармоническое среднее. Используется для оценки среднего объема группы, когда объемы выборок в группах различаются. Гармоническое среднее - это общее число выборок, деленное на сумму величин, обратных объемам отдельных групп.
Эксцесс. Мера интенсивности выбросов. Для нормального распределения значение эксцесса равно 0. Положительный эксцесс означает, что выбросы в данных интенсивнее, чем для нормального распределения. Отрицательный эксцесс означает, что в данных наблюдается меньше выбросов, чем в нормальном распределении.
Последнее. Выводит последнее значение в файле данных.
Максимум. Наибольшее значение числовой переменной.
Среднее. Мера центральной тенденции. Арифметическое среднее; сумма, деленная на число наблюдений.
Медиана. Значение, выше и ниже которого попадает по половине наблюдений, иначе 50-й процентиль. Если число наблюдений четно, медиана есть арифметическое среднее двух находящихся в середине значений, если выборку упорядочить по убыванию или по возрастанию. Медиана представляет собой меру центральной тенденции, которая нечувствительна к выбросам, в отличие от среднего значения, которое могут исказить несколько экстремально больших или малых значений.
Минимум. Наименьшее значение числовой переменной.
N. Число случаев (наблюдений или записей).
Процент от общего N. Процент от общего количества наблюдений в каждой категории.
Процент от общей суммы. Процент от общей суммы в каждой категории.
Range . Разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум.
Асимметрия. Мера асимметрии распределения. Нормальное распределение симметрично, и для него асимметрия равна 0. Распределение со значимой положительной асимметрией имеет длинный хвост справа. Распределение со значимой отрицательной асимметрией имеет длинный хвост слева. В качестве грубого правила можно сказать, что значение асимметрии, более чем вдвое превышающее ее стандартную ошибку, указывает на наличие асимметрии распределения.
Стандартное отклонение. Мера дисперсии вокруг среднего, выраженная в тех же единицах измерения, что и наблюдения. Равна корню квадратному из дисперсии. При нормальном распределении 68% наблюдений укладываются в одно стандартное отклонение от среднего, и 95% - в два стандартных отклонения. Если, например, средний возраст равен 45 годам со стандартным отклонением 10, то 95% наблюдений должны оказаться между 25 и 65 годами при нормальном распределении.
Стандартная ошибка эксцесса . Отношение эксцесса к его стандартной ошибке можно использовать как критерий нормальности (то есть, можно отвергнуть нормальность, если это отношение меньше, чем -2, или больше, чем +2). Большое положительное значение эксцесса указывает, что хвосты распределения длиннее, чем у нормального; отрицательное значение эксцесса указывает на более короткие хвосты (как у равномерного распределения).
Стандартная ошибка среднего. Мера того, как сильно могут отличаться значения среднего от выборки к выборке, извлекаемых из одного и того же распределения. Можно применять для грубого сравнения наблюденного среднего с гипотетическим значением (то есть можно заключить, что два значения различаются, если отношение их разности к стандартному отклонению меньше -2 или больше +2).
Стандартная ошибка асимметрии . Отношение асимметрии к ее стандартной ошибке можно использовать как критерий нормальности (то есть, можно отвергнуть нормальность, если это отношение меньше, чем -2, или больше, чем +2). Большое положительное значение асимметрии указывает на длинный правый хвост (распределения); большое отрицательное значение - на длинный левый хвост.
Sum. Сумма или итог для всех значений по всем наблюдениям, имеющим непропущенные значения.
Дисперсия. Мера дисперсии относительно среднего значения. Равна сумме квадратов отклонений от среднего, деленной на число, на единицу меньшее числа наблюдений. Дисперсия измеряется в единицах, которые равны квадратам единиц измерения самой переменной.
Задание статистик в процедуре Подытожить наблюдения
Для этой функциональной возможности требуется модуль База статистики.
- Выберите в меню:
- В диалоговом окне Подытожить наблюдения нажмите кнопку Статистики .