Многомерное масштабирование
Целью Многомерного масштабирования (ММ) является обнаружение структуры в наборе значений некоторой меры расстояния между объектами или наблюдениями. Это осуществляется путем приписывания наблюдениям положения в некотором многомерном пространстве (обычно размерности два или три) таким образом, чтобы расстояния между полученными точками в этом пространстве как можно более точно аппроксимировали исходные различия. Во многих случаях размерности (измерения) этого пространства могут быть интерпретированы и использованы для дальнейшего осмысления ваших данных.
Если вы имеете переменные, полученные в результате реальных измерений, вы можете использовать многомерное масштабирование для снижения размерности данных (если необходимо, процедура Многомерного масштабирования может вычислить расстояния по многомерным данным). Многомерное масштабирование может также применяться к данным, представляющим собой субъективные оценки различий между объектами или понятиями. Дополнительно процедура Многомерного масштабирования может манипулировать данными типа различий из нескольких источников, которые могут появиться в случае наличия нескольких индивидуумов, производящих оценку, или респондентов, отвечающих на вопросы анкеты.
Пример. Как люди воспринимают сходство между различными марками и моделями автомобилей? Если у вас есть данные от респондентов, представляющие рейтинги сходства между различными марками и моделями автомобилей, то многомерное масштабирование может быть использовано для идентификации размерностей (измерений), описывающих восприятие потребителей. Например, вам, возможно, удастся показать, что цена и размер автомобиля определяют двумерное пространство, которое объясняет сходства, определенные вашими респондентами.
Статистики. Для каждой модели: матрица данных, матрица данных, полученная в результате оптимального масштабирования, S - стресс (Юнга), стресс (Краскала), RSQ, координаты стимулов, средний стресс и RSQ для каждого стимула в модели Повторяемого ММ (Replicated MDS). Для моделей индивидуальных различий (INDSCAL): веса субъекта и индекс отклонения направления вектора весов от средней тенденции (weirdness index). Для каждой матрицы в моделях повторяемого многомерного масштабирования: стресс и RSQ для каждого стимула. Графики: координаты стимулов (двумерные или трехмерные), диаграммы рассеяния преобразованных исходных близостей (disparities) против расстояний.
Данные для многомерного масштабирования
Данные. Если ваши данные - различия, то все они должны быть количественными и измеренными в одной и той же метрике. Если у вас многомерные данные, то переменные могут быть количественными, двоичными или количествами. Масштаб переменных является важным моментом - различия в масштабах могут повлиять на решение. Если ваши данные имеют существенные различия в масштабах (например, одна переменная измерена в долларах, а другая в годах), то вам следует подумать об их стандартизации (это может быть выполнено автоматически процедурой Многомерного масштабирования).
Предположения. Процедура Многомерного масштабирования не накладывает жестких ограничений на распределение вероятностей. Не забудьте выбрать подходящий уровень измерений (порядковый, интервальный или отношения) в диалоговом окне Многомерное масштабирование: Параметры, чтобы получить корректные результаты.
Родственные процедуры. Если вашей целью является снижение размерности, то альтернативным методом может быть факторный анализ, особенно в случае, когда ваши данные количественные. Если вы хотите идентифицировать группы сходных наблюдений, то дополните многомерное масштабирование применением одного из методов кластерного анализа: иерархического или k-средних.
Как запустить процедуру многомерного масштабирования
Для этой функциональной возможности требуется модуль База статистики.
- Выберите в меню:
- Для анализа выберите по крайней мере четыре числовых значения.
- В группе Расстояния выберите пункты Данные содержат расстояния или Вычислить расстояния по данным.
- Если выбран пункт Вычислить расстояния по данным, можно также выбрать группирующую переменную для индивидуальных метрик. Группирующая переменная может быть как числовой, так и строковой.
Дополнительно можно выполнить следующие действия.
- Указать форму матрицы расстояния, если даты являются расстояниями.
- Укажите меру расстояния для использования при создании расстояний из данных.
Эта процедура вставит синтаксис команды ALSCAL .