В социальных науках масштабирование — это процесс измерения или упорядочивания сущностей по количественным атрибутам или признакам. Например, метод масштабирования может включать оценку уровней экстраверсии индивидуумов или воспринимаемого качества продуктов. Некоторые методы масштабирования позволяют оценивать величины на континууме , в то время как другие методы обеспечивают только относительное упорядочивание сущностей.
Уровень измерения — это тип данных, которые измеряются.
Слово шкала, в том числе в академической литературе, иногда используется для обозначения другой составной меры , индекса . Однако эти концепции различны. [1]
Решения по масштабированию строительства
- Какой уровень ( уровень измерения ) данных задействован ( номинальный , порядковый , интервальный или относительный )?
- Для чего будут использованы результаты?
- Что следует использовать — шкалу, индекс или типологию?
- Какие виды статистического анализа были бы полезны?
- Выберите, какую шкалу использовать: сравнительную или несравнительную.
- Сколько делений шкалы или категорий следует использовать (от 1 до 10; от 1 до 7; от −3 до +3)?
- Должно ли быть нечетное или четное количество делений? (Нечетное дает нейтральное значение центра; четное заставляет респондентов занимать ненейтральную позицию.)
- Какими должны быть характер и информативность шкальных меток?
- Какой должна быть физическая форма или компоновка шкалы? (графическая, простая линейная, вертикальная, горизонтальная)
- Должен ли ответ быть принудительным или он должен быть факультативным?
Метод построения шкалы
Созданные шкалы должны быть репрезентативными для конструкта, который они намерены измерить. [2] Возможно, что-то похожее на шкалу, которую человек намерен создать, уже существует, поэтому включение этих шкал и возможных зависимых переменных в опрос может повысить валидность шкалы.
- Начните с создания по крайней мере десяти элементов для представления каждой из подшкал. Проведите опрос; чем репрезентативнее и больше выборка, тем больше доверия она будет иметь в шкалах.
- Проверьте средние значения и стандартные отклонения для элементов, исключив все элементы с искаженными средними значениями или очень низкой дисперсией.
- Проведите исследовательский факторный анализ с косоугольным вращением элементов для шкал — важно дифференцировать их на основе их нагрузки на факторы, чтобы создать подшкалы, представляющие конструкцию. Запросите факторы с собственными значениями (для расчета собственного значения для каждого фактора, квадрата факторных нагрузок и суммирования столбцов) больше 1. Легче сгруппировать элементы по целевым шкалам. Чем более различимы другие элементы, тем выше шансы, что элементы будут лучше загружены в вашей собственной шкале.
- «Чисто загруженные элементы» — это те элементы, которые нагружают не менее .40 по одному фактору и более чем на .10 больше по этому фактору, чем по любым другим. Определите их в шаблоне фактора.
- «Перекрестно загруженные предметы» — это те, которые не соответствуют вышеуказанному критерию. Это кандидаты на отбрасывание.
- Определите факторы, содержащие всего несколько пунктов, которые не представляют собой четких концепций, это «неинтерпретируемые шкалы». Также определите любые факторы, содержащие только один пункт. Эти факторы и их пункты являются кандидатами на исключение.
- Посмотрите на кандидатов на исключение и факторы, которые следует исключить. Есть ли что-то, что нужно сохранить, поскольку это имеет решающее значение для вашей конструкции . Например, если концептуально важный элемент только пересекает нагрузку на фактор, который следует исключить, его лучше сохранить для следующего раунда.
- Отбросьте элементы и запустите подтверждающий факторный анализ, попросив программу выдать только количество факторов после отбрасывания неинтерпретируемых и одноэлементных. Пройдите процесс снова, начиная с шага 3. Здесь также могут быть приняты различные меры надежности теста.
- Продолжайте выполнять процесс до тех пор, пока не получите «чистые факторы» (пока все факторы не будут иметь чисто загруженные элементы).
- Запустите Альфа в статистической программе (запрашивая Альфа, если каждый элемент отбрасывается). Любые шкалы с недостаточным Альфой следует отбросить, и процесс повторить с Шага 3. [ Коэффициент альфа = количество элементов 2 x средняя корреляция между различными элементами / сумма всех корреляций в матрице корреляции (включая диагональные значения) ]
- Запустите корреляционную или регрессионную статистику, чтобы убедиться в валидности шкалы. Для лучшей практики сохраните окончательные факторы и все нагрузки вашей и подобных шкал, выбранные в Приложении созданной шкалы.
Многоэлементные и одноэлементные весы
В большинстве практических ситуаций многоэлементные шкалы более эффективны в прогнозировании результатов по сравнению с отдельными элементами. Рекомендуется осторожно использовать одноэлементные меры в исследованиях, их использование должно быть ограничено конкретными обстоятельствами. [3] [4]
Таблица: Критерии оценки потенциального использования одноэлементных мер [4]
Типы данных
Тип собранной информации может влиять на построение шкалы. Различные типы информации измеряются разными способами.
- Некоторые данные измеряются на номинальном уровне . То есть, любые используемые числа являются просто метками; они не выражают никаких математических свойств. Примерами являются коды инвентаризации SKU и штрих-коды UPC.
- Некоторые данные измеряются на порядковом уровне . Числа указывают относительное положение элементов, но не величину разницы. Примером может служить рейтинг предпочтений.
- Некоторые данные измеряются на уровне интервала . Числа указывают величину разницы между элементами, но абсолютной нулевой точки нет. Примерами являются шкалы отношения и шкалы мнения.
- Некоторые данные измеряются на уровне отношения . Числа указывают величину разницы, и есть фиксированная нулевая точка. Отношения могут быть рассчитаны. Примеры включают: возраст, доход, цену, издержки, выручку от продаж, объем продаж и долю рынка.
Комплексные меры
Составные меры переменных создаются путем объединения двух или более отдельных эмпирических показателей в одну меру. Составные меры измеряют сложные концепции более адекватно, чем отдельные показатели, расширяют диапазон доступных оценок и более эффективны при обработке нескольких элементов.
Помимо шкал, существуют еще два типа составных мер. Индексы похожи на шкалы, за исключением того, что несколько показателей переменной объединены в одну меру. Например, индекс потребительской уверенности представляет собой комбинацию нескольких мер потребительских установок. Типология похожа на индекс, за исключением того, что переменная измеряется на номинальном уровне .
Индексы строятся путем накопления баллов, присвоенных отдельным атрибутам, в то время как шкалы строятся путем присвоения баллов моделям атрибутов.
В то время как индексы и шкалы обеспечивают измерения одного измерения , типологии часто используются для изучения пересечения двух или более измерений. Типологии являются очень полезными аналитическими инструментами и могут быть легко использованы в качестве независимых переменных , хотя, поскольку они не являются одномерными, их трудно использовать в качестве зависимой переменной .
Сравнительное и несравнительное шкалирование
При сравнительном шкалировании элементы напрямую сравниваются друг с другом (пример: что предпочитаете: Pepsi или Coke ?). При несравнительном шкалировании каждый элемент масштабируется независимо от других. (пример: что вы думаете о Coke?)
Сравнительные методы масштабирования
- Шкала парного сравнения — респонденту одновременно предъявляют два элемента и просят выбрать один (например, предпочитаете ли вы Pepsi или Coke?). Это метод порядкового уровня, когда модель измерения не применяется. Крус и Кеннеди (1977) разработали шкалу парного сравнения в своей модели, привязанной к домену. Модель Брэдли–Терри–Льюса (BTL) (Брэдли и Терри, 1952; Люс, 1959) может применяться для получения измерений при условии, что данные, полученные из парных сравнений, обладают соответствующей структурой. Закон сравнительного суждения Терстоуна также может применяться в таких контекстах.
- Масштабирование модели Раша – респонденты взаимодействуют с элементами, и сравнения выводятся между элементами из ответов для получения значений шкалы. Респонденты впоследствии также масштабируются на основе их ответов на элементы с учетом значений шкалы элементов. Модель Раша тесно связана с моделью BTL.
- Ранжирование — респонденту одновременно предъявляют несколько элементов и просят их ранжировать (пример: оцените следующие рекламные объявления от 1 до 10). Это метод порядкового уровня.
- Шкала социальной дистанции Богардуса – измеряет степень, в которой человек готов ассоциировать себя с классом или типом людей. Она спрашивает, насколько респондент готов создавать различные ассоциации. Результаты сводятся к одному баллу по шкале. Существуют также несравнительные версии этой шкалы.
- Q-сортировка – до 140 элементов сортируются по группам на основе процедуры ранжирования.
- Шкала Гуттмана – это процедура для определения того, можно ли ранжировать набор элементов по одномерной шкале. Она использует структуру интенсивности среди нескольких показателей заданной переменной. Утверждения перечислены в порядке важности. Рейтинг масштабируется путем суммирования всех ответов до первого отрицательного ответа в списке. Шкала Гуттмана связана с измерением Раша; в частности, модели Раша привносят подход Гуттмана в вероятностные рамки.
- Шкала постоянной суммы — респонденту дается постоянная сумма денег, сценарий, кредиты или баллы и его просят распределить их по различным статьям (пример: если бы у кого-то было 100 иен на продукты питания, сколько бы он потратил на продукт A, на продукт B, на продукт C и т. д.). Это метод порядкового уровня.
- Шкала оценки величины – В психофизической процедуре, изобретенной С. С. Стивенсом, люди просто присваивают числа измерению суждения. Геометрическое среднее этих чисел обычно дает степенной закон с характерным показателем. При кросс-модальном сопоставлении вместо присвоения чисел люди манипулируют другим измерением, таким как громкость или яркость, чтобы сопоставить элементы. Обычно показатель психометрической функции можно предсказать из показателей оценки величины каждого измерения.
Методы несравнительного масштабирования
- Визуальная аналоговая шкала (также называемая непрерывной шкалой оценок и графической шкалой оценок) – респонденты оценивают элементы, размещая отметку на линии. Линия обычно маркируется на каждом конце. Иногда под линией находится ряд чисел, называемых точками шкалы (например, от нуля до 100). Оценка и кодификация сложны для бумажно-карандашных шкал, но не для компьютеризированных и интернет-визуальных аналоговых шкал. [5]
- Шкала Лайкерта – респондентов просят указать степень согласия или несогласия (от «полностью согласен» до «полностью не согласен») по пяти-девятибалльной шкале ответов (не путать со шкалой Лайкерта). Тот же формат используется для нескольких вопросов. Именно сочетание этих вопросов формирует шкалу Лайкерта. Эту процедуру категориального шкалирования можно легко расширить до процедуры оценки величины, которая использует полную шкалу чисел, а не словесные категории.
- Шкалы завершения фразы – респондентам предлагается завершить фразу по 11-балльной шкале ответов, в которой 0 представляет собой отсутствие теоретической конструкции, а 10 представляет собой теоретически предполагаемое максимальное количество измеряемой конструкции. Для нескольких вопросов используется тот же базовый формат.
- Семантическая дифференциальная шкала – Респондентам предлагается оценить элемент по 7-балльной шкале по различным атрибутам. Для каждого атрибута требуется шкала с биполярными терминальными метками.
- Шкала Стапеля – это однополюсная десятибалльная шкала оценок. Она имеет диапазон от +5 до −5 и не имеет нейтральной нулевой точки.
- Шкала Терстоуна – это метод шкалирования, который учитывает структуру интенсивности индикаторов.
- Математически выведенная шкала – Исследователи выводят оценки респондентов математически. Два примера – многомерное шкалирование и совместный анализ .
Оценка шкалы
Шкалы должны быть проверены на надежность , обобщаемость и валидность . Обобщаемость — это способность делать выводы из выборки для генеральной совокупности с учетом выбранной шкалы. Надежность — это степень, в которой шкала будет давать согласованные результаты. Надежность повторного тестирования проверяет, насколько схожи результаты, если исследование повторяется при аналогичных обстоятельствах. Надежность альтернативных форм проверяет, насколько схожи результаты, если исследование повторяется с использованием разных форм шкалы. Надежность внутренней согласованности проверяет, насколько хорошо отдельные меры, включенные в шкалу, преобразуются в составную меру.
Шкалы и индексы должны быть проверены. Внутренняя проверка проверяет связь между отдельными мерами, включенными в шкалу, и самой составной шкалой. Внешняя проверка проверяет связь между составной шкалой и другими индикаторами переменной, индикаторами, не включенными в шкалу. Проверка содержания (также называемая внешней валидностью) проверяет, насколько хорошо шкала измеряет то, что должно измеряться. Проверка критериев проверяет, насколько значимы критерии шкалы относительно других возможных критериев. Проверка конструкции проверяет, какая базовая конструкция измеряется. Существует три варианта валидности конструкции . Это конвергентная валидность , дискриминантная валидность и номологическая валидность (Кэмпбелл и Фиске, 1959; Крус и Ней, 1978). Коэффициент воспроизводимости показывает, насколько хорошо данные из отдельных мер, включенных в шкалу, могут быть реконструированы из составной шкалы.
Смотрите также
Ссылки
- ^ Эрл Бабби (1 января 2012 г.). Практика социальных исследований. Cengage Learning. стр. 162. ISBN 978-1-133-04979-1.
- ^ Макдональд, Родерик П. (2013-06-17). Теория тестирования: унифицированное лечение. Psychology Press. ISBN 978-1-135-67531-8.
- ^ Диамантопулос, Адамантио; Сарстедт, Марко; Фукс, Кристоф (2012). «Руководство по выбору между многоэлементными и одноэлементными шкалами для измерения конструкции: перспектива прогностической валидности». Журнал Академии маркетинговых наук . 40 (3): 434–449. doi :10.1007/s11747-011-0300-3. hdl : 1959.13/1052296 .
- ^ ab Фукс, Кристоф; Диамантопулос, Адамантиос (2009). «Использование одноэлементных мер для измерения конструкции в управленческих исследованиях: концептуальные вопросы и рекомендации по применению» (PDF) . Die Betriebswirtschaft . 69 (2).
- ^ У.-Д. Рейпс и Ф. Функе (2008) «Измерение уровня интервала с помощью визуальных аналоговых шкал в интернет-исследованиях: генератор VAS». doi :10.3758/BRM.40.3.699
Дальнейшее чтение
- ДеВеллис, Роберт Ф. (2003), Развитие масштаба: теория и применение (2-е изд.), Лондон: SAGE Publications , ISBN 0-7619-2604-6, получено 11 августа 2010 г.Мягкая обложка ISBN 0-7619-2605-4
- Лодж, Милтон (1981), Масштабирование величин: Количественное измерение мнений , Беверли-Хиллз и Лондон: SAGE Publications, ISBN 0-8039-1747-3
- Макайвер, Джон П. и Карминс, Эдвард Г. (1981), Одномерное шкалирование, Беверли-Хиллз и Лондон: SAGE Publications, ISBN 0-8039-1736-8, получено 11 августа 2010 г.
- Брэдли, РА и Терри, МЭ (1952): Ранговый анализ неполных блочных конструкций, I. Метод парных сравнений . Биометрика, 39, 324–345.
- Кэмпбелл, Д.Т. и Фиске, Д.У. (1959) Конвергентная и дискриминантная валидация с помощью матрицы многочерт и методов. Психологический вестник, 56, 81–105.
- Ходж, Д. Р. и Джиллеспи, Д. Ф. (2003). Завершение фраз: альтернатива шкалам Лайкерта. Исследования социальной работы, 27(1), 45–55.
- Hodge, DR & Gillespie, DF (2005). Шкалы завершения фраз. В K. Kempf-Leonard (редактор). Encyclopedia of Social Measurement. (т. 3, стр. 53–62). San Diego: Academic Press.
- Крус, DJ и Кеннеди, PH (1977) Нормальное масштабирование матриц доминирования: модель, привязанная к домену. Образовательные и психологические измерения, 37, 189–193 (Запросить перепечатку).
- Крус, DJ и Ней, RG (1978) Конвергентная и дискриминантная валидность в анализе элементов. Образовательные и психологические измерения, 38, 135–137 (Запросить перепечатку).
- Люс, Р.Д. (1959): Индивидуальный выбор поведения: теоретический анализ . Нью-Йорк: J. Wiley.
Внешние ссылки
- Справочник по шкалам управления – Многоэлементные метрики для использования в исследованиях, Wikibooks