9 класс

Измерительные шкалы в статистике. Теория измерений. Основные шкалы измерения. Типы шкал измерения переменных


5.2. Типы статистических шкал

В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

Пол 1 = мужской
2 = женский
Семейное положение 1 = холост/не замужем
2 = женат/замужем
3 = вдовец/вдова
4 = разведен(а)
Курение 1 = некурящий
2 = изредка курящий
3 = интенсивно курящий
4 = очень интенсивно курящий
Месячный доход 1 = до 3000 DM
2 = 3001 - 5000 DM
3 = более 5000 DM
Коэффициент интеллекта (I.Q.)
Возраст (лет)

Рассмотрим сначала графу "Пол" . Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале . В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название - дихотомическая .

Такая же ситуация и с переменной "Семейное положение" . Здесь также соответствие - между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической - у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

В качестве следующего примера рассмотрим переменную "Курение" . Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале .

Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

К классическими примерами переменных с порядковой шкалой относятся также переменные, полученные в результате объединения величин в классы, как "Месячный доход" в нашем примере.

Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции .

Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты , формулы которых оперируют рангами.

Рассмотрим теперь "Коэффициент интеллекта (IQ) ". Не только его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ганса IQ равен 80, у Фрица - 120 и у Отто - 160, можно сказать, что Фриц в сравнении с Гансом настолько же интеллектуальнее насколько Отто в сравнении с Фрицем (а именно - на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Ганса в два раза меньше, чем у Отто, исходя из определения IQ нельзя сделать вывод, что Отто вдвое умнее Ганса.

Такие переменные, у которых разность (интервал) между двумя значениями имеет эмпирическую значимость, относятся к интервальной шкале . Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

Наконец, мы достигли наивысшей статистической шкалы, на которой эмпирическую значимость приобретает и отношение двух значений. Примером переменной, относящейся к такой шкале является "Возраст ": если Максу 30 лет, а Морицу 60, можно сказать, что Мориц вдвое старше Макса. Шкала, к которой относятся данные называется шкалой отношений . К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. Поэтому переменные относящиеся к интервальной шкале, как правило, имеют и шкалу отношений.

Подводя итоги, можно сказать, что существует четыре вида статистических шкал, на которых могут сравниваться численные значения:

На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. То есть в дальнейшем практически всегда речь будет идти о переменных, относящихся к интервальной шкале .

Страница 1

Применение тех или других статистических методов определяется тем, к какой статистической шкале относится полученный материал. С. Стивенс предложил различать четыре статистические шкалы:

1. шкалу наименований (или номинальную);

2. шкалу порядка;

3. шкалу интервалов;

4. шкалу отношений.

Зная типические особенности каждой шкалы, нетрудно установить, к какой из них следует отнести подлежащий статистической обработ­ке материал.

Шкала наименований. К этой шкале относятся материалы, в ко­торых изучаемые объекты отличаются друг от друга по их качеству.

При обработке таких материалов нет никакой нужды в том, чтобы располагать эти объекты в каком-то порядке, исходя из их характери­стик. В принципе, объекты можно располагать в любой последователь­ности.

Вот пример: изучается состав международной научной конференции. Среди участников есть французы, англичане, датчане, немцы и русские. Имеет ли значение порядок, в котором будут расположены участники при изучении состава конференции? Можно расположить их по алфавиту, это удобно, но ясно, что никакого принципиального значения в этом распо­ложении нет. При переводе этих материалов на другой язык (а значит и на другой алфавит) этот порядок будет нарушен. Можно расположить национальные группы по числу участников. Но при сравнении этого ма­териала с материалом другой конференции найдем, что вряд ли этот порядок окажется таким же. Отнесенные к шкале наименований объек­ты можно размещать в любой последовательности в зависимости от цели исследования.

При статистической обработке такого рода материалов нужно счи­таться с тем, каким числом единиц представлен каждый объект. Име­ются весьма эффективные статистические методы, позволяющие по этим числовым данным прийти к научно значимым выводам (напри­мер, метод хи-квадрат).

Шкала порядка. Если в шкале наименований порядок следования изучаемых объектов практически не играет никакой роли, то в шкале порядка - это видно из ее названия - именно на эту последователь­ность переключается все внимание.

К этой шкале в статистике относят такие исследовательские ма­териалы, в которых рассмотрению подлежат объекты, принадлежа­щие к одному или нескольким классам, но отличающиеся при их сравне­нии одного с другим - «больше-меньше», «выше-ниже»- и т. п.

Проще всего показать типические особенности шкалы порядка, если об­ратиться к публикуемым итогам любых спортивных соревнований. В этих итогах последовательно перечисляются участники, занявшие соответ­ственно первое, второе, третье и следующие по порядку места. Но в этой информации об итогах соревнований нередко отсутствуют или отходят на второй план сведения о фактических достижениях спортсменов, а на первый план ставятся их порядковые места.

Допустим, шахматист Д. занял в соревнованиях первое место. Како­вы же его достижения? Оказывается, он набрал 12 очков. Шахматист Е. занял второе место. Его достижение - 10 очков. Третье место занял Ж. с восемью очками, четвертое - 3. с шестью очками и т. д. В сообщениях о соревновании разница в достижениях при размещении шахматистов отходит на второй план, а на первом остаются их порядковые места. В том, что именно порядковому месту отводится главное значение, есть свой смысл. В самом деле, в нашем примере З. набрал шесть, а Д. - 12 очков. Это абсолютные их достижения - выигранные ими партии. Если попытаться истолковать эту разницу в достижениях чисто арифме­тически, то пришлось бы признать, что 3. играет вдвое хуже, чем Д. Но с этим нельзя согласиться. Обстоятельства соревнований не всегда про­сты, как не всегда просто и то, как провел их тот или другой участник. Поэтому, воздерживаясь от арифметической абсолютизации, ограничи­ваются тем, что устанавливают: шахматист 3. отстает от занявшего пер­вое место Д. на три порядковых места.

Социально-психологические причины и факторы дезадаптации у подростков
Отклоняющееся поведение подростков нельзя назвать только психологической проблемой. Оно осмысливается как комплексная социальная проблема. Основные причины отклоняющегося поведения людей вообще и подростков, в частности, объясняют различн...

Сознание и бессознательное в личности человека
Сознание не является единственным уровнем, на котором представлены психические процессы, свойства и состояния человека, далеко не все, что воспринимается и управляет поведением человека, актуально осознается им. Кроме сознания, у человека...

Практические рекомендации по оптимизации учебной деятельности в классах разного профиля.
На основании проведённого анализа литературы и анализа полученных результатов, мы разработали следующие рекомендации, которые помогут создать старшекласснику благоприятные условия для развития, самоактуализации, личностного роста, а, след...

Существует 4 основных типа измерительных шкал.

Номинативная шкала - это шкала, классифицирующая по названию: потеп (лат.) - имя, название. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого. Номинативная шкала - это способ классификации объектов или субъектов, распределения их по ячейкам классификации.

Простейший случай номинативной шкалы - дихотомическая шкала, состоящая всего лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье"; "иностранец - соотечественник"; "проголосовал "за" - проголосовал "против"" и т.п.

Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак "проявился", если тот принял интересующее его значение, и что признак "не проявился", если он принял противоположное значение. Например: "Признак леворукости проявился у 8 испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак проявился - признак не проявился".

Более сложный вариант номинативной шкалы - классификация из трех и более ячеек, например: "экстрапунитивные - интрапунитивные - импунитивные реакции" или "выбор кандидатуры А - кандидатуры Б - кандидатуры В - кандидатуры Г" или "старший - средний - младший -единственный ребенок в семье" и др.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б - 11, кандидатуру В - 28, а кандидатуру Г - всего 1. Теперь мы можем оперировать этими числами, представляющими собой частоты встречаемости разных наименований, то есть частоты принятия признаком "выбор" каждого из 4 возможных значении. Далее мы можем сопоставить полученное распределение частот с равномерным или каким-то иным распределением.

Таким образом, номинативная шкала позволяет нам подсчитывать частоты встречаемости разных "наименований", или значений признака, и затем работать с этими частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количество наблюдений (испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это одно наблюдение. Такие данные могут быть обработаны с помощью метода χ 2 , биномиального критерия m и углового преобразования Фишера φ*.

Порядковая шкала (ранговая) - это шкала, классифицирующая по принципу "больше - меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки "самое малое значение" к ячейке "самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами, поскольку по отношению к классам употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и т.д.

В порядковой шкале должно быть не менее трех классов, например "положительная реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Например, классы "подходит для занятия вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу, чем класс подходит с оговорками" к классу "не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем больше классов в шкале, тем больше. У нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей по степени их значимости для него, проранжировать список личностных качеств социального работника или 10 претендентов на эту должность по степени их профессиональной пригодности, то во всех этих случаях испытуемый совершает так называемое принудительное ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

Независимо от того, приписываем ли мы каждому качеству или испытуемому один из 3-4 рангов или совершаем процедуру принудительного ранжирования, мы получаем в обоих случаях ряды значении, измеренные по порядковой шкале. Правда, если у нас всего 3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс могут попасть люди, достаточно серьезно различающиеся между собой. С другой стороны, принудительное ранжирование, то есть образование последовательности из многих испытуемых, может искусственно преувеличивать различия между людьми. Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми, так как группы могут изначально различаться по уровню развития исследуемого качества, и испытуемый, получивший водной группе высший ранг, в другой получил бы всего лишь средний, и т.п.

Выход из положения может быть найден, если задавать достаточно дробную классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности, подавляющее большинство психологических методик, использующих экспертную оценку, построено на измерении одним и тем же "аршином" из 10, 20 или даже 100 градаций разных испытуемых в разных выборках.

Итак, единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К данным, полученным по порядковой шкале, применимы все описанные в данной книге критерии и методы.

Интервальная шкала - это шкала, классифицирующая по принципу "больше на определенное количество единиц - меньше на определенное количество единиц". Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения задачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Аналогичным образом, каждая секунда после истечения полутора минут в опыте с измерением мышечного волевого усилия на динамометре с подвижной стрелкой, по "цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна секунда за год идет" - так сформулировал это однажды один испытуемый.

Попытки измерять психологические явления в физических единицах - волю в секундах, способности в сантиметрах, а ощущение собственной недостаточности - в миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах "объективно" существующего времени и пространства. Однако ни один опытный исследователь при этом не обольщает себя мыслью, что он совершает измерения по психологической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале порядка, нравится нам это или нет.

Можно с определенной долей уверенности утверждать лишь, что испытуемый А решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Аналогичным образом, значения, полученные испытуемыми в баллах по любой нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На самом деле равно интервальными можно считать лишь шкалы в единицах стандартного отклонения и процентильные шкалы, и то лишь при условии, что распределение значений в стандартизующей выборке было нормальным.

Принцип построения большинства интервальных шкал построен на известном правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его распределении укладываются в диапазоне М±3δ. Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми (подробнее об этом будет сказано позже).

Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее арифметическое значение в "сырых" баллах принимается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 2 представлена схема вычисления стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-факторного личностного опросника Р. Б. Кеттелла.

Рис. 2. Схема вычисления стандартных оценок (стенов) по фактору N 16- факторного личностного опросника Р. Б. Кеттелла; снизу указаны интервалы в единицах 1/2 стандартного отклонения

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значения будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; δ=2,4, вправо мы откладываем 1/2δ т.е. 1,2 "сырых" балла. Таким образом, граница интервала составит: (10,2 + 1,2) = 11,4 "сырых" балла. Итак, границы интервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4 баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2δ и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения - 9 и 10. Если испытуемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он получил 11 "сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т. д.

В принципе, шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки п>200 и нормальном распределении признака 2 .

Другой способ построения равно интервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении признака в окрестности среднего значения группируется большая часть всех наблюдений, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 3). Следовательно, такая процентильная шкала является равно интервальной только относительно накопленной частоты.

Рис. 3. Процентильная шкала; сверху для сравнения указаны интервалы в единицах стандартного отклонения

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивенс. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психологическую переменную по шкале порядка, подсчитали средние и стандартные отклонения, а затем получили, наконец, интервальную шкалу. Как отмечал Стивенс "Такому нелегальному использованию статистики может быть дано известное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам".

Многие исследователи не проверяют степень совпадения полученного ими эмпирического распределения с нормальным распределением, и тем более не переводят получаемые значения в единицы долей стандартного отклонения или процентили, предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают скошенное, срезанное по краям или двухвершинное распределение. На Рис. 4 представлено распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью можно считать нормальным (χ 2 =12,7 при v=9, М=89,75, δ= 25,1).

Рис. 4 Гистограмма и плавная кривая распределения показателя мышечного волевого усилия (n=102)

На Рис. 5 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини "Уровень успеха, которого я должен был достичь уже сейчас" (n=356). Распределение значимо отличается от нормального

(χ 2 = 58,8, при v=7; p<0,01; М=80,64; δ=16,86).

Рис. 5. Гистограмма и плавная кривая распределения показателя должного успеха (n=356).

С такими "ненормальными" распределениями приходится встречаться очень часто, чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне, а в самой специфике психологических признаков. По некоторым методикам от 10 до 20% испытуемых получают оценку "ноль" - например, в их рассказах не встречается ни одной словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки

Шкала отношений

Шкалу отношений называют также шкалой равных отношений. Особенностью этой шкалы является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства или признака Шкала отношений является наиболее информативной шкалой, допускающей любые математические операции и использование разнообразных статистических методов.

Шкала отношений по сути очень близка интервальной, поскольку если строго фиксировать начало отсчета, то любая интервальная шкала превращается в шкалу отношений

Именно в шкале отношений производятся точные и сверхточные измерения в таких науках, как физика, химия, микробиология и др. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психофизиология, психогенетика.

Очевидно, что все измерения должны проводиться на определенном материале. И здесь следует остановиться на основных определениях, относящихся к понятию Выборка .

Генеральная совокупность - это все множество объектов, в отношении которого формулируется исследовательская гипотеза.

Выборка - это ограниченная по численности группа объектов (в психологии - испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Репрезентативность выборки - иными словами, ее представительность - это способность выборки представлять изучаемые явления достаточно полно-с точки зрения их изменчивости в генеральной совокупности.

Стратифицированная выборка , или отбор по свойствам генеральной совокупности (разделение выборки на «страты». Он предполагает предварительное определение тех качеств, которые могут влиять на изменчивость изучаемого свойства (это может быть пол, уровень дохода или образования и т. д.).

Статистическая достоверность , или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода, которые предъявляют определенные требования к численности, или объему выборки.

В статистических исследованиях используют различные типы признаков, характеризующих состояние экономического объекта. Признаки могут иметь различный вид в зависимости от шкалы измерения, что в дальнейшем сказывается на выборе методов статистического анализа.

В зависимости от шкалы измерения различают количественные (числовые) и категориальные (нечисловые, качественные) данные (см. рис. 3.1).

Количественные (числовые ) данные - это показатели, принимающие числовые значения, которые получаются путем некоторых измерений или подсчетов.

С точки зрения шкал измерений, количественные данные считают измеренными в интервальной шкале, которая применяется для отображения величины различия между характеристиками элементов. Интервальная (количественная) шкала показывает, насколько одно значение больше другого в принятых единицах измерения (например, шкала температур, времени, количества объектов). Интервальная шкала может иметь произвольные начало отсчета и масштаб. Множество допустимых преобразований данной шкалы составляют все линейные преобразования. Основное свойство шкалы - сохранение отношения длин интервалов. Частными случаями шкалы интервалов служат шкала отношений (нулевое начало отсчета) и шкала разностей (произвольное начало отсчета и единичный масштаб), а также абсолютная шкала (нулевое начало отсчета и единичный масштаб отсчета). Количественные шкалы допускают все арифметические действия над результатами измерения (например, заработная плата, остатки банковского счета, число работников на фирме).

В случае если данные получены путем измерений и могут принимать абсолютно любые значения из некоторого промежутка или всей числовой оси, их называют непрерывными. Если данные образуют счетное множество и принимают только некоторые изолированные значения на числовой оси, между которыми значений быть не может, то такие признаки называют дискретными.

Примеры количественных дискретных данных

  • Число вызовов «скорой помощи», поступающих в больницы г. Москвы ежедневно.
  • Количество страховых компаний в Российской Федерации, имеющих лицензии.
  • Число страховых случаев, наступивших в портфеле договоров страхования автокаско страховой компании в течение года.
  • Число беженцев и вынужденных переселенцев, официально зарегистрированных Федеральной миграционной службой за 2011 г.

Источник: URL: http://rating.rbc.ru/article.shtml92008/09/30/32143066.

Данные представлены в табличной форме, в виде линейного графика и столбиковой диаграммы.

Две переменные - «количество автомобилей в городе» и «население города» - дискретные количественные. Для наглядности на графике представлена переменная, рассчитанная как их отношение - число автомобилей на тысячу жителей.

Примеры количественных непрерывных данных

  • Динамика учетных цен на золото в России за последние 20 лет.
  • Рост, вес, давление крови и другие измеряемые показатели человека.
  • Урожайность сельскохозяйственных культур фермерских хозяйств Российской Федерации.
  • Удои молока в животноводческих хозяйствах Центрального федерального округа.
  • Дальность полета выпускаемого из орудия снаряда.

Источник: URL: http://rating.rbc.ru/articles/201 l/ll/09/33470757_tbl.shtml?2011/ 11/08/33470320.

Для представления данных по непрерывной количественной переменной «Чистые активы» использованы табличная форма и столбиковая диаграмма.

Другую группу, существенно отличающуюся от количественных данных, составляют нечисловые - категориальные или качественные данные. В этом случае объект может принадлежать только к одной из множества категорий (классов). Особенно часто это имеет место при создании и обработке анкет, опросников, рейтингов и т.д. Даже если обозначить эти категории числами (например, перекодировать: 0 - женский, 1 - мужской пол), то с такими данными все равно нельзя работать как с числовыми, а только как с категориальными.

В зависимости от того, можно ли эти категории упорядочивать, различают признаки, измеренные в номинальной или порядковой шкалах. В соответствии с этим, данные разделяют на номинальные и порядковые.

Шкала наименований (номинальная или классификационная шкала). Данные по этой шкале определяются в терминах категорий, которые нельзя содержательно упорядочить (профессия; регион страны; город; номер студенческой группы; банк, в котором имеется вклад). Номинальная шкала используется для описания принадлежности элементов к определенным классам. Всем элементам одного и того же класса присваивается одно и то же текстовое значение или число, а элементам разных классов - разные значения или числа. Допустима любая замена чисел для обозначения классов, лишь бы это было взаимно однозначное преобразование, и каждый класс получил бы свое число. Это обстоятельство и определяет множество допустимых преобразований номинальной шкалы как множество всех взаимооднозначных функций. Нет оснований полагать, что одна категория лучше (или хуже), чем другая, поэтому при обработке таких данных применяются только операции сравнения: «равно» и «не равно».

  • Город Российской Федерации (Владивосток, Сургут, Тюмень и т.д.).
  • Группа крови человека (О, А, В, АВ).
  • Семейное положение (холост, женат, разведен, в гражданском браке).
  • Банк России (Сбербанк России, ВТБ, Газпромбанк и т.д.).
  • Федеральные округа России (Центральный, Дальневосточный и т.д.).

Пример 3.12


Данные по номинальной категориальной переменной «цвет глаз» представлены в табличной форме и в виде круговой диаграммы (piechart).

Другой тип категориальных переменных - порядковые (ординальные ) - отличаются тем, что данные измеряются в порядковой шкале. Порядковые шкалы используются для упорядочения элементов по одному или нескольким признакам. Они позволяют установить, что один элемент лучше, важнее, предпочтительнее другого или равноценен другому. Порядковая шкала отражает лишь порядок следования элементов и не дает возможности сказать, на сколько или во сколько раз один элемент предпочтительнее другого. Иными словами, в этой шкале нельзя определить меру степени предпочтительности. Для сравнения таких данных допускаются уже не только операции «равно» и «не равно», но и «больше» - «меньше» (без определения на сколько).

  • Ответы на вопросы анкеты, содержащей следующие варианты ответов: да; больше да, чем нет; больше нет, чем да; нет.
  • Оценки, полученные студентами на экзамене (отлично, хорошо, удовлетворительно, неудовлетворительно).
  • Должность, занимаемая сотрудником в научной лаборатории (младший научный сотрудник, научный сотрудник, старший научный сотрудник и т.д.);
  • Воинские звания в Российской армии (лейтенант, капитан, майор, полковник и т.д.).

Л (высокий), В (удовлетворительный), В+ (достаточный), В++ (приемлемый),

С (неудовлетворительный), D (банкротство), Е (отзыв лицензии или ликвидация))


  • Туровец О.Г. Маркетинговые исследования рынка: практикум (Документ)
  • Беляев В.И. Маркетинг: основы теории и практики (Документ)
  • Зубец А.Н. Маркетинговые исследования страхового рынка (Документ)
  • Методическое пособие - SPSS: компьютерная обработка данных (Документ)
  • Беляевский И.К. Маркетинговые исследования (Документ)
  • Алексеев А.А. Маркетинговые исследования на рынке услуг (Документ)
  • n1.doc

    2.3. ТИПЫ ШКАЛ ИЗМЕРЕНИЯ ПЕРЕМЕННЫХ

    Для работы с данными в SPSS важно знать, по шкале какого типа измеряются исследуемые переменные. Это необходимо для выбора метода анализа данных и определения возможности расчета статистических показателей (табл. 2.3).

    Существует четыре типа шкал измерения переменных:

    Номинальная шкала.

    Порядковая шкала.

    Интервальная шкала.

    Примеры переменных, измеряемых по шкалам разных типов

    Относительная шкала.

    Таблица 2.3


    Шкала

    Переменная

    Значения переменной

    Номинальная

    Пол

    (дихотомическая переменная)


    • «1» = мужской

    • «2» = женский

    Производитель продукта

    «X»


    • «1» = производитель А

    • «2» производитель В

    • «3» производитель С

    Порядковая

    Класс полета

    • «1» = первый класс

    • «2» = бизнес-класс

    • «3» =эконом-класс

    Категории потребителей по уровню дохода

    • «1» = до 1000 евро

    • «2» = от 1001 до 3000 евро

    • «3» = свыше 3000 евро

    Интервальная

    Коэффициент интеллекта

    (IQ)


    ...«120»...

    Относительная

    Уровень дохода

    ... «2100» евро...


    Номинальная шкала характеризуется самым низким уровнем измерения переменных. Все значения переменной, измеряемой по номинальной шкале, находятся на одном уровне. По этой шкале измеряются, как правило, качественные характеристики объекта исследования. Между значениями переменной, измеряемой по номинальной шкале, не существует логического порядка. Например, в качестве ответа на вопрос анкеты: «Какого производителя продукта «X» вы предпочитаете?» - может быть предложено несколько вариантов: «Производитель А», «Производитель В», «Производитель С» и т.д. В этом случае, с точки зрения исследователей, все предложенные производители являются рав нозначными. Числовые коды («1», «2», «3»...) могут присваиваться значениям метки переменной в любом порядке.

    Переменные, измеряемые по номинальной шкале и имеющие всего два значения (например, «мужчины» и «женщины»), называются дихотомическими.

    Порядковая шкала является второй по уровню измерения переменных. Значения переменной, измеряемой по порядковой шкале, не являются равнозначными, они находятся на равных уровнях по отношению друг к другу и подчиняются логическому числовому порядку.

    Порядковая шкала характеризуется низким уровнем измерения переменных, поскольку является шкалой с неравными интервальными отрезками. Совершенно четко можно утверждать, что уровень обслуживания авиапассажиров первого класса выше, чем бизнес-класса, но насколько именно, неизвестно. Также разница в обслуживании между первым и бизнес-клас- сом, между бизнес- и эконом-классом может быть различной (см. табл. 2.3).

    Низкий уровень измерения переменных по порядковой шкале можно проиллюстрировать на примере переменной «Категории потребителей по уровню дохода». Потребители примерно с одинаковым уровнем дохода (например, 950 и 1050 евро) оказываются в разных категориях, а потребители с существенной разницей по уровню дохода (например, 1050 и 2950 евро) оказываются в одной категории.

    Интервальная шкала является третьей по уровню измерения переменных. В отличие от порядковой шкалы она является шкалой с равными интервальными отрезками. Это позволяет осуществлять количественное сравнение значений переменной, т.е. можно определить, насколько одно значение больше или меньше (лучше или хуже, длиннее или короче и т.д.) другого.

    Характерной чертой интервальной шкалы является отсутствие «естественного нуля», т.е. исходная точка измерения является относительной. Примерами интервальной шкалы являются шкала Цельсия и календарь. По шкале Цельсия за «0» принята температура замерзания воды, однако за «0» можно было принять любую другую температуру. Существуют также различные календари с одинаковым количеством дней в году, но разным временем начала года.

    В маркетинговых исследованиях очень часто используется рейтинговая шкала, когда респондентам предлагается оценить по балльной шкале (например, от 1 до 7 баллов) утверждение, продукт, бренд и т.п. Строго говоря, рейтинговая шкала является порядковой, поскольку балльные оценки субъективны. Одинаковые балльные оценки в действительности отображают разный уровень измеряемой переменной. Например, студенты, получившие одинаковые оценки на экзамене, в действительности могут иметь разный уровень знаний.

    Очень часто при проведении исследований шкала бапльных оценок рассматривается как интервальная. В основе этого лежит предположение, что интервальные отрезки шкалы балльных оценок одинаковы. Это дает возможность рассчитать соеднее значение переменной (например, средний балл успеваемости студентов). Расчет средней величины (среднеарифметической) для показателя, измеряемого по порядковой шкале, невозможен. Например, не существует показателя «средний класс» полета (см. табл. 2.3).

    Относительная шкала характеризуется самым высоким уровнем измерения переменных. Ее основное отличие от интервальной шкалы заключается в существовании «естественного нуля», который можно интерпретировать как отсутствие значения переменной. Например, если заработная плата равна нулю, это значит, что ее не выплачивают.

    По относительной шкале измеряются количественные характеристики. Это могут быть как физические характеристики (объем, вес, скорость и пр.), так и экономические характеристики (доход, издержки, цена и пр.).

    Относительная шкала получила свое название благодаря возможности сравнения значений переменной по отношению друг к другу, что невозможно при использовании интервальной шкалы измерения. Например, нельзя сказать, что человек, у которого коэффициент интеллекта (iQ) равен 160, в два раза умнее человека у которого этот показатель составляет 80. Но можно сказать, что заработная плата 1000 евро в два раза больше заработной платы 2000 евро.

    При выборе типа шкалы измерения переменных в SPSS (столбец « Measure » во вкладке редактора данных «Variable View ») интервальная шкала и шкала отношений объединяются в один вид - метрическую шкалу ( Scale ).

    При построении в SPSS интерактивных графиков номинальная ( Nominal ) и порядковая ( Ordinal ) шкалы объединяются в «категориальный» тип (табл. 2.4).

    Таблица 2.4


    Шкала

    Характеристики

    Категориаль-ная

    Номинальная {Nominal)

    Служит для классификации качественных показателей. Все значения измеряемой переменной равнозначны

    Порядковая ( Ordinal )

    Служит для построения значений измеряемой переменной в определенной последовательности. Шкала с неравными интервальными отрезками

    Метрическая (Scale)

    Интервальная

    Шкала с равными интервальными отрезками и условной точкой отсчета

    Относительная

    Шкала с равными интервальными отрезками и безусловной точкой отсчета


    Чем выше уровень измерения переменной, тем богаче ее информационная содержательность и тем больше возможностей осуществления расчетов и определения статистических показателей.

    Числовые коды («1», «2», «3»...) значений метки переменной, измеряемой по номинальной или порядковой шкале, не могут рассматриваться как числа, они представляют собой лишь некие числовые символы. Поскольку они не являются числами, с ними нельзя производить никаких арифметических операций (сложение, вычитание, деление, умножение).

    Что касается статистических показателей, характеризующих распределение величины, измеряемой по номинальной шкале, можно провести частотный анализ (Frequencies ) и определить моду ( Mode ). Частоты показывают, например, сколько респондентов предпочитают того или иного производителя продукта «Л». Мода обозначает самую многочисленную группу респондентов, предпочитающих определенного производителя продукта «Л».

    Для переменных, измеряемых по порядковой шкале, кроме вышеуказанных статистических показателей можно определить медиану и средневзвешенное. Значения меток переменной, измеряемой по интервальной шкале, рассматриваются как числа. С ними можно производить такие арифметические операции, как сложение и вычитание.

    Что касается возможности расчета статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, кроме моды и медианы можно также определить стандартное отклонение ( Std . deviation ) и среднеарифметическое ( Mean ). (Средневзвешенное значение переменных с интервальной шкалой равно среднему арифметическому.)

    При расчете статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, не рассчитывается такой показатель, как сумма ( Sum ). Например, не рассчитывается «суммарный коэффициент интеллекта» для группы студентов, такого показателя не существует.

    Значения меток переменной, измеряемой по шкале отношений, выражаются в числах, с ними можно производить любые арифметические операции. Также можно определять любые статистические показатели, характеризующие распределение переменной.

    Возможна трансформация имеющихся данных, измеряемых по шкале более высокого уровня, в данные, измеряемые по шкале более низкого уровня, но не наоборот. Например, значения переменной «Уровень дохода», измеряемой по относительной шкале, можно трансформировать в значения переменной «Категории потребителей по уровню дохода», измеряемой по порядковой шкале (см. табл. 2.3). Подобная трансформация данных, производимая в целях упрощения процедуры анализа и наглядности представления результатов, неизбежно связана с частичной потерей информации и снижением точности расчетов.

    На практике, в том числе при применении SPSS , различие между переменными, измеряемыми по интервальной и относительной шкалам, обычно несущественно.

    Во многих учебниках по SPSS метрические переменные (Scale) определяются как интервальные.

    ип шкалы измерения переменных определяет возможность применения того или иного метода анализа данных. Все методы статистического анализа делятся на две группы:

    методы оценки связи между переменными;

    методы выявления структуры данных.

    Методы выявления структуры данных характеризуются тем, что исходные данные для проведения анализа не содержат информации (предположений) о существовании взаимосвязей между исследуемыми переменными. К таким методам относятся, например, кластерный и факторный анализ.

    Методы оценки связи между переменными устанавливают влияние одной или нескольких независимых переменных на одну или несколько зависимых переменных. С точки зрения теории статистики существуют правила применения того или иного метода оценки связи между переменными в зависимости от типа шкалы их измерения (табл. 2.5).


    Таблица 2.5

    Методы оценки связи между переменными и типы шкал измерения переменных

    (Backhaus, Erichson, Ptinke, Weiber, 2000.S. Ш )


    Независимые переменные

    Метрическая шкала

    Номинальная шкала

    Зависимые переменные

    Метрическая шкала

    Регрессионный анализ

    Дисперсионный анализ

    Номинальная шкала

    Дискриминантный анализ

    Таблицы сопряженности

    Применение некоторых основных методов статистического анализа в SPSS будет более подробно рассмотрено в следующих подразделах.

    КОНТРОЛЬНЫЕ ВОПРОСЫ

    Что представляют собой таблицы, содержащиеся во вкладках редактора данных SPSS «Свойства переменных» ( Variable View ) и «Значения переменных» ( Data View )?

    Каким образом осуществляется процедура занесения в исходный файл данных SPSS меток переменных?

    Чем отличаются пропущенные значения, определяемые системой ( system - defined truss , ig values ) от пропущенных значений, задаваемых пользователем программы { user - defined missing values )!

    Какие три типа шкал измерения переменных используются в SPSS и каким образом задается тип шкалы измерения переменной при формировании исходного файла данных?

    Чем отличаются дихотомическая и категориальная кодировка данных?

    Почему при занесении в исходный файл данных SPSS ответов ка многовариантные (безальтернативные) вопросы необходимо использовать дихотомическую кодировку данных?

    С какой целью и в каких случаях применяется двойная запись данных при создании исходного файла SPSS ?

    По шкале какого типа измеряются следующие переменные: а) частота приобретения товара « A »

    реже 1-го раза в неделю;

    1 - 3 раза в неделю;

    чаще 3-х раз в неделю;

    Б) семейное положение

    Замужем/женат;

    Не замужем/ холост;

    Разведена/разведен;

    В) оценка уровня сервисного обслуживания

    Очень высокая;

    Высокая;

    Средняя;

    Очень низкая;

    Г) возраст (23 года, 24 года, 32 года, 57 лет)?

    1. Как отличаются друг от друга переменные, измеряемые по разным типам шкал, относительно возможности произведения арифметических операций и расчета статистических показателей?