Open Library - открытая библиотека учебной информации. Проверка правильности ранжирования Задания для самостоятельной работы
Типы данных
Данные - ϶ᴛᴏ основные элементы, подлежащие классифицированию или разбитые на категории с целью обработки. Выделяют три типа данных:
1. Метрические данные: количественные данные, получаемые при измерениях. Их можно распределить на шкале интервалов или отношений.
2. Ранговые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке. Эти данные можно представить в виде порядковой шкалы.
3. Номинативные данные: категориальные (качественные) данные, представляющие собой особые свойства элементов выборки. К примеру, цвет глаз у испытуемых. Эти данные нельзя измерить, но можно оценить их частоту встречаемости.
Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, метрические значения переводятся в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться 2 правил.
Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). К примеру, чемпиону присуждают первое место, а не наоборот. Хотя, и здесь если бы был принят обратный порядок, то результаты от этого не изменились бы. Так что порядок ранжирования каждый исследователь вправе определять сам. К примеру, Е.В. Сидоренко рекомендует меньшему значению приписывать меньший ранᴦ. В некоторых случаях это удобнее, но непривычнее.
Напрмер: имеется неупорядоченная выборка, данные которой крайне важно проранжировать. {2, 7, 6, 8, 11, 15, 9}. После упорядочивания выборки ранжируем ее.
Отдельно следует сказать следующее. Существует группа редко используемых непараметрических критериев (Т-критерий Вилкоксона, U-критерий Манна-Уитни, Q-критерий Розенбаума и др.), при работе с которыми всегда нужно меньшему значению приписывать меньший ранᴦ.
Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранᴦ. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны. К примеру, нужно проранжировать выборку, содержащую ряд одинаковых метрических данных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. После упорядочивания выборки следует вычислить среднее арифметическое значение связанных рангов.
Примеры Формула для проверки правильности ранжирования Пример 2 Кодирование уровня агрессивности по пяти градациям. Процесс присвоения количественных (числовых) значений называется кодированием Правила ранжирования Результаты... [читать подробенее]
Пример Ограничения критерия U 1. В каждой выборке должно быть не менее 3 наблюдений: n1 n2&... [читать подробенее]
Ранжирование Материалы лекции Методические рекомендации к изучению темы Тема 5. Непараметрические критерии различий для сравнения выраженности признака в выборках Непараметрические критерии для сравнения независимых выборок. Критерий Розенбаума:...
Особенности ранжирования числовых характеристик:
1) Наименьшему числовому значению приписывается ранг 1.
2) Наибольшему числовому значению приписывается ранг, равный количеству ранжируемых величин.
3) В случае если несколько исходных значений оказываются равными, то им приписывается ранг, равный средней величине тех рангов, которые эти величины получили бы, если они стояли по порядку друг за другом и не были бы равны.
4) Общая сумма реальных рангов должна совпадать с расчётной, определяемой по формуле:
6) При необходимости ранжирования достаточно большого количества объектов их следует объединить по какому-либо признаку в достаточно однородные классы (группы), а затем уже ранжировать полученные классы (группы).
Пример 1.1. У 11-ти испытуемых получены показатели невербального интеллекта, которые представлены в таблице. Проранжируйте эти показатели. Сделайте проверку правильности ранжирования.
Решение: Необходимо заполнить третий столбец таблицы. Числа в скобках – вспомогательные записи в случае равных значений. В нашем случае – это значение 117. Оно встречается дважды (восьмым и девятым по порядку). Следовательно, ранг этого значения равен среднему арифметическому чисел 8 и 9, т.е. 8,5.
Проверка:
1) Сумма рангов: 6+4+11+10+8,5+8,5+3+5+7+1+2=66
2) По формуле: = =11 6 = 66
3) Сравниваем результаты: 66 = 66, следовательно, ранжирование проведено верно.
Вопросы для обсуждения
1. Что называется измерением, единицей измерения? Чем отличается измерение в психологии от измерения в естественных науках и технике?
2. Что такое кодирование? На каких этапах научного исследования психолог работает с числовыми кодами?
3. Какие типы измерительных шкал существуют? Каковы принципиальные различия между типами шкал?
4. Каковы особенности, примеры и частные случаи номинативной шкалы? Каковы другие названия данной шкалы? Какие статистические методы применимы к данной шкале?
5. Ранговая шкала: её особенности, примеры. Другие названия ранговой шкалы. Статистические методы, применимые в ранговой шкале.
6. Что такое ранжирование? Каковы правила ранжирования?
7. Как осуществить проверку правильности ранжирования?
9. Шкала интервалов: особенности, примеры. Интервал и его размер. Применимость статистических методов к шкале интервалов.
10. Шкала отношений и её отличие от шкалы интервалов. Применимость шкалы отношений в психологии.
11. Вы измеряете согласие девятиклассников на продолжение обучения в профильном классе школы. Школьник может дать ответ «Да» или «Нет». В какой шкале осуществляется данное измерение?
12. Проводится измерение веса и роста младших школьников. В какой шкале осуществляется измерение?
13. Вы определяете быстроту реакции военных лётчиков. Для этого фиксируется время ответа испытуемого на световой сигнал. В какой шкале проводится данное измерение?
14. Какие измерения вы можете провести в своей группе, чтобы они были проведены:
а) в шкале наименований;
б) в ординарной шкале;
в) в интервальной шкале;
г) в шкале равных отношений?
15. Какие психологические методики позволяют осуществлять измерение в шкале интервалов?
Ранжирование данных, то есть присваивание рангов элементам упорядоченного списка, происходит по определённым правилам.
Сначала вы определяете направление ранжирования – от большего к меньшему или от меньшего к большему.
Выбор направления ранжирования осуществляется в соответствии с целью проводимого исследования. Если вы хотите проранжировать результаты решения творческих задач, то на первое место оптимальнее поставить лучший результат, на второе – лучший из оставшихся и т.д. Таким образом, будет осуществляться ранжировка по убыванию результатов (набранных баллов при решении творческих задач).
Если вы ранжируете результаты диагностики уровня внимания (например, полученные с помощью корректурной пробы), то лучшим результатом будет отсутствие ошибок (или их минимальное число, если в выборке нет безошибочного варианта). Выбрав самое меньшее число ошибок, вы присваиваете этому результату ранг 1, затем из оставшихся выбираете результат с минимальным количеством ошибок, присваиваете ему ранг 2 и т.д. Таким образом, получится ранжирование по возрастанию ошибок (хотя с точки зрения результатов – тоже по убыванию).
Выбрав направление ранжирования, вы приступаете к осуществлению его процедуры – каждому числовому значению присваиваете ранг, то есть место в упорядоченном перечне.
Например, вы хотите проранжировать по убыванию результаты теста интеллекта. В выборке 11 человек полученные баллы колеблются от 98 до 127 (таблица 1).
Ранжирование результатов диагностики интеллекта Таблица 1
Поскольку выбрано направление ранжирования от большего к меньшему (чтобы более высокие ранги были присвоены лучшим результатам), то нужно найти самое большое значение (лучший результат) и присвоить ему ранг 1. В нашем случае это 127. Напротив его мы указываем ранг 1. Затем выбираем максимальный результат из оставшихся – 120 – и присваиваем ему ранг 2. Следующее значение 119 получает ранг 3. Результату 118 приписываем ранг 4 и так далее. Полностью результаты ранжирования представлены в таблице 1.
Если встречаются совпадающие результаты, например, несколько человек получили одинаковые баллы (таблица 2), то процедура ранжирования осуществляется следующем образом: выбрав направление ранжирования (предположим, по возрастанию) определяете число, соответствующее 1 рангу.
Ранжирование результатов диагностики интеллекта Таблица 2
В соответствии с выбранным направлением (по возрастанию) выбираем наименьший результат (104) и присваиваем ему ранг 1. Затем выбираем наименьшее значение из оставшихся. Это 105, но этих значений два. Если бы одно из них было 105, а другое 106, то мы присвоили бы им ранги 2 и 3 соответственно. Но в случае одинаковых значений мы не можем присвоить им разные ранги. Поэтому поступаем следующим образом: те ранги, которые были бы присвоены, будь значения различными, назовем активными. В нашем случае это ранги 2 и 3. Активные ранги усредняются и одинаковые значения получают усреднённый ранг. Таким образом,
правило ранжирования одинаковых результатов: одинаковые значения получают совпадающие ранги, представляющие собой усреднённые «активные» ранги.
Усредненный ранг (2+3):2=2,5 присваивается двум значениям 105. Следующее значение 109, оно получает ранг 4. Особое внимание следует уделить на то, что после усреднённого ранга 2,5 можно ошибочно приписать следующему значению ранг 3. Но ранг 3 мы уже использовали при подсчёте усреднённого ранга. Поэтому ранжирование продолжается со следующего по порядку значения, в нашем случае это 4. Результат в 111 баллов получает ранг 5. Следующее значение 112, но в выборке 3 таких значения. Их активные ранги 6, 7 и 8. Усредненный ранг (6+7+8): 3=7. Таким образом, все значения 112 получают ранг 7, а продолжаем ранжирование с ранга 9 (следующего за наибольшим активным рангом). Этот ранг приписывается значению 118, значение 119 получает ранг 10, 121 – ранг 11, 127 – ранг 12, 128 – ранг 13, 129 – ранг 14, 130 – ранг 15 (таблица 2).
Чтобы проверить, не допущена ли ошибка, можно сложить приписанные нами ранги и сравнить с суммой порядковых номеров (совпадающей с суммой рангов без сходных значений). Сумма порядковых номеров равна 120:
Сумма проставленных нами рангов также равна 120:
Следовательно, ранжирование проведено верно.
Пример
Ограничения критерия U
1. В каждой выборке должно быть не менее 3 наблюдений: n 1 n 2 ≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; n 1 n 2 ≤60. Однако уже при n 1 n 2 >20 ранжирование становиться достаточно трудоемким.
На наш взгляд, в случае, если n 1 n 2 >20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием λ, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.
Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума мы в предыдущем параграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.
Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?
Таблица 2.3
Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2 = 12) факультетов
Студенты-физики | Студенты-психологи | ||||
Код имени испытуемого | Код имени испытуемого | Показатель невербального интеллекта | |||
1. | И.А. | 1. | Н.Т. | ИЗ | |
2. | К.А. | 2. | О.В. | ||
3. | К.Е. | 3. | Е.В. | ||
4. | П.А. | 4. | Ф.О. | ||
5. | С.А. | 5. | И.Н. | ||
6. | Ст.А. | 6. | И.Ч. | ||
7. | Т.А. | 7. | И.В. | ||
8. | Ф.А. | 8. | К.О. | ||
9. | Ч.И. | 9. | P.P. | ||
10. | ЦА. | 10. | Р.И. | ||
11. | См.А. | 11. | O.K. | ||
12. | К.Ан. | 12. | Н.К. | ||
13. | Б.Л. | ||||
14. | Ф.В. |
Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.
Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.
2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.
Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:
Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:
3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:
где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.
При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.
АЛГОРИТМ 4 Подсчет критерия U Манна-Уитни. 1. Перенести все данные испытуемых на индивидуальные карточки. 2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим. 3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой. 4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2). 5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой. 6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной. 7. Определить большую из двух ранговых сумм. 8. Определить значение U по формуле: где n 1 - количество испытуемых в выборке 1; n 2 - количество испытуемых в выборке 2; Т х - большая из двух ранговых сумм; n х - количество испытуемых в группе с большей суммой рангов. 9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп ≤ U к p _ 005 , Н о отвергается. Чем меньше значенияU, тем достоверность различий выше. |
Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.
Таблица 2.4
Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов
Ads by OffersWizardAd Options
Студенты-физики (n 1 =14) | Студенты-психологи (n 2 =12) | |||
Показатель невербального интеллекта | Ранг | Показатель невербального интеллекта | Ранг | |
20,5 | ||||
20,5 | ||||
15,5 | 15.5 | |||
14" | ||||
11.5 | 11,5 | |||
11,5 | ||||
11,5 | ||||
6.5 | 6,5 | |||
4,5 | 4,5 | |||
Суммы | ||||
Средние | 107,2 | 111,5 |
Общая сумма рангов: 165+186=351. Расчетная сумма:
Равенство реальной и расчетной сумм соблюдено.
Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.
Теперь мы готовы сформулировать гипотезы:
H 0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.
Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.
В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:
Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х:
По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.
Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп ≤ U к p
Построим "ось значимости".
U эмп = 60
U эмп > U к p
Ответ: H 0 принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.
Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).