|
Будрейка Н.Н. Использование непараметрических критериев проверки статистических гипотез |
|
Понятие о непараметрических критериях
Непараметрическими критериями называют те приемы обработки экспериментальных данных, которые не рассматривают анализируемое статистическое распределение как функцию, их применение не предполагает предварительного вычисления параметров распределения. Эти критерии сопоставляют не сами по себе полученные величины, а порядок их расположения, их соотношение по типу больше – меньше.
В большинстве психолого-педагогических исследованиях для оценки существенных различий используют параметрический t - критерий Стьюдента, который основан на предположении, что сравниваемые выборки принадлежат нормальным распределениям совокупностей. Между тем, в психологических исследованиях распределения могут значительно отличаться от нормального. В этих случаях и даже тогда, когда просто неизвестно, являются ли распределения нормальными, применение t – критерия является необоснованным и может привести к ошибочным заключениям. Именно поэтому все большее распространение получают непараметрические критерии различий, не зависящие от формы распределений. Их название связано с тем, что эти критерии не требуют вычисления параметров известных распределений.
Назовем основные преимущества непараметрических критериев:
- при распределениях, близких к нормальному, они дают хороший результат;
- при распределениях, далеких от нормального, позволяют обнаружить существенные различия, когда t-критерий их не выявляет;
- не все психологические признаки распределяются нормально;
- применимость к порядковым, а не строго к количественным показателям;
- рассмотрение качественных признаков, которые выражаются порядковыми номерами или индексами;
- небольшая трудоемкость исследования и относительная простота математического аппарата.
Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.
Постановка задачи. Какие задачи наиболее часто рассматриваются при сравнении двух выборок? Обычно две выборки получаются как результаты применения различных условий эксперимента к двум группам испытуемых, однородных по своему составу. Изменение условий эксперимента обычно сказывается на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших изменениях наряду с изменением положения распределения изменяется и его дисперсия. Крайне редко происходит изменение самой формы распределения, поэтому при исследовании различий в двух выборках обычно предполагают, что законы распределения двух анализируемых выборок отличаются только сдвигом и относятся к сдвиговому семейству распределений. Исследователю приходится иметь дело не только с количественными, но и с качественными признаками, многие из которых выражаются порядковыми номерами, индексами и другими условными знаками. В таких случаях необходимо использовать непараметрические критерии.
G – КРИТЕРИЙ ЗНАКОВ
Назначение
G-критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.
Ограничения
Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n1 ≤ 300 и 5 ≤ n2 ≤ 300.
Алгоритм использования
1. проверить выполнение ограничений;
2. занести данные измерений в таблицу:
|
Испытуемые |
1 |
2 |
3 |
… n |
|
Значения «до воздействия» |
. |
. |
. |
… . |
|
Значения «после воздействия» |
. |
. |
. |
… . |
|
Сдвиг («после» - «до») |
. |
. |
. |
…. |
Сдвиг количественно не подсчитывается, ставится просто, знак разности (« + » или « - »), когда из значения «после воздействия» вычитается значение «до воздействия». Если разность эта равна нулю, то в таблице пишут нуль.
3. подсчитать количество нулевых реакций n0 и вычесть их из объема выборки п. Новый объем выборки найти по формуле: n = n - n0;
4. определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» - те, которых меньше;
5. сформулировать гипотезы:
Но: Сдвиг в типичную сторону является случайным;
H1: Сдвиг в типичную сторону является неслучайным.
6. подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G-критерия: G эмп. равно количеству «нетипичных» сдвигов;
7. по таблице 1 приложения по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости.

зона значимости зона неопределенности зона не значимости
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05)
Если G эмп. ≤ G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости.
Если G эмп. › G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Замечание
На практике всегда желательно брать группу испытуемых больше пяти человек.
Пример 1
На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:
|
Испытуемые |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Значения «до» |
8 |
6 |
3 |
2 |
5 |
5 |
7 |
8 |
10 |
12 |
|
Значения «после» |
12 |
8 |
3 |
5 |
10 |
4 |
9 |
8 |
9 |
15 |
Решение
Оценки испытуемых в общей массе после воздействия возросли, то есть без исследования можно было бы сделать вывод об эффективности обучения.
Так как речь идет об одной группе испытуемых, то следует применить G - критерий знаков, действуя по алгоритму:
1. Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.
2. Заполним таблицу вида:
|
Испытуемые |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Значения «до» |
8 |
6 |
3 |
2 |
5 |
5 |
7 |
8 |
10 |
12 |
|
Значения «после» |
12 |
8 |
3 |
5 |
10 |
4 |
9 |
8 |
9 |
15 |
|
Сдвиг («после» - «до) |
+ |
+ |
0 |
+ |
+ |
- |
+ |
0 |
- |
+ |
3. подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n0 = 2, значит n = 10 - 2 = 8 - новый объем выборки;
4. подсчитаем количество положительных и отрицательных сдвигов: сдвигов «+» - 6, сдвигов «-» - 2. Значит, «+» сдвиги - «типичные», а « - » сдвиги - «нетипичные»;
5. сформулируем гипотезы:
H0: Сдвиг показателей в типичную сторону является случайным;
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. найдем G эмп., равное количеству «нетипичных сдвигов» - 2;
7. по таблице 1 для критерия знаков приложения для n = 8 найдем
G кр. (p ≤ 0,05) = 1 и G кр. (p ≤ 0,01) = 0.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.
Так как G эмп. > Gкp. (p ≤ 0,05), то Но принимается, т. е. различия случайны.
Ответ
Обучение нельзя считать эффективным.
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по разному слова, обозначающие профессии (слесарь, химик, электрик, физик, биолог, геолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
|
Объем запоминания |
испытуемые |
|||||||||||
|
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
|
|
Профессии |
4 |
3 |
3 |
3 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
|
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
1. проверим ограничения. Так как n = 12 и 5 < 12 < 300, то критерий применим;
2. составим таблицу:
|
Испытуемые |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
|
Профессии |
4 |
3 |
3 |
3 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
|
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
|
Знак разности |
+ |
- |
+ |
+ |
- |
- |
+ |
- |
+ |
+ |
+ |
+ |
3. подсчитаем количество нулевых реакций: n0 = О, значит n = 12 - О = 12;
4. подсчитаем количество «+» и (-) сдвигов: сдвигов «+ » - 8, сдвигов «-» - 4. Значит, «+» сдвиги - «типичные», а «-), - «нетипичные»;
5. сформулируем гипотезы:
Н0: Сдвиг показателей в типичную сторону является случайным.
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. найдем G эмп., равное количеству «нетипичных» сдвигов – 4;
7. по таблице 1 приложения для n = 12 найдем С кр. (p ≤ 0,05) = 3; т. к. G кр. (p ≤ 0,05) < G эмп., то Но принимается, т.е. различия случайны.
Ответ
Преобладание эффективности запоминания профессий по сравнению с эффективностью запоминания научных абстракций не является статистически значимым.
Т – критерий Вилкоксона
Назначение
Т-критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.
Ограничение
Объем выборки должен быть 5 ≤ n ≤ 50.
Алгоритм использования:
1. проверить выполнение ограничений;
2. поместить данные в таблицу, записав в первый столбец испытуемых в каком-то определенном порядке (или их коды), во второй - результаты первого замера, а в третий - результаты второго замера:
|
№ испытуемого |
Замер 1 |
Замер 2 |
di = «после» - «до» |
| di | |
Ранг | di | |
Ранг «не типичные» |
|
1 |
Х1 |
Y1 |
. |
. |
. |
. |
|
2 |
Х2 |
Y2 |
. |
. |
. |
. |
|
3 |
Х3 |
Y3 |
. |
. |
. |
. |
|
… |
… |
… |
… |
… |
… |
… |
|
n |
Xi |
Yi |
. |
. |
. |
. |
|
Суммы |
- |
- |
- |
- |
Ri=? |
∑Rнетип.=? |
3. вычислить разность между значениями di = «после» - «до» - «после» для каждого испытуемого и занести в четвертый столбец. Нулевые сдвиги, если они получились, далее не рассматривать, уменьшить объем выборки на количество нулевых сдвигов n0. Новый объем выборки n = n – n0.
В пятый столбец записать модули разностей: |di|, затем проранжировать их, приписывая меньшему значению меньший ранг, а равным значениям - равные ранги. Результаты ранжирования записать в шестой столбец таблицы. Проверить совпадение суммы рангов с расчетной суммой по формуле:
∑ Ri = (n + 1) : 2;
4. определить «типичные» и «нетипичные» сдвиги («типичные» - те, которых больше, «нетипичные» - те, которых меньше). Выписать ранги «нетипичных» сдвигов R нетипичн. в седьмой столбец таблицы и просуммировать их;
5. сформулировать гипотезы.
H0: Интенсивность сдвигов в типичном направлении не превышает интенсивность сдвигов в нетипичном направлении.
Н1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
6. подсчитать эмпирическое значение критерия по формуле:
Т эмпир. = ∑ R нетип.
7. по n и таблице 2 приложения найти T кр. (p ≤ 0,05) и T (p ≤ 0,01). Построить ось значимости:

зона значимости зона неопределенности зона не значимости
T кр. (p ≤ 0,01) T кр. (p ≤ 0,05)
Если Т эмп. ≤ Т кр. на некотором уровне значимости, то Но отвергается и принимается Н1 на этом уровне значимости.
Если Т эмп. › Т кр. (p ≤ 0,05), то принимается Но.
Чем меньше Т эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если его результаты таковы:
|
Испытуемые |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Значения «до» |
8 |
6 |
3 |
2 |
5 |
5 |
7 |
8 |
9 |
15 |
|
Значения «после» |
12 |
8 |
3 |
5 |
10 |
4 |
9 |
8 |
9 |
15 |
Решение
Используем для решения примера алгоритм Т-критерия:
1. проверим выполнимость ограничений: 5 ≤ 10 ≤ 50;
2. запишем данные в таблицу и сделаем необходимые вычисления:
|
№ испыт. |
Замер 1 |
Замер 2 |
di = «после» - «до» |
|di| |
Ранг |di| |
Ранг «нетип.» |
|
1 |
8 |
12 |
4 |
4 |
7 |
- |
|
2 |
6 |
8 |
2 |
2 |
3,5 |
- |
|
3 |
3 |
3 |
0 |
0 |
- |
- |
|
4 |
2 |
5 |
3 |
3 |
5,5 |
- |
|
5 |
5 |
10 |
5 |
5 |
8 |
- |
|
6 |
5 |
4 |
-1 |
1 |
1,5 |
1,5 |
|
7 |
7 |
9 |
2 |
2 |
3,5 |
- |
|
8 |
8 |
8 |
0 |
0 |
- |
- |
|
9 |
10 |
9 |
-1 |
1 |
1,5 |
1,5 |
|
10 |
12 |
15 |
3 |
3 |
5,5 |
- |
|
Суммы |
- |
- |
- |
- |
36 |
3 |
В пятом столбце получились числа 4; 2; 0; 3; 5; 1; 2; 0; 1; 3. Исключим нулевые сдвиги и подсчитаем новый объем выборки: n.= 10 - 2 = 8;
3. запишем модули сдвигов в ряд по возрастанию и укажем их места в этом ряду, а затем припишем соответствующие ранги:
|
|di| |
1 |
1 |
2 |
2 |
3 |
3 |
4 |
5 |
|
Место |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Ранг |
1,5 |
1,5 |
3,5 |
3,5 |
5,5 |
5,5 |
7 |
8 |
Проверим совпадение ранговой суммы с контрольной:
∑ Ri = 1,5 + 1,5 + 3,5 + 3,5 + 5,5 + 5,5 + 7 + 8 = 36;
n * (n + 1) : 2 = 8 * (8 + 1) : 2 = 36;
4. определим, какие сдвиги являются «типичными», а какие - «нетипичными». Положительных сдвигов больше, их шесть, значит, они «типичные». Отрицательных - меньше, их всего два, значит, они «нетипичные»;
5. сформулируем гипотезы:
Н 0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н 1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. подсчитаем Т эмп. = ∑ R нетип. = 1,5 + 1,5 = 3;
6. по числу n и таблице 2 приложения найдем Т кр. (p ≤ 0,05) = 5 и Т кр. (p ≤ 0,0 1) = 1. Построим ось значимости и отметим на ней все найденные значения:

зона значимости зона неопределенности зона не значимости
1 3 2
T кр. (p ≤ 0,01) Т эмп. T кр. (p ≤ 0,05)
Так как Т эмп. < Т кр. (p ≤ 0,05), то Н 0 отвергается и принимается Н 1, на уровне значимости p ≤ 0,05, то есть сдвиг в типичном направлении более интенсивен, чем сдвиг в нетипичном направлении, что мы можем утверждать с вероятностью, большей 95 %.
Ответ
Обучение можно считать эффективным (с вероятностью, большей 95 %).
С помощью Т - критерия мы выявили неслучайный сдвиг в положительном направлении при воздействии, то есть можно с вероятностью, большей 95 %, сказать, что обучение эффективно, но с вероятностью, большей 99 %, этого утверждать нельзя, так как Т эмп. › Т кр. (p ≤ 0,0 1).
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по-разному слова, обозначающие профессии (слесарь, химик, электрик, физик, геолог, биолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
|
Объем запоминания |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
|
Профессии |
4 |
3 |
3 |
5 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
|
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
Решение
1. проверим выполнимость ограничений: 5 ≤ 12 ≤ 50;
2. запишем данные в таблицу и сделаем необходимые вычисления:
|
Профессии |
4 |
3 |
3 |
5 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
|
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
|
Разность |
+3 |
-1 |
+1 |
+3 |
-1 |
-1 |
+4 |
-3 |
+2 |
+3 |
+4 |
+1 |
|
Ранг разности по абсолютной величине |
8,5 |
3 |
3 |
8,5 |
3 |
3 |
11,5 |
8,5 |
6 |
8,5 |
11,5 |
3 |
3. поясним, как записывается нижняя строка. Наименьшее значение разности (- 1), таких значений 5 (независимо от знака), суммируем их номера (1, 2, 3, 4, 5), находим среднее арифметическое (- 3), проставляем всем единицам один и тот же ранг З. Следующий ранг - 6 получает значение разности 2. На ранги 7, 8, 9, 10 претендуют четыре значения 3, их помечаем рангом 8,5.
(7 + 8 + 9 + 10): 4 = 8,5
4. определим, какие сдвиги являются «типичными», а какие «нетипичными». Положительных - больше, их 8, значит они – «типичные». Отрицательных - меньше, их всего 4, значит, они - «нетипичные»;
5. сформулируем гипотезы:
Н 0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н 1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. подсчитаем Т эмп. = ∑R нетип. = 3 + 3 + 3 + 8,5 = 17,5;
7. по таблице 2 приложения и n = 12 находим Т кр. (p ≤ 0,05) = 17, Т кр. (p ≤ 0,01) = 9;
Так как Т эмп. › Т кр. (p ≤ 0,01) и тем более Т эмп. › Т кр. (p ≤ 0,05), следовательно, различия в величинах объема запоминания разных качеств слов не являются в данной группе испытуемых статистически значимыми.
Угловой ф – критерий Фишера
Назначение
Угловой φ - критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия - наличия эффекта» при сравнении контрольной и экспериментальной групп.
Ограничения
1. если n A и n B - объемы выборок, то n A ≥ 5, n B ≥ 5. Допускаются также случаи:
n A = 2, n B ≥ 30;
n A = 3, n B ≥ 7;
n A = 4, n B ≥ 5.
2. ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.
Алгоритм использования
1. проверить выполнимость ограничений для n A и n B;
2. определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Занести данные в таблицу:
|
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
|
Группа А |
А |
B |
A + B |
|
Группа В |
С |
D |
C + D |
|
|
А + С |
B + D |
A + B + C + D |
Проверить совпадение контрольной суммы A + B + C + D = n A + n B;
3. подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках и занести в четырех клеточную таблицу:
|
|
«Есть эффект» (%) |
«Нет эффекта» (%) |
|
Группа А |
M (%) |
K (%) |
|
Группа В |
P (%) |
Q (%) |
Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;
4. сформулировать гипотезы:
Н 0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В;
Н 1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.
5. по таблице 3.1 приложения найти величины углов φ 1 и φ 2 для процентной доли тех, у кого «есть эффект», в каждой выборке;
6. подсчитать эмпирическое значение критерия по формуле
φ эмп. = (φ 1 – φ 2) √ n 1 n 2 / n 1 + n 2;
7. по таблице 3.2 приложения определить р – уровень значимости различий для полученных процентных долей. Для контроля сравнить φ эмп. с φ кр. (p ≤ 0,05 ) = 1,64 и φ кр. (p ≤ 0,01) = 2,31.
Изобразить найденные значения на оси значимости:

зона значимости зона неопределенности зона не значимости
φ кр. (p ≤ 0,01) φ кр. (p ≤ 0,01)
Если φ эмп. ≥ φ кр. на некотором уровне значимости, то Н0 отвергается на этом уровне значимости. Если φ эмп. ≤ φ кр. (p ≤ 0,05), то принимается Н0.
Пример 1
Имеются две группы детей из параллельных средних групп детского сада, одна из них экспериментальная, другая - контрольная. В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе из 25 человек с заданием справились 10. Достоверно ли различаются результаты в этих группах?
Решение
1. проверим выполнимость ограничений:
(n 1 = 20 > 5 и n 2 = 25 > 5);
2. разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
|
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
|
Экспериментальная группа |
12 |
8 |
20 |
|
Контрольная группа |
10 |
15 |
25 |
|
|
22 |
23 |
45 |
Контрольные суммы совпадают:
а + b + с + d = 12 + 8 + 10 + 15 = 20 + 25 = n1 + n2;
3. подсчитываем процентные доли количества детей, «справившихся с заданием» в экспериментальной и контрольной группах. В экспериментальной группе всего 20 человек, которые составляют 100 %, из них справились с заданием 12 человек, они составляют х %. Тогда
20 / 12 = 100 / х;
Х = 12 * 100 % / 20 = 60 %;
Значит, не справились с заданием в экспериментальной группе 100 % -60 % =40 %.
Аналогично, в контрольной группе 25 человек, которые составляют 100 %, из них справились с заданием 10 человек, которые составляют y %. Значит,
25 / 10 = 100 / y;
Y = 10 * 100% / 25 = 40%;
Тогда доля, не справившихся с заданием в контрольной группе равна 60 %.
Заполним четырехклеточную таблицу:
|
|
«Есть эффект» |
«Нет эффекта» |
|
Экспериментальная группа |
60 % |
40 % |
|
Контрольная группа |
40 % |
60 % |
Отсюда видно, что ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н 0: доля испытуемых в экспериментальной группе, у которых «есть эффект», не превосходит доли таких же испытуемых в контрольной группе;
Н 1: доля испытуемых в экспериментальной группе, у которых «есть эффект», превосходит долю таких же испытуемых в контрольной группе.
5. по таблице 3.1 приложения найти значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (60%) = 1,772;
φ 2 (40%) = 1,369.
6. подсчитаем
φ эмп. = (φ1 – φ2) √ n 1* n 2 = (1,772 – 1,369) √ 20 * 25 = 1,34;
n1 + n2 20 + 25
7. по таблице 3.2 приложения найдем уровень значимости различия процентных долей: φ эмп. = 1,34 соответствует уровню значимости p = 0,09.
Для практики этот уровень мал, поэтому следует сравнить φ эмп. с φ кр. (p ≤ 0,05) = 1,64 и φ кр. (p ≤ 0,01) = 2,31 (их тоже найти по таблице 3.2 приложения).
Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости
1,34 1,64 2,31
φ эмп. φ кр. (p ≤ 0,05) φ кр. (p = 0,01)
Так как φ эмп. < φ кр. (p ≤ 0,05), а тем более φ эмп. < φ кр. (p ≤ 0,01), то принимается Н 0 с вероятностью ≥ 99 %.
Доля детей в экспериментальной группе, которые справились с заданием, не выше, чем доля таких детей в контрольной группе. Статистически такой процент различий недостаточен (хотя, на первый взгляд, разница в показателях у них большая - 20 %).
Ответ
Различия в результатах групп статистически незначительны.
Пример 2
В эксперименте по исследованию интермодального переноса получено, что в одной группе испытуемых более эффективным оказалось тактильное ознакомление с последующим зрительным узнаванием (8 человек из 14), тогда как во второй группе (nb = 10 чел.) только для трех испытуемых этот вид переноса был эффективнее, чем перенос в направлении зрение-осязание. Значимы ли различия этих двух групп испытуемых в части эффективности переноса осязание-зрение?
Решение
1. проверим выполнимость ограничений
(n А = 14 > 5 и n B =10 > 5);
2. разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
|
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
|
Группа А |
8 |
6 |
14 |
|
Группа В |
3 |
7 |
10 |
|
|
11 |
13 |
24 |
Контрольные суммы совпадают:
a + b + c + d = 8 + 6 + 3 + 7 = 14 + 10 = n A + n B;
3. подсчитаем процентные доли количества детей, «справившихся с заданием» и «не справившихся с заданием) в группе А и группе В. В группе А всего 14 человек, которые составляют 100 %, из них справились с заданием 8 человек, они составляют х %. Тогда:
14 / 3 = 100 / x;
Х = 8 * 100 % / 14 = 57 %.
Значит, не справились с заданием в экспериментальной группе 100% - 57 % = 43 %.
Аналогично, во второй группе 10 человек, которые составляют 100%, из них справились с заданием 3 человека, которые составляют у %. Значит:
10 / 3 = 100 / y;
Y = 3 * 100 % / 10 = 30 %.
Тогда доля, не справившихся с заданием в контрольной группе равна 100 % - 30 % = 70 %. Заполним таблицу:
|
|
«Есть эффект» |
«Нет эффекта» |
|
Группа А |
57 % |
43 % |
|
Группа В |
30 % |
70 % |
Ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н 0: доля испытуемых в группе А, у которых «есть эффект», превосходит доли таких же испытуемых в группе В;
Н 1: доля испытуемых в группе А, у которых «есть эффект», не превосходит долю таких же испытуемых в группе В;
5. по таблице 3.1 приложения найдем значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (57 %) = 1,711;
φ 2 (30%) = 1,159.
6. Подсчитаем
φ эмп. = (φ1 – φ2) √ n 1* n 2 = (1,711 – 1,159) √ 14 * 10 = 1,33;
n1 + n2 14 + 10
7. по таблице 3.2 приложения для уровня статистической значимости разных значений φ - критерия найдем уровень значимости различия процентных долей: φ эмп. = 1,33, соответствует уровню значимости p = 0,092.
Сравним φ эмп. с φ кр. (p ≤ 0,05) = 1,64 и φ кр. (p ≤ 0,01) = 2,31.
Ось значимости имеет следующий вид:

зона значимости зона неопределенности зона не значимости
1,33 1,64 2,31
φ эмп. φ кр. (p ≤ 0,05) φ кр. (p = 0,01)
Так как φ эмп. < φ кр. (p ≤ 0,05) и тем более φ эмп. < φ кр. (p ≤ 0,0 1), то принимается Н 0...
Ответ
Различия в результатах групп статистически незначимы.
Q – критерий Розенбаума
Назначение
Q-критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно.
Ограничения
В каждой выборке должно быть не менее 11 наблюдений, т.е. n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2.
При этом:
если n 1 ≤ 50, n 2 ≤ 50, то (n 1 – n2) ≤ 10;
если 51 ≤ n 1 ≤ 100, то (n l – n 2) ≤ 20;
если n 1 ≥ 100, n 2 ≥ 100, то n 1 : n 2 ≤ 1,5, где n 1 ≥ n 2.
Алгоритм использования
1. проверить выполнение ограничений критерия:
(n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2)
2. упорядочить значения признака в каждой выборке по убыванию. Определить в каждой выборке максимальное и минимальное значения исследуемого параметра. Считать первой ту выборку, в которой максимальное значение параметра больше, а второй - ту, в которой максимальное значение меньше.
3. сформулировать гипотезы:
Н 0: уровень признака в выборке 1 не превышает уровня признака в выборке 2;
Н 1: уровень признака в выборке 1 превышает уровень признака в выборке 2;
4. подсчитать количество значений (S 1) в выборке 1, которые больше максимального значения в выборке 2, и количество значений (S 2) в выборке 2, которые меньше минимального значения в выборке 1;
5. найти эмпирическое значение Q-критерия Розенбаума по формуле:
Q эмп. = S 1 + S 2;
6. по таблице 4 приложения для данных n 1 и n 2 определить критические значения критерия с уровнями значимости p ≤ 0,05 и p ≤ 0,01. Сравнить Q эмп. и Q кр..
Если Q кр. ≥ Q кр. на некотором уровне значимости, то Н 0 отклоняется на том уровне значимости, на котором вычислено критическое значение, а принимается Н 1. Если Q эмп. < Q кр. (p ≤ 0,05), то принимается Н 0.
Чем больше значения Q эмп., тем более достоверны различия.
Построить ось значимости:

зона значимости зона неопределенности зона не значимости
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Замечание
Q - критерий нежелательно применять тогда, когда максимальное и минимальное значения признака принадлежит одной группе. В этом случае погрешность очень велика.
Пример 1
У двух групп испытуемых (группа А и группа В) измерен по одной и той же методике уровень вербального интеллекта. Можно ли утверждать, что в первой группе оценки выше, чем во второй?
Оценки таковы:
группа А: 121; 104; 115; 116; 115; 109; 115; 109; 108; 112; 112;109.
группа В: 121; 113; 123; 124; 121; 121; 120; 121; 111; 116; 118; 125; 125; 125; 126.
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно попытаться применить Q-критерий Розенбаума.
1. проверим выполнимость ограничений:
n A = 12; n B = 15; (n A – n B) = (12 -15) == 3 < 10.
Ограничения выполнены.
2. упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 121; 116; 115; 115; 115; 112; 112; 109; 109; 109; 108; 104;
группа В: 126; 125; 125; 125; 124; 123; 121; 121; 121;121; 120; 118; 116; 113; 111;
x max (А) = 121; x min (A) = 104; x max (В) = 126; x min (B) = 111;
Назовем выборкой 1 группу В, выборкой 2 - группу А;
3. сформулируем гипотезы:
Н 0: уровень вербального интеллекта в выборке 1 не выше уровня вербального интеллекта в выборке 2;
H 1: уровень вербального интеллекта в выборке 1 выше уровня вербального интеллекта в выборке 2;
4. подсчитаем S 1 - количество значений в выборке 1, которые больше max значения в выборке 2, S 1 = 6, так как шесть значений в выборке 1 больше x max (2) = 121, а именно: 126, 125, 125, 125, 124, 123.
Так же для S 1 - количество значений в выборке 2, которые меньше минимального значения в выборке 1. S 2 = 5, так как в выборке 2 пять значений (109, 109, 109, 108 и 104), меньших х min (1) = 111;
5. найдем эмпирическое значение Q-критерия Розенбаума
Q эмп. = S 1 + S 2 = 6 + 5 = 11;
6. по таблице 4 приложения найдем для n 1 = 15 и n 2 = 12 Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости
7 9 11
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01) Q эмп.
Так как Q эмп. > Q кр. (p ≤ 0,01) (и больше Q кр. (p ≤ 0,05)), то Н 0 отвергается, Н l принимается с уровнем значимости p ≤ 0,01, т.е. различия статистически значимы.
Ответ
Уровень вербального интеллекта испытуемых группы В выше уровня вербального интеллекта испытуемых группы А, причем различия статистически значимы, достоверность получаемых различий более 99 %.
Пример 2
У двух групп испытуемых (группа А и группа В) измерен показатель концентрации внимания к:
группа А: 56,40,93,89,87,93,94,88,87, 71, 91, 58, 79, 69.
группа В: 74, 61, 74, 99, 75, 61, 74, 79, 70, 96, 45.
Можно ли утверждать, что в одной группе показатель выше, чем в другой?
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно применить Q-критерий Розенбаума.
1. проверим выполнимость ограничений:
n 1 = 14; n 2 = 11; (n 1 – n 2) = (14 -11) =3 < 10.
Ограничения выполнены.
2. упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 94, 93, 93, 91, 89, 88, 87, 87, 79, 71, 69, 58, 56, 40;
группа В: 99, 96, 79, 75, 74, 74, 74, 70, 61, 61, 45;
x max (А) = 94; x min (А)= 40; x max (В) = 99; x min (B) = 45.
Назовем выборкой 1 группу В, выборкой 2 - группу А.
3. Сформулируем гипотезы:
Н 0: показатель концентрации внимания в выборке 1 не выше показателя концентрации внимания в выборке 2;
Н 1: показатель концентрации внимания в выборке 1 выше показателя концентрации внимания в выборке 2;
4. подсчитаем S 1 - количество значений в выборке 1, которые больше max значения в выборке 2 : S1 = 2 (96 › 94 и 99 > 94). Аналогично подсчитаем S 2 - количество значений в выборке 2, которые меньше минимального значения в выборке 1 : S 2 = 1 (40 < 45).
5. найдем эмпирическое значение Q-критерий Розенбаума:
Q эмп. = S 1 + S 2 = 2 + 1 = 3;
6. по таблице 4 приложения для n 1 = 14 и n 2 = 11 найдем Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:

зона значимости зона неопределенности зона не значимости
3 7 9
Q эмп. Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Так как Q эмп. < Q кр. (p ≤ 0,05) и Q эмп. < Q кр. (p ≤ 0;01), то H 1 отвергается и принимается Н 0, т.е. различия статистически незначимы.
Ответ
Показатель концентрации внимания испытуемых группы В не выше показателя концентрации внимания в группе А.
U – критерий Манна-Уитни
-Уитни
Назначение
Предназначен для оценки различия величин членов двух выборок. Этот критерий основан на подсчете числа инверсий U (перестановок) членов в их общем упорядоченном ряду.
Ограничения
Объемы выборок должны удовлетворять условиям:
1. n 1 ≥ 3, n 2 ≥ 3, но допускается случай n 1 = 2, n 2 ≥ 5;
2. n 1 ≤ 60, n 2 ≤ 60, но на практике, если n 1 ≥ 20 и n 2 ≥ 20, то применение критерия затруднительно.
При больших объемах выборок лучше использовать другие критерии.
Алгоритм использования
1. проверить ограничения критерия;
2. объединить выборки А и В в одну общую выборку A U B, пометив принадлежность каждого индивидуального значения к данной группе (цветом, буквой, шифром). Упорядочить значения признака в объединенной выборке по возрастанию и проранжировать все значения, приписывая меньшему значению меньший ранг, а равным значениям - равный ранг;
3. разделить выборку на две прежние выборки А и В, ориентируясь на пометки. Подсчитать суммы рангов отдельно для каждой из выборок, обозначить их за Т а и Т в. Считать первой ту выборку, в которой значение по предварительной оценке выше, а второй - ту, в которой значения ниже. Пусть n А - объем выборки А, а n B - объем выборки В. Если ранжирование и подсчет произведены верно, то должно выполняться контрольное равенство:
Т а + Т в = (n А + n B) * (n А + n B + 1) : 2.
Результаты занести в таблицу:
|
Значения A U B |
х 1 |
х 2 |
х 3 |
… |
х n |
Суммы |
|
Место |
1 |
2 |
3 |
|
N |
… |
|
Ранг |
r 1 |
r 2 |
r 3 |
… |
r n |
… |
|
Выборка |
|
|
|
… |
|
… |
|
Ранги А |
|
|
|
… |
|
Т а = ? |
|
Ранги В |
|
|
|
… |
|
Т в = ? |
Здесь N = n А + n B - объем объединенной выборки.
4. cформулировать гипотезы:
Н 0: уровень признака в выборке 1 не выше уровня признака в выборке 2;
Н 1: уровень признака в выборке 1 выше уровня признака в выборке 2;
5. вычислить значения U – критерия для каждой из выборок:
U a = n A * n B + n A (n A + 1) – T a
2
U в = n A * n B + n B (n B + 1) – T в
2
Найти U эмп., равное наименьшему из величин U а и U в:
U эмп. = min (U a; U b);
6 по таблице 5 приложения по данным n 1 и n 2 найти U кр. (p ≤ 0,05) и U кр (p ≤ 0,01). Изобразить на оси значимости все найденные значения критерия.
если U эмп. ≤ U кр. на некотором уровне значимости, то H 0 отвергается, а H 1 принимается на этом уровне значимости;
если U эмп. › U кр. на некотором уровне значимости, то Н 0 принимается на том же уровне значимости;
чем меньше U эмпирический, тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
Даны результаты тестирования двух групп испытуемых А и В по некоторому признаку или свойству:
группа А: 25; 14; 18; 16; 23; 22; 18; 19;
группа В: 28; 15; 26; 13; 15; 11; 20; 19; 10; 12;
Можно ли считать, что результаты тестирования в группе В выше, чем в группе А?
Решение
1. проверим ограничения критерия n А = 8, 8 > 3 и n B = 10, 10> 3;
2. объединим значения признака в одну общую выборку, приписывая меньшему значению меньший ранг и равным значениям - равные ранги;
3. полученные данные занесем в таблицу (3 - значение, М - место, В - выборка):
|
З |
10 |
11 |
12 |
13 |
14 |
15 |
15 |
16 |
18 |
18 |
19 |
19 |
20 |
22 |
23 |
25 |
26 |
28 |
|
М |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
|
r n |
1 |
2 |
3 |
4 |
5 |
6,5 |
6,5 |
8 |
9,5 |
9,5 |
11,5 |
11,5 |
13 |
14 |
15 |
16 |
17 |
18 |
|
B |
В |
В |
В |
В |
А |
В |
В |
А |
А |
А |
А |
В |
В |
А |
А |
А |
В |
В |
|
T a |
- |
- |
- |
- |
5 |
- |
- |
8 |
9,5 |
9,5 |
11,5 |
- |
- |
14 |
15 |
16 |
- |
- |
|
T в |
1 |
2 |
3 |
4 |
- |
6,5 |
6,5 |
- |
- |
- |
- |
11,5 |
13 |
- |
- |
- |
17 |
18 |
Подсчитаем сумму рангов в выборке А и в выборке В: T a = 88, T в = 82,5.
Проверим общую расчетную сумму:
(n А + n B) * (n А + n B + 1) : 2 = (8 + 1 0) * (8 + 10 + 1) : 2 = 171;
Т а + Т в = 88,5 + 82,5 = 171.
Будем считать выборкой 1 группу В, а выборкой 2 - группу А;
4. сформулируем гипотезы:
Н 0: результаты тестирования в выборке 1 не выше результатов в выборке 2;
Н 1: результаты тестирования в выборке 1 выше результатов в выборке 2;
5. вычислим значения U a и U в:
U a = n A * n B + n A (n A + 1) – T a = 8 * 10 + 8 * (8 + 1) : 2 – 88,5 = 27,5
2
U в = n A * n B + n B (n B + 1) – T в = 8 * 10 + 10 * (10 + 1) : 2 – 82,5 = 52,5
2
Найдем U эмп. = min (U a; U b) = 27,5;
6. по таблице 5 приложения по данным n 1 = 10 и n 2 = 8 найдем U кр (p ≤ 0,05) и U кр. (p ≤ 0,01).
Изобразим на оси значимости все найденные значения критерия.
зона значимости зона неопределенности зона не значимости
13 20 27,5
U кр. (p ≤ 0,01) U кр. (p ≤ 0,05) U эмп.
Так как U эмп. > U кр. (p ≤ 0,05) и U эмп. > U кр. (p ≤ 0,01), то H 0 принимается с уровнем значимости p ≤ 0,01, а H 1 отвергается.
Значит, результаты тестирования в выборке 1 не выше, чем в выборке 2.
Различия между результатами в выборках статистически не достоверны, то есть случайны.
Ответ
Между результатами групп А и В существенных различий нет. Если даны три и более выборок, на которых измерен один и тот же признак, то можно сравнить результаты попарно, пользуясь вышеизложенными критериями, или использовать специальные критерии (Крускала Уоллиса или Джонкира).
Пример 2
При измерении пространственных порогов тактильной чувствительности (ощущение прикосновения, давления и вибрации) получены следующие величины порогов для женщин и мужчин:
группа А (женщины) - 32, 30, 28, 30, 33, 37, 28, 27 (n А = 8);
группа В (мужчины) - 39, 36, 31, 35, 29, 34, 38 (n B = 7).
Отличаются ли между собой по величине пороги женщин и мужчин?
Решение
1. проверим ограничения критерия n А= 8, 8 > 3 и n B = 7, 7 > 3 ;
2. объединим значения признака в одну общую выборку, упорядочив ее по возрастанию, получим:
27, 28, 28, 29, 30, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 (n = 15);
3. проранжируем объединенную выборку, приписывая меньшему значению меньший ранг и равным значениям - равные ранги. Полученные данные занесем в таблицу (3 - значение, М - место, В - выборка):
|
З |
27 |
28 |
28 |
29 |
30 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
|
М |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
|
r n |
1 |
2,5 |
2,5 |
4 |
5,5 |
5,5 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
|
B |
А |
А |
А |
В |
А |
А |
В |
А |
А |
В |
В |
В |
А |
В |
В |
|
T a |
1 |
2,5 |
2,5 |
- |
5,5 |
5,5 |
- |
8 |
9 |
- |
- |
- |
13 |
- |
- |
|
Tв |
- |
- |
- |
4 |
- |
- |
7 |
- |
- |
10 |
11 |
12 |
- |
14 |
15 |
Подсчитаем сумму рангов в выборке А и в выборке В:
Т а = 47, Т в = 73.
Проверим общую расчетную сумму:
(n А + n B) * (n А + n B + 1) : 2 = (8 + 7) * (8 + 7 + 1) : 2 = 120;
Т а + Т в = 120.
Будем считать выборкой 1 группу В, а выборкой 2 - группу А;
4. сформулируем гипотезы:
Н 0: результаты измерения в выборке 1 не выше результатов в выборке 2;
Н 1: результаты измерения в выборке 1 выше результатов в выборке 2.
5. вычислим значения U a и U в:
U a = n A * n B + n A (n A + 1) – T a = 8 * 7 + 8 * (8 + 1) : 2 – 47 = 56 + 72 : 2 – 47 = 45;
2
U в = n A * n B + n B (n B + 1) – T в = 8 * 7 + 7 * (7 + 1) : 2 – 73 = 56 + 56 : 2 – 73 = 11;
2
6. по таблице 5 приложения по n 1 = 8 и n 2 = 7 найдем U кр. (p ≤ 0,05) = 13 и U кр. (p ≤ 0,01) = 7.
Изобразим на оси значимости все найденные значения критерия.

зона значимости зона неопределенности зона не значимости
7 11 13
U кр. (p ≤ 0,01) U эмп. U кр. (p ≤ 0,05)
Ответ
Так как U кр. (p ≤ 0,05) >U эмп. > U кр. (p ≤ 0,01), то можно считать различия величин порогов мужчин и женщин статистически значимыми (p = 0,05).
X² – критерий Фридмена
Назначение
χ² - используется для сравнения частот двух распределений: двух эмпирических или эмпирического и теоретического.
Ограничения
Объем сопоставляемых распределений не менее 20-30 вариантов, а минимальная их частота не менее 5.
Алгоритм использования
1. проверить выполнение ограничений;
2. полученные результаты занести в таблицу:
|
Объем воспроизведения χ² |
- |
- |
- |
|
|
Количество испытуемых из 1 – гр. fi |
- |
- |
- |
N = |
|
Количество испытуемых из 2 – гр. fi |
- |
- |
- |
N = |
3. cформулировать гипотезы:
Н 0: различия между частотами двух групп незначимы;
Н 1: различия между частотами двух групп значимы.
4. вычисления χ² провести в таблице:
|
χ²
|
ƒi ΄ |
ƒi ΄΄ |
ƒi ΄- ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² |
ƒi ΄ + ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² ƒi ΄ + ƒi ΄΄
|
|
|
|
|
|
|
|
|
5. по таблице 5 для χ² найти χ² (p ≤ 0,05).
Если χ² < χ² (p ≤ 0,05), то принимается гипотеза Н 0, если χ² > χ² (p ≤ 0,05), то принимается Н 1.
Пример
Результаты воспроизведения заученных двухзначных чисел (53, 27, 84, 36, 47, 91, 72, 69, 15, 34) в двух группах испытуемых приведены в таблице:
|
Объем воспроизведения χ² |
2 |
3 |
4 |
5 |
6 |
|
|
Количество испытуемых из 1 – гр. fi |
5 |
6 |
8 |
10 |
6 |
N = 35 |
|
Количество испытуемых из 2 – гр. fi |
4 |
9 |
10 |
6 |
6 |
N = 35 |
В первой группе 35 человек и во второй группе 35 человек. Значимо ли различие частот в этих группах?
Решение
1. проверим выполнение ограничений: количество испытуемых в обеих группах - 35 человек (35 > 20);
2. результаты занесены в таблицу. Число составляемых разрядов ƒ = 5;
3. сформулируем гипотезы:
Н 0: различия между частотами двух групп не значимы;
Н 1: различия между частотами двух групп значимы.
4. вычисления χ² проведем в таблице
|
χ²
|
ƒi ΄ |
ƒi ΄΄ |
ƒi ΄- ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² |
ƒi ΄ + ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² ƒi ΄ + ƒi ΄΄
|
|
2 |
5 |
4 |
1 |
1 |
9 |
0,11 |
|
3 |
6 |
9 |
-3 |
9 |
15 |
0,6 |
|
4 |
8 |
10 |
-2 |
4 |
18 |
0,22 |
|
5 |
10 |
6 |
4 |
16 |
16 |
1 |
|
6 |
6 |
6 |
0 |
0 |
12 |
0 |
|
|
|
|
|
|
|
∑ = 1,93 χ² = 1,93 |
5. по таблице 6 приложения найдем для к = 4 (к = ƒ - = 5 – 1 = 4) значение χ² (p ≤ 0,05) = 9,49.
Так как 1,93 < 9,49, то принимается гипотеза но: различия между частотами двух групп испытуемых не значимы. Обе эмпирические совокупности можно считать выборками из одной генеральной совокупности.
Н – критерий Крускала-Уоллиса
Назначение критерия «Н»
Критерий предназначен для оценки одновременно между тремя, четырьмя и так далее выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Описание критерия «Н»
Критерий «Н» иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978 г.). Иногда его называют критерием «суммы рангов» (Нoceнкo И.А., 1981 г.).
Данный критерий является продолжением критерия «U» на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий «Н» позволит установить эти различия.
Алгоритм использования
Гипотезы
Н 0: между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака;
Н 1: между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.
Графическое представление критерия «Н»
Критерий «Н» оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 1 А), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 1 Б), то различия между выборками оказываются недостоверными.
1 ряд
2 ряд 1 ряд

2 ряд
![]()

3 ряд

3 ряд
![]()
![]()
Рис. А Рис. Б
Рис.1. Два возможных варианта соотношения рядов значений в трех выборках; отмечены зоны наложения.
Ограничения критерия Н
1. при сопоставлении 3-x выборок допускается, чтобы в одной из них n=3, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (p≤0,05). Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (p≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2;
2. критические значения критерия Н и соответствующие им уровни значимости приведены в таблице. Таблица предусмотрена только для трех выборок и {n 1, n 2, n 3} ≤ 5. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться таблицей критических значении критерия χ², поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ ² (Носенко И.А., 1981). Количество степеней свободы при этом определяется по формуле: v=c-1, где с - количество сопоставляемых выборок;
3. при множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½ * [с * (с-1) ], где с – количество выборок, для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ.
Пример
В эксперименте по исследованию интеллектуальной настойчивости (Е. В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.
Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?
Таблица 1. Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)
|
|
Группа 1: анаграмма ФОЛИТОН (ni=4) |
Группа 2: анаграмма КАМУСТО (n2=8) |
Группа 3: анаграмма СНЕРАКО (n3=6) |
Группа 4: анаграмма ГРУТОСИЛ (n4=4) |
|
1 |
145 |
145 |
128 |
60 |
|
2 |
194 |
210 |
283 |
2361 |
|
3 |
731 |
236 |
469 |
2416 |
|
4 |
1200 |
385 |
482 |
3600 |
|
5 |
|
720 |
1678 |
|
|
6 |
|
848 |
2081 |
|
|
7 |
|
905 |
|
|
|
8 |
|
1080 |
|
|
|
Суммы |
2270 |
4549 |
5121 |
8437 |
|
Средние |
568 |
566 |
854 |
2109 |
Сформулируем гипотезы:
Н 0 - 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения;
Н 1- 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток их решения.
Подсчет критерия «Н»
1. перенести все показатели испытуемых на индивидуальные карточки;
2. пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (можно использовать, естественно, и любые другие обозначения);
3. разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой;
4. проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке;
5. вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения;
6. подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной;
7. подсчитать значение критерия «Н» по формуле:
Н = ( (12 / N (N + 1)) * ( ∑ * Tj² / n)) - 3 (N+1)
Где:
N - общее количество испытуемых в объединенной выборке;
n - количество испытуемых в каждой группе;
Т - суммы рангов по каждой группе.
8. а. при количестве групп с = 3, n 1, n 2, n 3 ≤ 5, определить критические значения и соответствующий им уровень значимости. Если «Н эмп» равен или превышает критическое значение Н 0,05, НО отвергается.
8. б. при количестве групп с › 3 или количестве испытуемых n 1, n 2, n 3 › 5, определить критические значения . Если «Н эмп» равен или превышает критическое значение, НО отвергается.
G - критерий знаков
Назначение критерия «G»
Критерий знаков* «G» предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.
* Критерий знаков с математической точки зрения является частным случаем биномиального критерия для двух равновероятных альтернатив. При вероятности каждой из альтернатив P=Q=O,50 критерий знаков является зеркальным отражением биномиального критерия). В некоторых руководствах критерий знаков называют критерием Мак-Немара (МсСall R, 1970; Рунион Р., 1982).
Критерий знаков применим и к тем сдвигам, которые можно определить лишь качественно (например, изменение отрицательного отношения к чему-либо на положительное).
Критические значения критерия знаков G для уровней статистической значимости p ≤ 0,05 и p ≤ 0,01.
Преобладание «типичного» сдвига является достоверным, если G эмпирический ниже или равен G 0,05, и тем более достоверным, если G эмпирический ниже или равен G 0,01.
|
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
|
5 |
0 |
- |
27 |
8 |
7 |
49 |
18 |
15 |
92 |
37 |
34 |
|
6 |
0 |
- |
28 |
8 |
7 |
50 |
18 |
16 |
94 |
38 |
35 |
|
7 |
0 |
0 |
29 |
9 |
7 |
52 |
19 |
17 |
96 |
39 |
36 |
|
8 |
1 |
0 |
30 |
10 |
8 |
54 |
20 |
18 |
98 |
40 |
37 |
|
9 |
1 |
0 |
31 |
10 |
8 |
56 |
21 |
18 |
100 |
41 |
37 |
|
10 |
1 |
0 |
32 |
10 |
8 |
58 |
22 |
19 |
110 |
45 |
42 |
|
11 |
2 |
1 |
33 |
11 |
9 |
60 |
23 |
20 |
120 |
50 |
46 |
|
12 |
2 |
1 |
34 |
11 |
9 |
62 |
24 |
21 |
130 |
55 |
51 |
|
13 |
3 |
1 |
35 |
12 |
10 |
64 |
24 |
22 |
140 |
59 |
55 |
|
14 |
3 |
2 |
36 |
12 |
10 |
66 |
25 |
23 |
150 |
64 |
60 |
|
15 |
3 |
2 |
37 |
13 |
10 |
68 |
26 |
23 |
160 |
69 |
64 |
|
16 |
4 |
2 |
38 |
13 |
11 |
70 |
27 |
24 |
170 |
73 |
69 |
|
17 |
4 |
3 |
39 |
13 |
11 |
72 |
28 |
25 |
180 |
78 |
73 |
|
18 |
5 |
3 |
40 |
14 |
12 |
74 |
29 |
26 |
190 |
83 |
78 |
|
19 |
5 |
4 |
41 |
14 |
12 |
76 |
30 |
27 |
200 |
87 |
83 |
|
20 |
5 |
4 |
42 |
15 |
13 |
78 |
31 |
28 |
220 |
97 |
92 |
|
21 |
6 |
4 |
43 |
15 |
13 |
80 |
32 |
29 |
240 |
106 |
101 |
|
22 |
6 |
5 |
44 |
16 |
13 |
82 |
33 |
30 |
260 |
116 |
110 |
|
23 |
7 |
5 |
45 |
16 |
14 |
84 |
33 |
30 |
280 |
125 |
120 |
|
24 |
7 |
5 |
46 |
16 |
14 |
86 |
34 |
31 |
300 |
135 |
129 |
|
25 |
7 |
6 |
47 |
17 |
15 |
88 |
35 |
32 |
|
|
|
|
26 |
8 |
6 |
48 |
17 |
15 |
90 |
36 |
33 |
|
|
|
Критерий χ²r Фридмена
Алгоритм
1. проранжировать индивидуальные значения первого испытуемого, полученные им в 1-м, 2-м, 3-м и так далее замерах;
2. проделать то же самое по отношению ко всем другим испытуемым;
3. проссумировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной суммой;
4. определить эмпирическое значение χ²r по формуле:
χ²r = [ ____12_______ * ∑ (Ti²) ] – 3 * n * (c+1),
n*c* (c+1)
где с – количество условий,
n – количество испытуемых,
Tj – суммы рангов по каждому из условий.
5. определить уровни статистической значимости для χ²r эмп.:
при с=3, n≤9 – по табл. VII-А приложения 1;
при с=4, n≤4 – по табл. VII-Б приложения 1.
6. при большем количестве условий и/или испытуемых – определить количество степеней свободы v по формуле:
v=c-1,
где с – количество условий (замеров).
. Если χ²r эмпирический равен критическому значению χ² или превышает его, различия достоверны.
L – критерий тенденций Пейджа
Описание критерия дается с использованием руководства J. Green, M. D’Olivera (1989).
Назначение L – критерия тенденций
Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых.
Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений.
Описание критерия тенденций L
Критерий позволяет проверить наши предположения об определенной возрастной или ситуативно обусловленной динамике тех или иных признаков. Он позволяет объединить несколько произведенных замеров единой гипотезой о тенденции изменения значений признака при переходе от замера к замеру. Если бы не его ограничения, критерий был бы незаменим в "продольных" или лонгитюдинальных исследованиях.
К сожалению, имеющиеся таблицы критических значений рассчитаны только на небольшую выборку (n≤12) и ограниченное количество сопоставляемых замеров (c≤6).
В случае, если эти ограничения не выполняются, приходится использовать критерий χ²r Фридмана, рассмотренный в предыдущем параграфе.
В критерии L применяется такое же ранжирование условий по каждому испытуемому, как и в критерии х2r. Если испытуемый в первом опыте допустил 17 ошибок, во втором - 12, а в третьем - 5, то 1-й ранг получает третье условие, 2-й ранг - второе, а 3-й ранг - первое условие. После того, как значения всех испытуемых будут проранжированы, подсчитываются суммы рангов по каждому условию. Затем все условия располагаются в порядке возрастания ранговых сумм: на первом месте слева окажется условие с меньшей ранговой суммой, за ним условие со следующей по величине ранговой суммой, и т. д., пока справа не окажется условие с самой большой ранговой суммой. Далее мы с помощью специальной формулы подсчета L проверяем, действительно ли значения возрастают слева направо. Эмпирическое значение критерия L отражает степень различия между ранговыми суммами, поэтому чем выше значение L, тем более существенны различия.
Гипотезы
Но: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, случайно.
Н1: Увеличение индивидуальных показателей при переходе от первого условия ко второму, а затем к третьему и далее, неслучайно.
При формулировке гипотез мы имеем в виду новую нумерацию условий, соответствующую предполагаемым тенденциям.
Графическое представление критерия «L»
Пример: Используем для иллюстрации пример с предъявлением анаграмм предположительно возрастающей сложности. Замысел экспериментатора состоял в том, чтобы каждая последующая задача требовала от испытуемых все более длительных раздумий.
Судя по графику на, Рис. 3.6, у большинства испытуемых анаграмма 1 стоит на первом ранговом месте, то есть решается быстрее двух других, анаграмма 3 на 2-м ранговом месте, а анаграмма 2 - на 3-м. По-видимому, их следовало бы предъявлять в иной последовательности: 1, 3, 2. График, отражающий такую гипотетическую последовательность задач, представлен на Рис. 3.7.
t, сек.
Анаграмма 1: Анаграмма 3: Анаграмма 2:
КРУА ИНААМШ АЛСТЬ
Рис.2. Графики изменения показателей времени (сек.) анаграмм пятью испытуемыми в новой (гипотетической) последовательности их предъявления.
Символом достоверной, отчетливой тенденции в изменении показателей при переходе от условия к условию будет достаточно "собранная" ломаная кривая, устремленная кверху или, наоборот, книзу. Если на Рис. 3.6 характерной чертой всех индивидуальных кривых был крутой излом в одной и той же точке графика, то в данном случае на некоторых отрезках повышение кривой характеризуется большей крутизной, а на других - меньшей крутизной. Очевидно, достоверность тенденций будет обеспечиваться именно отрезками более крутого восхождения, но тест тенденций снисходительно распространит этот эффект и на более пологие отрезки.
На Рис. 3.8 графики представлены уже для ранжированных показателей. Здесь уже все различия в крутизне сглажены. L - Tecт построен на сопоставлении сумм рангов, а ранжирование неизбежно несколько огрубляет полученные показатели. Опыт показывает, однако, что L-тест является достаточно мощным критерием, хотя и ограниченным по сфере применения из-за отсутствия таблиц критических значений для больших п.
ранг
3
2
1
Анаграмма 1: Анаграмма 3: Анаграмма 2:
КРУА ИНААМШ АЛСТЬ
Рис.3. Графики изменения ранжированных показателей времени решения анаграмм пятью испытуемыми в новой (гипотетической) последовательности их предъявления.
Ограничения критерия Пейджа
1. нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в разных условиях. Верхний порог - 12 испытуемых и 6 условий (n≤12, c≤6). Критические значения критерия L даны по руководству J. Greene, М. D'Olivera (1989). Они предусматривают три уровня статистической значимости: p≤0,05; p≤0,01; p≤0,001;
2. необходимым условием применения теста является упорядоченность столбцов данных: слева должен располагаться столбец с наименьшей ранговой суммой показателей, справа – с наибольшей. Можно просто пронумеровать заново все столбцы, а потом вести расчеты не слева направо, а по номерам, но так легче запутаться.
Пример
Продолжим рассмотрение примера с анаграммами. В таблице показатели времени решения анаграмм и их ранги представлены уже в упорядоченной последовательности: анаграмма 1, анаграмма 3, анаграмма 2. Действительно ли время решения увеличивается при такой последовательности предъявления анаграмм?
|
Код имени испытуемого |
Условие 1: Анаграмма 1 |
Условие 2: Анаграмма 3 |
Условие 3: Анаграмма 2 |
||||
|
Время (сек.) |
Ранг |
Время (сек.) |
Ранг |
Время (сек.) |
Ранг |
||
|
1 |
Л-В |
5 |
1 |
7 |
2 |
235 |
3 |
|
2 |
П-О |
7 |
1 |
20 |
2 |
604 |
3 |
|
3 |
К-В |
2 |
1 |
5 |
2 |
93 |
3 |
|
4 |
Ю-Ч |
2 |
1 |
8 |
2 |
171 |
3 |
|
5 |
Р-О |
35 |
2 |
7 |
1 |
141 |
3 |
|
Суммы |
51 |
6 |
47 |
9 |
1244 |
15 |
|
|
Средние |
10,2 |
|
9,4 |
|
289 |
|
|
Таблица. Показатели времени решения анаграмм 1, 2, 3 и их ранги (n=5)
Сумма рангов составляет: 6+9+5=30. Расчетная сумма:
3*(3+1)
∑Ri =5* ____________ = 30
2
Реально полученная и расчетная суммы совпадают, мы можем двигаться дальше.
Как видно из табл. 3.7, среднее время решения анаграммы 3 даже меньше, чем анаграммы 1. Однако мы исследуем не среднегрупповые тенденции, а степень совпадения индивидуальных тенденций. Нам важен именно порядок, а не абсолютные показатели времени. Поэтому и формулируемые нами гипотезы - это гипотезы о тенденциях изменения индивидуальных показателей.
Сформулируем гипотезы.
Но: Тенденция увеличения индивидуальных показателей от первого условия к третьему является случайной.
Н1: Тенденция увеличения индивидуальных показателей от первого условия к третьему не является случайной.
Эмпирическое значение L определяется по формуле:
L=∑(Tij),
где Ti - сумма рангов по каждому условию;
j - порядковый номер, приписанный каждому условию в новой последовательности .
Lэмп.=(6*1)+(9*2)+(15*3)=69
По табл. VIII приложения 1 определяем критические значения L для данного количества испытуемых: n=5, и данного количества условий: с=3.
66 (p≤0,05)
Lкр. 68 (p≤0,01)
70 (p≤0,001)
Построим «Ось значимости»:

L0,05 L 0,01
… ? !
Lэмп. L 0,001
66 68 69 70
Lэмп. ›L кр.
Ответ: Но отклоняется. Принимается Н1. Тенденция увеличения индивидуальных показателей от первого условия к третьему не является случайной (р<О,О1). Последовательность анаграмм: 1(КРУ А), 3(ИНААМШ), 2(АЛСТЬ), - будет в большей степени отвечать замыслу экспериментатора о постепенном возрастании сложности задач, чем первоначально применявшаяся последовательность.
Алгоритм использования
Подсчет критерия тенденций L Пейджа
1. проранжировать индивидуальные значения первого испытуемого, полученные им в 1-м, 2-м, 3-м и т. д. замерах. При этом первым может быть любой испытуемый, например первый по алфавиту имен;
2. проделать то же самое по отношению ко всем другим испытуемым;
3. просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной суммой.
4. расположить все условия в порядке возрастания их ранговых сумм в таблице;
5. определить эмпирическое значение L по формуле:
L=∑(Ti*j)
Где Ti - сумма рангов по данному условию;
j - порядковый номер, приписанный данному условию в упорядоченной последовательности условий.
6. по табл. VIII приложения 1 определить критические значения L для данного количества испытуемых n и данного количества условий с. Если Lэмп. равен критическому значению, или превышает его, тенденция достоверна.
Применение непараметрических критериев:
классификация сдвигов и критериев оценки их статистической достоверности
|
Виды сдвигов |
Объект сопоставлений |
Условия |
Критерии оценки достоверности сдвига |
|
|
Количество замеров |
Количество групп |
|||
|
1. Временные, ситуационные, умозрительные, измерительные |
Одни и те же показатели, измеренные у одних и тех же испытуемых в разное время, в разных ситуациях, в разных представляемых условиях или разными способами |
2
|
1 |
G – критерий знаков; Т – критерий Вилкоксона. |
|
3 и более |
1 |
L - критерий тенденций Пейджа; χ²r – критерий Фридмена. |
||
|
2. Сдвиги под влиянием экспериментальных воздействий |
Одни и те же показатели, измеренные у одних и тех же испытуемых до и после воздействия: а). при отсутствии контрольной группы; |
2 |
1 |
G – критерий знаков; Т – критерий Вилкоксона. |
|
3 и более |
1 |
L - критерий тенденций Пейджа; χ²r – критерий Фридмена. |
||
|
б). при наличии контрольной группы |
2 |
2 |
Вариант 1 – сопоставление значений «до» и «после» отдельно по экспериментальной и контрольной группам: G – критерий знаков; Т – критерий Вилкоксона. Вариант 2 – сопоставление сдвигов в двух группах: Q – критерий; U – критерий Манна-Уитни; φ – критерий Фишера. |
|
|
3 и более |
2 |
Сопоставление значений отдельно по экспериментальной и контрольной группам: L - критерий тенденций Пейджа; χ²r – критерий Фридмена. |
||
|
3. Структурные сдвиги |
Разные показатели одних и тех же испытуемых |
2 |
1 |
G – критерий знаков; Т – критерий Вилкоксона. |
|
3 и более |
1 |
L - критерий тенденций Пейджа; χ²r – критерий Фридмена. |
||
Как следует из таблицы, при сопоставлении двух замеров, произведенных на одной и той же (экспериментальной) выборке, применяются критерии знаков G и критерий Т Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же выборке, применяются критерий тенденций L Пейджа, а если он неприменим из-за большого объема выборок - критерий х2r Фридмана.
В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух группах испытуемых (контрольной и экспериментальной или двух экспериментальных), мы можем использовать различные варианты сопоставлений:
1) производить сопоставления отдельно в двух группах, используя критерии L и χ²r;
2) сопоставлять показатели сдвига* в двух группах.
* Сдвиг - это разность между вторым и первым замерами. Сначала вычисляются разности отдельно для каждой из групп, а уж затем проводятся сопocтавления двух рядов разностей (сдвигов), полученных 13 разных группах.
Поскольку группы независимы, значения сдвигов также независимы, и мы можем применять по отношению к ним уже известные нам критерии Q Розенбаума, U Манна-Уитни и φ* угловое преобразование Фишера.
Литература:
1. Лонгвиненко А.Д. Измерения в психологии. Математические основы. М., 1993 г.;
2. Сидоренко Е.В. Методы математической обработки в психологии. С-Пб., 1996 г.;
3. Сосновский Б. А. Лабораторный практикум по общей психологии. М.: Просвещение, 1979 г.;
4.
Холлендер М., Вульф Д. А. Непараметрические методы статистики. М., 1983 г.
Главная |
Лаборатория |
Труды |
Программы |
Интерактивные задания |
Тесты знаний
Новости |
Книги |
Дайджест |
Гостевая книга |
Ссылки