Сравнение средних более двух независимых выборок (ANOVA)

Сравнение средних более двух независимых выборок (ANOVA)

Далее мы исследуем, существует ли значимое различие веса (переменная gr) между четырьмя разными возрастными группами (переменная ak).

Рис. 13.3: Диалоговое окно One-Way ANOVA

Подобная возможность есть и в первом пункте подменю (Means. ), но она дает значительно более ограниченные возможности для анализа, и поэтому мы ее не рассматриваем. Появится диалоговое окно One-Way ANOVA.

Рис. 13.4: Диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons

В окне просмотра появятся следующие результаты:

Descriptives (Описательная статистика)

N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound до 55 лет 52 169,10 8,21 1,14 166,81 171,38 150 185 56 - 65 лет 51 164,82 7,62 1,07 162,68 166,97 146 185 66 - 75 лет 47 162,47 7,22 1,05 160,35 164,59 145 175 >75 лет 24 162,67 7,38 1,51 159,55 165,78 150 178 Total 174 165,17 8,079 ,612 163,96 166,38 145 185

Test of Homogeneity of Variances (Тест гомогенности дисперсий)

Levene Statistic (Статистика Левена) dfl df2 Sig. ,639 3 170 ,591

ANOVA (Дисперсионный анализ)

Sum of Squares (Сумма квадратов) Df Mean Square (Средний квадрат) F Sig. (Значимость) Between Groups (Между группами) 1301,200 3 433,733 7,380 ,000 Within Groups (В группах) 9990,966 170 58,770 Total 111292,167 173

Апостериорные тесты Гомогенные подгруппы

Возрастной класс N Subset for alpha = ,05 (Подгруппа для альфа = ,05) 1 2 66-75 лет 47 162,47 >75 лет 24 162,67 56-65 лет 51 164,82 до 55 лет 52 169,10 Sig. (Значимость) ,201 1,000

Means for groups in homogeneous subsets are displayed (Показаны средние значения для групп внутри гомогенных подгрупп). a. Uses Harmonic Mean Sample Size = 39,300 (Используется гармоническое среднее для размера выборки = 39,300). b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. (Размеры групп неодинаковы. Используется гармоническое среднее размеров групп. Уровни ошибок типа I не гарантируются).

Выведенные результаты содержат:

В этом примере дисперсионный анализ дает максимально значимый результат (р < 0,001).

Тест Дункана выделяет две гомогенные подгруппы (со стандартным значением р = 0,05), одна из которых включает возрастной класс до 55 лет, а другая — три остальных класса. Это означает, что возрастной класс до 55 лет значимо отличается от трех других возрастных классов, которые, в свою очередь, не обнаруживают значимого различия между собой.

Тест Левена на гомогенность дисперсий. Этот тест определяет уровень значимости различий дисперсии групп. При р > 0,05 различие дисперсии между данными группами не значимо, следовательно, их можно рассматривать как гомогенные. В данном примере тест Левена не дает значимого результата (p=0,591), значит дисперсии гомогенные, и использование теста ANOVA корректно.

Уменьшение роста с увеличением возраста может быть связано с тем, что в старших возрастных классах преобладают женщины, рост которых мал по сравнению с мужчинами, что и вызывает данный эффект. Повторим этот анализ для категорий пола. Окажется, что у мужчин факт уменьшения роста с увеличением возраста подтверждается, а для женщин — нет.

Далее мы подробно рассмотрим имеющиеся в диалоговом окне ANOVA кнопки Contrasts (Контрасты), Post Hoc. и Options. а также возможности, которые они предоставляют.

Разложение на составляющие тренда

Сумму квадратов между группами можно разложить на линейные или полиномиальные (до 5 степени включительно) составляющие тренда.

Рис. 13.5: Диалоговое окно One-Way ANOVA: Contrasts

Априорные контрасты

Различия средних значений зависимых переменных, получаемые на базе априорных контрастов, можно подвергнуть t-тесту. Эта процедура называется априорным множественным сравнением. Контрасты определяются как последовательность (линейная комбинация) коэффициентов, каждый из которых соответствует отдельной категории независимой переменной.

Для коэффициентов, используемых при определении контрастов, можно задавать положительные, отрицательные, целые и дробные значения. Категории независимой переменной, соответствующие отрицательным коэффициентам, комбинируются, эти комбинации сопоставляются с комбинациями категорий, которые соответствуют положительным коэффициентам. Категории, которым соответствуют нулевые коэффициенты, не учитываются. Сумма всех коэффициентов должна равняться нулю.

В нашем примере сравнивались четыре возрастных класса (категории 1-4) по переменной роста. Допустим, нам требуется сопоставить первую возрастную группу и комбинацию из трех остальных групп; для этого мы выберем нижеследующие априорные коэффициенты:

Если же требуется сравнить комбинацию первых двух групп с последней группой, следует выбрать такие коэффициенты:

Для определения описанных контрастов по вышеописанной процедуре множественного сравнения откроем в диалоге ANOVA вспомогательное диалоговое окно Contrasts. В поле Coefficients этого диалогового окна введем первый коэффициент и щелкнем на кнопке Add. Таким же образом вводятся остальные коэффициенты.

Когда все коэффициенты задачи введены, можно кнопкой Next (Следующий) перейти ко вводу следующей комбинации коэффициентов. После задания коэффициентов для всех требуемых контрастов кнопкой Continue закройте это диалоговое окно. Можно задать до десяти контрастов, каждый из которых содержит до пятидесяти коэффициентов.

Апостериорные тесты

Чтобы провести апостериорные тесты множественного сравнения средних, щелкните в диалоговом окне ANOVA на кнопке Post Hoc. В появившемся окне можно выбрать один или несколько из восемнадцати тестов, которые производят такие сравнения для всех групп:

📎📎📎📎📎📎📎📎📎📎