^ Наверх

Добьёмся успеха вместе!


10

Критерий Стьюдента для независимых выборок

Критерий Стьюдента (t-тест Стьюдента или просто «t-тест») применяется, если нужно сравнить только две группы количественных признаков с нормальным распределением (частный случай дисперсионного анализа). Примечание: этим критерием нельзя пользоваться, сравнивая попарно несколько групп, в этом случае необходимо применять дисперсионный анализ. Ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» несуществующие различия. Например, вместо того, чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют лучшим.

Два события называются независимыми, если наступление одного из них никак не влияет на наступление другого. Аналогично, две совокупности можно назвать независимыми, если свойства одной из них никак не связаны со свойствами другой. 

Пример выполнения  t-теста в программе STATISTICA.

Женщины в среднем ниже мужчин, однако, это не является результатом того, что мужчины оказывают какое-либо влияние на женщин - дело здесь в генетических особенностях пола. С помощью t-теста необходимо проверить, имеется ли статистически значимое различие между средними значениями роста в группах мужчин и женщин. (В учебных целях мы допускаем, что данные о росте подчиняются закону нормального распределения и поэтому t-тест применим).

Рисунок 1. Пример оформления данных для выполнения t-теста для независимых выборок

Обратите внимание на то, как оформлены данные на рисунке 1. Как и при построении графиков типа Whisker plot или Box-whisker plot, в таблице имеются две переменные: одна из них - группирующая (Grouping variable) («Пол») - содержит коды (муж и жен), позволяющие программе установить, какие из данных о росте принадлежат какой группе; вторая - т.н. зависимая переменная (Dependent variable) («Рост») - содержит собственно анализируемые данные. Однако при выполнении t-теста для независимых выборок в программе STATISTICA возможен и другой вариант оформления - данные для каждой из групп («Мужчины» и «Женщины») можно ввести в отдельные столбцы (рисунок 2).

Рисунок 2. Еще один вариант оформления данных для выполнения t-теста для независимых выборок

Для выполнения t-теста для независимых выборок необходимо выполнить следующие действия:

1-а. Запустить модуль t-теста из меню  Statistics > Basic statistics/Tables > t-test, independent, by groups (если в таблице с данными есть группирующая переменная, см.рисунок 3)​

ИЛИ

1-б. Запустить модуль t-теста из меню  Statistics > Basic statistics/Tables > t-test, independent, by variables (если данные внесены в самостоятельные столбцы, см. рисунок 4).

Ниже описывается вариант теста, при котором в таблице с данными имеется группирующая переменная. 

2. В открывшемся окне нажать кнопку Variables и указать программе, какая из переменных таблицы Sreadsheet является группирующей, а какая - зависимой (рисунки 5-6).

Рисунок 5. Выбор переменных для включения в t-тест

Рисунок 6. Окно с выбранными переменными для проведения t-теста

3. Нажать на кнопку Summary: T-tests.

Рисунок 7. Результы t-теста для независимых выборок

В итоге программа выдаст рабочую книгу Workbook, содержащую таблицу с результатами t-теста (рисунок 7). Эта таблица имеет несколько столбцов:
  • Mean (муж) - среднее значение роста  в группе «Мужчины»;
  • Mean (жен) - среднее значение роста в группе «Женщины»;
  • t-value: значение рассчитанного программой t-критерия Стьюдента;
  • df - число степеней свободы;
  • P - вероятность справедливости гипотезы о том, что сравниваемые средние значения не различаются. Фактически, это самый главный результат анализа, поскольку именно значение P говорит, верна ли проверяемая гипотеза. В нашем примере P > 0.05, из чего можно сделать вывод о том, что статистически значимые различия между ростом мужчин и женщин отсутствуют.
  • Valid N (муж) - объем выборки «Мужчины»;
  • Valid N (жен) - объем выборки «Женщины»;
  • Std. dev. (муж) - стандартное отклонение выборки «Мужчины»;
  • Std. dev. (жен) - стандартное отклонение выборки «Женщины»;
  • F-ratio, Variances - значение F-критерия Фишера, с помощью которого проверяется гипотеза о равенстве дисперсий в сравниваемых выборках;
  • P, Variances - вероятность справедливости гипотезы о том, что дисперсии сравниваемых выборок не различаются.

 

 


Комментарий №1. Автор:малой

[28.06.2014 08:57]

Классная статья! Подскажите пожалуйста какой критерий лучше использовать для сравнения количественных признаков где все переменные независимые?  


Комментарий №2. Автор:малой

[28.06.2014 13:14]

блин, забыл написать, что сравниваем 3 группы


Добавление комментариев доступно только зарегистрированным пользователям
Google+