

t-тест для зависимых выборок
С зависимыми выборками исследователь имеет дело каждый раз, когда измерения значений какого-либо признака выполняются на одних и тех же объектах. Распределение обоих выборок должно быть нормальным! В противном случае использование критерия Стьюдента недопустимо.
Рассмотрим следующий пример. Для сравнения эффективности двух антиаритмических лекарственных средств, 20 условным добровольцам (сопоставимым по возрасту, полу, росту, массе тела) дали лекарство А, и через 1 час измерили частоту сердечных сокращений (ЧСС). Через 3 дня той же группе добровольцев дали лекарство Б в той же дозе и также через 1 час измерили ЧСС. Задача: выяснить, зависит ли ЧСС от вида используемого лекарственного средства.
Рисунок 1. Пример оформления данных для выполнения t-теста для зависимых выборок
Поскольку лекарства давались одним и тем же добровольцам, выборки, полученные в результате двух описанных выше экспериментов, являются зависимыми. Это объясняется тем, что уровень ЧСС через 1 час после дачи лекарства Б вполне мог испытывать определенное последействие лекарства А, т.е. ЧСС зависела от того, что происходило с добровольцами ранее. Для сравнения ЧСС в данном случае следует использовать t-тест для зависимых выборок. В учебных целях предполагается, что данные об ЧСС подчиняются закону нормального распределения.
Для выполнения t-теста для зависимых выборок необходимо:
1. Запустить соответствующий модуль из меню Statistics > Basic statistics/Tables > t-test, dependent samples. Вместо использования меню Statistics можно нажать кнопку на дополнительной панели инструментов (Занятие 1).
Рисунок 2.Запуск модуля t-test, dependent sample из меню Statistics > Basic statistics/Tables
В открывшемся окне нажать на кнопку Variables и указать программе первую (First variable) и вторую (Second variable) переменные, участвующие в анализе.
Рисунок 3-а. Выбор переменных, участвующих в анализе
Рисунок 3-б. Выбор переменных, участвующих в анализе
3. Нажать на кнопку Summary: T-tests.
Рисунок 4. Рабочая книга с результатами t-теста для зависимых выборок
Программа откроет рабочую книгу, очень похожую на ту, с которой мы столкнулись при выполнении t-теста для независимых выборок. Она содержит следующие столбцы:
- Mean - средние значения ЧСС для каждой из сравниваемых групп;
- Std. dv. - стандартные отклонения для каждой из групп;
- N - число наблюдений;
- Diff. - средняя разница ЧСС;
- Std. dv. diff. - стандартное отклоение для средней разницы;
- t - значение t-критерия;
- df - число степенй свободы;
- Р - вероятность справедливости гипотезы о том, средние величины урожайности в сравниваемых группах не различаются. Как видно из таблицы, Р << 0.05. Это говорит о том, что ЧСС при использовании условных лекарства А и лекарства Б значительно различается (кстати, при наличии различий, результаты анализа в STATISTICA выделяются красным цветом).
В модулях обеих рассмотренных нами вариантов t-теста есть очень удобная возможность - построить график типа Box-whisker plot и визуально оценить, насколько велика разница между сравниваемыми группами. Достаточно нажать кнопку Box & Whisker Plots (см. рисунок 5)
Рисунок 5. График Box & whisker plot, построенный на основе данных о ЧСС.
1. Распределения ОБОИХ выборок должно быть нормальным. В противном случае использовать тест Стьюдента (неважно, для зависимых или независимых выборок) недопустимо.
2. Статистика по-умолчанию автоматически ЗАМЕНЯЕТ пропущенные значения средним. В большинстве случаев это недопустимо.
3. Недопустимо попарно сравнивать серии последовательных наблюдений (например, уровень гемоглобина у пациентов на 1-е, 3-е, 7-е и 10-е сутки). Для этого существуют специальные методы (анализ повторяющихся событий).
Корректное использование t-критерия Стьюдента требует выполнения двух условий. О первом условии уже сообщено в предыдущем комментарии: "Распределения ОБОИХ выборок должно быть нормальным". Однако этого недостаточно. В ОБОИХ совокупностях, из которых извлечены эти выборки, должны быть равны ДИСПЕРСИИ. Отметим, что нормальное распределение в реальных биомедицинских данных встречается весьма редко, примерно в 2-5% случаев. (См.
http://biometrica.tomsk.ru/comp_aver_0.htm
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/lis/index25.htm
http://www.biometrica.tomsk.ru/error.htm )
Однако с учётом равества обоих дисперсий, корректное использование t-критерия Стьюдента допускается проводить весьма редко. При невыполнении этих двух условий оптимальнее использовать мощные непараметрические критерии. В частности, критерий Ван дер Вардена.
Комментарий №1. Автор:Igoroshka
[05.01.2014 12:50]