Выбор статистического критерия для тестирования гипотез
Прежде чем приступать к выбору статистического критерия, нужно определиться с тем, от чего зависит применение тех или иных статистических методов. Ранее мы уже подразделяли наши данные на количественные и качественные (см. статью «Типы данных»), изучали способы их описания в зависимости от типов признаков и видов распределения (см. статью «Описательная статистика» и «Виды распределений»). Для вариационных рядов, которые имеют нормальное распределение, мы рассчитывали определенные параметры, с помощью которых можно описать вариационный ряд. Для нормального распределения это – средняя величина и стандартное отклонение. В случае распределения, отличного от нормального, используются медиана и интерквартильный интервал, с помощью которых можно было описать большую часть данных.
Определение задачи, которая будет решаться с использованием статистических методов.
До того, как выбирать тот или иной статистический критерий исследователь прежде всего должен определиться, какие именно задачи будут решаться, и какие методы (статистические тесты) для этого будут подбираться.
Как таковые задачи можно разделить на несколько групп:
Предварительные задачи: Описание данных
Само по себе описание данных не является аналитической задачей. Задача описания данных состоит в упорядочивании и компактном представлении данных. Методы описательной статистики напрямую зависит от типа данных, с которым мы имеем дело. Ранее мы уже подразделяли наши данные на количественные и качественные (см. статью «Типы данных»), изучали способы их описания в зависимости от типов признаков и видов распределения (см. статью «Описательная статистика» и «Виды распределений»). Для вариационных рядов, которые имеют нормальное распределение, мы рассчитывали определенные параметры, с помощью которых можно описать вариационный ряд. Для нормального распределения это – средняя величина и стандартное отклонение. В случае распределения, отличного от нормального, используются медиана и интерквартильный интервал, с помощью которых можно было описать большую часть данных. Для качественных данных описание заключается в нахождении частот, долей, пропорций, представление в виде абсолютных и относительных величин.
- Оценка динамики явления — решается прежде всего через инструменты оценки динамических рядов
- Анализ различий между группами (статистическими совокупностями) в зависимости от типа данных и распределения количественных данных, количества и связанности групп может применяться большое количество инструментов. Этот пункт будет изложен в этой статье подробным образом
- Выявление и оценка взаимовлияний в динамике — в зависимости от типа данных и их распределения используются различные методы корелляционного анализа.
- Прогноя явлений — используются линейные и логистические регрессии (возможно, в связке с ROC-analysis), деревья решений, нейронные сети, различные вариантры дискриминативного анализа
- Группировка явлений и выявление общих свойств группы — варианты кластерного анализа.
Выбор статистического критерия для тестирования гипотез о различии групп
Наиболее частой задачей является сравнение статистических совокупностей (групп, выборок) на предмет статистически значимых различий между ними (подробнее см. «Ошибка первого рода, статистическая значимость»). К примеру в результате исследования «случай-контроль» или когортного исследования необходимо сравнить показатели длительности послеоперационного периода, частоты осложнений, функционального состояния импланта и пр.
Алгоритм выбора (Рисунок 1).
- Уточните тип данных (количественные или качественные)
- В случае количественных данных уточните тип распределения (нормальное или отличное от нормального)
- Уточните количество групп сравнения. Важный пункт, о котором часто забывают сравнивать группы 1 раз попарно в случае двух групп и три раза попарно в случае трех не одно и тоже. В данном контексте нужно учитывать увеличение ошибки первого рода в случае множественных сравнений. Для таких ситуаций есть отдельные статистические методы (к примеру вместо т-критерия стьюдента используется дисперсионный анализ).
- Уточните, связан ли группы сравнения между собой (в данном случае речь идет об идентичности единиц наблюдения в группах), т.е. являются ли единицы наблюдения в группах разными носителями признака (независимые или «опыт-контроль»), или это одни и те же пациенты, опрашиваемые, предметы, сопряженные «до и после эксперимента». В зависимости от ответа на этот вопрос меняется логика выбора статистического критерия.
В случае выбора статистического критерия для сравнения количественных данных нужно учитывать распределение признака: является ли оно нормальным или отличным от нормального. В первом случае, как и при описании вариационного ряда, мы будет использовать параметры распределения, отсюда и название этой группы методов: параметрические методы, в случае отличного от нормального распределения следует использовать непараметрические методы.
Параметрические статистические методы
Класс статистических методов, используемых для анализа данных, которые образуют известное распределение (обычно нормальное). Названы так потому, что основываются на оценке параметров (таких как среднее или стандартное отклонение) выборочного распределения интересующей величины.
Непараметрические методы
Непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины. Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.
Статистические методы с (некоторыми) желательными свойствами, сохраняющимися при относительно слабых допущениях о рассматриваемых генеральных совокупностях. Непараметрические методы позволяют обрабатывать данные «низкого качества» из выборок малого объёма с переменными, про распределение которых мало что или вообще ничего неизвестно.
Рисунок 1. Выбор статистического критерия для сравнения статистических совокупностей (По Мильчаков К.С.)
Пример выбора статистического критерия для сравнения статистических совокупностей
Пример 1: Для оценки успешности реабилитации после эндопротезирования коленного сустава было проведено исследование у двух выборок (n1=10; n2=10) на предмет скорости восстановления к сгибанию в колене. В первой выборке оказались люди прошедшие полный курс реабилитации, во второй пациенты, отказавшиеся от услуг реабилитолога. Сделайте статистический вывод о пользе реабилитологического сопровождения на основании представленных данных, прдположим, что данные распределены отличным от нормального образом.
Группа «Реабилитация», срок в днях | Группа «без реабилитации», срок в днях |
22.1 | 32.5 |
22.3 | 37.1 |
26.2 | 39.1 |
29.6 | 40.5 |
31.7 | 45.5 |
33.5 | 51.3 |
38.9 | 52.6 |
39.7 | 55.7 |
43.2 | 55.9 |
43.2 | 57.7 |
Ответ: Тип данных: количественный, непрерывный, распределение: отличное от нормального, количество групп: 2, связанность групп: не связаны. необходимо использовать критерий Манна-Уитни
Пример 2:
При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmol., 104:545—548, 1986) измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. Полученные результаты приведены в таблице. Сделайте вывод о проницаемости сетчатки у больных с дистрофией и относительно здорового контроля.
Проницаемость сосудов сетчатки, мм:
Здоровые | Больные |
0,5 | 1,2 |
0,7 | 1,4 |
0,7 | 1,6 |
1 | 1,7 |
1 | 1,7 |
1,2 | 1,8 |
1,4 | 2,2 |
1,4 | 2,3 |
1,6 | 2,4 |
1,6 | 6,4 |
1,7 | 19 |
2,2 | 23,6 |
Ответ: Тип данных: количественный, непрерывный, распределение: неизвестно. Количество групп: 2, связанность групп: не связаны.
Необходимо использовать критерий Манна-Уитни или после проверки распределения (в случае нормального распределения величины) использовать т-критерий Стьюдента для несвяазанных совокупностей.
Пример 3:
Бишоп (Т. Bishop. High frequency neural modulation in dentistry. J. Am. Dent. Assoc., 112:176—177, 1986) изучил эффективность высокочастотной стимуляции нерва в качестве обезболивающего средства при удалении зуба. Все больные подключались к прибору, но в одних случаях он работал, в других был выключен. Ни стоматолог, ни больной не знали, включен ли прибор. Позволяют ли следующие данные считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством?
Прибор включен | Прибор выключен | |
Боли нет | 24 | 3 |
Боли есть | 6 | 17 |
Ответ: Тип данных: качественный, абсолютные частоты, количество групп: 2, связанность групп: не связаны.
Необходимо использовать хи-квадрат Пирсона (или точный критерий Фишера).
NB! о выборе статистического критерия
Каждый статистический критерий работает с определенным набором данных и в условиях определенный групп. Аккуратно выбирайте статистические критерии, не упускайте логику выбора и результат Ваших расчетов будет корректным и не вызывающим сомнения о профессиональных статистических рецензентов, как при презентации материала на конференции, сдаче отчета о клиническом исследовании или публикации статьи. Удачи на научном поприще!