Суть статистического вывода при тестировании исследовательских гипотез
Статистический вывод (statistical inference) представляет собой процесс получения логических вывовод о статистической совокупности на основании случайно извлеченных выборок. Логика статистического вывода не зависит от конкретной проблемы и используемых статистических методов. На основании выборки исследователь тестирует те или иные гипотезы, часто:
- о различии статистических совокупностей,
- наличии закономерностей,
- отсутствии случайностей.
Проверка этиз статистических гипотез может быть уложена в следующую последовательность этапов статистического вывода:
- Формируется нулевая и альтернативную гипотезы.
Например, нулевая гипотеза (Ho): параметр совокупности равен какому-то определённому значению, альтернативная теория (Ha): не равен. Обычно исследовательская теория является альтернативной к уже существующей парадигме. Чаще всего мы хотим указать на имеющую место новую закономерность (альтернативная гипотеза) и соотнести ее с консервативной нулевой гипотезой (которая часто говорит о случайной природе находок и об отсутствии закономерностей в реальности). - Формируется случайная выборка элементов совокупности и определяются параметры выборки.
- Преобразуется параметр выборки в статистический критерий.
- Находим p-значение для полученного статистического критерия.
- Сравниваем с критическим значением статистического критерия.
- Делаем выводы о сохранении нулевой гипотезы или о подтверждении альтернативной.
Нулевая гипотеза сохраняется или отвергается исходя из того, насколько вероятным оказывается наблюдаемый результат. Для оценки выборочных статистик в отношении изменчивости используются статистически статистических критериев для которых имеются рассчитанные распределения и по которым эти самые вероятности можно посчитать (z-, хи-квадрат-, t-, и прочие виды распределений).
Если пазличие между исследуемыми группами (выборками) заметно выражено относительно величины изменчивости данных, исследователь отвергает нулевую гипотезу и делает вывод, что случайное появление такого результата маловероятно: полученный результат статистически значим. В медицине традиционно принято отвергать нулевую гипотезу на уровне близкому к краю распределения (случайной величины), которая моглы бы проявиться случайно с вероятностью менее 5% (p<0,05).
Поскольку статистический вывод основывается на оценках вероятности, возможны два основных вида ошибочных решений: Ошибка первого (I) рода (alpha, уровень достоверности, отвергается истинная нулевая гипотеза), и ошибки II рода (при которой сохраняется ложная нулевая гипотеза. Первые имеют следствием ошибочное подтверждение гипотезы исследования (ложноположительные результаты), а последние — неспособность распознать статистически значимый результат (ложно отрицательные результаты).
Автор: Кирилл Мильчаков