Как рассчитать p-value: пошаговое объяснение для медицинских исследований
В медицинской статистике одним из ключевых показателей, который определяет значимость результатов исследования, является p-value (уровень значимости). Именно это число помогает понять, являются ли полученные различия между группами случайными или статистически обоснованными.
В этой статье мы разберём:
В этой статье мы разберём:
- что такое p-value;
- как его правильно рассчитать;
- какие методы применяются в медицине;
- типичные ошибки при интерпретации.
Что такое p-value простыми словами
p-value — это вероятность получить наблюдаемый (или более экстремальный) результат при условии, что нулевая гипотеза (H₀) верна.
👉 Пример: В исследовании сравнивают эффективность двух препаратов при лечении гипертонии. Если p-value = 0,01, значит вероятность получить такие различия случайно составляет всего 1%. Мы можем уверенно утверждать, что препараты действительно различаются по эффективности.
- Если p-value меньше заранее заданного уровня значимости (обычно 0,05), то мы говорим, что результат статистически значим.
- Если p-value больше 0,05 — различия могли возникнуть случайно, и у нас нет оснований отвергать H₀.
👉 Пример: В исследовании сравнивают эффективность двух препаратов при лечении гипертонии. Если p-value = 0,01, значит вероятность получить такие различия случайно составляет всего 1%. Мы можем уверенно утверждать, что препараты действительно различаются по эффективности.
Способы расчёта p-value
1. Ручной расчёт (только для простых случаев)
В основе расчёта лежит выбор статистического критерия:
В основе расчёта лежит выбор статистического критерия:
- t-тест Стьюдента (для сравнения средних двух групп),
- χ²-тест (для категориальных данных),
- ANOVA (для трёх и более групп),
- корреляционный анализ (например, коэффициент Пирсона).
- Вычисляем t-статистику по формуле:
- Определяем число степеней свободы (df).
- С помощью статистических таблиц или специального ПО находим p-value.
2. Использование Excel
Excel позволяет быстро вычислить p-value через встроенные функции:
👉 Пример: сравнение роста пациентов двух групп → вбиваем данные в столбцы, применяем функцию T.TEST и сразу получаем p-value.
Excel позволяет быстро вычислить p-value через встроенные функции:
- =T.TEST(array1; array2; tails; type) — для t-теста,
- =CHISQ.TEST(actual_range; expected_range) — для χ²-теста.
👉 Пример: сравнение роста пациентов двух групп → вбиваем данные в столбцы, применяем функцию T.TEST и сразу получаем p-value.
3. Использование статистических пакетов
Для медицинских исследований чаще всего применяют:
Пример кода:
from scipy import stats
group1 = [120, 125, 130, 128, 132]
group2 = [115, 118, 119, 117, 116]
t_stat, p_value = stats.ttest_ind(group1, group2)
print("p-value =", p_value)
Для медицинских исследований чаще всего применяют:
- SPSS — удобный интерфейс, p-value автоматически выводится в таблицах.
- R — функция t.test(group1, group2) сразу даёт p-value.
- Python (SciPy):
Пример кода:
from scipy import stats
group1 = [120, 125, 130, 128, 132]
group2 = [115, 118, 119, 117, 116]
t_stat, p_value = stats.ttest_ind(group1, group2)
print("p-value =", p_value)
Как правильно интерпретировать p-value
- p < 0,05 → результат статистически значим (различия маловероятны случайно).
- p ≥ 0,05 → статистической значимости нет.
- Чем меньше p-value, тем выше уверенность в том, что результат не случаен.
⚠️ Важно: p-value не показывает силу эффекта и не гарантирует клиническую значимость. Например, при большом размере выборки даже незначительные различия могут дать маленький p-value.
Типичные ошибки
Путаница между «значимостью» и «важностью» результата.
Маленький p-value ≠ клиническая значимость.
Множественные сравнения без коррекции.
Если тестировать десятки гипотез, p-value нужно корректировать (например, методом Бонферрони).
Слепое доверие только p-value.
Нужно дополнительно смотреть на доверительные интервалы, размер эффекта, дизайн исследования.
Маленький p-value ≠ клиническая значимость.
Множественные сравнения без коррекции.
Если тестировать десятки гипотез, p-value нужно корректировать (например, методом Бонферрони).
Слепое доверие только p-value.
Нужно дополнительно смотреть на доверительные интервалы, размер эффекта, дизайн исследования.
Заключение
Расчёт p-value — это фундаментальный инструмент медицинской статистики. Он позволяет оценить достоверность результатов исследования и принять решение об отклонении нулевой гипотезы.
Но важно помнить: p-value — не «истина в последней инстанции», а лишь один из элементов статистического анализа. В медицинских исследованиях его всегда нужно дополнять клиническим контекстом, размерами эффекта и качеством дизайна исследования.
Но важно помнить: p-value — не «истина в последней инстанции», а лишь один из элементов статистического анализа. В медицинских исследованиях его всегда нужно дополнять клиническим контекстом, размерами эффекта и качеством дизайна исследования.
🔗 Если вы хотите, чтобы ваш медицинский проект был проанализирован с помощью корректных методов статистики, обращайтесь за консультацией: https://med-statistic.ru/