Вильгельм Гаус*, Бенджамин Майер, Райнер Муш
Термины «значимый» и «p-значение» важны для биомедицинских исследователей и читателей биомедицинских статей, включая фармакологов. Никакой другой статистический результат не интерпретируется неправильно так часто, как p-значения. В этой статье в целом обсуждается вопрос разведочного и подтверждающего тестирования. Значимое p-значение иногда приводит к точной гипотезе (исследовательское тестирование), иногда его интерпретируют как «статистическое доказательство» (подтверждающее тестирование). P-значение может быть интерпретировано как подтверждающее, только если (1) гипотеза и уровень значимости были установлены априори и (2) была выполнена корректировка для множественного тестирования, если было проведено более одного теста.
Программы скрининга (например, Национальная токсикологическая программа США по гинкго билоба) типичны для разведочных результатов. Контролируемые рандомизированные испытания обычно включают один подтверждающий тест первичной переменной результата и несколько исследовательских тестов вторичных переменных результата, а также разведочные анализы подгрупп. Некоторые исследования предоставляют p-значения, которые более значимы, чем просто разведочные, в то время как другие p-значения кажутся более или менее подтверждающими. Эпидемиологические исследования и метаанализы могут привести к p-значениям, которые находятся где-то между разведочными и подтверждающими. Мы предлагаем рассматривать разведочные и подтверждающие как биполярный континуум. Тем не менее, авторам протокола исследования рекомендуется разрабатывать свое исследование в четко разведочной или строго подтверждающей манере. Кроме того, мы рекомендуем, чтобы каждое опубликованное значимое p-значение было явно обозначено как разведочное или подтверждающее в дополнение к соответствующим описательным результатам.