Мгновенно проверьте статистическую значимость своих результатов. Воспользуйтесь нашим калькулятором для расчета p-значения, чтобы определить уровень значимости, а затем расшифруйте полученный показатель с помощью нашего экспертного руководства. Введите α и z-показатель, чтобы узнать, следует ли отклонить нулевую гипотезу.

женщина работает на ноутбуке

Z-оценка показывает, на сколько стандартных отклонений точка данных удалена от среднего значения. Ее можно найти в таблице стандартного нормального распределения или с помощью программного обеспечения.
Используйте двусторонний тест для определения различий в любом направлении. Выберите лево- или правосторонний тест, если ожидаются намного более низкие или высокие результаты.
Обычно порогом принятия статистической значимости результатов считается значение равное 0,05.

P-значение: 

0

Результат не является значимым при p ≥ 

0.05

Представьте себе следующую картину: вы с головой погружаетесь в мир аналитики и статистики, пытаясь разобраться во всех этих цифрах и данных. И тут вам на помощь приходит p-значение. Это своего рода секретный код, который исследователи используют для того, расшифровать результаты тестирования гипотез и их статистической значимости.

В основном, p-значение используют для принятия решений при тестировании гипотез. С его помощью исследователи оценивают достаточность данных для отклонения нулевой гипотезы. Кроме того, p-значение можно также использовать для сравнения групп или тестирования корреляций.

Получите ответы на свои вопросы с помощью калькулятора p-значения от SurveyMonkey, представленного выше.

P-значение представляет собой вероятность получить результаты, если нулевая гипотеза верна. То есть, с помощью этого показателя проверяется статистическая значимость.

P-значение позволяет оценить состоятельность нулевой гипотезы. Как правило, это значение сравнивается с заранее заданным уровнем значимости, например равным 0,05. Если p-значение низкое, это значит, что результаты, скорее всего, не случайны. В таком случае можно отклонить нулевую гипотезу и считать верной альтернативную. 

Исследователи используют p-значение для того, чтобы отклонить или принять нулевую гипотезу, поэтому этот показатель важен. Вот несколько примеров исследовательских вопросов, для ответа на которые можно использовать p-значение.

  • «У мужчин и женщин разный уровень удовлетворенности брендом?»
  • «Удовлетворенность обучающими программами связана с удовлетворенностью сотрудников?»

Низкий показатель p-значения говорит о том, что между протестированными группами есть разница. Кроме того, он также указывает на то, что между переменными могут существовать реальные и предсказуемые взаимосвязи.

Далее исследователи могут интерпретировать значимость полученных результатов и сообщить о достаточности доказательств заинтересованным лицам и коллегам.

Чтобы рассчитать p-значение, для начала необходимо определить вероятность получения данных при условии правильности нулевой гипотезы. Далее эта вероятность сравнивается с выбранным уровнем значимости (как правило, равным 0,05) с целью определить статистическую значимость результатов.

Чтобы рассчитать p-значение с помощью z-показателя, воспользуйтесь таблицей стандартного нормального распределения либо специальным программным обеспечением. Этот показатель отражает вероятность получения такого же крайнего значения, как z-показатель в случае нулевой гипотезы.

Используйте следующие формулы.

  • Левосторонний z-критерий: p-значение = P(Z-показатель)
  • Правосторонний z-критерий: p-значение = 1 - P(Z-показатель)
  • Двусторонний z-критерий: p-значение = 2 × P(−|Z-показатель|) или 2 - 2 × P(|Z-показатель|)

Ниже приведена пошаговая инструкция по расчету p-значения с помощью z-показателя.

  1. Определите проблему, которую вы хотите решить: у вас есть данные и вы хотите узнать, с какой вероятностью можно получить требуемый результат. Вы также хотите понять, насколько крайним может быть определенное значение с учетом того, что нулевая гипотеза верна.
  2. Выявите z-показатель: начните с поиска z-показателя для своих данных. Этот показатель поможет вам понять, на сколько стандартных отклонений ваши данные удалены от среднего значения. Для поиска z-показателя воспользуйтесь статистическим программным обеспечением (например, R или SPSS) или найдите его в статистической таблице (например, такой). 
  3. Определите направление: выберите односторонний (крайние значения в одном направлении) или двусторонний критерий (в обоих направлениях). Если вы считаете, что разница будет значительно больше или значительно меньше, используйте односторонний критерий (соответственно, лево- или правосторонний). Если у вас нет предположений относительно того, какой может быть разница, используйте двусторонний критерий.
  4. Найдите z-показатель: воспользуйтесь статистической таблицей, специальным программным обеспечением или калькулятором p-значения, чтобы определить суммарную вероятность.
  5. Рассчитайте p-значение с помощью калькулятора или:
    • в случае одностороннего критерия: если z-показатель положительный (правосторонний тест), вычтите из 1 значение суммарной вероятности; если z-показатель отрицательный (левосторонний критерий), просто используйте значение суммарной вероятности;
    • в случае двустороннего критерия: умножьте суммарную вероятность на два, чтобы учесть оба направления; далее, если z-показатель положительный, вычтите его значение из 1.
  6. Расшифруйте полученное p-значение: если p-значение очень низкое (как правило, менее 0,05), это значит, что ваши данные вряд ли поддерживают нулевую гипотезу, то есть являются статистически значимыми. Также для расшифровки p-значения на основе достоверности вы можете воспользоваться предложенным выше калькулятором.

Чтобы рассчитать p-значение с помощью t-показателя, сначала определите t-показатель, который представляет собой разницу между средним значением выборки и средним значением совокупности. С помощью статистической таблицы или специального программного обеспечения определите вероятность наличия этого показателя. То есть, вероятность получения результатов, подтверждающих нулевую гипотезу.

Для расчета p-значения с помощью t-показателя воспользуйтесь следующими формулами.

  • Левосторонний t-критерий: p-значение = cdft,d(t-показатель)
  • Правосторонний t-критерий: p-значение = 1 - cdft,d(t-показатель)
  • Двусторонний t-критерий: p-значение = 2 × cdft,d(−|t-показатель|) или p-значение = 2 - 2 × cdft,d(|t-показатель|)

где cdft,d — функция суммарного распределения t-критерия Стьюдента со степенями свободы d.

Ниже приведена пошаговая инструкция по расчету p-значения с помощью t-показателя.

  1. Определите проблему, которую вы хотите решить: у вас есть данные выборки и вы хотите узнать, с какой вероятностью можно получить требуемый результат. При этом реальных различий в совокупности нет.
  2. Рассчитайте t-показатель: таким образом вы узнаете, насколько среднее значение выборки отличается от среднего значения совокупности.
  3. Определите степени свободы: этот показатель зависит от размера вашей выборки. С его помощью вы найдете наиболее подходящее значение вероятности в статистической таблице распределения t-критерия.
  4. Найдите значение в статистической таблице: найдите рассчитанный вами t-показатель. Таким образом вы определите вероятность наличия конкретно этой разницы или большего значения, в случае если фактических различий в совокупности нет.
  5. Расшифруйте результаты: если p-значение очень низкое, это значит, что ваши результаты не подтверждают нулевую гипотезу. То есть, ваши результаты, скорее всего, статистически значимые.

Для расчета p-значения с помощью коэффициента корреляции Пирсона для начала определите коэффициент t. Далее найдите соответствующее ему p-значение, используя t-распределение со степенями свободы (n - 2).

Ниже представлена формула расчета коэффициента t с помощью коэффициента корреляции Пирсона.

Формула коэффициента t

где:

  • r — коэффициент корреляции Пирсона;
  • n — размер выборки. 

После того, как вы вычислили коэффициент t, вы можете рассчитать p-значение с помощью интегральной функции t-распределения. К нему применяются степени свободы n - 2, где n — это размер выборки.

Процесс выглядит следующим образом.

  1. Определите проблему, которую вы хотите решить: у вас есть данные выборки и вы хотите узнать, связаны ли друг с другом две переменные.
  2. Рассчитайте коэффициент t: с помощью формулы выше преобразуйте коэффициент корреляции (r) в коэффициент t.
  3. Определите степени свободы: рассчитайте степени свободы (df). Для этого воспользуйтесь формулой 𝑑𝑓 = n - 2, где n — это размер выборки.
  4. Определите p-значение: теперь с помощью таблицы t-распределения или специального программного обеспечения вы можете определить p-значение, соответствующее коэффициенту t.
  5. Расшифруйте результаты: если p-значение ниже выбранного вами уровня значимости (как правило, 0,05), вы можете отклонить нулевую гипотезу и сделать вывод о том, что между двумя переменными существует статистически значимая взаимосвязь. В противном случае, нулевую гипотезу отклонить нельзя.

Для расчета p-значения с помощью показателя хи-квадрат определите степени свободы, соответствующие распределению хи-квадрат. Далее воспользуйтесь статистической таблицей или специальным программным обеспечением, чтобы определить вероятность получения столь же крайнего значения хи-квадрат, каким является наблюдаемое.

Для расчета p-значения воспользуйтесь следующей формулой.

p-значение = 1 − cdfχ² (xdf)

где:

  • x — критерий хи-квадрат;
  • ​cdfχ² — функция суммарного распределения хи-квадрат;
  • df — степени свободы.

​Вам необходимо вычесть значение суммарной вероятности из 1, потому что распределение хи-квадрат скошено вправо, чтобы область справа от наблюдаемого значения хи-квадрат соответствовала p-значению.

Ниже приведена пошаговая инструкция по расчету p-значения с помощью показателя хи-квадрат.

  1. Определите проблему, которую вы хотите решить: у вас есть категориальные данные и вы хотите узнать, значимо ли связаны друг с другом переменные.
  2. Рассчитайте показатель хи-квадрат.
  3. Определите степени свободы (df): для простого критерия хи-квадрат степени свободы определяются следующим образом: количество категорий минус 1. Для расчета критерия независимости хи-квадрат степени свободы определяются следующим образом: (строки−1)×(столбцы−1).
  4. Определите p-значение: с помощью статистической таблицы или специального программного обеспечения определите суммарную вероятность хи-квадрат и степени свободы. На кривой распределения хи-квадрат это значение находится справа от значения хи-квадрат.
  5. Расшифруйте результаты: сравните полученное p-значение с выбранным уровнем значимости (как правило, 0,05). Если p-значение ниже уровня значимости, вы можете отклонить нулевую гипотезу и сделать вывод о том, что между двумя переменными существует статистически значимая взаимосвязь. В противном случае, нулевую гипотезу отклонить нельзя.

Если p-значение ниже или равно 0,05 (или другому выбранному значению уровня значимости), это говорит о том, что результат является статистически значимым. То есть, наблюдаемый результат статистически значимый на уровне α.

То есть, вероятность получения крайнего значения с учетом верности нулевой гипотезы очень низка. Как правило, такая вероятность равна менее 5 %.

Таким образом, вы можете отклонить нулевую гипотезу и сделать выбор в пользу альтернативной гипотезы, поскольку есть доказательства в ее поддержку.

Если p-значение больше 0,05, это значит, что полученный результат не является статистически значимым на выбранном уровне значимости. Другими словами, для отклонения нулевой гипотезы недостаточно данных. То есть, сделать вывод о том, что полученный результат отличается от результата, который следовало бы ожидать в случае правильности нулевой гипотезы, невозможно.

Некоторые считают, что p-значение, равное 0,05, означает, что вероятность того, что тестовая гипотеза верна, составляет 95 %. Это неверная интерпретация p-значения.

P-значение указывает на вероятность получения данных при условии подтверждения нулевой гипотезы. Это значение не измеряет истинность или ложность гипотезы.

P-значение также часто неверно толкуют в качестве показателя важности или величины эффекта. Из-за этого стирается грань между статистической и практической значимостью.

Низкое p-значение говорит о том, что полученный результат вряд ли является случайным. Но оно не говорит о величине эффекта. Кроме того, оно не указывает на практическую значимость эффекта.

Например, даже небольшие отклонения от нулевой гипотезы могут привести к статистически значимому p-значению в больших наборах данных, несмотря на практическую незначительность. Кроме того, если при проведении эксперимента статистически значимая разница определяется многократно, результаты иногда могут быть статистически незначимыми, потому что все основывается на вероятности.

И наоборот, высокое p-значение не обязательно означает, что полученный результат не является статистически значимым: это говорит о том, что в данных нет убедительных доказательств для отклонения нулевой гипотезы. 

Чтобы точно оценить практическую значимость результата, необходимо использовать p-значение совместно с показателями величины эффекта. Величина эффекта количественно характеризует силу наблюдаемого эффекта. С ее помощью исследователи рассматривают результаты в более широком контексте исследовательского вопроса или применения. 

Такое разграничение гарантирует соответствие статистической значимости реальному применению на практике. Оно также позволяет принимать более обоснованные решения и более точно толковать результаты исследований.

Такая проблема возникает, когда исследователи проводят несколько тестирований гипотез на одном и том же корпусе данных, не меняя при этом уровень значимости. В таком случае значительно повышается вероятность ложноположительных результатов или ошибок первого рода. Нулевая гипотеза при этом ошибочно отклоняется.

Представьте ситуацию, когда исследователи одновременно проводят несколько независимых тестирований. Даже если каждому тестированию присваивается низкий уровень значимости (например, α = 0,05), суммарная вероятность получения по крайней мере одного случайного значимого результата увеличивается. Такая ситуация возникает по мере увеличения количества тестирований.

Исследователи используют методы статистической поправки, например поправку по методу Бонферрони, чтобы отклонить нулевую гипотезу было сложнее. Такие решения позволяют эффективнее контролировать количество ложноположительных результатов и поддерживать вероятность их возникновения ниже обозначенного порога.

Постарайтесь учесть возможности практического применения полученных результатов в более широком контексте исследовательского вопроса или конкретного случая применения. Не преувеличивайте влияние статистически значимых результатов и не отклоняйте не обладающие значимостью результаты, не изучив их досконально.

Предположим, вы обнаружили статистически значимое улучшение в оценках учащихся, обучающихся по новому методу. Далее вы сравниваете это улучшение с улучшением в оценках тех, кто обучался по старому методу.

Не следует придавать результатам слишком большое значение. Лучше постарайтесь определить такие факторы, как величина эффекта. Является ли улучшение в оценках достаточно значимым показателем для обоснования внедрения нового метода обучения в масштабе? Можно ли полученный результат повторить в других исследованиях в похожих условиях? Нужно ли учесть какие-либо дополнительные факторы?

При этом стоит помнить, что статистически незначимые результаты могут возникать из-за других факторов, например недостаточного размера выборки или ошибок при расчетах. 

Поэтому, прежде чем делать выводы, важно критически оценить схему исследования, качество данных и потенциальные источники систематических ошибок.

Вне зависимости от значимости использовать следует все p-значения для всех переменных исследования. Только так можно получить полноценное представление. Для тех, кто будет изучать исследование, это станет гарантией надежности результатов.

Перечисляя в исследовании все полученные p-значения, исследователи показывают весь диапазон статистического анализа, включая статистически незначимые результаты. Благодаря такой прозрачности те, кто будут изучать исследование, смогут оценить его на предмет единообразия и надежности результатов при использовании различных переменных и методов анализа. Кроме того, это обеспечивает объективность исследования.

На низкие p-значения следует обратить особое внимание. Иногда они искажают значимость наблюдаемого эффекта. 

Поэтому здесь важно понимать, что низкие p-значения могут возникать естественным образом, например вследствие крупного размера выборки. Крупная выборка увеличивает статистическую мощность исследования, позволяя выявлять малозначимые отклонения от нулевой гипотезы.

Таким образом, низкие p-значения в исследованиях на крупной выборке могут не отражать значимых или значительных в практическом плане результатов.

  • Что такое z-показатель?
  • Что такое t-показатель?
  • Что такое коэффициент корреляции Пирсона?
  • Что такое критерий хи-квадрат?
Woman with red hair creating a survey on laptop

SurveyMonkey — ваш незаменимый помощник в работе. Узнайте, как разрабатывать успешные стратегии, продукты и многое другое.

A man and woman looking at an article on their laptop, and writing information on sticky notes

Изучите более 400 редактируемых шаблонов опросов, составленных экспертами. Быстро создавайте и проводите вовлекающие опросы с помощью SurveyMonkey.

Smiling man with glasses using a laptop

Задавайте правильные вопросы, чтобы сократить утечку кадров. Начните создавать формы уже сегодня с помощью нашего конструктора и шаблонов форм.

Woman reviewing information on her laptop

Без труда создавайте и настраивайте формы согласия. Собирайте электронные подписи и упрощайте процессы с помощью нашего конструктора безопасных форм.