Выпуск дня

Выпуск дня

Выпуск дня

STATS | Статистические показатели

Обзор статистических показателей в медицинских исследованиях: стандартное отклонение, доверительные интервалы, t-критерии, ANOVA, хи-квадрат, атрибутивный риск.

The Medbullets Step 1 Podcast

2 мая 2025 г.

Время чтения:

7 мин

В этом выпуске я расскажу о статистических показателях, включая стандартное отклонение, стандартную ошибку, доверительные интервалы, t-критерий, дисперсионный анализ (ANOVA), критерий хи-квадрат и атрибутивный риск. Я также разберу несколько вопросов для применения этой информации.

Понимание стандартного отклонения и стандартной ошибки

Стандартная ошибка среднего (SEM) равна сигме, деленной на квадратный корень из n, где n — размер выборки, а сигма — стандартное отклонение. Стандартная ошибка среднего, или SEM, дает представление о том, насколько точно среднее значение вашей выборки оценивает истинное среднее значение популяции. SEM всегда меньше сигмы, а это значит, что стандартная ошибка меньше стандартного отклонения, поскольку она учитывает размер выборки. SEM уменьшается с увеличением n, то есть с увеличением размеров выборки среднее значение выборки становится более надежной оценкой среднего значения популяции.

Z-показатели указывают стандартные отклонения от среднего значения, предлагая стандартизированный способ понять, насколько далеко находится точка данных от среднего. Единица равна плюс-минус одному стандартному отклонению, охватывая около 68% данных в нормальном распределении. Два — плюс-минус два стандартных отклонения, охватывая примерно 95% данных, а три — плюс-минус три стандартных отклонения, что составляет около 99,7% данных.

Объяснение доверительных интервалов

Доверительный интервал описывает диапазон, в который должно попасть среднее значение, если бы исследование было повторено, обеспечивая меру неопределенности вокруг оценки. Он рассчитывается как диапазон от среднего значения минус z-показатель, умноженный на SEM, до среднего значения плюс z-показатель, умноженный на SEM. Этот диапазон дает вам представление о вероятных значениях истинного среднего значения популяции на основе данных вашей выборки.

95% доверительный интервал, где альфа равна 0,05, является стандартным и указывает на 5% вероятность того, что истинное среднее значение выходит за пределы интервала. Для 95% доверительного интервала z равна 1,96, что отражает z-показатель, связанный с 95% доверием. Это означает, что вы примерно на 95% уверены, что истинное среднее значение популяции находится в пределах рассчитанного интервала.

При расчете разницы между двумя переменными, если 0 попадает в доверительный интервал, нулевая гипотеза не отклоняется, что указывает на незначительный результат. Это говорит о том, что между двумя сравниваемыми переменными нет статистически значимой разницы. Если 1 попадает в доверительный интервал при расчете отношения шансов (ОШ) или относительного риска (ОР), нулевая гипотеза не отклоняется, и результат не является значимым. Это подразумевает, что изучаемое воздействие или лечение не оказывает существенного влияния на исход.

Статистическая значимость vs. клиническая значимость

Статистическая значимость обычно определяется тем, меньше ли P-значение 0,05, что является общепринятым порогом для признания результата статистически значимым. Это означает, что существует менее 5% вероятности наблюдения результатов, если нулевая гипотеза верна. Клиническая значимость требует, чтобы статистически значимый результат также был клинически значимым, то есть результат оказывал практическое и заметное влияние на результаты лечения пациентов или клиническую практику.

T-критерии, ANOVA и критерий хи-квадрат

T-критерии сравнивают средние значения двух групп по непрерывной переменной, помогая определить, есть ли существенная разница между средними значениями двух групп. Например, вы можете использовать t-критерий для сравнения среднего артериального давления пациентов, принимающих новое лекарство, и пациентов, принимающих плацебо. Дисперсионный анализ (ANOVA) сравнивает средние значения трех или более групп по непрерывной переменной, что полезно, когда вы хотите увидеть, есть ли различия между несколькими группами. Примером может быть сравнение эффективности трех различных программ реабилитации на время восстановления пациента.

Критерий хи-квадрат определяет, связаны ли две номинальные переменные, и используется с таблицами 2x2 для проверки влияния лечения на заболевание, например. Этот тест помогает определить, существует ли взаимосвязь между двумя категориальными переменными. Примером использования критерия хи-квадрат является оценка наличия связи между конкретным лечением и возникновением побочного эффекта.

Коэффициент корреляции и атрибутивный риск

Коэффициент корреляции обозначается буквой R, и коэффициент Пирсона (R) варьируется от -1 до +1, указывая на силу и направление линейной связи между двумя непрерывными переменными. Значение +1 указывает на идеальную положительную корреляцию, -1 указывает на идеальную отрицательную корреляцию, а 0 указывает на отсутствие линейной корреляции. Абсолютное значение указывает на силу корреляции между двумя переменными; коэффициент детерминации равен R-квадрат.

Атрибутивный риск (АР) рассчитывается как заболеваемость среди подвергшихся воздействию (LE) минус заболеваемость среди не подвергшихся воздействию (LU): АР = LE — LU. Он измеряет избыточный риск заболевания в группе, подвергшейся воздействию, который можно отнести к этому воздействию. LE = A / (A + B) и LU = C / (C + D), поэтому AR = A / (A + B) — C / (C + D), и AR равен R-квадрат, помогая понять, какая часть риска может быть отнесена к конкретному фактору.

Процент атрибутивного риска (ARP) — это атрибутивный риск, деленный на заболеваемость среди подвергшихся воздействию (LE). Он выражается в процентах. ARP = 100 _ (LE — LU) / LE, что равно 100 _ (A / (A + B) — C / (C + D)) / (A / (A + B)).

Относительный риск (ОР) равен LE / LU, что составляет (A / (A + B)) / (C / (C + D)). Относительный риск сравнивает риск события в группе, подвергшейся воздействию, с риском в группе, не подвергшейся воздействию. ARP равен (RR — 1), деленному на RR, что упрощает расчет процента атрибутивного риска, когда известен относительный риск.

Вопрос 1: Хирургические методы и результаты лечения пациентов

Группа больниц проводит клиническое исследование, чтобы определить, улучшают ли два новых хирургических метода результаты лечения пациентов после тотального эндопротезирования тазобедренного сустава. Пациенты случайным образом распределяются либо на текущую стандартную методику, либо на одну из двух новых методик, и результаты оцениваются как отличные, хорошие, удовлетворительные или плохие. Цель состоит в том, чтобы оценить, приводят ли новые методы к улучшению результатов лечения пациентов по сравнению со стандартным подходом.

Чтобы определить, оказали ли хирургические методы какое-либо влияние на результаты лечения пациентов, наиболее подходящим статистическим показателем будет критерий хи-квадрат. В этом исследовании сравнивается номинальный исход с набором процедур. Поскольку результаты являются категориальными (отличные, хорошие, удовлетворительные, плохие), критерий хи-квадрат подходит для оценки связи между хирургической техникой и исходом.

Непрерывные переменные — это числовые значения, имеющие градации, тогда как дискретные или номинальные переменные существуют как категории; рост является непрерывным, а раса — дискретной. Когда дискретные переменные сравниваются между несколькими группами, критерий хи-квадрат является наиболее подходящим тестом. Он помогает определить, существенно ли наблюдаемое распределение результатов отличается от того, что можно было бы ожидать случайно.

ANOVA сравнивает непрерывную переменную между тремя или более группами; например, сравнение средней кровопотери во время операции с тремя различными хирургическими методами. COX-регрессия определяет, отличается ли время до возникновения события при определенном лечении или факторе риска; примером может быть сравнение показателей выживаемости при раке с двумя различными режимами лечения. Коэффициент Пирсона (R) определяет силу взаимосвязи между двумя непрерывными параметрами; например, определение корреляции между количеством выкуриваемых пачек сигарет в год и продолжительностью жизни.

T-критерий сравнивает непрерывную переменную между двумя группами; например, сравнение среднего времени до операции между двумя различными алгоритмами лечения. Понимая природу переменных и план исследования, можно выбрать правильный статистический тест для получения значимых результатов.

Вопрос 2: Заживление сухожилий и методы наложения швов

Хирург сравнивает три различных типа швов биомеханически, чтобы определить максимальную нагрузку до разрушения сухожилия через две недели после восстановления. Данные собираются о максимальной нагрузке для 90 различных восстановленных сухожилий от животной модели, при этом 30 сухожилий восстановлены с использованием каждой техники. Эта установка позволяет напрямую сравнивать механическую прочность различных методов наложения швов.

Для анализа результатов этого исследования наиболее подходящим статистическим показателем является ANOVA. Исследователь изучает непрерывную переменную (нагрузка до разрушения) и сравнивает три группы. ANOVA определит, существуют ли статистически значимые различия в среднем максимальном значении нагрузки до разрушения между тремя техниками наложения швов.

Статистические тесты в медицинских исследованиях следует выбирать, исходя из характера изучаемой переменной и количества сравниваемых групп. Изучаемая переменная может быть бинарной, категориальной или непрерывной. Выбор правильного теста гарантирует, что анализ точно отражает данные и обеспечивает достоверные выводы.

Критерий хи-квадрат используется для двух категориальных переменных, чтобы определить, связаны ли они. Коэффициент Пирсона R определяет, коррелируют ли две непрерывные переменные. Эти тесты не подходят, потому что основным результатом является непрерывная переменная (максимальная нагрузка) и существует более двух групп.

Стьюдент-t-тест проверяет непрерывный исход, где есть две дискретные группы тестирования. U-критерий Манна — Уитни используется для проверки различий между двумя группами в отношении исхода. Поскольку существует три группы, эти тесты не подходят для этого плана исследования.

Подводя итог, понимание статистических показателей имеет решающее значение для интерпретации исследований и применения их в клинической практике. Знание того, когда использовать такие тесты, как t-критерии, ANOVA и хи-квадрат, а также понимание таких концепций, как атрибутивный риск, позволяет вам критически оценивать данные и принимать обоснованные решения. Эти инструменты помогают вам оценить значимость и клиническую значимость результатов исследований, что в конечном итоге улучшает качество лечения пациентов.

Конспект подкаста представлен исключительно в информационных целях и не предназначен для постановки диагноза или назначения лечения.

Все важное в медицине.
На автопилоте.

Последние открытия и клиническая практика от мировых экспертов за 10 минут в день с доставкой в Телеграм

Все важное в медицине.
На автопилоте.

Последние открытия и клиническая практика от мировых экспертов за 10 минут в день с доставкой в Телеграм

Все важное в медицине.
На автопилоте.

Последние открытия и клиническая практика от мировых экспертов за 10 минут в день с доставкой в Телеграм

Все важное в медицине.
На автопилоте.

Последние открытия и клиническая практика от мировых экспертов за 10 минут в день с доставкой в Телеграм

Другие бесплатные выпуски