Статистические методы в эпидемиологическом анализе
Вопрос о роли статистики в эпидемиологических исследованиях причинно-следственных взаимосвязей является спорным. Для эпидемиологии статистика — это, прежде всего, набор методов для оценки данных, касающихся человеческой (а также животной) популяции. В частности, статистика — это методика количественного определения и измерения неопределенных явлений. Все научные исследования, имеющие дело… Читать ещё >
Статистические методы в эпидемиологическом анализе (реферат, курсовая, диплом, контрольная)
Статистические методы в эпидемиологическом анализе".
В современной эпидемиологии использование статистических приемов приобретает особое значение. В среде ученых, занятых биомедицинскими исследованиями, язык статистики становится международным. Статистические (биометрические) методы настолько широко применяются в эпидемиологии, что непосвященные часто не в состоянии дифференцировать эпидемиологические и статистические исследования.
Принципиальная особенность эпидемиологических исследований заключается в том, что эпидемиология особое внимание уделяет планированию исследований; она является идеологом выбранного исследования, обеспечивает содержательную интерпретацию полученных показателей, а статистические методы являются лишь инструментом исследования.
Эпидемиология — наука, изучающая особенности распространения и причины возникновения заболеваний в обществе с целью применения полученных знаний для решения проблем в здравоохранении.
Эпидемиология на современном этапе одновременно рассматривается как:
· особый подход к изучению болезней с применением теории вероятности, статистики и специфических методов проведения научных экспериментов;
· метод, с помощью которого можно установить причинно-следственные связи путем проверки гипотез о причинах возникновения болезней и способах их предупреждения;
· инструмент для принятия управленческих решений в сфере общественного здравоохранения, основанный на научных данных и вскрытых причинно-следственных связях.
Следует отметить, что изучение заболеваемости не является единственно возможным применением эпидемиологических исследований. Помимо оценки собственно заболеваемости или распространенности, эпидемиологические исследования могут быть направлены на:
· изучение естественного течения заболеваний;
· оценку этиологических гипотез развития тех или иных болезней (поиск возбудителей или факторов риска);
· оценку эффективности вмешательств (диагностических тестов, лечебных технологий, мероприятий по охране здоровья и т. п.).
1. Основные типы эпидемиологических исследований.
1.1 Обсервационное эпидемиологическое исследование — исследование без преднамеренного вмешательства со стороны исследователя.
эпидемиологический исследование статистический обсервационный.
1) Описание является первым этапом любого эпидемиологического исследования и дает ответ на вопросы «кто?», «где?» и «когда?» заболел. Выявляются временные тенденции заболеваемости, сезонность («когда?»), распределение заболевших по месту жительства, рождения, работы, получения медицинских услуг («где?»), полу, возрасту, национальности, семейному и социально-экономическому положению («кто?») и т. п. Однако чтобы ответить на вопрос «почему?», одного описания уже недостаточно. Требуется проведение аналитического или экспериментального исследования, на котором и происходит подтверждение или исключение гипотез о наличии причинно-следственных связей. Для изучения непосредственно заболеваемости используются:
Одномоментное исследование — обследование населения (в целом или отдельных групп) на определенный момент времени с целью изучения распространенности (prevalence) того или иного заболевания.
Изучение частоты встречаемости заболеваний в популяции может быть основной целью данного типа исследования, в связи с чем его также часто называют «prevalence-study» — исследование распространенности. Однако одномоментное исследование может являться также и составной частью исследования другого типа.
Источником информации в исследованиях данного типа являются как опросы, так и медицинские обследования населения.
Достоверность полученной информации определяется:
· наличием стандартных диагностических критериев определения случая — все участвующие в исследовании врачи должны использовать единые подходы к диагностике (что считается нормой, каков должен быть сдвиг лабораторных показателей, какие симптомы должны обязательно присутствовать и т. п.);
· качеством анкеты (особое внимание обращается на формулировку вопросов);
· количественной и качественной репрезентативностью выборки.
Когортное исследование, направленное на определение частоты новых случаев (incidence) в исследуемой популяции.
При этом формируется когорта — группа лиц без признаков заболевания на момент исследования, и в течение определенного периода наблюдения регистрируются новые случаи возникновения того или иного заболевания.
Время наблюдения может быть от нескольких дней (при острых заболеваниях) до нескольких десятков лет (при изучении болезней с длительным латентным периодом). В качестве источников информации могут использоваться данные медицинской документации, записи актов гражданского состояния, опросы, медицинские обследования.
2) Несмотря на то, что нередко в литературе когортные исследования называют «проспективными», они могут быть и ретроспективными. В этом случае когорта условно формируется «в прошлом» — это могут быть люди, в N-ном году работавшие на конкретном предприятии или проживавшие в конкретном районе. При помощи стандартных методик — выкопировок из медицинской документации, записей актов гражданского состояния и опросов, — выявляются изменения в их состоянии здоровья, уже произошедшие к моменту начала исследования. Ретроспективные когортные исследования удобны, поскольку значительно экономят время.
Определение распространенности и частоты новых случаев в популяции может быть как основной целью исследования, так и промежуточной задачей. В последнем случае разница в уровнях заболеваемости в двух и более исследуемых группах используется как доказательство влияния какого-либо этиологического фактора либо как критерий эффективности различных лечебно-диагностических мероприятий и профилактических программ. В частности, когортное исследование бывает чаще направлено не только и не столько на регистрацию первичной заболеваемости, как на поиск причин и факторов риска, т. е. на доказательство этиологических гипотез.
Эпидемиологические исследования бывают единовременными, перспективными, либо ретроспективными. До настоящего времени исследование заболеваемости населения не проводится по единой методике, что затрудняет сравнение показателей заболеваемости. Однако любой показатель заболеваемости должен соответствовать следующим требованиям:
· быть надежным;
· объективным;
· чувствительным (реагировать на изменения);
· точным.
1.2 Экспериментальное исследование — сравнительное исследование при преднамеренном вмешательстве в одну из исследуемых групп.
Рандомизированным контролируемым испытанием является исследование, в котором участников, включенных в исследование, случайным образом распределяют на основную и контрольную группы.
Контролируемое испытание — это всегда проспективное исследование, кроме того, это экспериментальное исследование (воздействие оказывает исследователь). Эксперимент в медицине получил распространение сравнительно недавно. Значение контролируемых исследований трудно переоценить. Благодаря рандомизации группы различаются только исследуемым признаком, тем самым преодолевается основной недостаток обсервационных исследований.
В отличие от ретроспективного обсервационного исследования, в проспективном исследовании никто до его завершения не знает, к чему оно приведет. Это уменьшает риск невольной подтасовки. Может быть, по этой причине контролируемые испытания нередко приводят к заключению о неэффективности того или иного метода лечения, когда обсервационное исследование, напротив, доказывает его эффективность.
2. Основные критерии и показатели эпидемиологичсекого анализа.
Оценка эпидситуации и эффективности профилактических и противоэпидемических мероприятий проводится с использованием ряда показателей, которые являются общими для многих инфекций, а по методу получения относятся к статистическим. Под термином «эпидемиологические показатели» следует понимать качественную или количественную характеристику эпидемических явлений. Эпидемиологические показатели рассчитываются на определенную численность населения (на 1000, 10 000, 100 000 и т. д.), поэтому они являются относительными величинами, а именно интенсивными показателями. Важнейшим критерием эпидемического процесса считается заболеваемость инфекционными болезнями за определенный период. При анализе заболеваемости дополнительно используют такие показатели, как инфицированность (число инфицированных лиц на 100, 1000 и т. д. обследованных), пораженность (число выявленных больных на 100 или 1000 обследованных), болезненность (число больных с активными и неактивными формами болезни на 10 000 населения). В ходе анализа часто необходимо выяснить структуру заболеваемости, долю различного по форме или по степени тяжести течения болезни, оценить результаты лабораторного исследования и т. д. Этим задачам отвечает экстенсивный показатель — удельный вес, который характеризует распределение целого на с оставные части и выражается в процентах. При этом за 100% принимается общее количество. Например, при изучении качества воды из 95 проб 60 оказалось без кишечной палочки, 30 — допустимым ее содержанием, 5 — с высоким содержанием кишечной палочки, в процентах это составляет 63,2; 31,6 и 5,2 соответственно. Из экстенсивных показателей наиболее широко применяются следующие:
Для более полного представления об эпидситуации исследуют такой параметр, как индекс очаговости. Его вычисляют отношением всех случаев, зарегистрированных в очагах данной болезни, к числу очагов, например, если в 9 очагах зарегистрировано 27 случаев заболевания, то индекс очаговости равен 3,0 (27:9). В оптимальном варианте в каждом очаге должно быть по одному больному, в соответствии с этим индекс очаговости равен 1. Показатель госпитализации выражают в процентах и определяют следующим образом:
Под индексом эпидемиологической эффективности понимается практическая ценность профилактических мероприятий (вакцинирования, фагирования, гаммаглобулинопрофилактики). Иногда пользуются коэффициентом эпидемиологической эффективности. Рассчитывают эти критерии по формулам:
где, а — заболеваемость в испытуемой группе; b — в контрольной. Индекс эффективности показывает во сколько раз заболеваемость в испытуемой группе ниже заболеваемости в контрольной группе. Коэффициент эффективности отражает на сколько процентов заболеваемость в испытуемой группе ниже заболеваемости в контрольной группе. Все рассмотренные эпидемиологические показатели обрабатываются с использованием методов статистического анализа.
Эпидемиологический анализ, как раздел эпидемиологической диагностики, предусматривает «установление закономерностей эпидемического процесса в данных конкретных условиях и изучение эффективности проводимых мер». Основой служит статистический метод, «без которого нельзя обойтись, если заболеваемость данной инфекцией достигает более и менее массового распространения».
Эпидемиологическая диагностика осуществляется с использованием ретроспективного и оперативного методов анализа инфекционной заболеваемости, которые предложены Беляковым В. Д., Дегтяревым A.A., Иванниковым Ю.Г.
Методы эпидемиологической диагностики совершенствуются как в учреждениях гражданского, так и военного. Важным элементом совершенствования всей системы эпидемиологической диагностики следует признать разработку и внедрение в практику работы автоматизированных систем базы данных эпидемиологической информации.
Ретроспективный эпидемиологический анализ представляет собой комплекс исследований уровня, структуры и динамики инфекционной заболеваемости за длительный предшествующий промежуток времени с целью обоснования перспективного планирования противоэпидемических мероприятий.
В связи с необходимостью профилактики инфекционной заболеваемости при ретроспективном эпидемиологическом анализе следует решать две задачи.
1. Оценка структуры заболеваемости и выделение инфекций, имеющих наибольшую эпидемиологическую, социальную и экономическую значимость.
2. Выявление основных причин, определяющих особенности развития эпидемического процесса отдельных инфекций среди обслуживаемого населения, расшифровка механизма действия этих причин. При решении данной задачи особенно важное значение имеет дифференциация групп населения, территорий и отдельных периодов по степени риска заражений и заболеваний различными инфекциями.
2.1 Интенсивные, экстенсивные показатели.
В процессе эпидемиологического анализа приходится постоянно оперировать также такими статистическими понятиями, как интенсивные и экстенсивные показатели, средние величины и т. д.
Экстенсивный показатель — это доля определенного варианта того признака, который в той или другой разновидности встречается во всех изучаемых случаях. Обычно он выражается в процентах. Экстенсивные показатели взаимозависимы: если в изучаемой группе психически больных (то, что все составляющие группу лица, психически больные — это признак) случаи шизофрении (диагноз — вариант этого признака) составляют 60 96, то на прочие заболевания придется 40%.
Интенсивный показатель — это мера частоты определенного признака среди тех случаев, в которых этот признак может быть, а может и не быть. Если мы говорим, что распространенность шизофрении среди населения составляет 1 на 1000, то это интенсивный показатель. Он не зависит от других интенсивных показателей: среди населения может быть сколько угодно больных с другими заболеваниями и здоровых, а показатель распространенности шизофрении при этом не изменится.
Средняя величина (точнее среднее арифметическое) — одно из самых частых понятий, используемых в эпидемиологических исследованиях. Говорят о средней длительности пребывания больного на койке, среднем числе посещений диспансера в день, средней длительности ремиссий и о множестве других средних величин.
Статистическое распределение количественных характеристик отдельных случаев, относящихся к подобному явлению, всегда бывает так называемым гауссовским, или нормальным. Если желательно использовать для характеристики каких-то данных их среднюю величину, следует проверить, соответствует ли распределение этих данных нормальному; если да, то применение средней величины оправдано, она имеет смысл: именно средняя величина определяется основной причиной изучаемого явления. Однако часто при такой проверке обнаруживается, что данные распределяются иначе. В частности, длительность многих психопатологических состояний имеет экспонециальное (а не нормальное) распределение, которое свидетельствует о том, что количественная характеристика каждого отдельного наблюдения случайна. Средняя величина в таких случаях не имеет содержания. Именно поэтому в ядерной физике не употребляют понятие «среднее время распада ядер» радиоактивного вещества, а говорят о «периоде полураспада», т. е. о времени, за которое распадается половина всех имеющихся ядер. Подобно этому не следует характеризовать средними величинами и длительность психопатологических синдромов.
3. Статистические методы.
Под статистическим наблюдением в эпидемиологии понимают научно организованный сбор (по единой программе) и обработку данных, например, о проявлениях эпидемического процесса конкретной инфекционной болезни. Этот метод используют в эпидемиологии для количественного изучения инфекционной заболеваемости, деятельности лечебно-профилактических учреждений, а также для оценки эффективности проводимых профилактических и противоэпидемических мероприятий. Статистический метод применяют всегда в сочетании с другими методами, он часто носит вспомогательный характер, т. е. служит для обработки материалов, полученных в результате эпидемиологических исследований. Так как многие факторы (детерминанты) эпидемического процесса часто не поддаются строгому учету и контролю и имеют иногда случайный характер, использование приемов математической статистики при обработке и интерпретации результатов исследований позволяет извлечь максимум информации и оценить степень ее достоверности.
Статистическая обработка собранного материала позволяет сделать ряд выводов, которые отчасти в суммарной, отчасти в дифференцированной форме по отдельным группам явлений позволяют судить о развитии эпидемического процесса по территории, среди разных групп населения и во времени. Статистические материалы обычно даются в числовых (абсолютных или относительных) выражениях и могут быть демонстративны, представлены в виде цифровых таблиц, всевозможных сводок, а также графических изображений, диаграмм, картограмм и т. д. Первичным материалом для статистического изучения эпидемического процесса служит материал учета и обследования каждого отдельного случая заболевания.
Сбор материала проводят методом сплошного или частичного (выборочного) обследования. При сплошном обследовании наблюдениями охватывают все отдельные единицы, входящие в состав изучаемой совокупности. Оно необходимо тогда, когда требуется установить абсолютные размеры явления, например общую численность населения данной территории, общее число больных той или иной болезнью и т. д. Сплошное наблюдение дает более полное представление об изучаемом явлении, однако его организация сложна. Для того чтобы правильно судить о какой-либо совокупности единиц, например об особенностях заболеваний шигеллезом в городе, нет необходимости обследовать всех больных, пребывавших в том регионе во время эпидемии. Достаточно изучить определенную группу больных, а затем полученные результаты перенести на всю совокупность больных шигеллезом. Это достигается путем проведения случайной (механической) выборки или методом топологической выборки, при котором действует закон больших чисел, отражающий закономерности распределения случайных величин.
Одним из методов частичного наблюдения является «гнездовое» обследование. В этом случае на определенной территории отбирают «гнезда», наиболее типичные для данной местности, и в них проводят либо сплошное, либо выборочное наблюдение (обследование).
Таким образом, статистическое наблюдение является одним из методов изучения закономерностей проявления эпидемического процесса с использованием обобщенных количественных показателей (например, интенсивных, экстенсивных, стандартизованных, показателей наглядности и др.).Определению циклической компоненты в большей степени служат методы скользящей и взвешенной скользящей средней, которые устраняют случайные колебания и более выпукло подчеркивают закономерный ход заболеваемости.
Метод математического моделирования в эпидемиологических исследованиях используют чаще всего для теоретического изучения эпидемического процесса в целом (при условии достаточной изученности всех детерминант, определяющих его развитие) и / или отдельных его проявлений (сезонность, очаговость, особенности заболеваемости в различных группах населения, распространение по территории и т. п.). Среди математических моделей эпидемического процесса различают описательные и вероятностные.
Описательная математическая модель имеет основной целью в сжатой и наглядной форме охарактеризовать внешне наблюдаемую реальную эпидемиологическую ситуацию. Так, рассматривая детали изменения ситуации, можно определить основное направление движения этой ситуации во времени, по территории или среди различных групп населения.
Вероятностная модель в отличие от описательной преследует цель не только описать характер, но и в определенной мере вскрыть механизм распространения инфекции во времени, пространстве или среди различных групп (контингентов) населения.
Математическое моделирование не может в силу ряда обстоятельств (например, упрощение изучаемого явления, невозможность учета всех детерминант эпидемического процесса и др.) гарантировать того, что получаемые при этом результаты абсолютно достоверно отражают развитие реально протекающего эпидемического процесса. В связи с этим получаемые результаты всегда необходимо сопоставлять как с основными положениями теоретической эпидемиологии, так и с особенностями эпидемического процесса, характерными для изучаемой нозологической формы болезни, которые известны из частной эпидемиологии.
Одной из важных целей большинства эпидемиологических Исследований является точная количественная оценка частоты распространенности болезней (или связанных с ними эффектов). Однако такая оценка довольно сложна, и существует множество факторов, приводящих к ошибкам. Ошибка может бьпъ либо случайной, либо систематической.
Случайная ошибка — это отклонение отдельного наблюдения (измерения) от его истинного значения, обусловленное исключительно случайностью. Случайную ошибку невозможно предусмотреть и предупредить. Выделяют три основные причины случайных ошибок: индивидуальные биологические Различия, процесс отбора и неточность измерения. Случайная ошибка может возникнуть на любом этапе клинического наблюдения или в ходе экспериментальных эпидемиологических Исследований. В отличие от систематической ошибки, которая вызывает отклонение оценки от истины в одну либо в другую сторону, случайная с одинаковой вероятностью приводит к завышенной или заниженной оценке изучаемого эффекта.
Полностью исключить случайную ошибку невозможно, так как в исследованиях принимают участие отобранные лица (ошибка в результате отбора), при выборке из населения индивидуальных различий избежать нельзя (ошибка в результате гено-фенотипической гетерогенности популяции). Кроме этого, никакие измерения не бывают абсолютно точными (ошибка измерения). Значение случайной ошибки может уменьшаться при тщательной количественной оценке экспозиции и ее эффекта, что максимально повышает точность отдельных количественных оценок. Увеличение выборки также приводит к снижению роли случайных ошибок. Оптимальное число наблюдаемых контингентов может быть рассчитано по стандартным формулам, но, учитывая материально-техническое и финансовое обеспечение исследования, как правило, находят компромисс между размером выборки и необходимыми затратами на исследования.
Систематическая ошибка (смещение) — это неслучайное, однонаправленное отклонение результатов от истинных значений. Возможные причины систематических ошибок многочисленны и разнообразны. Выделено более 30 типов смещения. В клинических исследованиях большинство систематических ошибок может быть отнесено к трем основным категориям.
Рандомизация, применяемая при экспериментальных исследованиях, является идеальным методом, позволяющим получить равномерное распределение потенциальных смешивающих факторов в группах наблюдения (опытная, контрольная). Использование рандомизации позволяет исключить ассоциацию между потенциально смешивающими переменными и изучаемым видом воздействия. Чтобы избежать случайного неравномерного распределения этих переменных, объем выборки должен быть достаточно большим. Метод рестрикции (удаления) применяется для того, чтобы ограничить исследование лицами, имеющими определенные характеристики. Например, в исследовании, посвященном влиянию курения на развитие ишемической болезни сердца, могут быть включены только те лица, которые не употребляют кофе, что поможет устранить любой потенциальный смешивающий эффект от употребления кофе. При использовании метода подбора выборка участников исследования проводится таким образом, чтобы было достигнуто равномерное распределение потенциальных смешивающих переменных в группах наблюдения (опытная и контрольная). Этот метод широко используют при организации и проведении исследований «случай-контроль».
На стадии анализа полученных материалов при проведении тех или иных эпидемиологических (клинических) экспериментальных исследований часто используют метод стратификации (деление на слои, подгруппы). Например, при анализе показателей иммунного статуса некорректно рассчитывать средние величины на всю наблюдаемую выборку, если смешивающим фактором является возраст и возрастной диапазон в наблюдаемой группе изменяется от 15−16 до 60−70 лет, еще более выраженное смещение будет при расчете показателя в возрастной группе от 1 года до 50−60 лет. В этом случае необходимо прибегнуть к делению наблюдаемой выборки на подгруппы по возрастному фактору. Аналогичная ситуация возникает и при анализе показателей иммуноструктуры, при выявлении возрастных групп наибольшего риска заболевания, например при менингококковой инфекции и др.
Хотя стратификация является простым и относительно легко используемым методом, она часто ограничена масштабом исследования и не дает возможности устранить большое число действующих одновременно факторов (например, возраст, пол, различная степень тяжести течения инфекционного процесса, его исходы и т. д.). В этом случае используют методы статистического моделирования (например, многофакторный анализ), что позволяет оценить выраженность ассоциаций по действующим факторам и одновременно учесть роль смешивающих переменных в изучаемом процессе.
Многократное применение указанных методов сглаживания различных динамических рядов заболеваемости позволило выявить показания и ограничения к их использованию. Так, сглаживание методом удлинения интервалов и скользящей средней показано в рядах динамики, имеющих 9 и более значений, что связано с потерей промежуточных вариант (удлинение интервалов) или крайних показателей (скользящая средняя). Метод взвешенной скользящей средней лишен этого недостатка и поэтому может быть использован для более коротких рядов.
Важнейшим условием применения рассматриваемых методов является выбор периода удлинения (осреднения), который в целом зависит от длины и характера динамического ряда. Установлено, что чем короче этот период, тем лучше выявляется цикл, но в меньшей степени обозначается тенденция.
В динамических рядах заболеваемости с большой амплитудой колебаний (грипп, эпидемический паротит), а также со слабо выраженной периодичностью (скарлатина, менингококковая инфекция) методы сглаживания использовать не рекомендуется, так как в первом случае они могут исказить особенность эпидемического процесса, а во втором — погасить слабо выраженные циклические компоненты. Методы удлинения интервалов и скользящей средней (в том числе взвешенной) пригодны для грубого, ориентировочного определения характера тенденции и циклической компоненты.
Для более тонкого исследования динамических рядов рекомендуется использовать методы фильтрации случайных процессов, простейшим среди которых является расчет и анализ отклонения от теоретической линии тенденции. Данный метод позволяет оценить выраженность периодических подъемов по абсолютным значениям рассчитанных отклонений.
Определенным преимуществом этого метода является возможность его использования для сравнительно коротких рядов (10 и более лет). В то же время для увеличения достоверности оценки многолетней динамики необходимо исследовать ряды, включающие несколько периодических волн.
Поиски более строгого математического решения задачи по отысканию «скрытой» периодичности эпидемического процесса начались в 70-х годах. Определенным толчком к этому, с одной стороны, были работы, описывающие методы теории случайных процессов, с другой — расширение использования ЭВМ в здравоохранении.
Наиболее перспективными при изучении многолетней периодичности являются методы теории случайных процессов — автокорреляционная функция, гармонический и спектральный анализ. Их применение в полной мере возможно только с помощью ЭВМ.
Одним из основных ограничений при применении корреляционно-спектрального анализа является длительность временного ряда, которая теоретически для получения объективных оценок должна исчисляться десятками и даже сотнями значений (лет), практически же спектральный анализ удовлетворительно используется при числе наблюдений порядка 100. Кроме того, особую значимость приобретает интерпретация результатов. В связи с этим формальное использование корреляционно-спектрального анализа не гарантирует объективность оценок. Математика в данном случае дает лишь средство описания поведения временного ряда (тип модели) в сжатом виде: вместо всего ряда получают соответствующую ему функцию спектральной плотности, выделение истинных максимумов которой не всегда можно сделать однозначно. Если же сгладить спектр, то, вероятно, часть небольших выбросов на кривой не проявится.
При эпидемиологических исследованиях часто сравнивают две выборки (или более). При этом может возникнуть проблема их несопоставимости (например, выборки очень различаются по возрастной структуре, что мешает решить поставленную задачу). В таких случаях помогает метод стандартизации данных. Смысл этого метода заключается в том, что искусственно устраняется различие между выборками по всем факторам, кроме изучаемого.
Достоверным считается то различие, при котором разность между показателями в определенное число раз больше, чем сумма их ошибок. Это число (Т) определяется тем уровнем надежности, который принят в данном исследовании. При таком условии число Т (критерий Стьюдента) должно быть больше 2. Если это так, то различие считается достоверным: можно быть уверенным, что по крайней мере в 95 из 100 любых аналогичных выборок различие окажется примерно таким же (плюс-минус ошибка).
Если сравниваемые группы маленькие (содержат менее 20 наблюдений), то для проверки достоверности различий между ними метод Стьюдента непригоден. Поэтому обычно стараются избегать слишком маленьких групп. Однако это не всегда возможно, и тогда приходится применять так называемый точный метод Фишера. С его помощью вычисляется не условный коэффициент (как при методе Стьюдента), а величина вероятности, что полученный результат случаен. Если эта вероятность меньше 0,025, то различие признается достоверным.
Вычисление критерия Стьюдента — вполне выполнимая задача, рассчитать же вероятность случайного результата по методу Фишера труднее. Помогают специальные таблицы, в которых, зная численность изучаемых групп и различия между ними, можно посмотреть, достоверны ли они.
Различия, которые при проверке оказываются статистически недостоверными, могут тем не менее иметь большое значение. Особенно часто это случается, когда сравнивается ряд показателей, характеризующих, например, динамику какого-либо процесса. Важным может оказаться не определение достоверности различий соседних показателей, а закономерность их изменений. Закономерные изменения всегда говорят о чем-то важном, независимо от того, достоверны ли различия между составляющими ее показателями.
Анализируя изменения показателей, постоянно приходится думать, не закономерны ли эти изменения. С распространением компьютерных технологий обработки полученных данных эта задача стала простой. Например, программный пакет «Microsoft Excel» решает ее автоматически, подбирая к экспериментальным данным линию тренда (определяя тенденцию их изменений) и указывая, насколько точно она их описывает.
Одной из главных методологических проблем при организации эпидемиологических исследований в психиатрии является идентификация больных. Последняя при эпидемиологическом обследовании отличается от обычной клинической диагностики. Массовость материала заставляет эпидемиолога опираться на стандартные диагностические критерии. Это требование вступает в очевидное противоречие со стремлением иметь как можно более добротный в клиническом отношении материал. При компромиссном решении, которое приходится принимать, неизбежно в жертву приносится либо стандартность диагностики, либо степень ее клинической фундированности. Зарубежные авторы, как правило, жертвуют последним, отдавая безусловный приоритет обеспечению сопоставимости материала разных исследователей. Поэтому они уже много лет используют формальные диагностические инструменты (опросники, шкалы, структурированные интервью и Т.П.).
3.1 Статистические стратегии.
Статистика имеет дело с методами обобщения серий отдельных наблюдений. Такой набор эмпирических данных называется образцом. Для суммирования собранной информации составляют некоторую описательную статистику образца.
Основная информация, которая обычно требуется для характеристики набора данных, касается их тенденции к схождению и их разброса. Выбор варианта обработки информации зависит от шкалы, используемой для измерения явления, и от целей статистического анализа. В таблице 28.9 представлены различные показатели тенденции к схождению и разброса (дисперсии) для соответствующих шкал измерения.
Результаты расчета описательной статистики называются оценками, если они используются по отношению к популяции, из которой отбирались участники исследования. Популяционными характеристиками, парными для оценок, являются параметры. Оценки одного и того же параметра можно получить с помощью различных статистических методов. Оценка должна быть одновременно значимой и точной.
Стратегия отбора объектов из популяции подразумевает, что значимость можно обеспечить методом отбора. Обычно применяется стратегия случайной или вероятностной выборки: если каждый член популяции имеет равные шансы для участия в исследовании, то, в среднем, выбранная группа представительна для населения в целом и, более того, любое отклонение от ожидаемого можно объяснять случайностью. Можно вычислить вероятность отклонения из ожидаемого значения при условии, что соблюдался случайный принцип отбора. Те же самые рассуждения можно использовать для оценки параметров населения в целом, вычисленных на основе исследуемой группы. Например, в качестве оценки среднего значения какой-либо характеристики населения в целом берется арифметическое среднее в исследуемой группе. Любое существующее отличие между средним в исследуемой группе и в целой популяции относят к случайным колебаниям процесса отбора участников исследуемой группы. Если исследуемая группа была отобрана по случайному принципу, то можно вычислить вероятность любой величины этого отличия. Если отличие между оценкой, сделанной при анализе исследуемой группы, и параметром населения в целом нельзя объяснить случайностью, оценка считается смещенной. Схема наблюдений или эксперимента должна обеспечивать значимость оценок, и случайная выборка является одним из фундаментальных принципов статистической стратегии.
В медицине при проведении исследований для сравнения различных групп применяется вторая стратегия статистики. Типичным примером является клиническое исследование с контрольной группой: отбор пациентов с похожими характеристиками осуществляется на основе заранее определенных критериев. На этой стадии не обращают никакого внимания на представительность выборки. Каждый участвующий в исследовании пациент в соответствии с процедурой рандомизации зачисляется либо в исследуемую группу, участники которой получают стандартное лечение и дополнительно новое исследуемое лекарство, либо в контрольную группу, участники которой получают стандартное лечение и плацебо. В этой схеме случайное распределение пациентов по группам заменяет случайный отбор участников. Различие между двумя группами можно оценить статистически, так как, согласно гипотезе об отсутствии эффективности нового лекарства, можно вычислить вероятность любого ненулевого различия.
В эпидемиологии обычно невозможно подобрать группы людей, подвергавшихся и не подвергавшихся вредному воздействию, используя стратегию случайной выборки. Тем не менее, можно применять статистические методы так, как если бы анализируемые группы были отобраны или распределены случайным образом. Правильность такого допущения в большой степени зависит от схемы исследования. Это особенно важно в биологической медицине, где планирование эпидемиологического исследования имеет превалирующее значение над статистическими методами.
3.2 Улучшенные методы.
Сложность статистических методов, используемых в медицине профзаболеваний, в последние нескольких лет постоянно растет. Главные достижения связаны со статистическим моделированием. Разработанное Nelder and Wedderburn семейство негауссовых моделей (генерализованные линейные модели) стало одним из наиболее важных вкладов в развитие таких областей, как эпидемиология профзаболеваний, где соответствующие переменные имеют бимодальный (например, выживание или смерть) или численный (например, число несчастных случаев на производстве) характер.
Анализы Пуассона, Кокса и метод логической регрессии теперь широко используются для проведения соответственно долгосрочных исследований и исследований с контрольной группой. Эти модели являются аналогами анализа линейной регрессии для переменных, формирующих категории, и они непосредственно и красиво выявляют соответствующую эпидемиологическую степень взаимосвязи явлений. Например, коэффициенты регрессии Пуассона являются логарифмами относительного риска, а коэффициенты логической регрессии — логарифмами отношений прироста.
Заключение.
Вопрос о роли статистики в эпидемиологических исследованиях причинно-следственных взаимосвязей является спорным. Для эпидемиологии статистика — это, прежде всего, набор методов для оценки данных, касающихся человеческой (а также животной) популяции. В частности, статистика — это методика количественного определения и измерения неопределенных явлений. Все научные исследования, имеющие дело с недетерминированными, изменчивыми явлениями в действительности могут выиграть от применения статистических методов. В эпидемиологии изменчивость свойственна самому объекту наблюдения, поскольку все люди разные. Можно варьировать схему исследований для достижения лучшего соответствия положениям статистики случайных переменных, однако из-за этических причин и особенностей практической работы такой подход используется редко. Вместо этого эпидемиология занимается феноменологическими исследованиями, в которых существенное значение имеют случайные факторы и другие источники изменчивости.
Статистические методы в эпидемиологии часто выводятся из сравнений, присущих самой природе эпидемиологии, когда задаются вопросы типа: «Подвержена ли одна часть населения большему риску заболевания, чем другая?». При таком сравнении относительный риск заболевания является распространенным показателем зависимости между индивидуальными характеристиками и вероятностью заболевания, и чаще всего его используют в этиологических исследованиях.
Список использованной литературы.
1. Б. С. Бессмертный и М. Н. Ткачева. Статистические методы в эпидемиологии. М., 1961, с. 106.
2. Поступайло В. Б. кандидатская работа «Статистические методы», 2008 г.
3. Ющук Н. Д., Мартынов Ю. В. Эпидемиология, 2003 г.
4. Сайты интернета: http://gyg-epid.com/2009/01/05/kleshhevojj_jencefalit.html.