Помощь в написании студенческих работ
Антистрессовый сервис

Основы статистической методологии

РефератПомощь в написанииУзнать стоимостьмоей работы

Строчной латинской буквой у мы обозначаем наблюдения (результаты измерения, данные) — те числа, которые мы реально имеем на руках. Нижний индекс / показывает номер выстрела. В нашем примере нумерация идет от 1 до 10: можно написать / = 1,10 или / = 1, 2, 3, 10. Напри мер, запись у5 = 10 означает, что пятым выстрелом стрелок попал в центр мишени. Прописной латинской буквой Г мы обозначаем… Читать ещё >

Основы статистической методологии (реферат, курсовая, диплом, контрольная)

Прежде чем переходить к более детальной характеристике данных и методов их сбора, необходимо придать более точный смысл ряду ключевых понятий, которые мы ввели в предыдущих разделах. В чем конкретно выражается валидность (невалидность) измерения, какие количественные характеристики здесь уместны? Под каким углом зрения вообще следует рассматривать данные? Что все эти числа в действительности означают?

Чтобы ответить на эти вопросы, нам потребуется знакомство с основами статистической методологии. В современной политической науке работа с данными базируется на методологических установках общей и прикладной статистики. По разным оценкам, в современной западной политологии в 80−95% количественных исследований — а это львиная доля всех исследований, — используются инструменты прикладной статистики. Грамотное использование таких инструментов предполагает ясное понимание особенностей «статистического взгляда на мир», знакомство с некой базовой моделью реальности, которая делает возможным использование статистических методов в анализе политических объектов и процессов. Два ключевых взаимосвязанных понятия, во многом определяющих сущность такой модели, — «случайная величина» и «вероятность».

Случайные величины

Начнем с определения случайной величины. Она характеризуется следующими основными признаками:

  • • результат измерения этой величины для конкретного объекта не может быть точно предсказан заранее;
  • • при каждом измерении величины должен сохраняться неизменный комплекс ключевых внешних условий;
  • • случайная величина должна представлять собой совокупность многократных измерений; по крайней мере, теоретически существует возможность произвести многократное измерение при сохранении неизменной совокупности условий;
  • • случайная величина — параметрическая переменная (выше мы договорились зарезервировать понятие «величина» за интервальными и относительными переменными). Иногда мы будем пользоваться понятием «случайная переменная», предполагая, что она соответствует трем первым условиям, но не четвертому.

Рассмотрим эти признаки более детально, начав с самого первого — непредсказуемости отдельных значений. Мы не знаем, сколько очков выпадет при подбрасывании игрального кубика; равно как не знаем, сколько голосов наберет та или иная партия на предстоящих выборах. Но, может возразить читатель, политика — это не игра в кости. Политические события подчиняются определенной логике, здесь действуют причинно-следственные связи и закономерности. Все это справедливо. И тем не менее случайная составляющая (неодинакового объема) присутствует в обоих случаях, хотя природа нашей неосведомленности о конечном результате будет разной в двух этих ситуациях.

При игре в кости невозможность точного предсказания связана с условиями, в которых проводится испытание: игральная кость должна быть «правильной», т. е. не обладать смещенным центром тяжести, бросок должен производиться так, чтобы дать возможность кости упасть на любую, а не на какую-то определенную грань. Мы формируем такие условия сознательно, потому что хотим получить случайный результат.

В ситуации с выборами наши цели (по крайней мере, в демократическом обществе) в каком-то смысле противоположны. Результаты выборов должны максимально точно отражать политические предпочтения граждан; собственно говоря, выборы и представляют собой способ измерения политических предпочтений. Однако, как и любое измерение, оно неизбежно будет содержать ошибки. Избиратель может ошибиться при заполнении бюллетеня; ошибки возможны при подсчете голосов или на этапе агрегации данных. Таким образом, структура результатов выборов уже не будет совершенно точно отражать структуру политических предпочтений, даже если выборы проводятся честно.

Существуют и более фундаментальные основания для рассмотрения электорального результата политической партии как случайной величины. Представим себе, что у нас есть возможность вернуться в прошлое — в утро 4 декабря 2011 г. — и повторить выборы депутатов Государственной Думы. Проголосовало бы за партию «Справедливая Россия» ровно 8 695 523 избирателя, как это было на реальных выборах (во всяком случае, судя по данным ЦИК)? Со статистической точки зрения — нет, хотя число голосовавших изменилось бы, вероятно, не очень существенно. Сыграла бы свою роль случайная составляющая этого результата: например, могли бы изменить свое решение о поддержке партии те избиратели, которые принимали решение в самый последний момент под влиянием сиюминутных причин. Те данные Центральной избирательной комиссии, которые были опубликованы по результатам выборов 4 декабря 2011 г. и которые послужили основанием для распределения депутатских мандатов в Думе VI созыва, мы будем рассматривать как реализацию одной из множества возможностей.

При этом на наши воображаемые путешествия во времени должно быть наложено очень жесткое ограничение. Мы не вправе допускать, что в день выборов произойдет какоелибо событие, которое окажет систематическое влияние на их ход: например, в СМИ сообщат о начале новой волны экономического кризиса или об отставке правительства. Требуется, чтобы все возможные результаты измерений были получены в одинаковых условиях.

Рассмотрим пример, не касающийся политической науки. Кстати, именно в этом разделе мы часто будем обращаться к «неполитологическим» иллюстрациям, так как подобрать простые для восприятия примеры в политике бывает подчас почти невозможно: это действительно сложная сфера нашей жизни!

Допустим, у нас имеются данные — результаты стрельбы из лука по мишени, измеренные на основании 10 выстрелов мастера в этом виде спорта. В этих результатах будет наличествовать закономерная составляющая, определяемая уровнем подготовки стрелка, и случайная составляющая, связанная с множеством плохо учитываемых факторов (микроскопические изменения внешней среды в момент выстрела, различия в оперении стрел и пр.). Если мы будем воспроизводить данную серию выстрелов многократно (чтобы сделать это физически, нам не требуется машина времени, как в предыдущем примере), каждый раз — под влиянием случайной составляющей — будут получаться несколько отличающиеся результаты. Но эти результаты будут неизменно высокими, поскольку мы имеем дело с мастером спорта по стрельбе из лука, — и в этом влияние закономерной составляющей. Запишем это рассуждение формально:

Основы статистической методологии.

Строчной латинской буквой у мы обозначаем наблюдения (результаты измерения, данные) — те числа, которые мы реально имеем на руках. Нижний индекс / показывает номер выстрела. В нашем примере нумерация идет от 1 до 10: можно написать / = 1,10 или / = 1, 2, 3, 10. Напри мер, запись у5 = 10 означает, что пятым выстрелом стрелок попал в центр мишени. Прописной латинской буквой Г мы обозначаем закономерную составляющую полученных данных — степень квалификации стрелка. Обратите внимание, что эта величина не имеет индекса, так как уровень владения луком не меняется в течение тех нескольких минут, за которые производятся 10 выстрелов. Греческой буквой е («эпсилон») мы обозначаем тот вклад в полученное число, которое вносит случайность. Здесь вновь появляется нижний индекс, ведь в каждом выстреле будет своя случайная составляющая. Например, стрела в первом выстреле будет иметь чуть-чуть другой центр тяжести по сравнению со стрелой в четвертом или девятом выстреле. Значение е может быть как положительным, так и отрицательным: в одном выстреле случайность приводит к отклонению стрелы к центру мишени (в сторону лучшего результата), в другом — наоборот. Так как на результат влияет случайная составляющая, у; является случайной величиной.

Теперь несколько изменим условия: пусть первые пять выстрелов производятся стрелком в закрытом помещении, а следующие пять — на открытом воздухе. Во втором случае на результаты стрельбы будет систематически влиять новый фактор, отсутствовавший ранее, — скорость и направление ветра. Поэтому нельзя механически объединять первую и вторую серию выстрелов в одну случайную величину, хотя по отдельности они таковыми являются. Изменение в комплексе условий в данном случае затрагивает случайную составляющую: наличие ветра приведет к гораздо более сильным колебаниям результата стрельбы. Теперь у нас две модели:

а) в закрытом помещении: Основы статистической методологии.

б) на открытом воздухе: Основы статистической методологии.

Этой записью мы подчеркиваем несколько моментов. Во-первых, имеются две разные случайные величины, в одном случае у, в другом — а,. В каждой серии выстрелов 5, а не 10, как было раньше. Квалификация стрелка одинакова в закрытом помещении и на открытом воздухе, и мы попрежнему обозначаем ее К в обеих моделях. Характер влияния случайной составляющей принципиально различается, и поэтому используются разные буквы, е и и («ипсилон»).

Другой пример. Пусть первые пять выстрелов сделаны мастером спорта, а вторые пять — человеком, последний раз державшим в руках лук в детстве и обладающим не очень хорошим зрением. Обе серии выстрелов проведены в закрытом помещении (или на открытом воздухе, главное здесь — одинаковые условия). Мы снова имеем две различные величины, но изменение в комплексе условий связано не со случайной, а с закономерной составляющей:

а) в закрытом помещении стреляет мастер спорта:

Основы статистической методологии.

б) в закрытом помещении стреляет его партнер:

Основы статистической методологии.

Напоминаю, мы имеем дело с разными величинами — у, и Ь,. Разный уровень стрелковой подготовки — закономерные части моделей — мы обозначаем разными латинскими буквами, У и В. Причем, очевидно, У > В (значительно больше!).

Аналогичным образом результат «Справедливой России» на выборах 2007 г., равно как и на выборах 2011 г., рассматривается нами как случайная величина; но совокупность этих данных никоим образом случайной величиной не является. Очевидно, что за четыре года произошли существенные изменения в совокупности политических, социальных, экономических условий, которые привели к изменению как закономерной, так и случайной составляющей результата выборов для этой партии.

Обратим внимание на еще один тонкий, но очень важный момент. Результаты стрельбы по мишени мастера спорта в серии из пяти выстрелов представляют собой переменную: полученные числа будет меняться в зависимости от /' — номера выстрела. Например, у, = 9, у2 = 7, у3 = 10, у4 = 8, у5 = 7. Таким образом, у, — случайная величина. Но каждый из этих результатов — у, у2, у3, у4, у5 — также представляет собой случайную величину. При тех же самых условиях и другом значении случайной составляющей третий (четвертый, второй) выстрел мог бы быть другим.

Возьмем некоторые данные по электоральной активности, или явке, избирателей на парламентских выборах 2011 г. (табл. 3.1).

Таблица 3.1

Объект — регион.

Переменная — электоральная активность (приняло участие в выборах, человек).

Республика Адыгея.

223 945.

Республика Алтай.

96 264.

Республика Башкортостан.

2 389 963.

Республика Бурятия.

381 415.

Количество избирателей, пришедших на выборы в Республике Бурятия, — это случайная величина, потому что в той же самой общей численности избирателей, том же самом политическом, экономическом, социальном и культурном контексте, характерном для данного региона, могли бы возникнуть другие результаты при гипотетическом повторном проведении выборов. То же самое касается Алтая, Адыгеи и Башкортостана. Могло ли в Бурятии при тех же самых условиях прийти на выборы столько же человек, сколько пришло в Башкортостане? Нет, это невозможно, потому что в Бурятии физически не имеется такого количества избирателей. Каждая из случайных величин, пронумерованных нами от 1 до 4, имеет и закономерную составляющую.

Является ли переменная «электоральная активность избирателей в /-ом регионе» (весь третий столбец табл. 3.1) случайной? Да, потому что отдельные наблюдения этой переменной представляют собой случайные величины.

Возникает довольно странная картина. Мы привыкли к тому, что если получен результат измерения определенного свойства для определенного объекта, представленный одним числом, то это и есть одно конкретное, определенное, постоянное число. В мире статистического анализа дело обстоит совершенно иначе.

Итак, случайная величина — это переменная, которая измеряется многократно и с различным результатом в рамках неизменного комплекса условий. Случайным испытанием мы будем называть некоторое наблюдение с не предсказуемым заранее результатом, производимое в рамках одних и тех же условий. Случайная величина представляет собой, таким образом, некоторое множество случайных испытаний. По смыслу понятие «испытание» очень близко к понятию «наблюдение».

Показать весь текст
Заполнить форму текущей работой