Данные ивент-анализа (событийные данные)
Рождение" ивент-анализа не случайно приходится на середину 60-х гг. XX в. и, опять же, не случайно напрямую связано с международными отношениями. К этому времени в западной (прежде всего, американской) политической науке уже прочно утвердилась бихевиористская парадигма: большинство исследований опирались на формализованный эмпирической материал, активно использовалась статистика и т. д. В этом… Читать ещё >
Данные ивент-анализа (событийные данные) (реферат, курсовая, диплом, контрольная)
Ивент-анализ (от англ, event — событие) как метод исследований политической науки зарождается в 60-х гг. прошлого столетия. Первое системное изложение методологии и инструментария ивент-анализа содержится в работах американского ученого Чарльза Маклеланда (Charles McClelland)1, которого можно считать «отцом-основателем» данного исследовательского направления. На сегодняшний день ивент-анализ остается одним из наиболее актуальных методов эмпирической политологии, его инструментарий продолжает расширяться и дополняться и в XXI столетии.
Ивент-анализ зародился и сформировался целиком в рамках политической науки, а точнее, в рамках ее направления, связанного с изучением международных отношений. Это само по себе примечательно, так как большинство методов сбора, обработки и анализа данных, используемых в политологии, являются междисциплинарными и были «адаптированы» политологией к своим потребностям.
Ивент-анализ принадлежит к группе количественных методов изучения политической реальности. Его суть состоит в систематическом формализованном представлении.
'Наиболее значимыми работами Маклеланда раннего (1960;е гг.) периода являются: McClelland Ch.A. Event-Interaction Analysis in the Setting of Quantitative International Relations Research. Los Angeles, 1967; McClelland Ch.A. International Interaction Analysis: Basic Research and some Practical Uses. Los Angeles, 1968; McClelland Ch.A. Access to Berlin: The Quantity and Variety of Events, 1948;1963//Quantitative International Politics / Ed. J. David Singer. N.Y., 1968; McClelland Ch.A. International Interaction Analysis in the Predictive Mode. Los Angeles, 1969.
интеракций между субъектами политики в рамках определенной шкалы (как правило, отражающей состояния конфликтности / мирных процессов). Информационной базой являются сообщения СМИ: преимущественно газет и информационных агентств. Соответственно, ближайший «родственник» ивент-анализа — контент-анализ: оба метода осуществляют количественный анализ текстов, но разными способами. В этом плане необходимо ясно понимать, что объектом ивент-анализа являются не сами события, а сообщения о них.
«Рождение» ивент-анализа не случайно приходится на середину 60-х гг. XX в. и, опять же, не случайно напрямую связано с международными отношениями. К этому времени в западной (прежде всего, американской) политической науке уже прочно утвердилась бихевиористская парадигма: большинство исследований опирались на формализованный эмпирической материал, активно использовалась статистика и т. д. В этом плане сфера международных отношений находилась как бы в положении «отстающего», здесь до сих пор доминировали традиционные методы: исторический анализ, традиционный анализ текстов. Это связано с тем, что основные источники количественных данных политической науки — результаты социологических опросов, электоральная и социально-экономическая статистика — генерируются на внутригосударственном, а не на межгосударственном уровне. Тем временем сложная внешнеполитическая ситуация — развертывание холодной войны и гонки вооружений, нестабильность в Ближневосточном регионе и т. д. — требовала активного внедрения более современных методов анализа и прогнозирования.
Таким образом, возникновение ивент-анализа стало, с одной стороны, ответом на объективные политические вызовы эпохи, с другой — находится целиком в русле тенденций развития эмпирической политологии того времени.
Процедуры ивент-анализа можно условно отнести к двум большим фазам:
• формализованное представление сообщений о событиях в соответствии с определенной кодировочной схемой, или процесс создания «данных о событиях» («событийных данных», Event Data);
• использование баз данных о событиях для получения содержательных гипотез и выводов относительно изучаемых политических процессов, построение и тестирование моделей. На этой стадии в современной политической науке используется очень широкий набор статистических и математических техник, как правило, довольно сложных. Эту часть мы оставим для магистерского курса, а сейчас сосредоточимся на процессе создания событийных данных.
Процесс создания таких данных включает четыре основные составляющие. Это:
- • выбор информационного обеспечения;
- • разработка системы кодировки (или адаптация уже существующей системы);
- • выбор способа кодирования: машинный или ручной. В первом случае необходима разработка и перевод на язык программирования специальных словарей, во втором — подготовка кодировщиков. Следует отметить, что с 90-х гг. машинное кодирование почти полностью вытесняет ручное;
- • формирование базы данных.
Графически процесс создания баз «событийных данных» можно представить следующим образом (рис. 4.1).
Рис. 4.1.
Не случайно между этапами 1) выбора источников информации и 2) разработки кодировочной системы существует обратная связь («двойная» стрелка): они существенно зависят друг от друга, на чем мы остановимся ниже.
Процесс кодировки в самом общем виде представляет собой перевод вербального сообщения о событии в формализованный ряд данных в соответствии с определенным форматом. «Базовым» для ивент-анализа выступает формат, предложенный Ч. Маклеландом. В соответствии с ним, любое политическое событие может быть представлено четырьмя составляющими:
- • временем наступления события — датой или более точным временем (time); ответ на вопрос «когда?»;
- • субъектом или инициатором политического действия (source); ответ на вопрос «кто?»;
- • объектом (target) политического действия; ответ на вопрос «кому?» («кого?»);
- • собственно политическим действием (activity); ответ на вопрос «что сделал?».
Существуют и более сложные форматы представления событий (сообщений о событиях). Так, другой американский исследователь, Э. Азар, также один из наиболее известных методологов ивент-анализа, вводит в эту схему пятую составляющую — «предмет взаимодействия» (issue, ответ на вопрос «по какому поводу?»). Некоторые исследователи вводят составляющие, отражающие контекст события. Мы же будем отталкиваться от формата Ч. Маклеланда как наиболее простого и ясного с точки зрения учебных задач.
Формат кодировки событий в значительной мере определяет набор источников информации. Так, в современном ивент-анализе наиболее распространенной практикой является использование сообщений мировых и, в меньшей степени, региональных информационных агентств. Нетрудно заметить, что большинство заголовков новостных лент информагентств изначально строится в формате ивент-анализа (например, «Сегодня президент Буш объявил ультиматум Ираку»: дата — субъект — действие — объект). Достоинством данного источника информации является минимум интерпретационных наслоений по сравнению с другими СМИ. Кроме того, эти данные изначально существуют в электронной виде и доступны как в сети Интернет, так и по специальной электронной подписке. Поэтому к 90-м гг. прошлого столетия информационные агентства как источник информации для ивент-анализа полностью вытеснили международно ориентированные печатные СМИ. В 60- 70-х гг. XX в. многие базы данных создавались на материалах газет The New York Times и Times of London. Сейчас же наиболее популярны среди исследователей Reuters и Agence France-Presse (AFP).
При конкретном выборе источников для формирования базы данных перед исследователем, тем не менее, встает целый ряд вопросов: использовать ли несколько источников — и как согласовывать информацию, если между ними есть противоречия? Использовать ли материалы только мировых информационных агентств или также региональных? Опять же, как «состыковать» их между собой? Универсальных рекомендаций здесь нет: все зависит от целей исследования и конкретного формата кодировочной системы.
Наиболее просто (по существу, автоматически) кодируется временная составляющая события — дата. Если событие произошло 2 июля 2011 г., оно получит код 110 702. Также весьма несложно кодируются объекты и субъекты событий. В качестве объектов и субъектов событий могут выступать государства, политические партии, транснациональные компании, несистемные игроки (например, партизанские движения), — в целом, все явно идентифицируемые участники политического процесса. Большинство уже созданных баз данных ориентировано на государства как на центральных акторов международного политического процесса, что вполне объяснимо. Для государств используется присвоение стандартной трехбуквенной аббревиатуры. Так, Россия обозначается как RUS, Ирак — IRQ, Кувейт — KUW, и т. д.
Наиболее «тонкая» часть кодировки событий — кодировка действий, которая и придает особую специфику ивентанализу. Каждое политическое действие входит в определенный класс (подкласс) действий, каждый класс действий имеет свое фиксированное место в некоей шкале, отражающей состояние отношений между акторами. Наиболее распространенный признак построения такой шкалы — уровень конфликтности (или, наоборот, «мирной» составляющей) в том или ином действии и классе действий.
Поясним все это на примере самой первой систематически разработанной (все тем же Ч. Маклеландом) кодировочной системы ивент-анализа — WEIS (World Event Interaction Survey). WEIS относит всю совокупность действий к 63 подклассам, агрегируемым в 22 класса. Кодировочный номер класса соответствует уровню «конфликтного поведения», содержащегося в том или иной действии. Так, классы с наиболее высоким числовым значением включают демонстрацию и применение военной силы, классы с наиболее низким числовым значением — заключение межгосударственных альянсов. Таким образом, кодировка действий в ивент-анализе выводит нас на порядковый уровень измерения. Мы знаем, к примеру, что в классе действий «Отказ» (Reject, № 11 в WEIS) уровень конфликтности меньше, чем в классе «Угроза» (THREAT, № 17 в WEIS).
То же правило порядкового измерения распространяется и на подклассы. Так, уже названный класс «Угроза» в WEIS содержит четыре подкатегории:
- 171 — угроза, не предполагающая применения санкций;
- 172 — угроза, предполагающая применение невоенных санкций;
- 173 — угроза, предполагающая применение военных санкций;
- 174 — ультиматум (угроза, предполагающая применение военных санкций в ограниченное время).
Нетрудно заметить, что уровень конфликтности поведения в категории идет по возрастающей от подкласса к подклассу, что отражается в возрастании цифрового кода. Это классическая порядковая шкала: мы знаем, что в действии 173 (угроза, предполагающая применение военных санкций) больше выражен признак «конфликтность», чем в действии 171 (угроза, не предполагающая применения санкций), и меньше, чем в действии 174 (ультиматум). 171 < 173 < 174. В го же время мы не знаем, насколько больше выражен признак, так как у нас нет четкой единицы измерения признака «конфликтность». Соответственно, шкала не параметрическая.
Существуют широко используемые шкалы, трансформирующие значения кодов в величины. Например, известна шкала Гольдштейна, позволяющая работать с кодировками WEIS на параметрическом уровне. Некоторые примеры приведены в табл. 4.5.
Класс в WEIS. | Код WEIS. | Значение по шкале Гольдштейна. |
Похвала (политическому курсу, лидеру и т. д.). | 3,4. | |
Обещание политической поддержки. | 4,5. | |
Ультиматум. | 6,9. | |
Военное вмешательство. | 10,0. |
Разумеется, шкала Гольдштейна небесспорна, как небесспорна была бы любая другая шкала, — объективного интервала для признака «конфликтность в международных отношениях», видимо, не существует в принципе. Однако необходимость перевода кодов ивент-анализа в параметры очевидна, так как именно это позволяет использовать в работе с событийными данными сложные статистические методы.
Кроме того, в таком виде мы имеем хороший инструмент визуализации событийной информации. Так, ниже приводится график, отражающий действия Ирака в отношении Ирана с 1979 по 1997 г. (отрицательные величины характеризуют более высокий уровень конфликтности). В частности, очень четко видна стадия Ирано-Иракской войны и период иракского вторжения в Кувейт.
Рис. 4.2.
Обратите внимание, что на оси абсцисс графика отложено время. Уровень конфликтности в действиях Ирана в отношении Ирана, таким образом, представляет собой временной ряд. Выше мы отмечали, что такие данные, с одной стороны, представляют особую ценность для исследователя, с другой — требуют специальных, как правило, достаточно сложных методов обработки.
Кроме «односторонней» картины действий одного актора в отношении другого, мы можем получить и визуальное представление о взаимодействии субъектов политики. Так, ниже приводится схема, демонстрирующая развитие палестино-израильского конфликта с 1982 по 1992 г. Опять же четко видны «провалы», связанные с интифадой.
Рис. 4.3.
Однако чисто «визуальной» верификации данных практически всегда бывает недостаточно. Любые СМИ — и в том числе информагентства — дают «погрешность», связанную с той или иной политической ангажированностью (если не прямое искажение фактов, то «умолчание» одних событий и «выпячивание» других). Соответственно, необходимо тестирование созданных баз данных с использованием независимых (по возможности объективных и непременно взятых из иных источников) индикаторов. Например, для оценки правильности описания динамики взаимодействий между Израилем и Палестиной в период интифады (1987— 1992) мы можем привлечь данные о потерях с одной и другой стороны. Их динамика должна в целом соответствовать динамике напряженности во взаимоотношениях сторон.
Кроме уже названной системы WEIS, на сегодняшний день существует комплекс баз данных ивент-анализа, который непрерывно дополняется новыми исследовательскими разработками. По мнению известного современного методолога ивент-анализа, профессора Канзасского университета Филипа Шродта, все базы данных можно подразделить на две большие группы[1]. Первую группу составляют базы, ориентированные на акторов международных политических процессов. Они включают информацию о взаимодействии определенного набора акторов на протяжении определенного периода времени (например, государства, расположенные и имеющие интересы на Ближнем Востоке с 1970 по 1990 г.). Вторая группа баз данных — назовем ее проблемно ориентированной — концентрируется на событиях, вовлеченных в конкретный исторический инцидент. Как правило, это крупный конфликт, например война в Персидском заливе.
«Классическими» представителями первой группы — субъектно ориентированных баз данных и систем кодирования — являются уже названная WEIS, COPDAB и CREON.
База данных WEIS была охарактеризована выше. Следует лишь отметить, что она и в настоящее время используется достаточно активно многими исследователями.
Система COPDAB (расшифровывается как Conflict and Peace Data Bank) связана с именем известного исследователя Эдуарда Азара. Основные отличия от WEIS следующие:
- • использование региональных источников за пределами Европы и Северной Америки;
- • использование 16-классовой системы кодировки, изначально «привязанной» к параметрической шкале «конфликт — сотрудничество»;
- • классификация каждого события по 8 типам: военные, дипломатические, символические, культурные и т. д.
Наиболее характерное отличие базы данных CREON (The Comparative Research on the Events of Nations data set) состоит в том, что традиционный формат кодировки дополняется обширным набором переменных, имеющих отношение к контексту события (в частности, принимаются в расчет другие события, связанные с кодируемым). Такой подход обусловлен тем, что CREON делает акцент на процедурах принятия решений акторами на международной арене. В рамках этой системы делается попытка проанализировать не только результаты политических действий, выражающиеся в тех или иных событиях, но и собственно политический процесс.
Характерными представителями второй группы баз данных являются BCOW и CASCON.
Кодировочная система BCOW (The Behavioral Correlates of War data set) разработана в 1987 г. Она включает кодированные данные по сорока пяти крупным международным кризисам с 1816 г. Центральный вопрос, который поставили разработчики базы данных, состоял в следующем: в силу каких причин одни кризисы заканчиваются развязыванием войны, а другие — нет? Такая постановка вопроса хорошо характеризует разницу между субъектно и проблемно ориентированными базами данных ивент-анализа.
Собственно кодировочная система BCOW основывается на схеме WEIS, но при этом существенно увеличивает количество категорий (до 100) и проводит более четкую грань между действиями экономического, военного и вербального характера.
Кроме того, BCOW — одна из наиболее разнообразных баз данных с точки зрения информационного обеспечения, что во многом обусловлено широтой хронологического охвата событий. Кроме новостных источников, используются мемуары, хроники, архивные исторические документы.
Следующая кодировочная система, CASCON (The Computer-Aided System for the Analysis of Local Conflicts), по своим базовым установкам напоминает BCOW, эта база данных также нацелена на анализ конфликтов. Однако во внимание здесь принимаются не только международные, но и внутренние конфликты в более узком хронологическом срезе: берется период после Второй мировой войны. Кроме того, CASCON отличает более системно-теоретический подход. Так, авторы проекта исходят из насчитывающей шесть стадий схемы развития любого конфликта — от инициирования к урегулированию, — которая влияет на характер кодировки событий. Как и CREON, CASCON учитывает не только собственно события, но внешние факторы, оказывающие на них влияние. В целом это достаточно мощный аналитический инструмент как для сопоставления уже произошедших конфликтов, так и для сравнения текущих конфликтов с историческими «предшественниками».
Кратко систематизируем особенности ивент-анализа как измерительного инструмента политической науки.
- • Результаты ивент-анализа «генетически» — по процедуре их получения — представляют собой переменные порядковой шкалы. Их вывод на параметрический уровень (с помощью шкалы Гольдштейна или каким-то иным способом) небесспорен с методической точки зрения. Соответственно, требуется определенная аккуратность при работе с данными ивент-анализа с помощью тех методов, которые «закреплены» исключительно за параметрическими данными.
- • Большинство данных ивент-анализа представляют собой временные ряды, требующие специальных математических и статистических техник.
- • Данные ивент-анализа, строящиеся на сообщениях о событиях, всегда служат материалом для изучения нетекстовой реальности — самих событий и тех политических процессов, которые эти события отражают (в отличие от контент-анализа, где возможны варианты). Соответственно, полученные в ходе ивент-анализа количественные показатели требуют специальной проверки их валидности, адекватности реальным политическим процессам.
- [1] Schrodl Ph. Event Data in Foreign Policy Planning // Foreign Policy Analysis: Continuity and Change in Its Second Generation. N.Y., 1994.