Помощь в написании студенческих работ
Антистрессовый сервис

Факторы влияния на электоральную активность

РефератПомощь в написанииУзнать стоимостьмоей работы

Однако проведенные проверки модели на надежность (допущения) показали, что выбранные данные являются показательными и могут быть взяты в расчет для объяснения зависимой переменной. Построенная гистограмма остатков (отклонений наблюдаемых от ожидаемых значений), не отображает значительные выбросы и свидетельствует о хорошем согласовании с нормальным распределением. Проведенная проверка на наличии… Читать ещё >

Факторы влияния на электоральную активность (реферат, курсовая, диплом, контрольная)

Выборы на уровне таких административно-территориальных единиц, как муниципальные районы и городские округа, относятся к местному самоуправлению и регламентируются федеральным законом № 131-ФЗ «Об общих принципах организации местного самоуправления в Российской Федерации [N 131-ФЗ]. По данным Росстата на 1 января 2015 года в состав Российской Федерации входит 22 923 муниципальных образований, среди которых 1823 муниципальных района и 535 городских округов [Сайт Федеральной службы государственной статистики].

В данной главе представлены результаты обработки ианализа электоральных и статистических данных, которые имеют отношение к выборам депутатов представительных органов муниципальных районов и городских округов.

За единицу анализа были взяты данные по 150 выборам депутатов представительных органов муниципальных образований Российской Федерации, которые проходили с 2010 по 2015 год. За данный период в муниципалитетах и городских округах было проведено 2664 избирательные кампании. Методом простой случайной выборки, были отобраны 150 единиц, по которым и были собраны и проанализированы данные. Под единицей анализа в данном контексте понимается «это элементарная, единичная часть объекта исследования». [Крыштановский, 2006, с. 10].

Переменная — признак или показатель, который характеризует одно свойство единицы измерения. Важным принципом переменной считается то, что для каждой единицы анализа она обладает неким определенным значением, но «не все единицы анализа имеют одинаковое значение переменной» [Там же, с. 10].

Демографические и социально-экономические данные был «разбиты» на следующие переменные: электоральная активность, пол, возраст, место жительства, численность населения, уровень жизни населения.

Электоральная активность представлена таким предиктором как явка, который характеризуется числом бюллетеней, опущенных в стационарные и переносные ящики избирателями. Пол избирателя представлен двумя предикторами — женщины и мужчины. Переменную «возраст» представляют такие два показателя как «трудоспособный возраст» и «старше трудоспособного возраста». Предикторы, определяющие переменную «место жительство», представлены числом жителей в сельских населенных пунктах и городов. Численность населения, которая непосредственно влияет на процент явки на выборах, включает в себя такие переменные как естественный прирост или убыль населения, общий коэффициент естественного прироста или убыли, а также миграционный прирост или убыль. Уровень жизни, исходя из результатов исследований, относящихся к изучению электорального поведения, измеряется показателями среднесписочная численность работников организаций и среднемесячная заработная плата работников организаций.

Рассмотрение и анализ этих факторов необходимо для того, чтобы проверить, влияют ли перечисленные социально-экономические факторы на зависимую переменную в нашем исследовании, т. е. электоральную активность. Исходя из этого, формируются следующие гипотезы, которые в дальнейшем должны быть подвергнуты проверке:

  • 1) Уровень активности избирателей связан с гендерной принадлежностью;
  • 2) Активность избирателей связана с лояльностью электората;
  • 3) Экономическое благосостояние населения связано с их активностью избирателей.

Таблица № 1. Описательные статистики переменных.

N.

Минимум.

Максимум.

Среднее значение.

Стандартное отклонения.

Явка.

0,16.

0,96.

0,5106.

0,19 237.

Женщины.

0,00.

0,61.

0,5062.

0,9 061.

Мужчины.

0,00.

0,56.

0,4582.

0,8 250.

Естественный прирост (убыль).

— 0,02.

0,02.

— 0,0021.

0,543.

Общий коэффициент прироста (убыли).

0,00.

0,00.

— 0,0001.

0,58.

Миграционный прирост (убыль).

— 0,04.

0,07.

— 0,0028.

0,1 431.

Среднесписочная численность работников организаций.

0,04.

0,67.

0,1975.

0,8 338.

Среднемесячная заработная плата работников организаций.

0,00.

66 902,5.

19 019,02.

9029,63.

Старше трудоспособного возраста.

0,00.

0,57.

0,2281.

0,7 869.

Трудоспособный возраст.

0,00.

0,67.

0,5395.

0,14 175.

Городское население.

0,00.

1,00.

0,4401.

0,37 895.

Сельское население.

0,00.

1,00.

0,5595.

0,37 855.

N валидных (по списку).

Как уже отмечалось, зависимой переменной в нашем исследовании является явка на выборах депутатов представительных органов муниципальных районов и городских округов. В свою очередь, предикторами являются следующие переменные, которые входят в критерии гендерного разрыва, лояльности и экономического благосостояния:

  • 1) пол (женщины, мужчины);
  • 2) возраст (трудоспособное население и пенсионеры); место проживания (городское и сельское население).
  • 3) среднесписочная численность работников организаций и среднемесячная заработная плата; естественный прирост или убыль населения и общий коэффициент естественного прироста, миграционный прирост или убыль.

Описательные статистики — это набор вычисляемых показателей, которые характеризуют распределение значений переменных [Дорогонько, 2010, с. 24].

Из данных, представленных в таблице № 1, мы видим, что минимальный процент явки избирателей на выборах депутатов представительных органов муниципальных образований в период с 2010 по 2015 год составил 16%, в то время как максимальная отметка этой же переменной составила 96%.

Максимальный процент числа женщин больше, чем процент мужчин. Этот вывод также подтверждает среднее значение. Предикторы объединены «естественный прирост/убыль», «общий коэффициент естественного прироста/убыли» и «миграционный прирост/убыль» отрицательным средним значением, что свидетельствует об уменьшении численности населения и оттока граждан из населенных пунктов.

Максимальное число работников организаций составляет 67%, что является хорошим показателем для уровня жизни населения. Минимальное значение — 4%, может быть объяснено тем, что в случайную выборку попали районы и городские округа, которые изначально не рассматривались как похожие, и, следовательно, имеют разную численность населения. В среднем, в 150 муниципальных образованиях работниками организаций является почти 20% населения.

Продолжая рассмотрение уровня жизни населения, стоит отметить, что максимальная заработная плата, которая выплачивается работникам организаций, составляет около 67 тысяч рублей, что также является неплохим показателем. Однако если обратить внимание на среднее значение, которое равно 19 019,02 рублей, то с учетом числа членов среднестатистической семьи (2,6 человека на 2010) [Число и состав домохозяйств], этот показатель сложно назвать удовлетворительным для достойного уровня жизни, основываясь на установленной норме прожиточного минимума.

В категории «возраст» преобладающим числом обладают люди трудоспособного возраста (средний процент пенсионеров в случайно отобранных районах составляет 22%, а процент лиц старше 18 и моложе пенсионного возраста в среднем равен 54%).

Переходя от возраста к месту проживания, очевидно, что в среднем число сельского населения (56%) преобладает над численностью жителей городов (44%).

Отдельного внимания требует такая мера разброса как стандартное отклонение, которое делает возможным задать диапазон разброса отдельных переменных. Удвоенное стандартное отклонение, т. е. ширина, которой оно равно, включает в себя 67% всех значений выборки (учитывая нормальное распределение переменных), удвоенное — 95%, а утроенное стандартное отклонение — почти 99%.

Регрессионный анализ позволяет выявить не только наличие связи между критериальной переменной и предикторами, но и определить вид этой связи.

Первый этап проведения регрессионного анализа — построение линейной регрессии, которая подтверждает или отрицает наличие связи между такой переменной как явка и социально-экономическими факторами. Следовательно, второй этап заключается в проверке полученных данных.

В ходе проведения регрессионного анализа выделенных переменных особое внимание уделяется коэффициенту регрессии и его значимости (на уровне доверия 0,05), который характеризует значимость влияния одного предиктора на зависимую переменную, т. е. явку.

Таблица № 2. Результаты пошагового проведения регрессионного анализа.

№ 1.

№ 2.

№ 3.

№ 4.

№ 5.

№ 6.

№ 7.

№ 8.

№ 9.

№ 10.

Женщины.

1,408 (0,048).

1,420 (0,043).

1,448 (0,037).

1,413 (0,040).

1,454 (0,031).

1,106 (0,077).

0,747 (0,110).

0,722 (0,120).

;

;

Мужчины.

1,313 (0,141).

1,313 (0,139).

1,329 (0,133).

1,197 (0,142).

1,124 (0,161).

;

;

;

;

;

Старше трудоспособного возраста.

— 1,907 (0,014).

— 1,918 (0,012).

  • -1,943
  • (0,011)

— 1,852 (0,010).

— 1,866 (0,009).

— 1,193 (0,022).

— 0,845 (0,010).

— 0,641 (0,017).

— 0,484 (0,061).

;

Трудоспособный возраст.

— 1,117 (0,117).

— 1,126 (0,110).

— 1,137 (0,105).

— 1,026 (0,109).

— 1,023 (0,105).

— 0,360 (0,386).

;

;

;

;

Городское население.

1,120 (0,708).

1,149 (0,698).

;

;

;

;

;

;

;

;

Сельское население.

1,267 (0,672).

1,294 (0,663).

0,143 (0,006).

0,144 (0,005).

0,140 (0,005).

0,175 (0,000).

0,178 (0,000).

0,170 (0,000).

0,165 (0,000).

0,176 (0,000).

Естественный прирост (убыль), человек.

— 11,894 (0,054).

— 11,945 (0,051).

— 12,117 (0,047).

— 11,637 (0,050).

— 8,186 (0,084).

— 4,384 (0,259).

— 3,036 (0,392).

;

;

;

Общий коэффициент.

45,906 (0,303).

46,334 (0,294).

46,408 (0,292).

43,463 (0,314).

;

;

;

;

;

;

Миграционный прирост/убыль.

0,527 (0,672).

0,523 (0,673).

0,485 (0,694).

;

;

;

;

;

;

;

Среднесписочная численность работников.

0,028 (0,916).

;

;

;

;

;

;

;

;

;

Среднемесячная заработная плата.

— 0,005 (0,025).

— 0,005 (0,019).

— 0,005 (0,015).

— 0,005 (0,16).

— 0,004 (0,017).

— 0,004 (0,036).

— 0,004 (0,029).

— 0,004 (0,010).

— 0,004 (0,019).

  • -0,004
  • (0,027)

Значимость.

0,000.

0,000.

0,000.

0,000.

0,000.

0,000.

0,000.

0,000.

0,000.

0,000.

R2

0,259.

0,259.

0,258.

0,257.

0,250.

0,239.

0,234.

0,221.

0,198.

0,179.

Полученные результаты, представленные в таблице № 2, позволяют рассмотреть, какие предикторы влияют на зависимую переменную. Для получения данных, которые отображены в таблице, проводится пошаговый регрессионный анализ. Основной идеей пошагового исключения является изменение влияния независимой переменной на критерий при появлении других независимых переменных [Наследов, 2011, с. 257]. Таким образом, мы наблюдаем исключение тех предикторов, которые незначимы для переменной «явка» и, следовательно, никаких образом не оказывают на нее влияние.

В ходе поэтапного исключения предикторов, мы получаем 10 моделей, которые являются значимыми и имеют различные коэффициенты. Однако, в нашем случае, особое внимание привлекает значимость того или иного регрессора.

Модель № 1. В данной модели представлены коэффициенты регрессий и значимость предикторов по отношению к зависимой переменной — явке. Основываясь на полученных данных, следует исключить такой фактор как среднесписочная численность работников организаций с коэффициентом регрессии 0,028, поскольку его значимость составляет 0,916 (значимость не должна быль больше 0,05).

Модель № 2. Действуя по аналогии построения предыдущей модели, исключается переменная «среднесписочная численность работников организаций», и проводится регрессионный анализ по оставшимся переменным. Менее значимой является переменная «городское население» с коэффициентом 1,149, значимость которого равна 0,698.

Модель № 3. На основании данной модели, самым незначимым предиктором для переменной «явка» является миграционный прирост или убыль. Коэффициент регрессии данного показателя равен 0,485 при уровне значимости 0,694.

Модель№ 4. В случае данной модели, делаем вывод, что также незначимым предиктором для зависимой переменной является общий коэффициент естественного прироста (убыли) с коэффициентом 43,463 (на уровне значимости 0,314).

Модель № 5. Следующей переменной, не влияющей на явку, является доля мужчин с коэффициентом 1,124, уровень значимости которого составляет 0,161.

Модель № 6. Незначимой также является переменная «трудоспособный возраст», коэффициент которой равен — 0,360, а уровень значимости — 0,386.

Модель № 7. Основываясь на регрессионном анализе оставшихся переменных, в данной модели самой незначимой является переменная «естественный прирост или убыль населения», коэффициент которой равен -3,036 на уровне значимости 0,392.

Модель № 8. Переменной, не оказывающей влияние на явку на этом шаге регрессионного анализа, можно считать долю женщин, поскольку коэффициент регрессии равен 0,722 на уровне значимости 0,120.

Модель № 9. Основываясь на коэффициенте регрессии -0,484 (на уровне значимости 0,061), следующим исключаемым предиктором является населения старше трудоспособного возраста.

Модель № 10. В результате, мы получаем модель, в который особо значимыми для явки на выборах депутатов представительных органов муниципальных образований являются такие факторы как доля сельского населения и среднемесячная заработная плата работников организации.

Ниже будет представлена регрессионная статистика, которая подтверждает, что такие предикторы как «сельское население» и «среднемесячная заработная плата» являются значимыми и оказывающие влияние на зависимую переменную.

Таблица № 3 отображает значения коэффициента регрессии ®, коэффициент детерминации (R-квадрат), скорректированный R-квадрат и стандартную ошибку оценки.

Таблица № 3. Сводная таблица для модели.

Модель.

R.

R-квадрат.

Скорректированный R-квадрат.

Стандартная ошибка оценки.

0,423.

0,179.

0,168.

0,17 581.

Таблица № 4. Дисперсионный анализ модели.

Модель.

Сумма квадратов.

ст.св.

Средний квадрат.

F.

Знач.

Регрессия Остаток Всего.

  • 0,979
  • 4,482
  • 5,461
  • 2
  • 148
  • 150
  • 0,489
  • 0,031

15,835.

0,000.

Таблица № 5. Коэффициенты переменных «Сельское население» и «Среднемесячная заработная плата работников организаций».

Модель.

Нестандартизованные коэффициенты.

Стандартизованные коэффициенты.

т.

Знач.

B.

Стандартная Ошибка.

Бета.

(Константа).

0,481.

0,045.

10,586.

0,000.

Сельское население.

0,176.

0,040.

0,345.

4,436.

0,000.

Среднемесячная заработная плата работников организаций.

— 0,004.

0,002.

— 0,174.

— 2,238.

0,027.

Коэффициент регрессии, равный 0,423, показывает связь предикторов с критериями. Коэффициент детерминации позволяет сделать вывод о том, что объяснительная сила данной модели составляет почти 18%.

Значение R-квадрат часто бывает завышенным, в то время как скорректированный R-квадрат ближе к реальной величине. В нашем исследовании разница между R2 и скорректированнымR2 почти 2%, что также подтверждает слабую степень точности описания модели.

В таблице № 4 представлены результаты дисперсионного анализа, который позволяет оценить достоверность представленной модели по уровню значимости критерия Фишера. Согласно данным, значимость критерия меньше, чем 0,05, следовательно, это говорить о ее достоверности.

Результаты регрессионного анализа (или, другими словами, анализа нестандартизированных коэффициентов), представленные в таблице № 5, анализа нестандартизированных коэффициентов позволяют получить уравнение регрессии, которое имеет следующий вид:

Y = 0,481+ 0,176x1 — 0,004 x2 + ?,.

где: 0,481 — константа;

Y — зависимая переменная;

x1, x2 — независимые переменные;

? — случайные ошибки.

Полученные результаты в таблице № 5 и уравнении можно проинтерпретировать следующим образом:

  • 1) при увеличении доли голосующего на выборах сельского населения на 1 единицу, уровень явки повышается на 1,7%;
  • 2) с увеличением среднемесячной заработной платы на 1 единицу, уровень явки будет снижаться на 4%.

Второй этап проведения регрессионного анализа состоит из проверки допущений. В основании всех статистических анализов лежат допущения, например, нормальность, нормально распределенная ошибка, гомоскедастичность и т. д. Нарушение этих допущений может стать причиной снижения надежности полученных результатов в ходе анализа данных и скажется на неправильности интерпретации. Для того, чтобы избежать подобных ситуаций, следует провести следующие проверки:

  • 1) проверка на нормальность переменных;
  • 2) проверка модели на гетероскедастичность;
  • 3) проверка переменных на мультиколлинеарность.

Самым простым способом доказательства нормальности используемых переменных является построение гистограммы стандартизированных остатков, представленной на примере гистограмме № 1. Гистограмма необходима для анализа и точности данных, по которым были выявлены получившиеся модели.

Мы видим, получившаяся гистограмма практически полностью совпадает с нормальной кривой распределения, но положение пика на гистограмме свидетельствует о том, что процесс нецентрирован, что говорит о возможных выбросах в данных. Однако учитывая, что выборка представлена значительным числом предикторов и что большая часть данных находится близко к линии регрессии, то можно полагаться на достоверность представленной гистограммы, т. е. на надежность выбранных данных.

Следующим способом проверки надежности полученной модели является равенство дисперсии распределения остатков или гетероскедастичность. Под гетероскедастичностью понимается неоднородность дисперсий нестандартизированных остатков.

На примере графика № 2 представлена проверка модели на гетероскедастичность. В качестве зависимой переменной выступают нестандартизованные значения регрессионных остатков, в то время как независимой является процент сельского населения.

Получившийся график можно интерпретировать следующим образом. Разброс наблюдений на всем диапазоне является одинаковым. Данный факт означает, что стандартные ошибки коэффициентов регрессии тоже будут совпадать. Также дисперсии оценок параметров не рассчитываются со смешением. Этот факт позволяет говорить о невозможности смещении итогов анализа по отношению, как минимум, к данным. Следовательно, это свидетельствует об однородности остатков и подтверждает надежность используемых данных.

Гистограмма №1. Гистограмма стандартизированных остатков.

Гистограмма № 1. Гистограмма стандартизированных остатков.

Данное наблюдение свидетельствует о противоположном явлении гетероскедастичности — гомоскедастичности, т. е. о нормальном характере дисперсии распределения остатков. Таким образом, численность сельского населения является самостоятельной переменной, которая оказывает влияние на такую переменную как явка.

Следуя логике исследования, подобная процедура проверки модели на гетероскедастичность проводится и для предиктора «среднемесячная заработная плата работников организаций». В качестве зависимой переменной также выступают нестандартизованные значения регрессионных остатков, независимой на этот раз является размер среднемесячной заработной платы.

График №1. Проверка модели на гомоскедастичность (сельское население).

График № 1. Проверка модели на гомоскедастичность (сельское население).

График № 2 практически аналогичен графику № 1. Кроме того, данный график показывает, что модель также гомоскедастична, и, следовательно, и не подтверждает наличие некой пропущенной переменной, которая не вошла в наше исследование. Это также подтверждает, что такой предиктор как «среднемесячная заработная плата работников организации» является самостоятельной переменной и его не следует рассматривать вместе с другими переменными, к примеру, с показателями места жительства или полом.

Следующим важнейшим пунктом при работе с множественной регрессии является проверка на мультиколлинеарность.

Мультиколлинеарность — высокий уровень корреляции между независимыми переменными, который вызывает технические трудности, влекущие за собой неточности в оценивании значения переменных и даже невозможность выявления влияния той или иной переменной [Фёрстер, Рёнц, 1983, с. 214].

График №2. Проверка модели на гомоскедастичность (Среднемесячная заработная плата работников организаций).

График № 2. Проверка модели на гомоскедастичность (Среднемесячная заработная плата работников организаций).

Мультиколлинеарность является очевидной, в нескольких случаях. Во-первых, коэффициент регрессии является отрицательным. Во-вторых, регрессионный коэффициент значительно меняется при увеличении или уменьшении выборки. Кроме того, подозрительным для модели является отсутствие значимости у коэффициентов регрессии. И, наконец, регрессионный коэффициент не является значимым, когда теоретически он влияет на зависимую переменную.

Для полного подтверждения того, что модель не имеет мультиколлинеарности между переменными, необходимо проверить их на наличие корреляции.

Результаты проведения корреляционного анализа (таблица № 6) подтверждают, что между предикторами «сельское население» и «среднемесячная заработная плата» существует слабая связь (находится близко к значению 0) и отрицательная (коэффициент корреляции Пирсона равен -0,251).

Таблица № 6. Корреляционный анализ.

Сельское население.

Среднемесячная заработная плата работников организаций.

Сельское население.

Корреляция Пирсона.

— 0,251**

Знач. (двухсторонняя).

0,002.

N.

Среднемесячная заработная плата работников организаций.

Корреляция Пирсона.

— 0,251**

Знач. (двухсторонняя).

0,002.

N.

**. Корреляция значима на уровне 0,01 (двухсторонняя).

Подводя итог, следует отметить, что проведение регрессионного анализа на основании электоральных и статистических данных по случайно отобранным муниципальным районам и городским округам, показывает, что значимыми переменные, оказывающими влияние на переменную «электоральная активность», являются предикторы «сельское население» и «среднемесячная заработная плата». Также в ходе регрессионного выявлено влияние каждого из предикторов и получены ответы на вопрос — как зависит процент явки на выборах от доли сельского населения и размера заработной платы. Таким образом, увеличение доли сельского населения, принимающего участие в голосовании, на 1 единицу, влечет повышение явки почти на 0,2%. Однако обратная ситуация наблюдается с другим предиктором — среднемесячной заработной платы работников организаций. В этом случае, увеличение размера среднемесячной заработной платы на 1 единицу не приводит к росту электоральной активности, напротив, процент явки снижается на 0,004%.

Коэффициент детерминации, отражающий меру качества полученной в ходе анализа регрессионной модели, которая описывает связь между зависимой переменной и независимыми переменными, составил 0,179. Это показывает, что только примерно 18% отобранных данных, включенных в модель, могут объяснить зависимую переменную, в нашем случае, явку.

Однако проведенные проверки модели на надежность (допущения) показали, что выбранные данные являются показательными и могут быть взяты в расчет для объяснения зависимой переменной. Построенная гистограмма остатков (отклонений наблюдаемых от ожидаемых значений), не отображает значительные выбросы и свидетельствует о хорошем согласовании с нормальным распределением. Проведенная проверка на наличии гетероскедастичности в модели показала, что модель является гомоскедастичной, т. е. подтверждается однородность и надежность используемых данных. Кроме того, проверка на мультиколлинеарность подтвердила предполагаемое отсутствие линейной связи между независимыми переменными.

Показать весь текст
Заполнить форму текущей работой