Обработка статистических данных
Эмитент — это юридическое лицо, орган местного самоуправления или исполнительной власти, которое от своего имени выпускает денежные знаки, платежные карты или ценные бумаги для финансирования или развития своей деятельности. Воспользовавшись правом эмиссии (предъявляется на определенных условиях), эмитент берет на себя обязательства по предоставлению прав, закрепленных выпущенными ценными… Читать ещё >
Обработка статистических данных (реферат, курсовая, диплом, контрольная)
(Эмитент (англ. issuer) — организация, выпустившая (эмитировавшая) ценные бумаги для развития и финансирования своей деятельности.
Эмитент — это юридическое лицо, орган местного самоуправления или исполнительной власти, которое от своего имени выпускает денежные знаки, платежные карты или ценные бумаги для финансирования или развития своей деятельности. Воспользовавшись правом эмиссии (предъявляется на определенных условиях), эмитент берет на себя обязательства по предоставлению прав, закрепленных выпущенными ценными бумагами, их владельцам. В числе ценных бумаг, выпускаемых по эмиссии: дорожные чеки, акции, облигации, кредитные карты.)
В данной работе была произведена обработка и анализ статистических данных — стоимость чистых активов эмитента, млн. руб; и производительности труда, тыс. руб/чел за 2010;2013 г. г.
Целью данной контрольной является освоение инструментов статистики для дальнейшего применения в решении управленческих задач.
В качестве задач контрольной работы можно выделить:
— приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений;
— овладение навыками группирования выборочных данных различными способами;
— графическое построение ряда распределения и определение средних величин;
— развитие аналитических навыков в ходе проведения анализа взаимосвязи выбранных данных.
По результатам данной контрольной были изучены в практическом и теоретическом плане различные статистические показатели, основные методы построения графиков и таблиц.
1. Общая характеристика исследуемой совокупности Описание данных, источник получения, рассматриваемый период и пространственные рамки.
В данной курсовой работе рассматривается следующий показатель: стоимость чистых активов эмитента, млн. руб; и производительности труда, тыс. руб/чел за 2010;2013 г. г. На основе полученных данных выполнена простая сводка. Задачей сводки является выявление типичных черт и взаимосвязи между исследуемыми признаками.
2. Характеристика используемых статистических показателей, в том числе вид и единица измерения, тип (интервальный или моментный) Путем непосредственного суммирования первичных данных получают обобщающие абсолютные показатели, которые характеризуют площадь совокупности и объем (размер) изучаемого явления в конкретных границах времени и места.
Абсолютные показатели являются всегда именованными числами, т. е. имеют какую-либо единицу измерения.
Таким образом, абсолютные величины получают непосредственным подсчётом данных статистического наблюдения или расчётным путем. Сопоставление статистических данных осуществляется в различных формах и по разным направлениям. В соответствии с различными задачами и направлениями сопоставления статистических данных применяются различные виды относительных величин. Цели направления исследования определяют выбор вида относительных величин.
Важно отметить, что в процессе экономико-статистического анализа абсолютные и относительные величины должны рассматриваться во взаимосвязи, то есть пользоваться относительными величинами нужно не формально, а представлять, какая абсолютная величина скрывается за каждым относительным показателем.
2.1 Обоснование размера выборки (обеспечивающий необходимый уровень ошибки) Выборочное наблюдение наиболее часто используется в статистике, так как полученные таким способом данные можно распространить на всю совокупность, так же такое распространение обоснованно как статистически так и математически. В данном случае выборочное наблюдение так же повышает точность данных за счёт уменьшения числа единиц наблюдения (снижение ошибок регистрации). Неоспоримым плюсом выборочного наблюдения является высокая достоверность его результатов.
Будем производить выборку случайным способом отбора, так как данный способ имеет ряд преимуществ:
1. Это наиболее простой способ.
2. Данный способ отбора обеспечивает достаточную репрезентативность.
Метод отбора — бесповторный, то есть единица, попавшая в выборку, не возвращается обратно в исходную совокупность.
2.2 Проведение выборки одним из способов бесповторным методом Таблица Выборка, полученная собственно-случайным способом (n=12)
квартал, год | стоимость чистых активов эмитента, млн. руб | производительность труда, тыс. руб/чел. | |
1кв.2010 | 209,58 | 104,76 | |
2кв.2010 | 198,65 | 218,15 | |
3кв.2010 | 218,52 | 337,2 | |
1кв.2011 | 256,46 | 154,9 | |
2кв.2011 | 254,2 | 341,92 | |
3кв.2011 | 267,99 | 543,66 | |
1кв.2012 | 200,73 | 220,73 | |
2кв.2012 | 317,83 | 407,82 | |
3кв.2012 | 176,29 | 624,01 | |
1кв.2013 | 187,34 | 229,25 | |
2кв.2013 | 291,51 | 431,66 | |
3кв.2013 | 177,91 | 659,15 | |
3. Оценка среднего значения каждого показателя Средняя величина — это обобщающая характеристика количественно и качественно однородной совокупности в определенных условиях. Средняя величина определяется по какому-либо признаку. Средняя величина проявляется в результате действия закона больших чисел, когда в массовых совокупностях индивидуальные отклонения от типичного уровня взаимопогашаются. Средняя величина позволяет заменить множество значений показателей одним типичным, что значительно упрощает последующий анализ явлений.
Расчёт средней величины по сгруппированным данным осуществим по формуле средней арифметической взвешенной:
4) Оценка структурных средних (моды, медианы) на основе структурной группировки.
Проведем расчет и сравнительный анализ средних по результатам структурной группировки.
А) Мода. Произведем расчет моды.
где x0 — начало модального интервала; h — величина интервала; f2 -частота, соответствующая модальному интервалу; f1 — предмодальная частота; f3 — послемодальная частота.
Выбираем в качестве начала интервала 209.58, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда — 104.76
Б) Медиана. Произведём расчет медианы.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше? f/2 = 2137. Это значение xi = 317.83. Таким образом, медиана равна 317.83
гистограмма медиана группировка показатель
4. Оценка показателей вариации
4.1 Абсолютные показатели вариации. Произведём расчет абсолютных показателей вариации по таблице 1.1
Размах вариации
R = Xmax — Xmin
R = 317.83 — 176.29 = 141.54
Размах квартилей.
Квартили — это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.
Находим xi, при котором накопленная частота S будет больше? f/4 = 1069. Это значение xi = 254.20.
Таким образом, первый квартиль равен 254.20
25% единиц совокупности будут меньше по величине 254.20
Q2 совпадает с медианой, Q2 = 317.83
Находим xi, при котором накопленная частота S будет больше ?3f/4 = 3207. Это значение xi = 291.51. Таким образом, третий квартиль равен 291.51
Среднее линейное отклонение.
Среднее линейное отклонение — вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 81.57
Дисперсия и среднеквадратичное отклонение. Произведем расчет простой дисперсии по формуле: дисперсия — характеризует меру разброса около ее среднего значения (мера рассеивания, т. е. отклонения от среднего).
Среднеквадратичное отклонение:
4.2 Относительные показатели вариации К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение. Коэффициент вариации — мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v? 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
Линейный коэффициент вариации или Относительное линейное отклонение — характеризует долю усредненного значения признака абсолютных отклонений от средней величины.
Коэффициент осцилляции — отражает относительную колеблемость крайних значений признака вокруг средней.
Графическое представление распределения значений (гистограмма, куммулята). Графическое построение моды и медианы Таблица
Группы | Середина интервала, xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x — xср|*f | (x — xср)2*f | Частота, fi/n | |
209.58 — 104.76 | 157.17 | 157.17 | 135.76 | 18 430.21 | 0.0833 | |||
198.65 — 218.15 | 208.4 | 208.4 | 84.53 | 7144.97 | 0.0833 | |||
218.52 — 337.21 | 277.87 | 277.87 | 15.06 | 226.89 | 0.0833 | |||
256.46 — 154.91 | 205.69 | 205.69 | 87.24 | 7611.33 | 0.0833 | |||
254.20 — 341.93 | 298.07 | 298.07 | 5.14 | 26.39 | 0.0833 | |||
267.99 — 543.67 | 405.83 | 405.83 | 112.9 | 12 746.88 | 0.0833 | |||
200.73 — 220.73 | 210.73 | 210.73 | 82.2 | 6756.5 | 0.0833 | |||
317.83 — 407.82 | 362.83 | 362.83 | 69.9 | 4885.6 | 0.0833 | |||
176.29 — 624.01 | 400.15 | 400.15 | 107.22 | 11 496.58 | 0.0833 | |||
187.34 — 229.25 | 208.3 | 208.3 | 84.63 | 7162.73 | 0.0833 | |||
291.51 — 431.66 | 361.59 | 361.59 | 68.66 | 4713.8 | 0.0833 | |||
177.92 — 659.15 | 418.54 | 418.54 | 125.61 | 15 777.14 | 0.0833 | |||
Итого | 3515.14 | 978.85 | 96 979.01 | |||||
Гистограмма куммулята Построим куммуляту распределения по данным таблицы 1.2
Оценка абсолютных и относительных показателей динамики для выбранного показателя. Цепные и базисные: абсолютный прирост, темп роста, темп прироста. Абсолютное ускорение, средний уровень ряда, средний абсолютный прирост, средний темп роста, средний темп прироста.
Важнейшим статистическим показателем динамики является абсолютный прирост, который определяется в разностном сопоставлении двух уровней ряда динамики в единицах измерения исходной информации.
Абсолютный прирост цепной прирост
?yц = yi — yi-1
базисный прирост
?yб = yi — y1
Темпы прироста характеризуют абсолютный прирост в относительных величинах. Исчисленный в процентах темп прироста показывает, на сколько процентов изменился сравниваемый уровень с уровнем, принятым за базу сравнения.
Темп прироста цепной темп прироста
Tпрцi = ?yi / yi-1
базисный темп прироста
Tпpб = ?yбi / y1
Распространенным статистическим показателем динамики является темп роста. Он характеризует отношение двух уровней ряда и может выражаться в виде коэффициента или в процентах.
Темп роста цепной темп роста
Tpцi = yi / yi-1
базисный темп роста
Tpб = yбi / y1
Абсолютное значение 1% прироста цепной: 1%цi = yi-1 / 100%
базисный: 1%б = yб / 100%
Темп наращения
Tн = ?yцi / y1
Таблица Цепные показатели ряда динамики
Период | стоимость чистых активов | Абсолютный прирост | Темп прироста, % | Темпы роста, % | Абсолютное содержание 1% прироста | Темп наращения, % | |
209.58 | ; | ; | 2.1 | ||||
198.65 | — 10.93 | — 5.22 | 94.78 | 2.1 | — 5.22 | ||
218.52 | 19.87 | 1.99 | 9.48 | ||||
256.46 | 37.94 | 17.36 | 117.36 | 2.19 | 18.1 | ||
254.2 | — 2.26 | — 0.88 | 99.12 | 2.56 | — 1.08 | ||
267.99 | 13.79 | 5.42 | 105.42 | 2.54 | 6.58 | ||
200.73 | — 67.26 | — 25.1 | 74.9 | 2.68 | — 32.09 | ||
317.83 | 117.1 | 58.34 | 158.34 | 2.01 | 55.87 | ||
176.29 | — 141.54 | — 44.53 | 55.47 | 3.18 | — 67.54 | ||
187.34 | 11.05 | 6.27 | 106.27 | 1.76 | 5.27 | ||
291.51 | 104.17 | 55.6 | 155.6 | 1.87 | 49.7 | ||
177.91 | — 113.6 | — 38.97 | 61.03 | 2.92 | — 54.2 | ||
Итого | 2757.01 | ||||||
В 12 по сравнению с 11 стоимость чистых активов уменьшилось на 113.6 млн. руб или на 38.97%
Максимальный прирост наблюдается в 8 (117.1 млн. руб) Минимальный прирост зафиксирован в 9 (-141.54 млн. руб) Темп наращения показывает, что тенденция ряда возрастающая, что свидетельствует об ускорении стоимость чистых активов Таблица Базисные показатели ряда динамики
Период | стоимость чистых активов | Абсолютный прирост | Темп прироста, % | Темпы роста, % | |
209.58 | ; | ; | |||
198.65 | — 10.93 | — 5.22 | 94.78 | ||
218.52 | 8.94 | 4.27 | 104.27 | ||
256.46 | 46.88 | 22.37 | 122.37 | ||
254.2 | 44.62 | 21.29 | 121.29 | ||
267.99 | 58.41 | 27.87 | 127.87 | ||
200.73 | — 8.85 | — 4.22 | 95.78 | ||
317.83 | 108.25 | 51.65 | 151.65 | ||
176.29 | — 33.29 | — 15.88 | 84.12 | ||
187.34 | — 22.24 | — 10.61 | 89.39 | ||
291.51 | 81.93 | 39.09 | 139.09 | ||
177.91 | — 31.67 | — 15.11 | 84.89 | ||
Итого | 2757.01 | ||||
В 12 по сравнению с 1 стоимость чистых активов уменьшилось на 31.67 млн. руб или на 15.11%
Расчет средних характеристик рядов.
Средний уровень интервального ряда рассчитывается по формуле:
Среднее значение стоимость чистых активов с 1 по 12 составило 229.75 млн руб. Средний темп роста В среднем за весь период рост анализируемого показателя составил 0.99
Средний темп прироста В среднем с каждым периодом стоимость чистых активов сокращался на 1%.
Средний абсолютный прирост С каждым периодом стоимость чистых активов в среднем уменьшалось на 2.88 млн руб.
5. Выравнивание ряда методом скользящей средней Одним из эмпирических методов является метод скользящей средней. Этот метод состоит в замене абсолютных уровней ряда динамики их средними арифметическими значениями за определенные интервалы.
Таблица
t | y | ys | Формула | (y — ys)2 | |
209.58 | ; | ; | ; | ||
198.65 | ; | ; | ; | ||
218.52 | 227.48 | (209.58 + 198.65 + 218.52 + 256.46 + 254.20)/5 | 80.32 | ||
256.46 | 239.16 | (198.65 + 218.52 + 256.46 + 254.20 + 267.99)/5 | 299.15 | ||
254.2 | 239.58 | (218.52 + 256.46 + 254.20 + 267.99 + 200.73)/5 | 213.74 | ||
267.99 | 259.44 | (256.46 + 254.20 + 267.99 + 200.73 + 317.83)/5 | 73.07 | ||
200.73 | 243.41 | (254.20 + 267.99 + 200.73 + 317.83 + 176.29)/5 | 1821.41 | ||
317.83 | 230.04 | (267.99 + 200.73 + 317.83 + 176.29 + 187.34)/5 | 7707.79 | ||
176.29 | 234.74 | (200.73 + 317.83 + 176.29 + 187.34 + 291.51)/5 | 3416.4 | ||
187.34 | 230.18 | (317.83 + 176.29 + 187.34 + 291.51 + 177.91)/5 | 1834.92 | ||
291.51 | ; | ; | ; | ||
177.91 | ; | ; | ; | ||
15 446.81 | |||||
Стандартная ошибка (погрешность) рассчитывается по формуле где i = (t-m-1, t)
Выявление наличия тренда в рассматриваемых рядах (проверка гипотезы о разности средних у первой и второй половины ряда).
При выборе вида функции тренда можно воспользоваться методом конечных разностей (обязательным условием применения данного подхода является равенство интервалов между уровнями ряда).
Конечными разностями первого порядка являются разности между последовательными уровнями ряда:
?1t = Yt — Yt-1
Конечными разностями второго порядка являются разности между последовательными конечными разностями1-го порядка:
?2t = ?1t — ?1t-1
Конечными разностями j-го порядка являются разности между последовательными конечными разностями (j-1)-го порядка:
?jt = ?j-1t — ?j-1t-1
Если общая тенденция выражается линейным уравнением Y = a + bt, тогда конечные разности первого порядка постоянны: ?12 = ?13 = … = ?1n, а разности второго порядка равны нулю.
Если примерно постоянными оказываются темпы роста, то для выравнивания применяется показательная функция.
Таблица
yi | ?1t | ?2t | Темп роста | |
104.76 | ; | ; | ; | |
218.15 | 113.39 | ; | 2.08 | |
337.2 | 119.05 | 5.66 | 1.55 | |
154.9 | — 182.3 | — 301.35 | 0.46 | |
341.92 | 187.02 | 369.32 | 2.21 | |
543.66 | 201.74 | 14.72 | 1.59 | |
220.73 | — 322.93 | — 524.67 | 0.41 | |
407.82 | 187.09 | 510.02 | 1.85 | |
624.01 | 216.19 | 29.1 | 1.53 | |
229.25 | — 394.76 | — 610.95 | 0.37 | |
431.66 | 202.41 | 597.17 | 1.88 | |
659.15 | 227.49 | 25.08 | 1.53 | |
Линейное уравнение $ имеет вид
y = a1t + a0
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1? t = ?y
a0?t + a1? t2 = ?y * t
Таблица
t | y | t2 | y2 | t y | |
209.58 | 104.76 | 43 923.78 | 10 974.66 | 21 955.6 | |
198.65 | 218.15 | 39 461.82 | 47 589.42 | 43 335.5 | |
218.52 | 337.2 | 47 750.99 | 113 703.84 | 73 684.94 | |
256.46 | 154.9 | 65 771.73 | 23 994.01 | 39 725.65 | |
254.2 | 341.92 | 64 617.64 | 116 909.29 | 86 916.06 | |
267.99 | 543.66 | 71 818.64 | 295 566.2 | 145 695.44 | |
200.73 | 220.73 | 40 292.53 | 48 721.73 | 44 307.13 | |
317.83 | 407.82 | 101 015.91 | 166 317.15 | 129 617.43 | |
176.29 | 624.01 | 31 078.16 | 389 388.48 | 110 006.72 | |
187.34 | 229.25 | 35 096.28 | 52 555.56 | 42 947.7 | |
291.51 | 431.66 | 84 978.08 | 186 330.36 | 125 833.21 | |
177.91 | 659.15 | 31 651.97 | 434 478.72 | 117 269.38 | |
2757.01 | 4273.21 | 657 457.53 | 1 886 529.42 | 981 294.77 | |
Для наших данных система уравнений имеет вид:
12a0 + 2757.01a1 = 4273.21
2757.01a0 + 657 457.53a1 = 981 294.77
Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a0 = 360.678, a1 = -0.0199
Уравнение тренда:
y = -0.0199 t + 360.678
Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов? i, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Коэффициент тренда b = -0.0199 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением tна 1 единицу, y изменится в среднем на -0.0199.
6. Аналитическое выравнивание (построение тренда), прогноз при помощи тренда на 3 периода вперед Данные для прогноза при помощи тренда смотри выше.
Определим среднеквадратическую ошибку прогнозируемого показателя.
Uy = yn+L ± K
где
L — период упреждения; уn+L — точечный прогноз по модели на (n + L)-й момент времени; n — количество наблюдений во временном ряду; Sy — стандартная ошибка прогнозируемого показателя; Tтабл — табличное значение критерия Стьюдента для уровня значимости? и для числа степеней свободы, равного n-2.
По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;?/2) = (10;0.025) = 2.228
Точечный прогноз, t = 178.91: y (178.91) = -0.0195*178.91 + 360.58 = 357.09
357.09 — 499.7 = -142.61; 357.09 + 499.7 = 856.79
Интервальный прогноз:
t = 178.91: (-142.61;856.79)
Точечный прогноз, t = 179.91: y (179.91) = -0.0195*179.91 + 360.58 = 357.07
357.07 — 517.13 = -160.06; 357.07 + 517.13 = 874.2
Интервальный прогноз:
t = 179.91: (-160.06;874.2)
Точечный прогноз, t = 180.91: y (180.91) = -0.0195*180.91 + 360.58 = 357.05
357.05 — 536.37 = -179.32; 357.05 + 536.37 = 893.42
Интервальный прогноз:
t = 180.91: (-179.32;893.42)
Заключение
В результате проделанной работы по многостороннему исследованию совокупности, состоящей из 12 данных по стоимости чистых активов и производительности труда, выяснилось что средняя арифметическая взвешенная равна 292,93.
При построении гистограммы графически удалось отметить наличие правосторонней, т. е. положительной асимметрии.
По данным абсолютных и относительных показателей динамики, можно сделать вывод, что среднее значение стоимости активов составит 229,75 млн руб. Рост показателей с 1 по 12 составит 0,99, а стоимость чистых активов в среднем уменьшается на 2,88 млн руб.
Выполнение данной контрольной работы позволило приобрести навыки по обработке статистических данных и построению графиков.
1. Гусарев В. М. Теория статистики. — М.: ЮНИТИ, 1998.
2. Чернова Т. В. Экономическая статистика: Учебное пособие. Таганрог: Изд-во ТРТУ, 1999.
3. Бархатов В. И., Плетнев Д. А. Статистика. Учебно-методический комплекс. Челябинск, 2005.
4. Статистика: учебно-практическое пособие. Под ред. М. Г. Назарова. 2е изд. М.: КНОРУС, 2008.
5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник для вузов по экономическим специальностям/ под ред. О. Э. Башиной, А. А. Спирина — М.: Финансы и статистика, 2000.
.ur