Статистический анализ.
Статистический анализ
Анализ полученных данных говорит о том, что группы предприятий по уровню цен отличаются от средней (Х= 12,9 млн руб.) в среднем на 2,34 млн руб. Значение коэффициента вариации не превышает 33%, следовательно, вариация по величине выпуска продукции не высока. На 96% фактор Х обусловлен фактором Y. Расчетное показывает умеренную линейную связь между Х и Y. Эмпирическое корреляционное отношение… Читать ещё >
Статистический анализ. Статистический анализ (реферат, курсовая, диплом, контрольная)
Сегодня статистика — это отрасль науки, которая с помощью присущих ей приемов и методов изучает количественную сторону (в неразрывной связи с качественной стороной) массовых явлений и процессов и дает числовое выражение тенденций и закономерностей их развития.
Многочисленные определения статистики как науки можно свести к двум вариантам: узкому и широкому.
В широком смысле статистика, как это явствует из данного определения, — наука, изучающая все массовые явления, т. е. явления, протекающие в совокупностях объектов, к какой бы области они ни относились. В этом можно видеть универсальное значение статистики как науки.
В более специальном, узком смысле статистика определяется как наука, исследующая с количественной стороны массовые общественные явления.
Как отрасль общественной науки и практической деятельности по получению, обработке, анализу и публикации информации она исследует количественное выражение закономерностей жизни общества в конкретных условиях места и времени. Сюда относятся, например, закономерности роста или снижения экономических, демографических, правовых и других данных, характеризующих жизнь общества за определенный период времени. Эти закономерности статистика выражает с помощью статистических показателей, из чего следует, что статистика — вместе с тем и учение о системе показателей, т. е. количественных характеристик, определяющих состояние (уровень) — тех или иных явлений.
Исходные данные
Имеются следующие выборочные данные по предприятиям одной из отраслей промышленности в отчетном году (выборка 20%-ная механическая):
№ предприятия. | Выпуск продукции, тыс. ед. | Затраты на производство продукции, млн. руб. | № предприятия. | Выпуск продукции, тыс. ед. | Затраты на производство продукции, млн. руб. |
16,000. | 18,240. | 14,890. | 17,612. | ||
14,000. | 17,080. | 11,210. | 13,970. | ||
10,500. | 13,440. | 14,160. | 17,666. | ||
15,200. | 17,850. | 15,530. | 17,980. | ||
15,080. | 18,170. | 16,980. | 19,266. | ||
17,000. | 19,210. | 15,630. | 17,940. | ||
15,220. | 17,936. | 13,540. | 16,335. | ||
17,840. | 19,580. | 12,290. | 15,250. | ||
18,200. | 19,440. | 13,120. | 15,860. | ||
16,040. | 18,860. | 20,150. | 21,000. | ||
15,100. | 17,818. | 12,570. | 15,250. | ||
14,200. | 17,040. | 15,220. | 17,784. | ||
12, 060. | 15,000. | 17,340. | 19,030. | ||
10,080. | 13,000. | 11,550. | 14,490. | ||
17,640. | 19,360. | 19,000. | 19,950. |
Задание 1
- 1. Постройте статистический ряд распределения предприятий по признаку — выпуск продукции, образовав пять групп с равными интервалами.
- 2. Постройте графики полученного ряда распределения: гистограмму и кумуляту. Графически определите значения моды и медианы.
- 3. Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, моду и медиану.
- 4. Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Решение:
Для того чтобы произвести группировку, необходимо вычислить величину группировочного интервала по формуле:
.
где и — соответственно max и min значения выпуска продукции, — число образуемых групп.
Группировку предприятий произведем в рабочей таблице 1.1.
Таблица 1.1.
Рабочая таблица с группировкой.
Группы. | Группы предприятий по выпуску продукции, млн.руб. | № предприятия. | Выпуск продукции, млн.руб. |
10,08−12,09. | 10,5. | ||
12,06. | |||
10,08. | |||
11,21. | |||
11,55. | |||
ИТОГО: | 55,4. | ||
12,09−14,1. | 14,000. | ||
13,54. | |||
12,29. | |||
13,12. | |||
12,57. | |||
ИТОГО: | 65,52. | ||
14,1−16,11. | |||
15,2. | |||
15,08. | |||
15,22. | |||
16,04. | |||
15,1. | |||
14,2. | |||
14,89. | |||
14,16. | |||
15,53. | |||
15,63. | |||
15,22. | |||
ИТОГО: | 182,27. | ||
16,11−18,12. | |||
17,84. | |||
17,64. | |||
16,98. | |||
17,34. | |||
ИТОГО: | 87,0. | ||
18,12−20,15. | 18,2. | ||
20,15. | |||
19,0. | |||
ИТОГО: | 57,35. | ||
Всего. | 447,54. |
Таблица 1.2.
Ряд распределения с накопленными частотами.
Группы, млн.руб. | Число предприятий. | Выпуск продукции, млн.руб. |
10,08−12,09. | 55,4. | |
12,09−14,1. | 65,52. | |
14,1−16,11. | 182,27. | |
16,11−18,12. | 87,0. | |
18,12−20,15. | 57,35. | |
Итого. | 447,54. |
Рисунок 1.1 Гистограмма, графическое определение моды
Рисунок 1.2 Кумулята, графическое определение медианы.
В интервальном вариационном ряду мода вычисляется по формуле:
где yo — нижняя граница модального интервала;
h — размер модального интервала;
fMo — частота модального интервала;
fMo-1 — частота интервала, стоящего перед модальной частотой;
fMo+1 — частота интервала, стоящего после модальной частоты.
В интервальном вариационном ряду медиана рассчитывается по формуле:
где yo — нижняя граница медианного интервала;
h — размер медианного интервала;
— половина от общего числа наблюдений;
SMe-1 — сумма наблюдений, накопленная до начала медианного интервала;
fMe — частота медианного интервала.
Определяем медианный интервал, в котором находится порядковый номер медианы (n).
он находиться в интервале 14,1−16,11.
Таблица 1.4.
Расчетная таблица для характеристики ряда.
Группы, млн.руб. | Середина интервального ряда, х | Число предприятий, f | xf | |
10,08−12,09. | 11,09. | 55,45. | 16,3805. | |
12,09−14,1. | 13,1. | 65,5. | 0,2. | |
14,1−16,11. | 15,11. | 181,32. | 58,6092. | |
16,11−18,12. | 17,12. | 85,6. | 89,042. | |
18,12−20,15. | 19,13. | 57,39. | 116,439. | |
Итого. | 387,87. | 164,232. |
Средняя арифметическая:
млн.руб.
Среднее квадратическое отклонение:
Коэффициент вариации:
%.
— уровень выпуска продукции по предприятиям однороден, т.к. 18,1%<33%.
Средняя арифметическая по исходным данным:
Средняя арифметическая взвешенная отличается от результата, полученного на основе средней арифметической простой. Это объясняется тем, что в расчете на основе ряда распределения мы уже не располагаем исходными индивидуальными данными, а вынуждены ограничиться лишь сведениями о величине середины интервала.
Анализ полученных данных говорит о том, что группы предприятий по уровню цен отличаются от средней (Х= 12,9 млн руб.) в среднем на 2,34 млн руб. Значение коэффициента вариации не превышает 33%, следовательно, вариация по величине выпуска продукции не высока.
Задание 2
По исходным данным:
- 1. Установите наличие и характер связи между признаками выпуск продукции и затраты на производство методом аналитической группировки, образовав пять групп с равными интервалами по факторному признаку.
- 2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполнения задания.
Установим наличие и характер связи между выпуском продукции и затратами на производство методом аналитической группировки. Аналитическая группировка показывает взаимосвязь между двумя признаками, один из которых будет рассматриваться как факторный, а другой как результативный. В данной задаче факторным признаком будет — выпуск продукции, а результативным признаком затраты производства.
Для установления наличия и характера связи строим итоговую аналитическую таблицу.
Таблица 2.1.
Итоговая аналитическая таблица
Группы, млн.руб. | Число предприятий. | Выпуск продукции, млн.руб. | Затраты производства, млн.руб. | Затраты производства в среднем на 1 предприятие, млн.руб. |
10,08−12,09. | 55,4. | 69,9. | 13,98. | |
12,09−14,1. | 65,52. | 79,775. | 15,955. | |
14,1−16,11. | 182,27. | 214,896. | 17,908. | |
16,11−18,12. | 87,0. | 96,446. | 19,29. | |
18,12−20,15. | 57,35. | 60,39. | 20,13. | |
Итого. | 447,54. | 467,407. | 15,58. |
Данные таблицы 2.1 показывают, чем больше выпуск продукции, тем больше затраты на производство. Следовательно, между исследуемыми признаками существует прямая зависимость.
Вычислим коэффициент детерминации и эмпирическое корреляционное отношение, для чего выполним некоторые расчеты.
Эмпирическое корреляционное отношение:
— межгрупповая дисперсия;
— общая дисперсия.
Теперь найдем общую дисперсию:
Среднее по пяти группам (из табл. 2.1):
Найдем межгрупповую дисперсию:
Дисперсия по первой группе:
Дисперсия по второй группе:
Дисперсия по третьей группе:
Дисперсия по четвертой группе:
Дисперсия по пятой группе:
Рассчитаем среднюю из внутригрупповых дисперсий:
Из полученных данных можем рассчитать коэффициент детерминации:
Эмпирическое корреляционное отношение рассчитывается по формуле:
Таким образом, связь между величиной затратами на производство и выпуска продукции очень сильная, так как изменение затрат на 92% зависит от изменения выпуска, а другие 8% - это уже влияние других факторов. По шкале Чеддока можно сделать вывод, что эта связь весьма тесная.
Таблица 2.2.
Данные для расчета коэффициента детерминации.
№ п/п. | Х (выпуск продукции, млн.руб.). | У (затраты производства, млн.руб.). | Х2 | У2 | ХУ. |
18,24. | 332,698. | 291,84. | |||
17,08. | 291,726. | 239,12. | |||
10,5. | 13,44. | 180,634. | 110,25. | 141,12. | |
15,2. | 17,85. | 318,623. | 231,04. | 271,32. | |
15,08. | 18,17. | 330,149. | 227,4064. | 274,0036. | |
19,21. | 369,024. | 326,57. | |||
15,22. | 17,936. | 321,7. | 231,6484. | 272,9859. | |
17,84. | 19,58. | 383,376. | 318,2656. | 349,3072. | |
18,2. | 19,44. | 377,914. | 331,24. | 353,808. | |
16,04. | 18,86. | 355,7. | 257,2816. | 302,5144. | |
15,1. | 17,818. | 317,481. | 228,01. | 269,0518. | |
14,2. | 17,04. | 290,362. | 201,64. | 241,968. | |
12,06. | 145,4436. | 180,9. | |||
10,08. | 101,6064. | 131,04. | |||
17,64. | 19,36. | 374,81. | 311,1696. | 341,5104. | |
14,89. | 17,612. | 310,183. | 221,7121. | 262,2427. | |
11,21. | 13,97. | 195,161. | 125,6641. | 156,6037. | |
14,16. | 17,666. | 312,088. | 200,5056. | 250,1506. | |
15,53. | 17,98. | 323,28. | 241,1809. | 279,2294. | |
16,98. | 19,266. | 371,179. | 288,3204. | 327,1367. | |
15,63. | 17,94. | 321,844. | 244,2969. | 280,4022. | |
13,54. | 16,335. | 266,832. | 183,3316. | 221,1759. | |
12,29. | 15,25. | 232,563. | 151,0441. | 187,4225. | |
13,12. | 15,86. | 251,54. | 172,1344. | 208,0832. | |
20,15. | 406,0225. | 423,15. | |||
12,57. | 15,25. | 232,563. | 158,0049. | 191,6925. | |
15,22. | 17,784. | 316,271. | 231,6484. | 270,6725. | |
17,34. | 19,03. | 362,141. | 300,6756. | 329,9802. | |
11,55. | 14,49. | 209,96. | 133,4025. | 167,3595. | |
19,95. | 398,003. | 379,05. | |||
Сумма. | 447,34. | 521,407. | 9182,8. | 6854,946. | 7921,411. |
Коэффициент детерминации.
Коэффициент детерминации показывает, что на 96% фактор Х обусловлен фактором Y. Расчетное показывает умеренную линейную связь между Х и Y. Эмпирическое корреляционное отношение показывает общую тесноту связи между Х и Y. Расчетное значение показывает умеренную тесноту связи.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
- 1. Среднюю и предельную ошибку выборки среднего размера выпуска продукции и границы, в которых будет находиться средний размер выпуска продукции в генеральной совокупности.
- 2. Среднюю и предельную ошибку выборки доли предприятий с размером выпуска продукции 16,11 млн руб. и более и границы, в которых будет находиться генеральная доля.
Решение:
Известен процент выборки m = 0,1.
Средняя ошибка выборки.
Известна вероятность Р = Ф (t) = 0,954; тогда t (из таблицы Лапласа) = 2.
Предельная ошибка выборки Тогда искомые границы для ср. значения Искомая доля.
Тогда средняя ошибка выборки для доли.
Предельная ошибка выборки для доли Тогда искомые границы для доли Генеральная доля находится в границах (0,11; 0,43) или от 11% до 43%.
Задание 4.
Планом предприятия предусматривалось увеличение выпуска продукции на 8%, фактически произведено на 6% больше, чем в базисном периоде.
Определите процент выполнения плана по выпуску продукции.
Процент выполнения плана составит: 6/8*100=75%.
Задание 5
Имеются следующие данные о продаже товаров в магазинах:
базисный период. | Отчетный период. | |||
Товары. | продано, кг. | цена, руб./кг. | продано, кг. | цена, руб./кг. |
Картофель. | ||||
Морковь. | ||||
Капуста. |
Определите по трем товарам вместе индекс цен, индекс физического объема товарооборота и индекс розничного товарооборота.
Решение:
Общий индекс цен:
или 131,5%.
Цены в отчетном периоде, по сравнению с базисным периодом в среднем по трем товарам увеличились на 31,5%.
Общий индекс физического объема:
статистический индекс группировка распределение.
или 106,4%.
Физический объем в среднем по трем товарам, в отчетном периоде по сравнению с базисным периодов увеличился на 6,4%.
Общий индекс розничного товарооборота:
или 139,9%.
Общий индекс розничного товарооборота в отчетном периоде в среднем увеличился на 39,9%.
Заключение
В результате выполнения задания 1, 2 и 3 были сделаны следующие выводы:
Средняя арифметическая взвешенная отличается от результата, полученного на основе средней арифметической простой. Это объясняется тем, что в расчете на основе ряда распределения мы уже не располагаем исходными индивидуальными данными, а вынуждены ограничиться лишь сведениями о величине середины интервала.
Группы предприятий по уровню цен отличаются от средней (Х= 12,9 млн руб.) в среднем на 2,34 млн руб. Значение коэффициента вариации не превышает 33%, следовательно, вариация по величине выпуска продукции не высока.
Связь между величиной затратами на производство и выпуска продукции очень сильная, так как изменение затрат на 92% зависит от изменения выпуска, а другие 8% - это уже влияние других факторов. По шкале Чеддока можно сделать вывод, что эта связь весьма тесная.
На 96% фактор Х обусловлен фактором Y. Расчетное показывает умеренную линейную связь между Х и Y. Эмпирическое корреляционное отношение показывает общую тесноту связи между Х и Y. Расчетное значение показывает умеренную тесноту связи.
Генеральная доля находится в границах (0,11; 0,43) или от 11% до 43%.
В результате выполнения задания 4 было выявлено, процент выполнения плана составляет 75%.
В результате выполнения задания 5 были сделаны следующие выводы:
Цены в отчетном периоде, по сравнению с базисным периодом в среднем по трем товарам увеличились на 31,5%.
Физический объем в среднем по трем товарам, в отчетном периоде по сравнению с базисным периодов увеличился на 6,4%.
Общий индекс розничного товарооборота в отчетном периоде в среднем увеличился на 39,9%.
Список используемой литературы
- 1. Гусаров В. М. Теория статистики: учеб. М., Изд-во Юнити, 2010. 463 с.
- 2. Сборник задач по теории статистики: Учебное пособие / Под ред.проф. В. В. Глинского. изд. 3-е. М.: ИНФРА — М; Новосибирск: Сибирское соглашение, 2006. 257 с.
- 3. Статистика: Учебник / И. И. Елисеева, А. В. Изотов, Е. Б. Капралова; под ред. И. И. Елисеевой. М.: КНОРУС, 2006. 552 с.
- 4. Статистика: Учебник / Под ред. И. И. Елисеевой. М.: Высшее образование, 2006. 565 с.
- 5. Шмойлова Р. А. Практикум по теории статистики: учеб. пособ. М., Изд-во Финансы и статистика, 2011. 656 с.