Построение интервального ряда распределения
Если составляется интервальный ряд с ровными интервалами, то размах вариации делится на указанное число интервалов. При этом, если полученное значение целое и однозначное (что бывает редко), то длина интервала принимается равной этому числу. В остальных случаях производится округление обязательно в сторону увеличения, так чтобы последняя оставляемая цифра была чётной. Очевидно, с увеличением… Читать ещё >
Построение интервального ряда распределения (реферат, курсовая, диплом, контрольная)
ЗАДАЧА 1
Имеются следующие данные о заработной плате работников на предприятии:
Таблица 1.1.
Размер заработной платы в усл. ден. ед. | ||
Требуется построить интервальный ряд распределения, по которому найти;
- 1) среднюю заработную плату;
- 2) среднее линейное отклонение;
- 4) среднее квадратическое отклонение;
- 5) размах вариации;
- 6) коэффициент осцилляции;
- 7) линейный коэффициент вариации;
- 8) простой коэффициент вариации;
- 9) моду;
- 10) медиану;
- 11) коэффициент асимметрии;
- 12) показатель асимметрии Пирсона;
- 13) коэффициент эксцесса.
Решение
Как известно, варианты (значения признано) расположены в порядке возрастания образуют дискретный вариационный ряд. При большом числе вариант (больше 10) даже в случае дискретной вариации строятся интервальные ряды.
Если составляется интервальный ряд с ровными интервалами, то размах вариации делится на указанное число интервалов. При этом, если полученное значение целое и однозначное (что бывает редко), то длина интервала принимается равной этому числу. В остальных случаях производится округление обязательно в сторону увеличения, так чтобы последняя оставляемая цифра была чётной. Очевидно, с увеличением длины интервала расширяется размах вариации на величину, равной произведению числа интервалов: на разность расчетной и первоначальной длины интервала
Далее поступают так:
- а) Если величина расширения размаха вариации незначительна, то ее либо прибавляют к наибольшему либо вычитают из наименьшего значения признака;
- б) Если величина расширения размаха вариации ощутима, то, чтобы не произошло смешения центра размаха, ее примерно делят пополам одновременно прибавляя к наибольшему и вычитая из наименьшего значений признака.
Если составляется интервальный ряд с неравными интервалами, то процесс упрощается, но по-прежнему длина интервалов должна выражаться числом с последней чётной цифрой, что значительно упрощает последующие расчёты числовых характеристик.
= 30 — объем выборки.
Составим интервальный ряд распределения, используя формулу Стерджеса :
K = 1 + 3.32*lg n,.
K — число групп;
K = 1 + 3.32*lg 30 = 5,91=6.
Находим размах признака — заработная плата работников на предприятии — (х) по формуле.
R= xmaх — xmin и делим на 6; R= 195−112=83.
Тогда длина интервала будет lпер=83:6=13.83.
Началом первого интервала будет 112. Прибавляя к 112 lрас=13,83, получим его конечное значение 125,83, которое одновременно является началом второго интервала и т. д. конец пятого интервала — 195.
Далее находим частоты (количество значений признака попадающих в интервал) и накопительные частоты каждого полученного интервала.
При нахождении частот следует руководствоваться правилом: «если значение признака совпадает с границей внутреннего интервала, то его следует относить к предыдущему интервалу».
Получим интервальный ряд частот и накопительных частот.
Таблица 1.2.
интервал. | 112−125,83. | 125,83−139,66. | 139,66−153,49. | 153,49−167,32. | 167,32−181,15. | 181,15−195. | |
частота. | |||||||
Накопит. частота. | |||||||
Следовательно, 3 работника имеют зар. плату от 112 до 125,83 усл.ден.ед. Наибольшая зар. плата от 181,15 до 195 усл.ден.ед. только у 6-ті работников.
Для расчёта числовых характеристик интервальный ряд преобразуем в дискретный, взяв в качестве вариант середины интервалов:
Таблица 1.3.
xi. | 118,915. | 132,745. | 146,575. | 160,405. | 174,235. | 188,075. | сумма. | |
mi. | ||||||||
xi mi. | 356,745. | 398,235. | 732,875. | 1122,835. | 1045,41. | 1128,45. | 4784,55. | |
121,71. | 80,22. | 64,55. | 6,44. | 88,5. | 171,54. | 532,96. | ||
4937,7747. | 2145,0828. | 833,3405. | 5,9248. | 1305,375. | 4904,3286. | 14 131,83. | ||
По формуле взвешенного среднего арифметического.
Находим.
усл.ден.ед.
Среднее линейное отклонение:
L =.
где xi — значение изучаемого признака у i-той единицы совокупности,.
— средняя величина изучаемого признака.
= усл.ден.ед.
Среднее квадратическое отклонение:
у =.
Дисперсия:
у2 =.
Относительный размах вариации (коэффициент осцилляции): с= R,.
Относительное линейное отклонение: q = L :
Коэффициент вариации: V = у :
Коэффициент осцилляции показывает относительную колеблемость крайних значений признака около среднего арифметического, а коэффициент вариации характеризует степень и однородности совокупности.
с= R: = 83 / 159,485*100% = 52,043%.
Таким образом, разница между крайними значениями на 5,16% (=94,84%-100%) меньше среднего значения заработной платы работников на предприятии.
q = L: = 17,765/ 159,485*100% =11,139%.
V = у: = 21,704/ 159,485*100% = 13,609%.
Коэффициент вариации меньше 33%, что говорит о слабой вариации заработной платы работников на предприятии, т. е. о том, что средняя величина является типической характеристикой заработной плате работников (совокупность однородная).
В интервальных рядах распределения мода определяется по формуле ;
.
где.
— частота модального интервала, т. е. интервала, содержащего наибольшее число вариант;
— частота интервала, предшествующего модальному;
— частота интервала, следующего за модальным;
— длина модального интервала;
— нижняя граница модального интервала.
Для определения медианы в интервальном ряду воспользуемся формулой.
.
где — кумулятивная (накопленная) частота интервала, предшествующего медианному;
— нижняя граница медианного интервала;
— частота медианного интервала;
— длина медианного интервала.
Медианный интервал — интервал, накопленная частота которого (=3+3+5+7) превышает половину суммы частот — (153,49; 167,32).
.
Рассчитаем асимметрию и эксцесс для чего составим новую рабочую таблицу:
Таблица 1.4.
Фактические данные. | Расчетные данные. | ||||||
xi. | mi. | ||||||
118,915. | — 40,57. | — 66 775,1732. | — 200 326. | 2 709 068,78. | |||
132,745. | — 26,74. | — 19 119,838. | — 57 359,5. | 511 264,469. | |||
146,575. | — 12,91. | — 2151,68 517. | — 10 758,4. | 27 778,2556. | 138 891,3. | ||
160,405. | 0,92. | 0,778 688. | 5,450 816. | 0,71 639 296. | 5,14 751. | ||
174,235. | 14,75. | 3209,46 875. | 19 254,28. | 47 333,4414. | 284 000,6. | ||
188,075. | 28,59. | 23 369,12578. | 140 214,8. | 668 123,306. | |||
Итого. | ; | ; | — 108 969. | 3 963 568,96. | |||
Рассчитаем момент третьего порядка.
Следовательно, асимметрия равна.
Так как 0,3553 0,25, то асимметрия признается значительной.
Рассчитаем момент четвертого порядка.
.
Следовательно, эксцесс равен.
Так как < 0, то эксцесс является плосковершинным.
Степень асимметрии может быть определена с помощью коэффициента асимметрии Пирсона (Аs): осцилляция выборка стоимость товарооборот.
где — средняя арифметическая ряда распределения; — мода; — среднее квадратическое отклонение.
При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.
Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.
Распределение не является симметричным, а имеет левостороннюю асимметрию.
ЗАДАЧА 2
Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,04, если на основе предыдущих обследований известно, что дисперсия равна 0,24?
Решение
Объем выборки при бесповторном отборе рассчитывается по формуле:
n =.
t — коэффициент доверия (при вероятности 0,954 он равен 2,0; определяется по таблицам интегралов вероятности),.
у2=0,24 — среднее квадратическое отклонение;
=10 000 чел. — численность выборки;
Дх =0,04 — предельная ошибка выборочной средней.
семей.
С вероятностью 95,4% можно утверждать, что численность выборки, обеспечивающая относительную погрешность не более 0,04, должна составлять не менее 566 семей.
ЗАДАЧА 3
Имеются следующие данные о доходах от основной деятельности предприятия, млн. руб.
Для анализа ряда динамики определите следующие показатели:
- 1) цепные и базисные:
- — абсолютные приросты;
- — темпы роста;
- — темпы прироста;
- 2) средний
- — уровень ряда динамики;
- — абсолютный прирост;
- — темп роста;
- — темп прироста;
- 3) абсолютное значение 1% прироста.
Решение
1. Абсолютный прирост (Ду) — это разность между последующим уровнем ряда и предыдущим (или базисным):
цепной: Ду = уi — yi-1,.
базисный: Ду = уi — y0,.
где уi — уровень ряда,.
i — номер уровня ряда,.
y0 — уровень базисного года.
2. Темп роста (Ту) — это отношение последующего уровня ряда и предыдущего (или базисного 2001 г.):
цепной: Ту = ;
базисный: Ту =.
3. Темп прироста (ТД) — это отношение абсолютного прироста к предыдущему уровню, выраженное в %.
цепной: Ту = ;
базисный: Ту =.
4. Абсолютное значение 1% прироста (А) — это отношение цепного абсолютного прироста к темпу прироста, выраженному в %.
А =.
Средний уровень ряда рассчитывается по формуле средней арифметической.
Средний уровень доходов от основной деятельности за 4 года:
= =.
Средний абсолютный прирост рассчитывается по формуле:
Ду =.
где n — число уровней ряда.
Ду =.
В среднем за год доходы от основной деятельности выросли на 3,333 млн руб.
Среднегодовой темп роста рассчитывается по формуле средней геометрической:
Ту =.
где.
уn — конечный уровень ряда, у0 — начальный уровень ряда.
Ту = 100% = 102,174%.
Среднегодовой темп прироста рассчитывается по формуле:
Т? = Ту — 100% = 102,74% - 100% = 2,74%.
Таким образом, в среднем за год доходы от основной деятельности предприятия увеличивались на 2,74%.
ЗАДАЧА 4
Вычислить:
- 1. Индивидуальные индексы цен;
- 2. Общий индекс товарооборота;
- 3. Агрегатный индекс цен;
- 4. Агрегатный индекс физического объема продажи товаров;
- 5. Абсолютный прирост стоимости товарооборота и разложите по факторам (за счет изменения цен и количества проданных товаров);
- 6. Сделать краткие выводы по всем полученным показателям.
Решение.
1. По условию, индивидуальные индексы цен по изделиям А, Б, В составили ;
iрA=1.20; iрБ=1,15; iрВ=1.00.
2. Общий индекс товарооборота рассчитаем по формуле:
I w = = 1470/1045*100% = 140,67%.
Товарооборот вырос на 40,67% (140,67%-100%).
I р = =.
или 110,24%.
В среднем цены на товары выросли на 10,24%.
Сумма дополнительных расходов покупателей от роста цен:
w (p) =? p1q1 —? p0q1 = 1470 — 1333,478= 136,522 млн руб.
В результате роста цен покупателям пришлось дополнительно израсходовать 136,522 млн руб.
4. Общий индекс физического объема товарооборота:
или 127,61%.
Физический объем товарооборота вырос на 27,61%.
5. Определим общее изменение товарооборота во втором периоде по сравнению с первым периодом:
w = 1470- 1045 = 425 млн руб.
за счет изменения цен:
W (р) = 1470 — 1333,478 = 136,522 млн руб.
за счет изменения физического объема:
w (q) = 1333,478 — 1045= 288,478 млн руб.
Товарооборот товаров увеличился на 40,67%. Цены в среднем по 3-м товарам выросли на 10,24%. Физический объем товарооборота увеличился на 27,61%.
В целом объем реализации увеличился на 425 млн руб., в том числе за счет роста цен он вырос на 136,522 млн руб., а за счет увеличения объемов продаж — на 288,478 млн руб.
ЗАДАЧА 5
По 10 заводам одной отрасли имеются следующие данные.
Таблица.
№ завода. | Выпуск продукции, тыс. шт. (Х). | |
На основе приведенных данных:
I) для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (объемом выпуска продукции) и результативным признаком (расходом электроэнергии) нанесите исходные данные на график корреляционного поля и сделайте выводы о форме связи, укажите ее формулу;
- 2) определите параметры уравнения связи и нанесите полученную при этом теоретическую линию на график корреляционного поля;
- 3) исчислите линейный коэффициент корреляции,
- 4) поясните значения показателей, полученных в пунктах 2) и 3);
- 5) используя полученную модель, сделайте прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.
Решение
Данные признака — объем выпуска продукции (фактор), обозначим через хi; признака — расход электроэнергии (результат) через уi; точки с координатами (х, у) наносим на корреляционное поле ОХУ.
Точки корреляционного поля расположены вдоль некоторой прямой. Следовательно, связь — линейная, будем искать уравнение регрессии в виде прямой Уx=ax+b. Для его нахождения воспользуемся системой нормальных уравнений:
Составим расчетную таблицу.
По найденным средним составляем систему и решаем её относительно параметров, а и b:
Итак, получим уравнение регрессии у на х: = 3,57 692 х + 3,19 231.
Строим линию регрессии на корреляционном поле.
Подставляя в уравнение регрессии значения х из столбца 2, получим расчетные (столбец 7) и сравниваем их с данными у, что отражено в столбце 8. Кстати, правильность расчетов подтверждается и совпадением средних значений у и .
Коэффициент линейной корреляции оценивает тесноту зависимости между признаками х и у и рассчитывается по формуле.
Угловой коэффициент прямой регрессии, а (при х) характеризует направление выявленной зависимости признаков: при а>0 одинаковы, при а<0- противоположны. Его абсолютная величина — мера изменения результативного признака при изменении факторного на единицу измерения.
Свободный член прямой регрессии выявляет направление, а его абсолютное значение — количественную меру влияния на результативный признак всех прочих факторов.
Если <0, то ресурс факторного признака отдельного объекта используется с меньшей, а при >0 с большей результативностью, чем в среднем по всему множеству объектов.
Проведём послерегрессионный анализ.
Коэффициент при х прямой регрессии равен 3,57 692 >0, следовательно, с увеличением (уменьшением) выпуска продукции растёт (падает) расход электроэнергии. Увеличение выпуска продукции на 1 тыс. шт. даёт в среднем рост расход электроэнергии на 3,57 692 тыс. кВт.ч.
- 2. Свободный член прямой регрессии равен 3,19 231,следовательно, влияние прочих факторов увеличивает силу воздействия выпуска продукции на расход электроэнергии в абсолютном измерении на 3,19 231 тыс. кВт.ч.
- 3. Коэффициент корреляции 0,8235 выявляет весьма тесную зависимость расхода электроэнергии от выпуска продукции.
По уравнению регрессионной модели легко делать прогнозы. Для этого в уравнение регрессии подставляют значения х — объем выпуска продукции и прогнозируют расход электроэнергии. При этом значения х можно брать не только в пределах заданного размаха, но и вне его.
Сделаем прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.
= 3,57 692*4,5 + 3,19 231= 19,288 45 тыс. кВт.ч.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- 1. Захаренков С. Н. Социально-экономическая статистика: Учеб.-практ пособие. -Мн.: БГЭУ, 2002.
- 2. Ефимова М. Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики. — М.: ИНФРА — М., 2000.
- 3. Елисеева И. И. Статистика. — М.: Проспект, 2002.
- 4. Общая теория статистики / Под общ. ред. О. Э. Башиной, А. А. Спирина. — М.: Финансы и статистика, 2000.
- 5. Социально-экономическая статистика: Учеб.-практ. пособие / Захаренков С. Н. и др. — Мн.: ЕГУ, 2004.
- 6. Социально-экономическая статистика: Учеб. пособие. / Под ред. Нестерович С. Р. — Мн.: БГЭУ, 2003.
- 7. Теслюк И. Е., Тарловская В. А., Терлиженко Н. Статистика.- Минск, 2000.
- 8. Харченко Л. П. Статистика. — М.: ИНФРА — М, 2002.
- 9. Харченко Л. П., Долженкова В. Г., Ионин В. Г. Статистика. — М.: ИНФРА — М, 1999.
- 10. Экономическая статистика / Под ред. Ю. Н. Иванова — М., 2000.