Определение количественной взаимосвязи между тарифным разрядом и заработной платой
Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой ее части, отобранной в случайном порядке. Выборочное наблюдение — наиболее распространенный вид несплошного наблюдения. Оно дает возможность, не прибегая к сплошному наблюдению, получить обобщающие показатели, которые правильно отражают характеристики всей совокупности в целом… Читать ещё >
Определение количественной взаимосвязи между тарифным разрядом и заработной платой (реферат, курсовая, диплом, контрольная)
Московский Государственный Технический Университет Гражданской Авиации Кафедра экономики ГА Курсовая работа по дисциплине «Статистика»
Вариант 5.
Москва — 2012
Задание
Исходные данные
1. Построить комбинационное распределение рабочих каждого цеха и завода в целом по общему стажу работы и заработной плате.
2. Рассчитать средние тарифный разряд, заработную плату и производственный стаж рабочих цеха № 2, а также моду и медиану заработной платы этих рабочих.
3. Рассчитать дисперсию тарифного разряда рабочих в цехах № 1 и № 2. Определить коэффициенты вариации тарифного разряда рабочих по цехам. Сделать выводы.
4. С вероятностью 0,954 определить ошибку выборки для среднего тарифного разряда рабочих завода и для доли рабочих, имеющих четвертый разряд. Указать пределы возможных значений этих показателей в генеральной совокупности.
5. Определить количественную взаимосвязь между признаками:
5.1 С помощью графического метода определить форму связи между тарифным разрядом и заработной платой рабочих цеха № 2 с № 41 по № 60 включительно (п=20).
5.2 Вычислить параметры уравнения регрессии, характеризующего зависимость между тарифным разрядом и заработной платой рабочих. Построить на графике теоретическую и эмпирическую линии регрессии. Объяснить смысл полученных параметров уравнения.
5.3 Определить степень тесноты между рассматриваемыми признаками.
Исходные данные
В результате выборочного обследования 10% рабочих авиаремонтного завода (по состоянию на 01 января текущего года) получены следующие данные:
№№ п/п | Разряд | Производственный стаж, полных лет | Заработная плата, у.е. | |
Цех № 1 | ||||
Цех № 2 | ||||
Задача 1. Построить комбинационное распределение рабочих каждого цеха и завода в целом по общему стажу работы и заработной плате
Группировку рабочих по стажу работы и заработной плате можно показать с помощью комбинационного распределения, т. е. группировку будем проводить по нескольким признакам, по стажу (факториальный признак) и зарплате (результативный признак), при этом распределение по зарплате будем осуществлять с равными интервалами, а по стажу с неравными:
Цех № 1
Таблица 1.1.
Группировка рабочих по зарплате, у.е. | 460−480 | 481−500 | 501−520 | 521−540 | 541−560 | 561−580 | 581−600 | Итого | |
Группировка по стажу работы | |||||||||
Менее 2-х лет | |||||||||
2−3 года | |||||||||
4−5 лет | |||||||||
6−7 лет | |||||||||
8−9 лет | |||||||||
10 и более | |||||||||
итого | |||||||||
Цех № 2
Таблица 1.2.
Группировка рабочих по зарплате, у.е. | 460−480 | 481−500 | 501−520 | 521−540 | 541−560 | 561−580 | 581−600 | Итого | |
Группировка по стажу работы | |||||||||
Менее 2 лет | |||||||||
2−3 года | |||||||||
4−5 лет | |||||||||
6−7 лет | |||||||||
8−9 лет | |||||||||
10 и более | |||||||||
итого | |||||||||
Всего по заводу
Таблица 1.3.
Группировка рабочих по зарплате, у.е. | 460−480 | 481−500 | 501−520 | 521−540 | 541−560 | 561−580 | 581−600 | Итого | |
Группировка по стажу работы | |||||||||
Менее 2 лет | |||||||||
2−3 года | |||||||||
4−5 лет | |||||||||
6−7 лет | |||||||||
8−9 лет | |||||||||
10 и более | |||||||||
итого | |||||||||
тарифный разряд зарплата комбинационный
Задача 2. Рассчитать средние тарифный разряд, заработную плату и производственный стаж рабочих цеха № 2, а также моду и медиану заработной платы этих рабочих
Средний тарифный разряду вычисляется, как средняя арифметическая взвешенная по формуле
где? — частота повторения признака, в данном случае разряда, т. е. количество рабочих
Таблица 2
Разряд (x) | Число рабочих (f) | |
Итого | ||
(5*1+2*12+3*20+4*14+5*7+6*2)/60=3.2
Средний тарифный разряд для рабочих цеха № 2 — 3.2
Среднюю зарплату рабочих цеха № 2 можно рассчитать, как среднюю арифметическую, тогда она составляет: 31 847/60 = 530,78 у.е.
Так же среднюю зарплату можно рассчитать как среднюю взвешенную на основе составленного распределения, для чего найдем середину интервалов по зарплате:
Таблица 3
Группировка рабочих по зарплате, у.е. | 460−480 | 481−500 | 501−520 | 521−540 | 541−560 | 561−580 | 581−600 | |
Середина интервала | ||||||||
Кол-во рабочих | ||||||||
(470*3+490*7+510*11+530*18+550*10+570*7+590*4)/60= 31 840/60=530,67
Средний производственный стаж рассчитывается как средняя арифметическая взвешенная: = 6,73 года Мода (Мо) — это значение варьирующего признака наиболее часто встречающееся в данном ряду.
Модой в дискретном ряду является варианта, имеющая наибольшую частоту.
Мода заработной платы рабочих цеха № 2 определяется с учетом следующих рассуждений: наибольшую частоту в вариационном ряду распределения имеет интервал [521;540], для которого частота fMAX=18, следовательно, этот интервал является модальным.
Тогда xM0=521 у.е.; fM0=18; fM0−1=11; fM0+1=10; i=20 у.е.
Соответственно, мода равна:
Мо=521+20*(((18−11)/((18−11)+(18−10)))= 529,24 у.е.
Медиана (Ме) — это варианта, которая находится в середине упорядоченного вариационного ряда, т. е. она делит ряд на две равные части.
Если ряд распределения дискретный и состоит из четного числа членов, то медиана будет определяться как средняя арифметическая из двух вариант, расположенных в середине ряда.
Определим медиану заработной платы рабочих цеха № 2:
В интервальном ряду распределения с равными интервалами медиана определяется по формуле:
где — нижняя граница медианного интервала;
— частота медианного интервала;
— сумма накопленных частот, предшествующая медианному интервалу.
Распределим заработную плату рабочих на равные интервалы, определим число рабочих получающих заработную плату в этих интервалах и рассчитаем накопленные частоты:
Заработная плата, у.е. | Число рабочих fi | Накопленные частоты S | |
460−480 | |||
481−500 | |||
501−520 | |||
521−540 | |||
541−560 | |||
561−580 | |||
581−600 | |||
Итого: | :; | ||
Определяем порядковый номер медианы:
.
По накопленным частотам видно, что 30 находится в интервале (521−540), ее значение определяем по формуле:
Ме=521+20*((30−21)/18)=531(у.е.)
Т.е. делаем вывод по медиане, что половина рабочих получает заработную плату ниже 531 у.е., а половина — выше.
Задача 3. Рассчитать дисперсию тарифного разряда рабочих в цехах № 1 и № 2. Определить коэффициенты вариации тарифного разряда рабочих по цехам. Сделать выводы
Дисперсия представляет собой среднюю арифметическую из квадратов отклонений вариант от их средней арифметической
?2 =? (xi — x0)2 * f / ?f
Сгруппируем рабочих по разрядам, построив дискретный ряд распределения:
Цех № 1:
Таблица 3.1
Разряд (x) | Число рабочих (f) | |
Итого | ||
Средний разряд по цеху № 1 находим по средней взвешенной:
(1*7+2*13+3*10+4*6+5*3+6*1)/40= 2,7
Группировку рабочих Цеха № 2 проводили в таблице 2
Определим коэффициенты вариации рабочих по цехам:
V =? / x * 100%
где:? — среднее квадратическое отклонение;
x — средний разряд.
? = v ?2
?ц1 = v 1,61 = 1,27;
?ц2 = v 1,49 = 1,22;
Для цеха № 1: (1,27/2,7)*100%= 47,04%
Для цеха № 2: (1,22/3,2)*100%= 38%
Коэффициент вариации является критерием надежности средней. Различие указывает на большую колеблемость в величине тарифных разрядов у рабочих 1-го цеха. Тарифный разряд рабочих второго цеха имеет более низкий коэффициент, а следовательно более высокую степень однородности тарифного разряда рабочих цеха.
Задача 4. С вероятностью 0,954 определить ошибку выборки для среднего тарифного разряда рабочих завода и для доли рабочих, имеющих четвертый разряд. Указать пределы возможных значений этих показателей в генеральной совокупности
Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой ее части, отобранной в случайном порядке. Выборочное наблюдение — наиболее распространенный вид несплошного наблюдения. Оно дает возможность, не прибегая к сплошному наблюдению, получить обобщающие показатели, которые правильно отражают характеристики всей совокупности в целом.
Вся совокупность единиц называется генеральной совокупностью, а та часть совокупности единиц, которая подвергается выборочному обследованию, называется выборочной совокупностью. Задача выборочного наблюдения — получить правильное представление о показателях генеральной совокупности на основе изучения выборочной совокупности.
Основными вопросами теории выборочного наблюдения являются:
определение предельной ошибки выборки для различных типов выборочных характеристик с учетом особенностей отбора;
определение объема выборки, обеспечивающего необходимую репрезентативность выборочной совокупности с учетом особенностей отбора.
Величина предельной ошибки выборки зависит от вариации признака внутри совокупности объема выборки. И способа отбора единиц.
Определим ошибку выборки для среднего тарифного разряда рабочих завода:
Средний тарифный разряд рабочих завода является:
Дисперсия по заводу:
.
Предельная ошибка выборки определяется по формуле:
Где: — средняя ошибка выборки;
t — коэффициент доверия, зависящий от вероятности (), с которой можно утверждать, что предельная ошибка не превысит t — кратное значение средней ошибки.
При = 0,954 t = 2,0
= 10% = 0,1 (исх. данные)
Т.е. объем выборочной совокупности (n) 100 человек, а объем генеральной совокупности (N) 1000 человек. Исходя из условий задания, отбор бесповторный.
— средняя ошибка для среднего тарифного разряда
Тогда предельная ошибка для среднего тарифного разряда равна:
= 3
Ошибка выборки по среднему тарифному разряду равна 0,48.
Тогда средний тарифный разряд рабочих завода колеблется от 2,52 до 3,48.
Определим ошибку выборки для доли рабочих имеющих 4 разряд.
Рассчитаем ошибку выборки по альтернативному признаку:
Определим среднее значение альтернативного показателя: из 100 человек 20 имеют 4 разряд.
Определим среднюю ошибку для доли рабочих, имеющих 4 разряд.
Ошибка выборки для рабочих завода имеющих 4 разряд составляет 0,076.
Доля рабочих, имеющих 4 разряд, колеблется от 0,124 до 0,276.
Задача 5. Определить количественную взаимосвязь между признаками
5.1 С помощью графического метода определить форму связи между тарифным разрядом и заработной платой рабочих цеха № 2 с № 41 по № 60 включительно (n=20)
Сущность графического метода заключается в построении поля корреляции, которое представляет собой точечный график, для построения которого в прямоугольной системе координат по оси абсцисс откладывают значения факториального признака, а по оси ординат — результативного. По тому как располагаются точки, судят о наличии и форме связи.
В данном случае тарифный разряд будет факториальным признаком, а заработная плата — результативным, т.к. она зависит от тарифного разряда.
Осуществим группировку по разряду и заработной плате, т.к. при одинаковом разряде у разных рабочих разная заработная плата.
Таблица 5.1 Данные для построения графика
(х) | Зарплата рабочих | (у) | |
483, 505, 506, 508, 512 | 502,8 | ||
514, 521, 524, 526, 534, 552, 555. | 532,3 | ||
527, 547, 552, 559 | 546,25 | ||
575, 595, 597 | |||
По полученным значениям разряда и заработной платы построим график, где множество получившихся точек называется — полем корреляции, а их последовательное соединение — эмпирической линией регрессии.
По графику можно определить, что связь стохастическая, т.к. каждому значению факториального признака (х), соответствует некоторое множество значений результативного признака (у).
Корреляционная связь между признаками проявляется в том, что при изменении признака (х) на единицу изменяется средняя величина признака (у). В данном случае связь линейная прямая, т.к. с возрастанием признака (х) увеличивается признак (у).
5.2 Вычислить параметры уравнения регрессии, характеризующего зависимость между тарифным разрядом и заработной платой рабочих. Построить на графике теоретическую и эмпирическую линии регрессии. Объяснить смысл полученных параметров уравнения
При линейной регрессии уравнение имеет вид:
ух = а + b * x
где: ух — среднее значение результативного признака;
х — среднее значение факториального признака;
a, b — параметры уравнения связи.
Параметр a — показывает уровень заработной платы на который влияют другие факторы, которые в данном случае не рассматриваются.
Параметр b (коэффициент регрессии) — показывает на сколько в среднем изменяется результативный признак (у) при увеличении факториального признака (х) на единицу.
Таблица 5.2
№ пп | Разряд (х) | Зарплата (у), у.е. | х * у | х2 | у2 | |
Итого: 20 | ||||||
Для определения параметров уравнения прямой на основе методов наименьших квадратов решается следующая система нормальных уравнений:
? у = а * n + b * ?x,
? х * у = а *? х + b *? x2;
10 683 = 20 * a + 63 * b,
34 272 = 63 * a + 223 * b;
а = (10 683 — 63 * b) / 20,
34 272 = 63 * ((10 683 — 63 * b) / 20) + 223 * b;
а = 454,53,
b = 25,28.
ух = 454,53 + 25,28 * х
Параметр, а представляет собой теоретическое значение результативного признака при х = 0, и показывает влияние других факторов на результативный.
Параметр b — коэффициент регрессии — показывает, на сколько в среднем изменяется значение признака у при увеличении значения признака х на единицу. В данном примере при повышении тарифного разряда на 1 единицу зарплата в среднем повышается на 25,28 у.е.
у1 = 454,53 + 25,28 * 1 = 479,81
у2= 454,53 + 25,28 * 2 = 505,09
у3= 454,53 + 25,28 * 3 = 530,37
у4= 454,53 + 25,28 * 4 = 555,65
у5= 454,53 + 25,28 * 5 = 580,93
По полученным величинам составляем теоретическую линию регрессии, характеризующую форму корреляционной связи между изучаемыми признаками.
5.3 Определить степень тесноты между рассматриваемыми признаками
При наличии линейной зависимости степень тесноты связи можно рассчитать с помощью коэффициента парной корреляции (?).
Коэффициент корреляции определяется следующим образом:
0,90
Коэффициент корреляции изменяется в пределах от -1 до +1. Знак при коэффициенте корреляции показывает направление вязи (прямая или обратная), а его величина — степень связи (чем ближе к 1, тем связь теснее).
Следовательно, наличие линейной связи установлено правильно и эта связь довольно тесная, т.к.? = 0,90.
Оценка существенности коэффициента корреляции определяется на основании критерия надежности t, который рассчитывается по формуле:
20,65
В математической статистике доказано, что если t < 2,56, то связь между признаками признается несущественной. В этом случае считается, что факториальный признак не оказывает существенного влияния на результативный признак. Если t > 2,56, то связь признается существенной, т. е. факториальный признак оказывает существенное влияние на признак результативный.
Т.к. t=20,65> 2,56, то связь между признаками считается существенной. Т. е. квалификация рабочего оказывает большое влияние на заработную плату.
Список используемой литературы
1. Степанова Н. И., «Статистика» пособие по выполнению курсовой работы, М.-2011г.
2. Степанова Н. И., «Статистика. Конспект лекций. Часть 1», М.-2006г.