Основы выборочного наблюдения
Как известно, статистическое наблюдение может быть сплошным и несплошным. Сплошное наблюдение является дорогостоящим мероприятием, проводимым чаще всего органами государственной статистики. Примером может служить перепись населения. Сплошное наблюдение охватывает и изучает всю совокупность, называемую генеральной, иначе — все множество единиц, которое и составляет эту совокупность. Обычно… Читать ещё >
Основы выборочного наблюдения (реферат, курсовая, диплом, контрольная)
В результате освоения данной главы студент должен:
знать
- • основные задачи проведения выборочного наблюдения;
- • базовые алгоритмы выборочного исследования;
- • логику формулирования и проверки статистических гипотез;
уметь
- • рассчитывать необходимый объем выборки и ее ошибки (средние и предельные), а также вероятность отклонения оценки от параметра;
- • распространять выборочные характеристики на всю генеральную совокупность;
владеть
• навыками проведения небольшого выборочного исследования и построения доверительных интервалов для полученных оценок.
Основные понятия выборочного наблюдения
Как известно, статистическое наблюдение может быть сплошным и несплошным. Сплошное наблюдение является дорогостоящим мероприятием, проводимым чаще всего органами государственной статистики. Примером может служить перепись населения. Сплошное наблюдение охватывает и изучает всю совокупность, называемую генеральной, иначе — все множество единиц, которое и составляет эту совокупность. Обычно генеральная совокупность обозначается символом N. Из несплошных наблюдений наиболее важным и научно обоснованным является выборочное.
Теоретическими основами выборочного метода являются теория вероятностей, математическая статистика и комбинаторика. Эти математические науки изучаются в соответствующих курсах, и их основы должны быть усвоены студентами-экономистами, социологами и вообще всеми теми, кто занимается изучением конкретных массовых явлений.
Теория вероятностей возникла в середине XVII в. из потребностей подсчета вероятностей выигрыша в азартных играх. У ее истоков стоят Б. Паскаль (1623—1662), П. Ферма (1601 — 1665), Я. Бернулли (1654—1705), С. Д. Пуассон (1781−1840), К. Ф. Гаусс (1777−1855) и др.
Многие видные математики Нового времени — А. М. Ляпунов (1857—1918), К. Пирсон (1857—1936), А. А. Чупров (1874—1926), Р. Фишер (1890—1968) — внесли вклад в развитие теории вероятностей и статистики, и в настоящее время практически нет области человеческого знания, где бы не применялись в той или иной форме вероятностно-аналитические подходы, разные статистические методы анализа совокупностей, в частности выборочный метод.
Выборочная совокупность (или выборка) является частью (при этом желательно небольшой) генеральной совокупности и обозначается «п». Объектом изучения и предметом интереса, бесспорно, является генеральная совокупность, однако ввиду ее большой численности и ряда других факторов осуществить на практике непосредственное ее изучение трудно, а иногда и невозможно. Таким образом, выборка является представительницей генеральной совокупности и при условии, что отдельные единицы генеральной совокупности отобраны случайно и имеют равную возможность попасть в выборку, она считается в силу действия закона больших чисел (ЗБЧ) репрезентативной или представительной. Суть ЗБЧ сводится к тому, что при увеличении выборочной совокупности средняя по выборке сколь угодно мало отличается от математического ожидания, т. е. среднего значения по всей генеральной совокупности.
Закон больших чисел состоит в постепенном погашении элемента случайности в сводных характеристиках совокупности по мере увеличения ее численности.
В математике его выражает ряд теорем:
- • теорема Бернулли о приближении частости к вероятности, остающейся одинаковой во всех испытаниях;
- • теорема Пуассона о приближении частости к средней вероятности в случае, если вероятность в разных испытаниях различна;
- • теорема Чебышева о приближении средней к своему математическому ожиданию (или к средней величине математических ожиданий).
Важно помнить, что условием справедливости всех этих теорем является независимость индивидуальных результатов. Но если независимости нет, то нет и случайности: индивидуальный результат может быть в совокупности таким или иным лишь постольку, поскольку он независим от других индивидуальных результатов.
Все усилия исследователя на первоначальном этапе планирования выборочного исследования направлены именно на получение репрезентативной выборки, которая возможно наилучшим способом отражает основные характеристики и свойства генеральной совокупности. Случайный отбор обеспечивает репрезентативность выборки и является основой математической теории выборочного наблюдения при условии достаточно большого объема выборки. Отдельные единицы генеральной совокупности могут отбираться в выборку по схеме повторного или бесповторного (иначе — возвратного или невозвратного) отбора. Бесповторный отбор дает в некоторых случаях более точные результаты (почему, увидим далее), но это не всегда имеет практическое значение.
Выборочное наблюдение имеет ряд очень существенных преимуществ, но сравнению со сплошным наблюдением: а) выборочное наблюдение дает значительную экономию сил и средств; б) оно может быть проведено в сжатые сроки и дать важную информацию при принятии решений;
в) в ряде случаев выборочное наблюдение является единственно возможным способом наблюдения: изучение мнений и предпочтений населения, проверка качества продукции (при которой часть продукции уничтожается). Выборочное наблюдение часто дополняет сплошное наблюдение и вносит некоторые существенные коррективы, равно как и данные переписей способствуют более точному формированию выборочной совокупности.
Собственно случайная выборка (простая выборка) является основной. Репрезентативность ее достигается в силу действия закона больших чисел (случайностью отбора). Представительность следует понимать в том смысле, что основные характеристики генеральной совокупности будут отражены в выборке, т. е. что выборка будет похожа на генеральную совокупность по своим основным параметрам. Однако существуют и широко используются и другие типы выборок, которые появились в результате развития и совершенствования выборочного метода. Тем не менее они часто применяются в практической деятельности благодаря значительному снижению затрат (механическая и серийная выборки) или же при комбинации различных способов отбора, где достигается увеличение репрезентативности при сокращении затрат и сроков проведения. Последнее обстоятельство иногда бывает решающим, в частности в тех случаях, когда необходимо получить срочный ответ.
Общая схема выборочного наблюдения состоит в следующем. Из некой генеральной совокупности, которая пас интересует и является объектом изучения, случайным образом извлекается выборка небольшого объема. По данным этой выборки рассчитываются все характеристики, которые нам важны (средняя, дисперсия, разные коэффициенты и т.н.). Все эти характеристики носят название оценок неизвестных нам параметров генеральной совокупности. Из курса математической статистики известно, что «хорошие» оценки должны быть состоятельными, несмещенными и эффективными. Состоятельная оценка означает, что с ростом численности выборки ошибка оценки не превысит сколь угодно малого положительного числа. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру. Эффективная оценка — это такая оценка параметра, которая имеет наименьшую дисперсию. Кроме того, все оценки, т. е. сведения, полученные по данным случайной выборки, имеют свои среднеквадратические ошибки, поэтому оценке всегда сопутствует ее среднеквадратическая ошибка. Далее с известной вероятностью (обычно 0,7 и выше) полученные оценки и их среднеквадратические ошибки распространяются на генеральную совокупность, образуя так называемую интервальную оценку (в отличие от точечной), которая и является окончательным итогом. Интервальная оценка определяется двумя числами — границами интервала. Она позволяет сказать, с какой вероятностью и внутри какого интервала находится оцениваемый (неизвестный) параметр генеральной совокупности. Отметим, однако, что можно получить разные ответы в зависимости от принятой доверительной вероятности и объема выборки.