Помощь в написании студенческих работ
Антистрессовый сервис

Основы выборочного наблюдения

РефератПомощь в написанииУзнать стоимостьмоей работы

О Все усилия исследователя на первоначальном этапе планирования выборочного исследования направлены именно на получение репрезентативной выборки, которая возможно наилучшим способом отражает основные характеристики и свойства генеральной совокупности. Случайный отбор обеспечивает репрезентативность выборки и является основой математической теории выборочного наблюдения при условии достаточно… Читать ещё >

Основы выборочного наблюдения (реферат, курсовая, диплом, контрольная)

В результате освоения данной главы студент должен:

знать

  • • почему, когда и как проводится выборочное наблюдение;
  • • преимущества и слабые стороны выборочного наблюдения;
  • • логику вероятностного формулирования и проверки статистических гипотез;

уметь

  • • различать понятия «параметр» и «оценка» и связующее их звено — доверительные интервалы;
  • • проводить соответствующие вычисления при определении ошибок выборки и ее величины, используя математико-статистические таблицы;

владеть

  • • основными навыками при проведении небольшого выборочного наблюдения;
  • • способами распространения результатов выборочного наблюдения на генеральную совокупность.

Основные понятия выборочного наблюдения

Как известно, статистическое наблюдение может быть сплошным и несплошным. Сплошное наблюдение является дорогостоящим мероприятием, проводимым чаще всего органами государственной статистики. Примером данного вида наблюдения может служить перепись населения. Сплошное наблюдение охватывает и изучает всю совокупность, называемую генеральной, иначе, все множество единиц, которое и составляет эту совокупность. Обычно генеральная совокупность обозначается символом «N». Из несплошных наблюдений наиболее важным и научно-обоснованным является выборочное наблюдение.

Теоретическими основами выборочного метода являются теория вероятностей, математическая статистика и комбинаторика. Эти математические науки изучаются в соответствующих курсах, и их основы должны быть усвоены студентами-экономистами, социологами и вообще всеми теми, кто занимается изучением конкретных массовых явлений.

Теория вероятностей — это математическая наука, которая изучает случайные события, процессы, явления, функции. Она определяет и анализирует численные характеристики случайных событий, таких как вероятность события и математическое ожидание и другие характеристики случайной величины. Математическая статистика — это раздел математики, изучающий методы обработки результатов массовых случайных явлений с целью выявления статистических закономерностей. Математическая статистика имеет дело с практическим результатом опытов и наблюдений. Теория вероятностей и математическая статистика тесно связаны и в процессе решения конкретных задач дополняют и обогащают друг друга.

Теория вероятностей возникла в середине XVII в. из потребностей подсчета вероятностей выигрыша в азартных играх. У ее истоков стоят Б. Паскаль (1623—1662), П. Ферма (1601 — 1665), Я. Бернулли (1654—1705), С. Д. Пуассон (1781 — 1840), К. Ф. Гаусс (1777—1855), П. Л. Чебышев (1821 — 1894) и др. Многие видные математики — А. М. Ляпунов (1857—1918), К. Пирсон (1857—1936), А. А. Чупров (1874—1926), Р. Фишер (1890—1968), А. Н. Колмогоров (1908—1987) — внесли огромный вклад в развитие теории вероятностей и математической статистики, и в настоящее время практически нет области человеческого знания, где бы не применялись в той или иной форме вероятностно-аналитические подходы, разные статистические методы анализа совокупностей, в частности выборочный метод.

Выборочная совокупность (или выборка) является частью (при этом желательно небольшой) генеральной совокупности и обозначается «п». Объектом изучения и предметом интереса, бесспорно, является генеральная совокупность, однако ввиду ее большой численности и ряда других факторов осуществить на практике непосредственное ее изучение трудно, а иногда и невозможно. Таким образом, выборка является составной частью генеральной совокупности, и при условии, что отдельные единицы генеральной совокупности отобраны случайно и имеют равную возможность попасть в выборку, она считается в силу действия закона больших чисел (ЗБЧ) репрезентативной или представительной. Суть ЗБЧ сводится к тому, что при увеличении выборочной совокупности средняя по выборке сколь угодно мало отличается от математического ожидания, т. е. среднего значения по всей генеральной совокупности. Закон больших чисел состоит в постепенном погашении элемента случайности в сводных характеристиках совокупности по мере увеличения ее численности.

В математике ЗБЧ выражает ряд теорем:

• теорема Бернулли о приближении частости к вероятности, остающейся одинаковой во всех испытаниях;

  • • теорема Пуассона о приближении частости к средней вероятности в случае, если вероятность в разных испытаниях различна;
  • • теорема Чебышева о приближении средней к своему математическому ожиданию (или к средней величине математических ожиданий).

Важно помнить, что условием справедливости всех этих теорем является независимость индивидуальных результатов. Но если независимости нет, то нет и случайности: индивидуальный результат может быть в совокупности таким или иным лишь постольку, поскольку он независим от других индивидуальных результатов. К вышеуказанным теоремам ЗБЧ следует добавить важную теорему, так называемую центральую предельную теорему (ЦПТ), доказанную А. М. Ляпуновым в 1901 г. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней х — х не превзойдет по абсолютной величине некоторой величины ti = А, равна интегралу Лапласа.

Основы выборочного наблюдения.

где Ф (t) — нормированная функция Лапласа.

В выборочном наблюдении два распределения — биномиальное и нормальное — играют очень большую роль, все выводы и основные формулы в той или иной степени связаны с этими распределениями.

Напомним, что если проводится серия независимых испытаний, в каждом из которых успех появляется с вероятностью р, то вероятность того, что успех в п испытаниях появится ровно к раз, выражается формулой Бернулли.

Основы выборочного наблюдения.

где <7 = 1 -р.

В том случае, когда п велико, а вероятность наступления события р мала, используется формула Пуассона.

Основы выборочного наблюдения.

где единственный параметр Х=рп= х.

Локальная и интегральная теоремы Муавра — Лапласа приближают нас к ответу на вопрос не столько о вероятности осуществления некоего события ровно к раз, сколько о возможном определении вероятности, что случайная величина будет находиться в некоторых заданных пределах.

Понятия случайной величины и случайного события в теории вероятностей являются базовыми. Связь случайного события и случайной величины заключается в том, что принятие случайной величиной некоторого числового значения из набора возможных (т.е. выполнения равенства X = х,) есть случайное событие, характеризующееся вероятностью Р (Х = х;) =pv

Непрерывная случайная величина распределена по нормальному закону (закону Гаусса) с параметрами х и ст, если ее плотность вероятностей имеет вид:

Основы выборочного наблюдения.

где х— математическое ожидание х и а2 — дисперсия. Нормальное распределение с параметрами х = 0 и а2 = 1 называется стандартным нормальным распределение с функцией плотности вероятностей.

Основы выборочного наблюдения.

Для вычисления функции распределения F (x) случайной величины, распределенной по нормальному закону, прибегают к табулированным значениям функции Лапласа (здесь и ниже упоминаются математико-статистические таблицы, которые можно найти, например, в работе [40]).

Для нахождения вероятности попадания случайной нормально распределенной величины в интервал (xv х2) используется формула.

X; — X.

X; — X.

где tj =-.

о Все усилия исследователя на первоначальном этапе планирования выборочного исследования направлены именно на получение репрезентативной выборки, которая возможно наилучшим способом отражает основные характеристики и свойства генеральной совокупности. Случайный отбор обеспечивает репрезентативность выборки и является основой математической теории выборочного наблюдения при условии достаточно большого объема выборки. Отдельные единицы генеральной совокупности могут отбираться в выборку по схеме повторного или бесповторного (иначе — возвратного или невозвратного) отбора. Бесповторный отбор дает в некоторых случаях более точные результаты (почему, увидим далее), но это не всегда имеет практическое значение.

Объектом статистического изучения служит, как правило, весьма большая по объему и весьма неоднородная совокупность, именуемая генеральной. Поэтому при работе с массовым материалом на всех этапах сбора, хранения и анализа неизбежно совершаются ошибки разного рода. Имеются подробные классификации этих ошибок. Ошибки регистрации появляются при сборе первичного материала, и они связаны с двумя видами ошибок: случайными (непреднамеренными) и преднамеренными ошибками.

Случайные ошибки связаны со случайными обстоятельствами (неправильное суммирование, недостаточная квалификация и невнимательность персонала, неточно задаваемые вопросы, что ведет к разному их пониманию и, как следствие, ответу). Устранение случайных ошибок требует дополнительных усилий и затрат. Частично случайные ошибки взаимопоглощаются.

Преднамеренные ошибки, безусловно, является более опасными, чем случайные, и для их выявления и устранения разработаны разные методы, позволяющие хотя бы отчасти снизить их негативное действие. К этим ошибкам относятся приписки и сознательное сокрытие тех или иных существенных фактов, например уклонение от уплаты налогов, преуменьшение потерь, и наоборот, преувеличение производственных результатов. К преднамеренным ошибкам следует бесспорно отнести так называемое освоение средств без видимых реальных результатов.

При выборочном исследовании появляется еще один вид ошибок — так называемые ошибки репрезентативности (или ошибки выборки, которые также бывают как случайными, так и систематическими). Следует сказать, что любому выборочному наблюдению присущи ошибки выборки (т.е. расхождение между характеристиками генеральной совокупности и выборочными показателями).

В свою очередь ошибки репрезентативности делятся на систематические и случайные. Их происхождение разное. Случайные ошибки появляются вследствие и по причине, что исследуется только небольшая часть генеральной совокупности и вполне возможно, что не все свойства, характеризующие генеральную совокупность, были достаточно полно представлены в выборке вследствие неправильной организации выборочного наблюдения, небольшой численности выборки или же в силу иных причин и обстоятельств, в том числе и финансовых.

Систематические ошибки — это ошибки, связанные с видом отбора и способом обработки данных. Эти ошибки трудно исправимы, часто неизбежны. Так, например, при исследовании определенных категорий получить четкое представление о них довольно затруднительно. Это касается как неблагополучных в социальном плане лиц лиц (бомжей, бродяг, лиц с криминальным прошлым и т.н.), так и наоборот, весьма обеспеченных людей, доступ к местам проживания которых ограничен. В этой связи следует отметить, что различия между фактической ошибкой и допустимой могут быть значительными. Это обстоятельство учитывается при планировании выборочного наблюдения, в процессе которого вполне возможно будут внесены соответствующие изменения и коррективы. Отметим также, что в ряде случаев в выборочном исследовании используются данные, полученные при сплошных исследованиях (переписях населения, малых предприятий, торговли и т.н.), проводимых органами государственной статистики, а также из иных заслуживающих доверия источников — публикаций ООН и ее организаций, статистических ежегодников национальных статистических служб и др.

Суть средней ошибки выборки р, которая называется еще средиеквадратическим отклонением средней арифметической, заключается в том, что в каждом конкретном случае мы не можем определить величину ошибки (т.е. расхождение между неизвестным параметром и его оценкой, полученной по выборке).

Математическая статистика доказывает, что средняя дисперсия признака в выборочных совокупностях, которые могут быть образованы при случайном отборе, связана с дисперсией генеральной совокупности:

Основы выборочного наблюдения.

Как указывалось выше, основное практическое следствие теорем ЗБЧ и теоремы Ляпунова состоит в том, что можно заменить а2 дисперсией конкретной выборки а2. Тогда формула средней ошибки выборки р может быть представлена как.

Основы выборочного наблюдения.

Разнообразные и многочисленные примеры вычисления средней ошибки выборки убедительно подтвердили теоретические выводы и связали величину конкретной ошибки с вероятностью ее наступления.

Ошибка выборки чаще всего связывается со средним значением выборочной и генеральной совокупностей. Однако следует сказать, что все характеристики, полученные, но данным выборки а2, а, Мо, As и т. д., содержат свою собственную среднюю ошибку, которая в среднем и с определенной вероятностью определяет отклонение между оценкой и неизвестным параметром. В табл. 8.1 приведены средние квадратические ошибки (стандартные погрешности) некоторых выборочных характеристик.

Таблица 8.1

Средние квадратические ошибки некоторых выборочных характеристик.

Параметр

Средние квадратические ошибки.

В формуле средней ошибки выборки ясно видно, что величина этой ошибки зависит как от дисперсии признака в генеральной совокупности, выраженной в виде дисперсии конкретной выборки, так и от величины самой случайной выборки, которую можно увеличивать или уменьшать в зависимости от конкретных условий. В этой связи делается очевидным, что численность выборки п ~ о22.

Выборочное наблюдение имеет ряд очень существенных преимуществ по сравнению со сплошным наблюдением: а) выборочное наблюдение дает значительную экономию сил и средств; б) оно может быть проведено в сжатые сроки и дать важную информацию при принятии решений; в) в ряде случаев выборочное наблюдение является единственно возможным способом наблюдения: изучение мнений и предпочтений населения, проверка качества продукции (при которой часть продукции уничтожается). Выборочное наблюдение часто дополняет сплошное наблюдение и вносит некоторые существенные коррективы, равно как и данные переписей способствуют более точному формированию выборочной совокупности.

Собственно случайная выборка (простая выборка) является основной. Репрезентативность ее достигается в силу действия закона больших чисел (случайностью отбора). Представительность следует понимать в том смысле, что основные характеристики генеральной совокупности будут отражены в выборке, т. е. что выборка будет похожа на генеральную совокупность по своим основным параметрам. Однако существуют и широко используются и другие типы выборок, которые появились в результате развития и совершенствования выборочного метода. Они часто применяются в практической деятельности благодаря значительному снижению затрат (механическая и серийная выборки) или же при комбинации различных способов отбора, где достигается увеличение репрезентативности при сокращении затрат и сроков проведения. Последнее обстоятельство иногда бывает решающим, в частности в тех случаях, когда необходимо получить срочный ответ.

Общая схема выборочного наблюдения состоит в следующем. Из некой генеральной совокупности, которая пас интересует и является объектом изучения, случайным образом извлекается выборка сравнительно небольшого объема. По данным этой выборки рассчитываются все характеристики, которые нам важны (средняя, дисперсия, разные коэффициенты и т. п.). Все эти характеристики носят название оценок неизвестных нам параметров генеральной совокупности. Из курса математической статистики известно, что «хорошие» оценки должны быть состоятельными, несмещенными и эффективными. Состоятельная оценка означает, что с ростом численности выборки ошибка оценки не превысит сколь угодно малого положительного числа. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру. Эффективная оценка — это такая оценка параметра, которая имеет наименьшую дисперсию. Кроме того, все оценки, т. е. сведения, полученные по данным случайной выборки, имеют свои среднеквадратические ошибки, поэтому оценке всегда сопутствует ее среднеквадратическая ошибка. Далее с известной вероятностью (обычно 0,7 и выше) полученные оценки и их среднеквадратические ошибки распространяются на генеральную совокупность, образуя так называемую интервальную оценку (в отличие от точечной), которая и является окончательным итогом. Интервальная оценка определяется двумя числами — границами интервала. Она позволяет сказать, с какой вероятностью и внутри какого интервала находится оцениваемый (неизвестный) параметр генеральной совокупности. Отметим, однако, что можно получить разные ответы в зависимости от принятой доверительной вероятности и объема выборки.

В математической статистике принято четко различать параметры и их оценки, т. е. значения, но генеральной совокупности и по выборке. Общий принцип состоит в том, что параметры обозначаются греческими буквами, а выборочные оценки — латинскими.

Мы, однако, в данном тексте приняли несколько иную символику с учетом того факта, что в большинстве учебников и учебных пособий, но теории статистики такого четкого разграничения нет. Для обозначения средней генеральной совокупности используется х, для ее оценки — х, для относительной величины (доли) — Р, Q, для ее оценки — р, г/, для дисперсии — ад, для ее оценки — а2 или S2.

Показать весь текст
Заполнить форму текущей работой