Помощь в написании студенческих работ
Антистрессовый сервис

Генеральная совокупность, выборка и выборочный метод

РефератПомощь в написанииУзнать стоимостьмоей работы

Для понимания свойств генеральной совокупности обратимся к одной из фундаментальных отечественных работ, но теории вероятностей и математической статистики и посмотрим, как ее авторы определяли интересующие нас понятия. «Пусть имеется многочисленная совокупность однородных элементов (объектов), каждый из которых может обладать или не обладать каким-либо признаком; неизвестная нам доля тех из них… Читать ещё >

Генеральная совокупность, выборка и выборочный метод (реферат, курсовая, диплом, контрольная)

Поскольку охватить всю совокупность наблюдений за социально-экономическими явлениями невозможно, прогнозисту приходится использовать только некоторую их часть. Из всего множества имеющихся наблюдений он использует только те, которые некоторым образом выбраны им из всего множества возможных значений для того, чтобы по нескольким значениям составить правильное представление об изучаемом явлении в целом. Поскольку всю возможную совокупность наблюдений обычно представляют как генеральную совокупность, а часть из нее — как выборочную, следует разобраться в том, какая именно совокупность наблюдений может быть названа генеральной в строго статистическом смысле, а какая, опять же в строго математическом понимании, — выборочной. Это очень важно, поскольку под понятиями «генеральная совокупность» и «выборочная совокупность» в теории вероятностей и математической статистики понимаются вполне определенные и четко очерченные в границах определения характеристики соответствующих объектов. Поэтому, прежде чем использовать их, необходимо уяснить, что же они собой представляют. Это позволит прогнозисту избежать терминологической путаницы и не ошибиться в выборе инструмента прогнозирования.

О том, что простого ответа на поставленный вопрос нет, может свидетельствовать следующая цитата: «Анализируемые ряды динамики являются почти всегда выборками из более длинных рядов»1. Она говорит о том, что еще в 1977 г. ученые считали, что имеющиеся в их распоряжении ряды не всегда являются выборками. Как различить случаи, когда анализируемые ряды являются выборками из более длинных рядов, а когда они таковыми не являются? Ответ на этот вопрос найти необходимо, ведь для обработки выборочных значений используется выборочный метод, а он подразумевает использование методов математической статистики. Но, как было показано, в предыдущей главе, например, для необратимых процессов методы математической статистики неприемлемы — свойства рядов необратимой динамики не соответствуют посылкам выборочного метода.

Вайпу Я. Я.-Ф. Корреляция рядов динамики. М.: Статистика, 1977. С. 90.

Итак, прежде всего, рассмотрим понятие «генеральная совокупность». Мы не будем рассматривать определения типа: «та совокупность, из которой проводится отбор, называется генеральной совокупностью; отобранные данные составляют выборочную совокупность»[1], поскольку такие определения не отражают сущностных свойств определяемых понятий. Они позволяют включить в число генеральных совокупностей практически все ряды наблюдений, например, социально-экономические показатели Руси и России за всю историю существования государства. Но ни один нормальный прогнозист не станет рассматривать статистические данные такого ряда с 1000 по 2012 г. для того, чтобы по этой «генеральной совокупности» сделать прогноз на последующие за 2012 годы. Значит, генеральная совокупность — не просто некоторая база данных. Она включает те из них, которые обладают определенными свойствами, знание которых нужно прогнозисту, чтобы легко определить, генеральная совокупность перед ним или нет.

Для понимания свойств генеральной совокупности обратимся к одной из фундаментальных отечественных работ, но теории вероятностей и математической статистики и посмотрим, как ее авторы определяли интересующие нас понятия. «Пусть имеется многочисленная совокупность однородных элементов (объектов), каждый из которых может обладать или не обладать каким-либо признаком; неизвестная нам доля тех из них, которые обладают этим признаком, и подлежит определению. Наше испытание заключается в том, что мы выбираем наугад один элемент из множества элементов, отмечаем, обладает или нет этот элемент данным признаком и возвращаем его обратно в совокупность. При выборе элемента из совокупности принимаются меры к тому, чтобы вероятность быть выбранным была одинакова для всех элементов. Тогда имеющееся множество элементов называется генеральной совокупностью. Группа из п элементов, наблюдаемых при повторных испытаниях, называется случайной выборкой, число отобранных элементов — объемом выборки, а описанный процесс отбора элементов — простым случайным выбором. Определив частоту признака среди отобранных в выборке объектов, мы можем по ней, опираясь на теорему Лапласа, приближенно оценить долю признака в генеральной совокупности: в самом деле, эта доля в данных условиях играет роль неизменной вероятности появления объекта, обладающего интересующим нас признаком, а уклонения частоты от вероятности приближенно следуют нормальному закону. При правильной организации отбора выборки мы должны обеспечить каждому объекту генеральной совокупности равную вероятность попадания в выборку.

На практике выбор из генеральной совокупности производится различными способами, в частности, выбор подразделяется на следующие разновидности.

  • 1. Выбор с возвратом или повторением, или, иначе говоря, простой случайный выбор, о котором говорилось выше.
  • 2. Выбор без возврата или без повторения, когда каждый отобранный индивидуум перед выбором следующего индивидуума обратно в генеральную совокупность не возвращается.

Полученная выборка называется репрезентативной (представительной), если она достаточно хорошо представляет пропорции генеральной совокупности"[2].

В этом отрывке приведены характерные свойства, присущие генеральной совокупности и выборке из нее, поэтому, воспользовавшись им, конкретизируем эти свойства. Относительно генеральной совокупности ясно, что это совокупность всех однородных элементов. Что касается выборки, то для нее характерны случайность выбора, одинаковая вероятность для каждого элемента быть выбранным, а также способность выборки характеризовать свойства генеральной совокупности.

Генеральная совокупность может быть конечной или бесконечной. В первом случае множество однородных элементов, хотя и очень велико, но все же конечно (например, количество подберезовиков в лесах Поволжья осенью текущего года). Во втором — множество этих элементов не ограничено, поскольку новые наблюдения за ними дают все новые и новые значения этой совокупности (например, количество подберезовиков в Поволжье с момента их появления в этом регионе и до настоящего времени. Поскольку «настоящее время», как верхняя временная граница этого множества со временем устремляется к бесконечности, то и генеральная совокупность элементов является бесконечной).

Важно, что генеральная совокупность представляет собой именно совокупность однородных элементов — элементов одного рода. Это ключ к толкованию того, какую совокупность элементов можно отнести к генеральной, а какую — нельзя.

Четких определений понятия «однородность» в научной литературе не встречается. Говорят об однородной функции, об упруго-однородном теле и т. п. Поэтому, отмечая сложность попытки дать однозначное толкование термину «однородная выборка», некоторые ученые вводят собственные определения, удобные для практического применения. Например: «однородной называется такая совокупность, элементы которой формируются под воздействием общих основных причин и условий, а их законы распределения имеют простую структуру»[3]. Так, например, если динамика некоторого показателя х описывается моделью постоянного прироста со случайными отклонениями.

Генеральная совокупность, выборка и выборочный метод.

где а — постоянный прирост; et — не зависящие друг от друга случайные отклонения, имеющие нормальный закон распределения с нулевым математическим ожиданием и дисперсией, не зависящей или зависящей от t, то все элементы совокупности xif х2ухт имеют различные законы распределения, но сама совокупность в соответствии с указанным определением будет однородной.

Сложность использования такого «рабочего» определения однородности совокупности заключается в том, что понятия «общие причины и условия» недостаточно конкретны. Например, рассматривая динамику развития промышленности России на протяжении 30 лет, можно говорить, что основной причиной формирования этого динамического ряда является спрос на товары промышленности, а условием — работа поставщиков. На основе этого, воспользовав1980. С. 14.

шись приведенным выше определением, кажется, что можно говорить об однородности совокупности. Но учитывая, что сама причина — спрос на продукцию — непрерывно меняется и качественно, и количественно, да и структура промышленного производства претерпела кардинальные изменения, то необходимо будет признать, что совокупность все же является неоднородной[4]. Принципиально важной характеристикой однородности процесса является ее инвариантность времени или порядку наблюдения. Поэтому совокупность элементов будет являться однородной только в том случае, когда ее элементы yv t = 1, 2, 3, …, т, …, Т формируются под воздействием общих основных неизменных причин и условий xt так, чтобы при возникновении для t = k условий и причин, равных xk = хт, элемент yk был равен

где ц — не зависящие друг от друга случайные отклонения, имеющие нормальный закон распределения с нулевым математическим ожиданием и конечной дисперсией.

где ц — не зависящие друг от друга случайные отклонения, имеющие нормальный закон распределения с нулевым математическим ожиданием и конечной дисперсией.

Используя наше определение для случая (3.1), можно убедиться в том, что все элементы совокупности х{, х2, …, однородны. Действительно, при достиженииxt=xv величина х будет определяться как Генеральная совокупность, выборка и выборочный метод.

Теперь можно дать определение понятия генеральной совокупности, которое мы будем использовать в дальнейшем в качестве основного: генеральная совокупность — это множество всех возможных элементов однородной совокупности. Из этого определения с учетом введенного понятия однородности следует, что каждый элемент генеральной совокупности обладает характеристиками генеральной совокупности, но в силу воздействия на него множества случайных факторов эти характеристики в каждом элементе наблюдаются с некоторым отклонением.

Теперь можно ответить на проверочный вопрос, сформулированный ранее: социально-экономические показатели за всю многовековую историю существования Руси, а затем и России представляют собой все мысленно возможные состояния; это.

2000. С. 186.

генеральная совокупность или нет? Если предложить российской промышленности, например, выпустить продукцию в количестве и качестве, соответствующих 1960;му г., то, например, количество потребленной при этом электроэнергии будет значительно меньше электропотребления, соответствовавшего 1960;му г., поскольку технологии промышленного производства существенно изменились. Если в 1960 г. на промышленных предприятиях наряду с электрическим приводом машин встречались паровые, газовые и гидравлические приводы, то к настоящему времени в подавляющем большинстве используются электрические приводы, да еще и с программным управлением. Но, что еще более важно, сегодня промышленность России просто не в состоянии выпустить ту номенклатуру изделий, которая была в 1960 г. — разрушены оснастка и технологические линии, уничтожена проектная документация, потеряны навыки производства продукции, которая давно не выпускается. Если по каким-то причинам будет все же необходимо в точности повторить эту номенклатуру и количество, то условия производства, затраты сырья, труда, денежных средств и т. п. будут существенно отличаться от имевших место в 1960 г.

Это значит, что социально-экономические показатели Руси и России в разные периоды времени отражали разные условия неоднородной динамики этой системы. Поэтому их ни в коем случае нельзя назвать генеральной совокупностью! Множество наблюдений социально-экономического развития России за многие века, пусть даже упорядоченное во времени, остается только множеством и никогда не превратится в генеральную совокупность.

Теперь следует определить понятие «выборочной совокупности». Понятно, что оно связано с генеральной совокупностью, и выборочная совокупность представляет собой ее часть. Обратимся к существующим определениям этого понятия.

«Если ограничиться числом наблюдений, которое в той или иной степени меньше общего числа элементов исследуемой совокупности, то будем говорить, что используется выборка… В широком смысле выборка — это любая часть всех элементов совокупности. Обычно эта часть извлекается таким образом, чтобы она „представляла“ совокупность»[5].

Из этого определения не совсем ясно, о какой совокупности идет речь — о генеральной или вообще о любом множестве каких-то элементов, представленном в виде некоторой совокупности. Но в нем есть одна важная характеристика, которая обязательно встречается при констатации основных характеристик выборочной совокупности — она должна отражать свойства генеральной совокупности. Если выборка не будет обладать таким свойством, то ее исследование бессмысленно, и называть ее выборочной нельзя.

«Случайная выборка есть совокупность единиц (выборочная совокупность), отобранных из генеральной совокупности случайно, т. е. таким образом, что все единицы генеральной совокупности имеют равные шансы быть отобранными (попасть в выборку)»[6].

В этом определении указывается на наличие источника выборки (генеральная совокупность), способ получения выборки (случайная выборка), но нет указания на то, что выборка должна представлять основные характеристики генеральной совокупности.

Этот же недостаток содержится в другом определении: «Выборкой размера п из распределения F называется случайный вектор {^!, …, %"}, компоненты которого независимы и одинаково распределены с функцией распределения F (x)»[7]. Впрочем, необходимо отметить, что здесь появилась еще одна сущностная характеристика выборки — независимость элементов выборки.

«Выборка из данной генеральной совокупности — это результаты ограниченного ряда наблюдений xlfx2,…, хп случайной величины ^… Если … ряд наблюдений хх, хъхп образует последовательность независимых и одинаково распределенных случайных величин, то выборка называется случайной»[8].

Итак, можно утверждать, что выборочная совокупность обладает следующими характеристиками, отличающими ее от других подмножеств:

  • 1) элементы выборочной совокупности формируются из генеральной совокупности;
  • 2) они формируются случайным образом — так, чтобы каждый элемент генеральной совокупности имел одинаковую вероятность попасть в выборку;
  • 3) способ формирования выборки должен обеспечивать независимость элементов выборки друг от друга;
  • 4) элементы выборки должны давать представление о свойствах генеральной совокупности.

Зная эти свойства случайной выборки, дадим ее определение, которое будем использовать в дальнейшем.

Выборочная совокупность — это случайно выбранные элементы генеральной совокупности, дающие представление о ней и выбранные так, что каждый элемент генеральной совокупности имеет одинаковую вероятность попасть в выборку не зависимо от других элементов.

Определив понятия генеральной и выборочной совокупностей, можно понять суть выборочного метода, который является основой математической статистики и эконометрии, а также одним из основных методов реализации индуктивного вывода, когда по изученным свойствам нескольких элементов всего множества делается вывод о свойствах самого множества в целом. Следует напомнить, что метод индуктивного вывода пришел на смену методу дедуктивного вывода, который более 1000 лет оставался единственным методом обобщения научных результатов и получения достоверных знаний. Именно применение индуктивного метода, как метода на порядок более дешевого и требующего значительно меньшего времени, послужило бурному росту науки с середины II тыс. н.э. Выборочный метод является математическим обоснованием этого индуктивного вывода, дает возможность математически корректно сформулировать его, и, что немаловажно, оценить вероятность его правильности.

Процесс выборочного метода заключается в следующем. Пусть имеется многочисленная генеральная совокупность однородных элементов, каждый из которых обладает какимлибо признаком. Из этой совокупности выбирается наугад один из элементов, причем при выборе элемента из совокупности принимаются все меры к тому, чтобы вероятность быть выбранным была одинаковой для всех элементов. Затем таким же образом выбирается другой элемент и т. д. до тех пор, пока сформированная выборка не будет удовлетворять некоторым заранее сформулированным требованиям исследователя (размер выборки, стоимость получения выборки и т. п.).

Полученные выборочные значения обрабатываются с помощью методов математической статистики на предмет выявления основных закономерностей генеральной совокупности и оценки ее основных характеристик. Чаще всего эго выявление вида и формы некоторого закона изменения элементов генеральной совокупности, оценка параметров этого закона и достоверности полученных значений.

Если процессы, в ходе которых формируется совокупность элементов, не являются стационарными, то это означает, что информация о них, которую несут в себе фиксируемые в такие моменты времени наблюдения, не дает знания о совокупности в целом — они отражают лишь поведение объекта в этот конкретно-исторический промежуток времени, поведение объекта до этого промежутка и после него происходило в других условиях с другими характеристиками, которые, чаще всего, не вытекают друг из друга. В этом случае использовать выборочный метод нельзя. В лучшем случае при этом будут получены некоторые характеристики текущего момента, но знания о прошлом и будущем из них не вытекают.

Как определить, что имеющийся в распоряжении прогнозиста ряд статистических значений о некотором социально-экономическом объекте является выборочной совокупностью в статистическом смысле? Это сделать довольно просто. Надо только понять: безграничное расширение числа этих наблюдений позволит уточнить характеристики изучаемого объекта или, наоборот, помешают? Если увеличение числа наблюдений действительно улучшит понимание изучаемого процесса и позволит построить более точные модели, то перед нами выборочная совокупность, для обработки которой необходимо использовать методы математической статистики. Любое увеличение этой выборки из числа наблюдений, относимых к генеральной совокупности, только улучшит понимание характеристик генеральной совокупности.

Например, если прогнозист строит модель зависимости производительности труда швей-мотористок пятого разряда от уровня оплаты их труда, то новые дополнительные данные позволят улучшить результаты его работы по выявлению такой зависимости и построению соответствующей модели этой работы.

Если же включение в имеющуюся совокупность новых элементов только ухудшит свойства модели, то очевидно, что прогнозист имеет дело не с выборочной совокупностью. Например, если прогнозист собирается построить модель производственной функции Кобба—Дугласа для промышленности современной России и сделать с ее помощью прогнозы о том, как в ближайшие годы будут меняться объемы промышленного производства, то для этого ему нужны данные, в лучшем случае, с 1999 г. по настоящее время. Включение в имеющуюся совокупность данных значения прошлых лет (1990, 1980, I960 и т. п.) бессмысленно — тогда была другая социально-экономическая система и эти данные, которые на первый взгляд расширяют статистическую базу, при их использовании для построения прогнозной модели производственной функции на самом деле только ухудшат ее характеристики.

Поскольку в данной главе изучаются методы прогнозирования однородных стационарных процессов, мы будем иметь дело исключительно с выборочными совокупностями, характеристики которых мы определили выше.

  • [1] Елисеева И. ИЮзбашев М. М. Общая теория статистики: учебник /пол ред. И. И. Елисеевой. М.: Финансы и статистика, 2004. С. 216; Справочник по математике для экономистов: учеб, пособие / под ред. проф.В. И. Ермакова. М.: ИНФРА-М, 2007. С. 372;Доугерти К.

    Введение

    в эконометрику. М.: ИНФРА-М, 1997. С. 4. и др.

  • [2] Дунин-Барковский И. В., Смирнов Н. В. Теория вероятностей и математическая статистика в технике. М.: Гос. изд-во технико-теоретическойлитературы, 1955. С. 179.
  • [3] Смоляк С. А., Титаренко Б. П. Устойчивые методы оценивания (статистическая обработка неоднородных совокупностей). М.: Статистика,
  • [4] Светунъков С. Г., Литвинов А. А. Конкуренция и предпринимательские решения. Ульяновск: Изд-во Корпорации технологий продвижения,
  • [5] Джессен Р. Методы статистических обоснований. М.: Финансыи статистика, 1985. С. 21—22.
  • [6] Головам А. В., Ерина А. М., Трофимов В. П. Критерии математическойстатистики в экономических исследованиях. М.: Статистика, 1973. С. 5.
  • [7] Лагутин М. В. Наглядная математическая статистика: учебное пособие. М.: БИНОМ, Лаборатория знаний, 2009. С. 42.
  • [8] Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: учебник для вузов. М.: ЮНИТИ, 1998. С. 197.
Показать весь текст
Заполнить форму текущей работой