Выборочное исследование
Можно без особого труда создать случайную выборку, если в распоряжении исследователя имеется полный список всех людей, мнением которых он интересуется. Множество таких людей называется изучаемой совокупностью, или генеральной совокупностью. Создание списка представителей совокупности возможно, когда, например, планируется проведение опроса на предприятии, руководство которого готово предоставить… Читать ещё >
Выборочное исследование (реферат, курсовая, диплом, контрольная)
План.
1. Суть выборочного метода и его роль в социологии.
2. Случайные и неслучайные выборки в социологии.
3. Стратификация и кластеризация Заключение Список использованной литературы.
Сегодня вряд ли можно встретить человека, который хотя бы однажды не сталкивался с таким понятием, как социологическое исследование.
Об этих исследованиях часто можно слышать от специалистов самых разных областей: журналистов, экономистов, социологов, политиков, менеджеров, бизнесменов. При этом результаты самых разнообразных социологических исследований широко используются не только, так сказать, в конструктивных целях, например для обоснования тех или иных социальных, экономических, политических или относящихся к сфере бизнеса проектов. Нередко на результаты социологических исследований ссылаются (чаще всего в ходе политических дискуссий) как на один из самых весомых аргументов в критике оппонентов, в стремлении убедить массовое сознание в преимуществах одних взглядов, идей, методов деятельности и т. д., и породить в нем сомнение или даже полное неприятие позиций критикуемой стороны. Иными словами, наше общество все больше привыкает к тому, что социологические исследования становятся обязательной составляющей в решении тех или иных ответственных задач не только общегосударственного, но и локального масштаба.
Социологическое исследование — система логически последовательных методологических, методических и организационно-технических процедур, связанных между собой единой целью: получить достоверные данные об изучаемом явлении или процессе для их последующего использования в практике социального управления.
Прежде всего, следует отметить, что мировая практика проведения социологических исследований позволяет говорить об их достаточно обширных возможностях для получения надежной социальной информации. Это касается отражения в результатах таких исследований состояния социальных явлений и процессов, определения ведущих тенденций их развития и прогнозирования социальных ситуаций, выявления воздействующих на них факторов, поиска оптимальных путей их совершенствования, осуществления эффективного социального контроля и т. д. Таким образом, использование социологических исследований, в принципе, способно оказывать большую практическую помощь в решении различных социальных проблем, возникающих как на общегосударственном уровне, так и на уровне отдельных предприятий и организаций.
Цель работы — составить общее представление о выборочном методе и о возможностях его применения в социологии.
Задачи работы:
— рассмотреть суть выборочного метода и его роль в социологии,.
— изучить случайные и неслучайные выборки в социологии,.
— описать стратификации и кластеризации..
Теоретической базой послужили труды отечественных и зарубежных авторов, посвященные данной теме..
1. Суть выборочного метода и его роль в социологии.
Одной из задач, которые стоят перед социологом при проведении исследования, является сбор необходимых эмпирических данных об объекте исследования. Множество элементов, составляющих объект исследования называют генеральной совокупностью (ГС). Наиболее простым, на первый взгляд, способом сбора данных является сплошное обследование ГС. Однако применение сплошного обследования не всегда представляется возможным. В этом случае применяется выборочное обследование. Суть выборочного метода заключена в том, что обследованию подвергается только часть элементов ГС, которая называется выборочной совокупностью (ВС). Как писал профессор А. Кауфман, «изобретателем выборочного была сама жизнь». Действительно, еще до теоретического обоснования возможностей применения выборочного метода, статистики были вынуждены проводить выборочные обследования. Основными причинами для этого были отсутствие времени и средств.
Выборочный метод позволяет не только сократить временные и материальные затраты на проведения исследования, но и повысить достоверность результатов исследования. Достоверность полученной информации может быть не только не ниже, чем при сплошном обследовании, но и выше вследствие возможности привлечения персонала более высокого класса и применения различных процедур контроля качества получаемой информации.
Кроме того, выборочный метод имеет более широкую область применения. Широта области применения выборочного метода объясняется тем, что небольшой (по сравнению с ГС) объем выборки позволяет использовать более сложные методы обследования, включая использование различных технических средств (например, видеои аудиоаппаратуры).
Следует различать единицы отбора и единицы наблюдения. Единицами отбора являются единицы или группы единиц ГС отбираемые на каждом этапе формирования ВС. Единицы наблюдения — это отобранные единицы ГС, характеристики которых непосредственно измеряются. Если выборка проходит в несколько этапов (многоступенчатая выборка), то единицы отбора и единицы наблюдения могут не совпадать.
Развитие теории вероятностей позволило теоретически обосновать возможность применения выборочного метода. В основе теоретического обоснования выборочного метода лежит так называемый закон больших чисел. Физический смысл этого закона можно выразить следующим образом: при очень большом числе случайных явлений средний их результат практически перестает быть случайным и может быть предсказан с большой степенью определенности.
Также это дало возможность определять ошибку репрезентативности. Репрезентативностью ВС называется ее способность адекватно представлять (репрезентировать) характеристики ГС. Ошибкой репрезентативности, как правило, называют отклонение выборочного среднего значения признака от генерального. Важно учитывать, что при помощи выборочного метода никогда нельзя получить абсолютно точную оценку наблюдаемого признака, всегда существует вероятность ошибки, но, если вероятность ошибки мала, то она, скорее всего, не произойдет.
Разделяют два типа ошибок. Случайная (статистическая) ошибка — это ошибки, которые возникают вследствие случайной вариации значений, вызванной тем, что наблюдается только часть единиц, а не вся ГС. Случайные ошибки уменьшаются с увеличением объема ВС. Случайную ошибку можно измерить методами математической статистики, если при формировании ВС соблюдался принцип случайности. Принцип случайности заключается в следующем: каждый элемент ГС имеет равную и отличную от нуля вероятность попасть в ВС. Иными словами, термин «случайный» употребляется здесь и далее как синоним слова «равновероятный». Для соблюдения принципа случайности формирование выборочной совокупности должно проходить по строго определенным правилам, которые составляют метод формирования выборочной совокупности.
На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки. Систематическая ошибка — это неконтролируемые перекосы в распределении выборочных наблюдений. Число опрошенных не влияет на величину систематической ошибки.
2. Случайные и неслучайные выборки в социологии.
Выборка называется случайной, если каждый человек (каждый представитель совокупности) имеет известную ненулевую вероятность быть отобранным. Корни этого определения лежат в теории вероятностей, которая обосновала выборочные методы исследования.
Именно на ее основе было строго доказано, что по ответам относительно небольшого числа людей можно с высокой точностью судить о мнении всех. Обязательным условием этого является случайный характер выборки. Чтобы отличать такие выборки от случайных в обыденном понимании, их еще называют вероятностными выборками.
Выборки, в которых невозможно вычислить вероятность отбора людей, не являются случайными. Математическая теория к ним неприменима. Существует большое многообразие неслучайных выборок, одним из представителей которых является квотная выборка. В реальных исследованиях применяется даже больше неслучайных выборок, чем случайных.
Простая случайная выборка.
Можно без особого труда создать случайную выборку, если в распоряжении исследователя имеется полный список всех людей, мнением которых он интересуется. Множество таких людей называется изучаемой совокупностью, или генеральной совокупностью. Создание списка представителей совокупности возможно, когда, например, планируется проведение опроса на предприятии, руководство которого готово предоставить полный список своих сотрудников. В этом случае надо сначала решить, сколько человек будет опрошено, то есть определить размер выборки (иногда говорят «объем выборки»), а затем последовательно отобрать из списка нужное число людей. Для отбора необходимо использовать случайный механизм, обеспечивающий любому человеку из списка равную вероятность попасть в выборку. Полученная таким способом выборка называется простой случайной.
В качестве случайного механизма для отбора с равной вероятностью используют таблицы случайных чисел или датчики случайных чисел.
Каждый человек в списке имеет свой порядковый номер: 1, 2,.. ., N, где N равно общему числу людей в списке. Таблица или датчик случайных чисел выдает с равной вероятностью номера в интервале от 1 до N. Люди с соответствующими порядковыми номерами включаются в выборку.
Если какой-либо порядковый номер выпал повторно, то его просто игнорируют, поскольку человек с этим номером уже есть в выборке и второй раз в отборе участвовать не должен. Такой способ отбора называют отбором без возвращения (по аналогии с вытягиванием жребия из шляпы, когда вытянутые листки с номерами обратно в шляпу не возвращают). Случайные числа получают до тех пор, пока не будет выбрано нужное количество людей.
Во многих программах, предназначенных для обработки результатов опросов, есть специальная команда для получения простой случайной выборки. Такая команда есть, например, в программе SPSS. Но и без специальной команды легко получить простую случайную выборку, если в программе имеется датчик случайных чисел. Достаточно рядом с каждым человеком из общего списка записать случайное число, полученное этим датчиком (например, случайное число, равномерно распределенное на отрезке от 0 до 1), а затем пересортировать людей из списка в порядке возрастания (или убывания) значений этих случайных чисел. Теперь, чтобы получить простую случайную выборку нужного размера n, достаточно взять первые n человек из списка, отсортированного в случайном порядке.
В простую случайную выборку всегда попадает ровно столько людей, сколько запланировал исследователь, потому что именно так устроен механизм отбора. Несложно показать, что при размере выборки n каждый из N людей, помещенных в список, имеет равную вероятность по пасть в выборку. Эта вероятность равна f = n/N.
Более того, в выборку могут попасть любые n человек из N, т. е. любая комбинация n людей из N возможна, и даже одинаково вероятна. В математике число различных комбинаций n элементов из N (без повторений) обозначается символом CnN и вычисляется по формуле:
CnN =.
Именно столько существует различных простых случайных выборок размера n. Все они одинаково вероятны.
Простая случайная выборка обладает несомненными достоинствами — такими, как простота реализации, хорошее воспроизведение структуры совокупности, возможность вычисления доверительных интервалов.
Недостатки простой случайной выборки: необходим список всех представителей совокупности; стоимость исследования велика из-за удаленности респондентов друг от друга; статистическая погрешность возникает по всем параметрам выборки, даже по тем, для которых известны истинные пропорции.
Для устранения перечисленных недостатков используются два специальных приема формирования выборки — стратификация и кластеризация.
3. Стратификация и кластеризация.
Совокупность, из которой формируется выборка, обычно имеет свою структуру. В соответствии с этой структурой можно разделить совокупность на части по определенному признаку — территориальному, административному, производственному, социальному и т. п.
Простая случайная выборка не может гарантировать отбор заданного числа людей из каждой части совокупности. Она хотя и дает в среднем пропорциональное представительство в выборке людей разных групп, однако эти пропорции подвержены случайным колебаниям.
Иногда они могут заметно нарушаться.
Для обеспечения в выборке нужного соотношения между разными частями совокупности применяется стратификация. Она заключается в разбиении всей совокупности на непересекающиеся части, называемые стратами. Для каждой страты вычисляется приходящийся на нее размер выборки, а затем производится случайный отбор нужного числа респондентов. В результате в каждой страте отбирается ровно столько респондентов, сколько запланировал исследователь. Полученная таким способом выборка называется стратифицированной. Иногда вместо термина «страты» применяют названия «типические районы» или «слои», а стратифицированную выборку называют районированной или расслоенной.
Чаще всего выборка распределяется по стратам пропорционально числу людей в них. Такое распределение называется пропорциональным. Оно позволяет выдержать в выборке те же пропорции между стратами, что и во всей совокупности. Наряду с пропорциональным применяется также равное размещение, размещение Неймана и оптимальное размещение.
При равном размещении из каждой страты опрашивают одинаковое число людей, хотя число людей в стратах может заметно различаться.
Равное размещение применяют, когда требуется сравнить между собой разные части совокупности.
Размещение Неймана основано на том, что размер выборки делают больше в тех стратах, где труднее оценить интересующий исследователя параметр.
При оптимальном размещении учитывается не только разброс в стратах по оцениваемому параметру, но и разница в стоимости опроса.
В тех стратах, где стоимость опроса выше, размер выборки уменьшается по сравнению с размещением Неймана. Там, где стоимость опроса ниже, размер выборки увеличивается. За счет экономии на «дорогих» стратах оптимальное размещение позволяет увеличить общий размер выборки при той же самой стоимости исследования.
Размещение Неймана применяют в тех случаях, когда нужно уменьшить статистическую погрешность по какому-то одному, наиболее важному для исследователя параметру. При этом погрешности по другим параметрам могут увеличиться по сравнению с пропорциональным размещением выборки. Оптимальное размещение позволяет еще больше уменьшить погрешность по этому параметру за счет увеличения общего размера выборки при сохранении ее стоимости. Но чтобы применить размещение Неймана, необходима информация о величине разброса параметра в стратах (т. е. о дисперсии), а для оптимального размещения требуется также информация о стоимости опроса в стратах.
Четыре рассмотренных способа распределения выборки между стратами являются типовыми. Каждый из них решает определенную задачу.
Можно применять и другие способы размещения выборки в зависимости от преследуемой цели. Но только один из способов обеспечивает пропорциональное представительство в выборке людей из каждой страты, а именно — пропорциональное размещение.
Никаких ошибок не возникнет, если при вычислениях учитывается число людей в каждой страте. Предположим, что вся совокупность разделена на M страт и что число представителей совокупности в стратах равно соответственно N1, N2, …, NM. Пусть требуется оценить по выборке некоторый параметр, например средний доход за последний месяц. Сначала посчитаем средний доход в каждой страте обычным способом, как среднее арифметическое доходов респондентов из этой страты. Общий средний доход для всех страт считается по следующей формуле:
где — средний доход по всей стратифицированной выборке,.
— средний доход в i-ой стра те, Ni — число людей в i-ой страте, N — число людей во всей совокупности. Несмотря на то, что правильные пропорции между стратами в выборке могут не соблюдаться, использование множителей Ni / N восстанавливает эти пропорции.
Величина Wi = Ni / N, равная доле населения страты во всем населении, называется весом страты. Веса страт надо учитывать при вычислении среднего значения в стратифицированной выборке. При пропорциональном размещении веса страт можно не учитывать, т. к. нужные пропорции и так выдержаны.
где Wi — вес i-ой страты, Дi — погрешность в i-ой страте (все величины возводятся в квадрат). Если погрешности во всех стратах будут невелики, то и общая погрешность будет мала.
Это свойство стратифицированной выбор ки можно эффективно использовать при делении совокупности на страты. Страты надо создавать таким образом, чтобы в них попадали схожие между собой люди. Чем более похожи друг на друга будут люди внутри одной страты, тем меньше будет погрешность стратифицированной выборки.
Для создания страт надо иметь точные данные о числе людей в каждой страте. Эти данные обычно имеются по небольшому числу социально-демографических параметров, таких как пол, возраст, тип места жительства и некоторым другим. Но даже из этих параметров не все можно использовать для стратификации, так как при случайном отборе люди из одной страты должны быть отделены от людей из другой. Поэтому страты чаще всего формируются по территориальным признакам или по признакам, с ними связанным, например, по типам населенных пунктов. В результате в одну страту попадают люди, не слишком похожие друг на друга, из-за чего статистическая погрешность выборки уменьшается незначительно.
И тем не менее при пропорциональном размещении выборки по стратам общая статистическая погрешность всегда уменьшается, либо, в крайнем случае, остается той же самой. Она в принципе не может увеличиться. По этой причине стратифицированные выборки применяют в большинстве исследований.
Стратификация устраняет только один из недостатков простой случайной выборки — она позволяет выдержать в выборке точные пропорции всей совокупности, если они известны. Но два других недостатка остаются. Для проведения случайного отбора надо иметь список людей каждой страты. Отобранные в стратах респонденты будут по-прежнему удалены друг от друга, что увеличивает стоимость опроса.
Избавиться от этих недостатков позволяет другой метод формирования выборки — кластеризация.
Кластеризация позволяет включать в выборку респондентов, проживающих на небольшом расстоянии друг от друга, сохраняя при этом случайный механизм их отбора. Это достигается путем объединения людей в группы, которые участвуют в отборе как самостоятельные единицы. Такие группы называются кластерами. Чаще всего в качестве кластеров используют различные территориальные образования. Это могут быть административные районы, населенные пункты, городские микрорайоны, городские кварталы, территории избирательных округов или избирательных участков и т. п. В роли кластеров могут также выступать предприятия при опросе рабочих и служащих, учебные заведения при опросе учащихся, магазины при опросе продавцов.
Для получения выборки надо сначала отобрать нужное число кластеров, а затем в каждом из отобранных кластеров отобрать нужное число респондентов, т. е. отбор надо проводить в два этапа. На первом этапе в отборе участвуют кластеры, на втором — люди.
Прежде чем приступить к отбору кластеров, надо составить их полный список. Каждый человек, входящий в изучаемую совокупность, должен быть отнесен к какому-либо кластеру, причем только к одному. Составление полного списка кластеров представляет гораздо меньше проблем, чем составление полного списка людей. Особенно тогда, когда кластерами служат единицы административно-территориального деления. Например, списки всех административных районов, а также всех городов и поселков городского типа России (с указанием числа жителей) ежегодно публикуются Федеральной службой госстатистики. Их вполне можно использовать в качестве кластеров при опросе населения.
Одна из задач кластеризации состоит в том, чтобы сократить время и затраты на перемещение интервьюера от респондента к респонденту в пределах кластера. Желательно, чтобы это время не превышало 10−15 минут. Если отобранные кластеры имеют слишком большую территорию и не обеспечивают выполнения данного требования, приходится проводить еще один этап или ступень отбора. При этом кластеры, которые отбираются сначала, на первой ступени, называются первичными единицами отбора (ПЕО).
Внутри них формируются более мелкие кластеры, которые называются единицами отбора второй ступени или вторичными единицами отбора (ВЕО). Вторая ступень отбора проводится только в тех кластерах, которые были отобраны на первой ступени. Например, если на первой ступени проводился отбор административных районов России, то на второй ступени могут отбираться населенные пункты районов, попавших в выборку.
В кластерах, отобранных на второй ступени, можно провести отбор еще более мелких кластеров. Например, в городах можно провести отбор микрорайонов, кварталов или избирательных участков. Это будет третья ступень отбора. На последней ступени отбираются люди (или другие элементы, из которых состоит изучаемая совокупность и которые являются объектом исследования). В зависимости от числа ступеней отбора выборка будет называться двухступенчатой, трехступенчатой и т. д.
Выборка, в которой на начальных этапах отбираются кластеры, а на последнем этапе — люди (представители совокупности), называется многоступенчатой или кластерной. В некоторых изданиях на русском языке кластеры называются гнездами, а кластерная выборка — гнездовой.
Использование кластерной выборки избавляет исследователя от необходимости составлять полный список всех представителей совокупности. Вместо этого составляются списки кластеров: первичных единиц отбора — для всей совокупности, вторичных единиц отбора — для тех ПЕО, которые попали в выборку на первой ступени, и т. д. Списки людей нужны только для проведения последней ступени отбора. Они составляются для тех небольших по размеру кластеров, которые были отобраны на предпоследней ступени. При опросах по месту жительства списки людей заменяются списками домохозяйств. Эти списки могут быть получены на основе домовых книг жилищно-эксплуатационных организаций или сельских администраций, а могут быть составлены интервьюером непосредственно на местности, что достаточно просто для небольших кластеров.
Таким образом, у кластерной выборки отсутствуют два главных недостатка простой случайной выборки — не требуется список всех представителей совокупности и интервьюер имеет возможность опросить нескольких человек, проживающих на небольшом расстоянии друг от друга.
Кластерная выборка является случайной, т. е. для каждого человека (элемента совокупности) должна быть обеспечена определенная (желательно — равная) вероятность попасть в выборку.
Для этого кластеры должны отбираться с вероятностью, пропорциональной числу элементов в кластере. Такой способ отбора часто называют ВПР-отбором (по первым буквам слов «вероятность, пропорциональная размеру») или PPS-отбором (от аналогичного английского выражения «probability proportional to the size»). Число элементов совокупности в кластере называют размером кластера.
Если отбирать кластеры с вероятностью, пропорциональной размеру, а людей внутри кластера — с равной вероятностью, то для любого человека из изучаемой совокупности будет обеспечена одинаковая вероятность попадания в выборку. Это следует из того, что итоговая вероятность отбора получается путем умножения вероятности отбора кластера p1 на вероятность отбора человека внутри кластера p2. Если в i-ом кластере содержится Ai элементов, а во всей совокупности — N элементов, то вероятность PPS-отбора i-го кластера равна p1 = Ai / N. Вероятность отбора одного человека в кластере, состоящем из Ai людей, равна p2 =1/ Ai. Итоговая вероятность попадания человека в выборку получается после умножения p1 на p2, она равна.
Эта вероятность в итоге не зависит от размера кластера Ai и будет одинаковой для любого человека из совокупности.
Когда последовательно отбирается n1 кластеров и в каждом кластере отбирается по n2 элементов, то общая вероятность отбора будет равна.
где n — общий размер выборки.
Аналогично вычисляется вероятность и при многоступенчатом отборе. Например, при трехступенчатом отборе вероятность равна.
.
Отметим, что кластеры надо отбирать «с возвращением», т. е. все кластеры, в том числе и уже попавшие в выборку, участвуют в каждом из n1 отборов. Поэтому один и тот же кластер может попасть в выборку два и более раз. Повторное попадание кластера в выборку означает, что внутри кластера тоже должен проводиться повторный отбор. Если в кластере, попавшем в выборку один раз, отбирается n2 человек, то в попавшем в выборку два раза — дважды по n2 человек, в попавшем в выборку три раза — трижды по n2 человек, и т. д. То же самое относится и к многоступенчатому отбору, когда на второй ступени отбираются не люди, а более мелкие кластеры.
Их количество тоже увеличивается в соответствующее число раз.
Кластерная выборка получается дешевле простой случайной. За уменьшение стоимости приходится платить увеличением статистической погрешности. Потеря точности кластерной выборки происходит из-за того же, из-за чего уменьшается ее стоимость, а именно из-за группировки респондентов внутри кластеров. Респонденты, живущие недалеко друг от друга, часто дают похожие или даже одинаковые ответы на вопросы анкеты.
Размер простой случайной выборки, имеющей такую же статистическую погрешность, что и применяемая выборка, называется эффективным размером этой выборки. В приведенном гипотетическом примере эффективный размер выборки будет в 10 раз меньше ее реального размера.
Понятие «эффективный размер» используется при сравнении выборок между собой, поскольку реальный размер выборки не отражает величину ее статистической погрешности. Чем меньше величина статистической погрешности, тем больше эффективный размер выборки, и наоборот. Про реальный размер выборки этого сказать нельзя.
Для измерения качества выборки используют параметр, который называется дизайн-эффектом и обозначается deff. Он получается в результате сравнения выборки произвольного типа с простой случайной выборкой такого же размера. Простая случайная выборка играет здесь роль эталона. Дизайн-эффект показывает, во сколько раз реальный размер выборки n больше или меньше ее эффективного размера nэф.
Связь между статистической погрешностью выборки Д и статистической погрешностью Д0 простой случайной выборки такого же размера выражает следующее соотношение:
.
Если deff > 1, то погрешность будет больше погрешности простой случайной выборки, т. е. применяемая выборка «хуже». Если deff < 1, то ее погрешность меньше, т. е. она «лучше». Если deff = 1, то выборки одинаковы по точности.
Кластерная выборка всегда менее точна, чем простая случайная, т. е. ее дизайн-эффект всегда больше единицы. Потеря в точности происходит из-за наличия зависимости между ответами респондентов одного кластера. Для измерения степени этой зависимости используют показатель, который называется коэффициентом внутри кластерной корреляции и обозначается roh (rate of homogeneity). Он принимает значения от нуля до единицы; 0 означает полное отсутствие зависимости внутри кластеров, 1 — максимальную зависимость (внутри каждого кластера все респонденты отвечают одинаково). На практике roh принимает всегда промежуточное значение между 0 и 1. Для разных параметров совокупности roh может принимать разные значения.
По результатам опроса можно оценить величину roh по любому измеряемому признаку. Для этого существуют специальные программные средства.
Дизайн-эффект кластерной выборки зависит от двух факторов: от коэффициента внутрикластерной корреляции roh и от размера подвыборки в кластере nc. Эта зависимость выражается формулой.
При малых значениях roh в каждом кластере можно опрашивать больше респондентов.
При больших roh число опрашиваемых в кластерах надо сокращать, а необходимый размер выборки достигается за счет увеличения числа отбираемых кластеров.
Исследователь не может повлиять на величину roh, это свойство кластеров, которое можно измерить, но нельзя изменить. Единственное, что он может сделать, это использовать в качестве единиц отбора другой тип территориальных единиц с другим значением roh. А вот количество человек nc, которое будет опрашиваться в кластерах, полностью зависит от исследователя.
При большом nc стоимость выборки уменьшается, но погрешность растет. При малом nc стоимость растет, а погрешность уменьшается.
Существует некоторое оптимальное значение nc. Чтобы его определить, надо из общих затрат на исследование попытаться выделить затраты, связанные с кластерами, и непосредственные затраты на проведение интервью. К первым относятся время и транспортные расходы интервьюера на то, чтобы добраться до места нахождения кластера. Если кластером является городской квартал, то это время и стоимость проезда интервьюера до квартала и обратно. Если кластером является село, то стоимость кластера определяется временем, которое интервьюер затрачивает на дорогу туда и обратно, а также стоимостью проезда на электричке, автобусе, попутной машине и т. п. В затраты, относящиеся к кластеру, входит также стоимость проживания интервьюера в гостинице, когда опрос проходит в удаленной местности и его не удается завершить в течение одного дня.
Стоимость проведения интервью определяется длиной вопросника и средней длительностью интервью, а также временем, затрачиваемым интервьюером на поиск респондента после прибытия на место проведения опроса (в нужный квартал, село и т. п.).
Для определения величины nc важны не столько сами стоимости, сколько их отношение. Если обозначить через C средние затраты на один кластер, а через I — средние затраты на одно интервью, то оптимальное значение размера выборки в кластере можно вычислить по следующей формуле:
Полученное значение nc будет оптимальным в том смысле, что обеспечит минимальную статистическую погрешность при фиксированной стоимости исследования, или, что эквивалентно, обеспечит заданную погрешность при минимальных затратах.
Для вычисления nc надо знать помимо отношения стоимостей C/ I еще и коэффициент внутрикластерной корреляции roh. Обычно его определяют по результатам предыдущих исследований, в которых были использованы кластеры того же типа (районы, населенные пункты или городские кварталы).
В тех случаях, когда оптимальное значение nc вычислить не удается из-за отсутствия нужной информации или по другим причинам, размер подвыборки в кластерах определяется исходя из числа имеющихся интервьюеров, максимально допустимой нагрузки на одного интервьюера и других подобных соображений.
Кластеризация уменьшает стоимость выборочного исследования, позволяя отбирать респондентов, проживающих на небольшом расстоянии друг от друга. При этом увеличивается статистическая погрешность. При изучении общественного мнения больших масс населения, проживающих на обширной территории, это единственный способ создать случайную выборку.
Заключение.
При проведении исследования необходимо установить контингент опрашиваемых в соответствии с его целями и задачами. Большинство социологических исследований носят не сплошной, а выборочный характер, потому что сплошной охват изучаемой совокупности требует недопустимо высоких материальных и временных затрат. В соответствии с четкими правилами отбирается определенное количество людей, которые по своим социально-демографическим характеристикам соответствуют структуре изучаемого объекта. Такая операция в социологии называется выборкой.
Под генеральной совокупностью понимают полное множество объектов, имеющих отношение к изучаемой проблеме, на которое распространяются все выводы проведенного исследования. Строгое определение генеральной совокупности фактически формализует объект социологического исследования.
Выборочной совокупностью называют микромодель всей генеральной совокупности, построенную по строгим правилам, с учетом основных для данного исследования характеристик, генеральной совокупности. Выборочный метод основан на следующих постулатах:
— существует взаимосвязь и взаимообусловленность между качественными характеристиками объекта исследования;
— на основании рассмотрения части, которая по своей структуре является микромоделью целого, правомерно делать выводы о всей генеральной совокупности.
Обобщение результатов выборочного исследования на генеральную совокупность осуществляется с помощью строгих индуктивных процедур статистического вывода. Существует устойчивая пропорция: если величина генеральной совокупности составляет менее 5000 человек, то достаточным объемом выборочной совокупности считается объем не менее 500 человек, при большей величине выборочная совокупность должна составлять 10%, но не более 2000;2500 человек.
Тип и способы выборки напрямую зависят от вида исследования, его целей и гипотез, причем достоверность результатов прямо зависит от качества выборки. Наиболее строгие требования к выборке предъявляются в аналитическом исследовании.
Представительностью, или репрезентативностью, выборки называют ее способность правильно отражать характеристики той совокупности, из которой она извлечена. Ошибкой репрезентативности называются расхождения между двумя совокупностями — генеральной и выборочной. Разница в показаниях генеральной и выборочной совокупностей не должна превышать 5%. Главный принцип, которым должен руководствоваться социолог при составлении выборочной совокупности, заключается в следующем: чем более однороден изучаемый объект, тем меньше может быть выборочная совокупность. Однородной считается такая совокупность, в которой контролируемый признак не образует пустот или сгущений. В этом случае, опросив несколько человек, социолог может смело распространять свои выводы на весь объект. Таким образом, на репрезентативность данных влияют не только количественные характеристики выборочной совокупности, но и качественные характеристики генеральной совокупности, в частности степень ее однородности.
социология выборочное исследование совокупность.
1. Агабекян Р. Л. Математические методы в социологии. Анализ данных и логика вывода в эмпирическом исследовании: Учебное пособие для вузов / Р. Л. Агабекян, М. М. Кириченко, С. В. Усатиков. — Ростов н/Д: Феникс, 2005.
2. Анурин В. Ф. Эмпирическая социология: Учебное пособие для вузов. — М.: Академический Проект, 2011. — 288с.
3. Бабосов Е. М. Прикладная социология: Учеб. пособие для студентов вузов. 2-е изд., стереотип. — Мн.: «ТетраСистемс», 2011.
4. Большой толковый социологический словарь (Collins). Том 2 (П-Я): Пер. с англ. — М.: Вече, АСТ, 2011. — 528с.
5. Девятко И. Ф. Методы социологического исследования. — 3-е изд. — М.: КДУ, 2012. — 296с., ил.
6. Зборовский Г. Е., Шуклина Е. А. Прикладная социология: Учебное пособие. — М.: Гардарики, 2010. — 176 с.
7. Кравченко А. И. Социология: Общий курс: Учебное пособие для вузов. — М.: ПЕРСЭ; Логос, 2012. — 640с.: ил. — (Современное образование).
8. Основы прикладной социологии. Учебник для вузов. Колл. авторов. Под ред. Ф. Э. Шереги и М. К. Горшкова. М.: Интерпракс, 2009. — 184с.
9. Сикевич З. В. Социологическое исследование: практическое руководство. — СПб.: Питер, 2008. — 320с.
10. Рабочая книга социолога. Под ред. Рудкевича М. Н. — М., 2010.
11. Шикун А. И. Социологический практикум: Учебное пособие. — Мн.: Амалфея, 2010. — 208с.
12. Ядов В. А., В. Я. Беляев, В. Ф. Марарица, П. Н. Оконешников Общая социология: теория и прикладные исследования. — СПб, Санкт-Петербургское философское общество, 2011. — 440с.