ФАРХАД ИЛЬЯСОВ | публикации |
Главная | Книги | Статьи | Контакты |
Ильясов Ф.Н. Алгоритмы формирования выборки социологического опроса //Социальные исследования. 2017. №2. С. 60-76.
АННОТАЦИЯ В статье уточняются термины, связанные с понятиями выборки и репрезентативности. Описывается классификация выборок, принятая в социологии. Предлагается и описывается классификация выборок по месту нахождения респондента и по методу контакта с ним. Ключевые слова: виды выборки; алгоритмы отбора; репрезентативность Прохождение статьи: Поступила: 21.11.2017, Принята: 14.12.2017, Опубликована онлайн: 28.12.2017
1. Введение Проблема выборки в социальных обследованиях имеет очень большое значение, тем не менее, эта тема остается не в полной мере разработанной и проясненной. Особенно это касается не-вероятностных, рандомных выборок (англ. random sample). Ред Бейкер с коллегами отмечают: «В отличие от вероятностной выборки, нет единого основания, которое позволило бы адекватно классифицировать и описать все виды не-вероятностных выборок. Не-вероятностные выборки представляет собой набор, коллекцию методов, и трудно, если не невозможно, описать особенности и алгоритмы, применяемые во всех видах не-вероятностных выборок» [Baker et al., 2013: 3]. Целью настоящей статьи является уточнение имеющихся классификаций и описаний алгоритмов отбора в социальных исследованиях.
Генеральная совокупность - группа, выбранная в качестве объекта исследования. В соответствии с задачами исследования, генеральная совокупность выбирается по двум и более признакам. Однако, даже, если для выделения группы выбраны два «целевых» признака, например: 1. «все население определенной страны», 2. «в возрасте 18+», то выделяются еще и дополнительные репрезентирующие признаки. Это могут быть пол, возраст, образование, социальное положение, национальность, место расположения, детность, брачность, религиозность и т.д. Генеральные совокупности, формируемые респондентами – это совокупности респондентов, находящихся по своей воле, и в силу сходной детерминации поведения, в определенных местах или осуществляющих определенные онлайн-контакты. Это могут быть:
Выборка, выборочная совокупность – часть генеральной совокупности, отобранная для первичных измерений. Первичные измерения в социологии это измерение свойств первичного объекта измерения – отдельных респондентов, через измерение свойств которых измеряются свойства изучаемой группы (выборки). Конечный объект измерения в отдельном социологическом исследовании – это специфическая группа, выборка или генеральная совокупность. Репрезентативность выборки – это её свойства точно отражать исследуемые характеристики генеральной совокупности. Строго говоря, репрезентативность – это не единое, общее свойство всей выборочной совокупности, а это характер распределения ответов на тот или иной конкретный вопрос анкеты. То есть репрезентативным являются распределение ответов на определенный вопрос. Характер рассеяния разных свойств респондентов в генеральной совокупности может быть различным, оттого в одном опросе уровень репрезентативности ответов может быть различным по разным вопросам. Порой используют не совсем корректное выражение «репрезентативный опрос», на самом деле имея в виду репрезентативность выборки, либо репрезентативность результатов опроса, тогда как сам опрос – это процесс сбора эмпирической информации. Иногда репрезентативной называют выборку, которая по социально-демографическим характеристикам опрошенных воспроизводит генеральную совокупность, при этом репрезентативность ответов на содержательные вопросы может оставаться неизвестной. Порой под репрезентативной понимают выборку, которая с точки зрения теории математической статистики, «должна быть» репрезентативной. Однако в данном случае речь идет только о гипотезе, которая, как правило, сохраняет статус непроверяемой.
Параметры выборки – определение объема выборки и того, какие параметры генеральной совокупности должна репрезентировать выборка. Это могут быть пол, возраст, доход, профессия, социальное положение, обладание определенными предметами, потребление определенных товаров и т.д. Формирование выборки – реализация алгоритма отбора. Целью формирования выборки часто является создание репрезентативной выборки. Ошибка выборки. Как отмечал Геннадий Батыгин: «Практически ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. …В качестве контрольных параметров обычно применяются социально-демографические признаки» [Батыгин, 2008: 149]. Важно указать – показатель «статистическая погрешность», описываемый в терминах доверительного интервала и уровня доверия, является теоретическим понятием математической статистики и никак не характеризует реальную выборочную совокупность. О доверительном интервале и статистической погрешности подробнее см., например: [Антонов, 2013]. Также некорректными следует признать построения, основанные на идее нормального распределения, т.к. нет социологического свойства, относительного которого были бы получены достоверные эмпирические данные, подтверждающие нормальное распределение величин его свойств. Удобная выборка (англ. convenience sampling) – это виды выборок, в которых отбор осуществляется в генеральных совокупностях, формируемых респондентами. Размер, объем выборки – количество отбираемых респондентов. Как указывается в известном издании: «Выборочный метод не дает универсального решения относительно необходимого в каждом конкретном случае объема выборки, обязательного соотношения объемов генеральной и выборочной совокупностей» [Рабочая книга…, 1977: 266]. На практике размер выборки определяется эмпирически, исходя из результатов анализа ранее проведенных опросов. Следует указать, что, как известно, так называемый «расчет объема выборки по специальной формуле», основанный на показателе дисперсии величин некоторого свойства (признака), возможен только при известности дисперсии в генеральной совокупности, однако если дисперсия известна, опрос проводить не имеет смысла. Квотное задание – сформулированное для конкретного интервьюера на основе параметров выборки, задание опросить конкретное число лиц с определенными свойствами, признаками. Это может быть, например, число женщин и число мужчин заданного возраста. Тип отбора респондентов – при самом общем подходе можно выделить следующие типы отборов:
В первом случае отбор основан на строгом алгоритме с использованием основы выборки, таблицы или генератора случайных чисел. Во втором случае речь идет об использовании алгоритмов отбора, эмпирически показавших свою возможность обеспечивать репрезентативность выборки. В третьем и четвертом случаях строго алгоритма отбора нет, и вопрос репрезентативности может оставаться открытым. В настоящем тексте используется термин «рандомная», чтобы не применять многозначное слово «случайная» и не совсем точное «вероятностная» (отбор основан на вероятности, однако производится случайным образом). Шаг, ступень выборки – элемент алгоритма отбора.
Выражение «виды выборки» используется в разных смыслах, например:
Соответственно, классификации выборок отражают многозначный характер этого понятия, описывая, как правило, один или два ключевых критерия, подхода, алгоритма.
Более подробно о классификации видов выборок см., например: [Рабочая книга…, 1977: 258-297; Могильчак, 2015; Alvi, 2016]. Понятия «квотная, кластерная, районированная, стратифицированная» являются в определенной мере сходными и обозначают выделение некоторых непересекающихся групп, страт по отдельным основаниям, определяемым исследователем. Иногда стратами называют разные подвыборки, формируемые в рамках одного исследования из двух или более сравниваемых генеральных совокупностей, к их числу относятся:
Сходными являются также понятия гнездовой и серийной выборки, они обозначают процесс выбора групп (семья, школьный класс, подразделение в организации), подлежащих сплошному опросу.
С точки зрения теории статистики, случайный выбор – это выбор одного варианта из нескольких равновозможных. Рандомный, статистически случайный отбор – это алгоритм отбора респондентов, при котором каждая из единиц генеральной совокупности имеет равные шансы, одинаковую вероятность, попасть в выборку. При рандомном отборе есть возможность посчитать теоретическую вероятность попадания каждого респондента в выборку, потому она называется также вероятностной. Более подробно о рандомных (вероятностных, случайных) выборках см., например: [Чуриков, 2007]. Надо заметить, использование рандомного, вероятностного отбора не гарантирует репрезентативность выборки. Репрезентативность в данном случае – это просто предположение, вытекающее из теории математической статистики, некоторая априорная предпосылка, которая может реализоваться в конкретном отборе, а может и не реализоваться. Рандомной может считаться, например, выборка, в которой основой выборки является полный список всех единиц генеральной совокупности. Это может быть список избирателей, список адресов, список работников организации и т.д. В соответствии с принятым объемом выборки, отбор может осуществляться через определенный интервал, шаг выборки. Рандомный отбор может быть осуществлен с помощью компьютерной программы, с использованием генератора случайных чисел. В программу вносятся два показателя – размер генеральной совокупности и размер выборки. Эта процедура реализуема и с использованием известных статистических пакетов.
На практике алгоритм строго рандомного отбора реализовать сложно. Потому все чаще используются так называемые «эмпирические» выборки, под которыми понимаются различные совокупности алгоритмов рандомного и «стихийного», «произвольного» отбора, которые, как ожидается исследователем, обеспечивают репрезентативность. Эмпирическими они называются потому, что оптимальный алгоритм отбора в них определяется эмпирически, через апробацию тех или иных алгоритмов и нахождения наиболее точного, оптимального.
Каждая из эмпирических выборок представляет собой алгоритм отбора, состоящий из двух элементов:
Соответственно, можно выделить два основания для классификации видов выборок, алгоритмов отбора:
6. Эмпирические виды выборок по месту нахождения респондента
По основанию локации респондентов можно выделить следующие основные эмпирические виды выборок:
Объектом исследования в случае выборки по месту жительства могут являться генеральные совокупности – территориальные общности разного уровня: страна, область, город, район. Построение выборки начинается с локации нужного масштаба. Определяется размер и параметры выборки. Алгоритм формирования выборки по месту жительства респондента приведен на рис. 1. На первых пяти ступенях отбора, от региона до наименования улицы, отбор может производиться либо рандомным образом, либо отбираются типичные на взгляд исследователя локации, соответствующие целям изучения.
Рис. 1. Алгоритм формирования выборки по месту жительства респондентов |
|
До интервьюера эти квоты доводятся в виде квотного задания, в котором указывается, сколько человек с определенными социально-демографическими и иными свойствами он должен опросить. Рис. 2. Алгоритм формирования выборки по месту работы респондентов |
|
Алгоритм уличного отбора во многом совпадает с алгоритмом отбора по месту жительства, только здесь конечной, опросной точкой является место на улице. Как правило, уличный опрос проводится на основе квотных заданий. На первом этапе, до выбора квот, респонденту дается задание отбирать для опроса проводящих мимо респондентов через определенный шаг, например, каждого пятого. Этот этап отбора можно считать рандомным. На втором этапе респондент отбирает в соответствии с недобранными квотами, например, только мужчин среднего возраста. Этот этап отбора можно полагать стихийным.
По основанию типа дистанционного контакта с респондентом можно выделить следующие основные виды выборок:
В случае выборки, создаваемой на основе списка телефонов, она может быть репрезентативной при соблюдении следующих условий:
В случае выборки само-отбора, осуществляемой посетителями сайтов, выборка может рассматриваться как репрезентативная только относительно аудитории этих сайтов. Выборка само-отбора имеет признаки стихийной. Однако, она может рассматриваться как эмпирическая, в случае, если результаты онлайн опроса согласуются с результатами другого опроса, определенными как репрезентативные. Подробнее о выборке само-отбора см., например: [Bethlehem, 2008].
|
Антонов Г. В. Выборочный метод в социологических исследованиях // Научный диалог. 2013. №11. С. 96-109. Батыгин Г. С. Лекции по методологии социологических исследований. М.: РУДН. 2008. - 368 с. Ильясов Ф. Н. Репрезентативность результатов опроса в маркетинговом исследовании // Социологические исследования. 2011. № 3. С. 112-116. Ильясов Ф. Н. Обратная задача выборки и мотивация на рынке Форекс // Социальные исследования. 2016. №2. С. 49-59. Могильчак Елена Львовна Выборочный метод в эмпирическом социологическом исследовании. Екатеринбург: УрФУ. 2015. – 120 с. Рабочая книга социолога. М.: Наука. 1977. – 511 с. Рогозин Д. М. Конформная выборка в торговых центрах // Социологический журнал. 2008. №1. С. 22-48. Чуриков А. Случайные и неслучайные выборки в социологических исследованиях // Социальная реальность. 2007. №4. С. 89-109. Alvi, Mohsin Hassan. A Manual for Selecting Sampling Techniques in Research. MPRA Paper No. 70218, posted 25 March 2016. Available online: https://mpra.ub.uni-muenchen.de/70218/ (Accessed: 2017.12.02) Baker R., Brick J. M., Bates N. A., Battaglia M., Couper M. P., Dever J. A., Gile K. J., Tourangeau R. Report of the AAPOR task force on non-probability sampling. June 2013. Available online: (Accessed: 2017.12.02) Bethlehem, Jelke. How accurate are self-selection web surveys. The Hague/Heerlen: Statistics Netherlands. 2008. Available online: https://peilingpraktijken.nl/wp-content/uploads/2014/06/bethlehem04.pdf (Accessed: 2017.12.02) Stoop, Ineke and Harrison, Eric. Classification of Surveys. In: Handbook of Survey Methodology for the Social Sciences. Ed. Gideon L. New York: Springer Science + Business Media. 2012. P. 7-21.
Algorithms for sampling a sociological survey
|