Методы и методология социологического исследования
Лекция 10
Расчет объема выборки количественного исследования
Видео-курс Владимира Звоновского для социологов-бакалавров, читавшийся в СГЭУ в 2012-2021 гг.
Цель лекции: Дать представление о принципах и процедуре расчета объема выборки количественного исследования (опроса, наблюдения, анализа документов, эксперимента), а также факторах и условиях, влияющих на этот расчет
План лекции
1
Основные понятия выборочного метода. Связь точности и достоверности измерения. Стандартизация переменных.
2
Расчет объема выборки для оценки среднего
3
Расчет объема выборки для оценки доли
4
Коррекция объема выборки
10.1. Измерение как цель выборочного исследования
Эта лекция посвящена теме расчета объема или размера выборочной совокупности количественного опроса, хотя, сказанное сегодня в равной степени касается других видов социологического исследования – наблюдения, эксперимента или анализа документов. Мы изучим, какие параметры необходимо учитывать для определения размера выборочной совокупности.

Прежде всего нужно заметить, что с помощью выборки или производства этой выборочной совокупности мы реализуем некоторую измерительную процедуру, то есть мы измеряем различные количественные параметры. Все множество количественных параметров можно свести к двум основным. Во-первых, это - среднее значение, например, средний чек в магазине, среднее число походов в кинотеатр, среднее время, затраченное на дорогу с работы домой и обратно, или какие-то другие параметры. Во-вторых, это – доля: другой тип количественных характеристик, например, доли мужчин и женщин; сколько избирателей поддерживает одну партию, сколько поддерживает другую; какая доля горожан людей намерена провести отпуск на море, сколько - на своем дачном участке и т.д. Для измерения этих количественных параметров мы и проводим выборочные исследования, и в зависимости от того, с помощью какого из этих двух параметров - средней или доли, мы это будем делать, и будет зависеть, как именно нужно вычислять объем требуемой для этого выборочной совокупности.

Поскольку мы имеем дело с выборочными исследованиями, большое значение имеют две статистические характеристики, присущие выборочному исследованию как таковому: точность и достоверность.

Точностью мы называем степень расхождения между параметром выборочной совокупности и параметром генеральной совокупности, который мы и хотим измерить. Эта степень определяется величиной доверительного интервала и зависит от размера выборочной совокупности.

Достоверность - это вероятность выхода параметров выборочной совокупности за пределы доверительного интервала, рассчитанного для этой совокупности.

Прежде чем перейти к формуле определения размера выборки, необходимо упомянуть о статистических параметрах, используемые в этой формуле. Это - средняя (среднее арифметическое, если мы говорим о строгом соответствии математическому определению) и дисперсия.

Средним арифметическим мы называем отношение суммы всех значений данного множества, деленного на число элементов данного множества. Например, если у нас есть пять значений чисел, то складывая эти числа и деля на 5, мы получим среднее арифметическое или просто среднее.

Вторым важным параметром является дисперсия, представляющая собой отношение суммыквадратов разностей между конкретным значением величины и средним значением к числу этих значений. Главное предназначение дисперсии - демонстрация того, насколько значения совокупности отклоняются от среднего, насколько однообразной или разнообразной, гомогенной или гетерогенной, является исследуемая совокупность.

Центральная предельная теорема, о которой мы говорили на предыдущих занятиях, показывает нам, что точность нашего измерения будет расти с увеличением объема выборки.

Мы можем измерить некую величину с некоторой точностью при объеме выборки, например, 100 единиц. При объеме выборки 200 единиц мы получим более точные измерения, а при объеме в 1000 единиц мы получим еще более точное измерение данной величины. Иначе говоря, с ростом объема выборки дисперсия нашего измерения уменьшается, и, чем больше объем выборки, тем более точным и достоверным будет наше измерение. Увеличение объема выборки позволяет нам увеличить точность измерения и снизить его дисперсию.

На предыдущих занятиях мы уже говорили об этом очень важном свойстве статистических величин, которое бывает противоречит здравому смыслу: именно выборочные исследования, а не измерения всей генеральной совокупности дают более точные результаты средних параметров, таких, как среднее арифметическое или доля. Это является следствием центральной предельной теоремы: дисперсия выборочной совокупности равна отношению дисперсии генеральной совокупности к объему выборки. Иначе говоря, чем больше объем выборки, тем в большей степени в нашем выборочном исследовании мы снижаем дисперсию генеральной совокупности и можем более точно измерить ее параметры.

Помимо мер центральной тенденции и дисперсии, важным элементом статистического анализа является стандартизация.

Разные величины имеют разные размерности: например, для измерения денежных потоков используем рубли, а вес измеряем в килограммах, т.е. применяем разные размерности. Даже при одной и той же единице измерения (например, рублях) размерность будет разной, если мы говорим о доходах отдельной семьи или о доходах предприятия или организации.

Для того, чтобы унифицировать измерительную процедуру в выборочном методе, используется стандартизация мер измерения. Стандартизация необходима для измерения ширины доверительных интервалов, которые определяется величиной дисперсии, которая сама размерности не имеет.

Используются разные виды стандартизации. Наиболее распространенным видом стандартизации является Z-стандартизация или стандартизация Фишера, представляющая собой отношение разности между текущим значением и средним значением данной величины к дисперсии. Физически эта формула означает то, на сколько дисперсий (единиц дисперсии) отличается текущее значение xi от среднего значения . Тем самым мы согласуем между собой степень гомогенности различных совокупностей и можем сравнивать эту степень друг с другом у разных величие, например, степень разнообразия дохода и степень разнообразия баллов ЕГЭ.

Таким образом, величина z является величиной, показывающей, насколько наше текущее значение xi отклоняется от среднего , и выраженной в единицах дисперсии. Задача любого выборочного исследования - измерить среднее или долю с заданной точностью и достоверностью. В случае больших выборок достоверность и точность связаны обратной зависимостью - чем выше точность измерения, тем ниже достоверность и напротив, выигрывая в достоверности, мы проигрываем в точности.

Чтобы объяснить, почему так происходит, давайте посмотрим на этот график. Под этой кривой, то есть между этой кривой и осью x, располагаются все возможные результаты наших измерений, то есть 100% этих значений, которые можно было бы получить в ходе разных выборочных исследований. Но мы знаем, что большинство этих значений лежат недалеко от максимума этой кривой, т.е. недалеко от линии, соединяющий ось x и максимум данной кривой. При этом можно вычислить, какая часть этих значений будет укладываться в ту или иную величину доверительного интервала. А это значит, что мы можем связать точность измерения и ширину доверительного интервала.

Например, мы знаем, что примерно 67% возможных результатов выборочного измерения будут укладываться в доверительный интервал, отличающийся от максимального значения в ту и в другую сторону на ±1 дисперсию, 95% значений будет лежать в пределах ±2 дисперсии, и 99% - ±3 дисперсии. Как видим, чем более точным будет результат, тем больше вероятность того, что мы в ходе реального измерения выйдем за пределы доверительного интервала. И, напротив, чем более достоверный результат мы хотим получить, тем менее точным он будет. С точки зрения здравого смысла это очевидно - чем более точно мы хотим что-то измерить, тем более вероятно, что мы можем ошибиться, стремясь к столь высокой точности.

Точность измерения исследователю чаще всего задается внешними факторами. Например, заданием или условиями, которые ставит заказчик - скажем, нужно измерить средний чек в магазине с некой точностью. А точность при сравнении результатов проведенного исследования с данными государственной статистики определяется точностью, задаваемой данными государственной статистики.

Достоверность же определяется внутренними устремлениями и желаниями исследователя. Хочет ли он получить наиболее достоверные исследования или наиболее точно измерить и представить результат? В любом случае, требуется определиться с балансом точности и достоверности.
10.2. Расчет объема выборки для среднего
Объем выборки для оценки среднего представлен в формуле.

С левой стороны размер выборки, справа - сочетание следующих ключевых параметров. Уровень достоверности, которым мы задаемся, выражен значением z, где z - это результат стандартизации, проведенной нами для возможности сравнения величин с разной размерностью. Здесь же, в числителе - дисперсия генерального среднего, а в знаменателе - квадрат ожидаемой, или допустимой, ошибки. Все эти параметры возведены в квадрат. Иначе говоря, если мы хотим измерить какую-то величину с очень большой точностью, то есть с очень маленькой ошибкой, то в этом случае необходимо увеличить необходимый объем выборки. Если же мы хотим задаться более высокой достоверностью, то в этом случае также будет возрастать объем выборки. Однако, добиваясь некоторого баланса между величиной достоверности и величиной ожидаемой ошибки, необходимо соблюсти баланс в определении объема выборки.

z - доверительный интервал
H - ожидаемая ошибка
σ - дисперсия генеральной
На практике различают два случая расчета объема выборки для среднего: с известной дисперсией генерального среднего и с неизвестной дисперсией генерального. Например, мы хотим измерить средний чек в магазине, и нужно определить, сколько покупателей этого магазина мы должны опросить и задать им вопрос, сколько денег они потратили в данном магазине. Предположим, что нам это нужно сделать с точностью ±250 рублей, с достоверностью 95% и с дисперсией генерального среднего 1000 рублей. Подставив эти значения в формулы, мы получим значение 64, то есть, опросив 64 покупателей это магазина, мы сумеем расчитать средний чек с заданной достоверностью и заданной точностью. Очевидно, что если мы захотим увеличить точность нашего измерения вдвое, то объем выборки придется увеличить в 4 раза.

Рассмотрим случай, когда дисперсия генерального среднего нам неизвестна. Откуда мы можем взять это недостающее в нашей формуле значения дисперсии генерального? Прежде всего, его берут из предыдущих исследований. Ну, скажем, если мы проводили такое исследование в этом магазине раньше или мы проводили такое исследование в других магазинах, или мы знаем, что из каких-то других исследований дисперсия среднего будет примерно вот такой величины. Вторым способом может быть получение этих данных от сторонних организаций, например, от органов государственной статистики, если речь идет об объеме потребления тех или иных продуктов в целом по стране или в каком-то регионе или городе. Кроме этого, возможно проведение небольшого пилотажного исследования, который позволит собрать данные о том, насколько разнообразной является наша генеральная совокупность, то есть определить ее дисперсию. Еще одним способом является использование каких-либо косвенных данных о том, насколько разнообразна та или иная величина. Ну в случае среднего чека в магазине это может быть длина бумажной весрии этого чека, которая может быть определена визуально до самого измерения, или, по количеству сумок и пакетов, которые выносят из магазина покупатели. Это также является косвенным свидетельством размера стоимости произведенных покупок.

Ну и наконец, если никакой из этих способов не доступен, используется простой статистический метод нахождения дисперсии среднего, исходя из предположения о том, какими могут быть самый большой и самый маленький чек в этом магазине. Это может быть сделано на основе опросов экспертов, скажем, кассиров в этом магазине. Получая этот размах, обычно его делят на 6 частей, то есть ±3 дисперсии. Это и будет наша оценка значения дисперсии генерального среднего.
10.3. Расчет объема выборки для доли

Второй важнейшей статистическая характеристикой, которую мы измеряем, является доля. Необходимо отметить два важных отличия среднего и доли. Во-первых, среднее почти всегда имеет размерность: рубли, килограммы, etc. Доля размерности не имеет. Например, 50% людей намеревается пойти проголосовать или 10% россиян каждое воскресенье ходят в кинотеатры. Другим важным отличием доли и среднего является диапазон возможных значений: средняя меняется чаще всего от нуля, а, может, даже от каких-то отрицательных значений до бесконечности. Доля может меняться только от 0 до 100, или от 0 до 1. Более того, вероятность какого-то события, которые мы чаще всего выражаем через долю, жестко связана с вероятностью ненаступления этого события. Если вероятность того, что я пойду в кино, равна 20%, то вероятность того, что я не пойду туда, равна 80%. То есть, если мы измеряем вероятность какого-то события, то его вероятность жестко привязана к вероятности его ненаступления.

По этой причине вместо дисперсии в формуле вычисления объема выборки для среднего для доли мы используем произведение вероятности события на вероятность того, что это событие не произойдет, то есть р умноженное на (1-р). Остальные части этой формулы остаются на своих местах, то есть в числителе – достоверность, выраженная через z и требуемая в данном измерении, в знаменателе – ожидаемая ошибка измерения.

Важным свойством распределения доли в генеральной и выборочной совокупности является то, что это распределение носят биноминальный характер, в то время как распределение среднего чаще всего носит характер нормального распределения. Однако мы знаем, что при объеме выборки в 30 единицам и более, биноминальное распределение хорошо аппроксимируется нормальным законом. Поэтому данная формула используется в случаях, когда объем выборки больше 30 единиц.

В качестве примера рассмотрим случай вычисления выборки в исследовании, в котором нужно определить долю потенциальных покупатели посетителей магазина в каком-то микрорайоне. Так же, как в отношении генерального среднего, мы сделаем предположение относительно того, какая доля жителей данного микрорайона может посещать этот магазин.

Сделаем предположение, что это 30%. Таким образом р у нас будет равно 0,3 и соответственно 1 - р будет равна 0,7. Зададимся уровнем достоверности 95%. Требуемую точность измерения примем равной ±4%, подставим все в формулу и получим значение - 525 человек, то есть объем нашей выборки должен быть равен 525 респондентам. Если после того, как мы проведем данный опрос, окажется, что ожидаемая доля посетителей магазина будет меньше предположенной нами 30%, то нам придет доопросить какое-то число жителей данного микрорайона тем же самым способом как в первом исследовании. Ну если данная доля окажется больше, то это значит, что мы более точно и(или) достоверно измерили данную величину.

Итак, мы убедились, что при проведении выборочного исследования для измерения доли на размер нашей выборочной совокупности, влияют 3 параметра: достоверность, которую мы хотим придать нашему измерению, точность результата, который мы хотим получить, и ожидаемая доля, которая, скорее всего, будет получена в результате. Обратите внимание на то, что объем выборки получается максимальным в тех случаях, когда доля близка к 50%. Иначе говоря, для измерения величин, находящихся в районе 50% в нашей генеральной совокупности, нам потребуется наибольший объем выборки для производства такого измерения с той же самой точностью, достоверностью, что и для других значений больших или меньших 50%. По этой причине для определения размера выборочной совокупности ожидаемую долю измеряемого признака принимают равной 50%, чтобы исключить возможность нехватки выборки по итогам измерения.

Наоборот, если ожидаемая величина будет небольшой (5 или 10%), то необходимый объем выборки будет меньше, чем если бы мы ожидали результат в районе 50%. Это также противоречит здравому смыслу. Кажется, что при приближении к нулевому значению, вероятность ошибки увеличивается. На самом же деле, теория статистики говорит об уменьшении вероятности ошибок на краях диапазона.

Лучше всего связь между всеми этими четырьмя параметрами можно показать на данной трехмерной диаграмме: как здесь показано разными цветами, меняя точность, достоверность, величину выборки, ожидаемую величину параметра измеряемого, мы можем менять параметры нашего выборочного исследования. Данный трехмерный график можно частично представить в двухмерном виде на плоскости и продемонстрировать еще раз связь между объемом выборки, точностью измерения и достоверностью. Если вы знакомитесь с результатами исследований, в описании которых утверждается, что в опросе приняло участие 200 человек, а точность этого измерения составила ±2%, то скорее всего это либо ошибка, либо какая-то махинация, и результатам такого исследования доверять не стоит. Точность в реальном исследовании не может быть выше расчетной, формулы которых я вам только что продемонстрировал.

Кроме таких графических представлений связи между объемом выборки, ее точностью и достоверностью используется табличная формула, которая представлена на данном слайде. Здесь так же приведены столбцы с различным уровнем достоверности: 99%, 95% и 90%, и разные объемы выборки. На пересечении этих строк и столбцов мы найдем значение точности нашей выборки.

Данный вид расчета объема выборки используется для случайных видов отбора для всех случайных или вероятностных выборках. Кроме них, социологи используют часто и другие, детерминированные, виды выборки, например, квотные.

Сталкиваясь с задачами определения точности и достоверности проведенного исследования, и используя данные таблицы и формулы, необходимо понимать, что все они касаются лишь случайной выборки, и полученные с их помощью результаты измерения будут отражать заданные достоверность и точность. В случае же детерминированных выборок эти формулы будут давать лишь ориентировочные результаты и, скорее, показывают насколько не точными является проведенные измерения.

Аккуратное представление результатов социологических исследований подразумевает публикацию описания выборки, то есть то, как проводилось исследование, каким образом был рассчитан объем выборки и откуда взяты параметры для определения точности проведенного измерения. И, напротив, когда вы будете знакомиться с результатами исследований, то разумно прочитать вначале, каким образом формировалась выборка и какие параметры были заданы для расчета объема выборки, например, каким уровнем достоверности задавались, и какой уровень точности был целью для организаторов данного исследования.

С развитием онлайн технологий появились разнообразные онлайн калькуляторы, которые позволяют быстро и оперативно рассчитать либо объем выборки, либо по имеющемуся объему выборки рассчитать точность проведенного измерения. Вы без труда найдете их, набрав в поисковой строке Яндекс или google «онлайн калькулятор», или «калькулятор статистической ошибки измерения», или «онлайн калькулятор ошибки выборки». Поисковые машины выдадут несколько адресов, на которые вы можете зайти и, введя туда одни параметры, можно получить другие, расчетные, которые связаны одной и той же формулой.

Поскольку целью любого количественного исследования является поиск значимых отличий между измеренными параметрами, то после проведения таких исследований необходимо понять, всегда ли между двумя разными цифрами, между значениями двух разных параметров есть какая-то статистическая значимая разница? Статистически значимой разницей является то значение точности, которые мы использовали для вычисления необходимого объема выборки. Теперь, опираясь на объем выборки, мы можем посчитать, укладывается ли измеренные нами значение (а точнее, отклонения измеренного нашего значения) от какого-то другого в заданный параметр точности.

Например, в ходе исследования мы получили, что среди посетителей торгового центра доли людей старшего поколения и младшего поколения составили 10% и 15%. Для того, чтобы определить, значимая ли это разница, мы должны использовать ту же самую формулу, только теперь мы вычисляем не объем выборки, а по имеющемуся объему выборки находим статистически значимую разницу. Подставляя в эту формулу объем выборки, заданную достоверность и полученный результат в долях к выборочной совокупности (те же 10% и 15%), мы получаем значение статистически значимой разницы. Предположим, что мы получили значение 7%. Это значит, что статистически значимой разницы в посещении данного торгового центра между старшим поколением и младшим поколениями нет, и с математической точки зрения 15% посетители торгового центра среди одного поколения и 10% среди другого поколения - это одинаковые значения.

Часто в отчетах в отчетных таблицах тем или иным способом размечают цифры, чтобы быстро увидеть статистически значимую разницу. Здесь приведен фрагмент одной из отчетных таблиц Фонда «Общественное Мнение». В ней значения, выделенные красным и подчеркнутые, отличаются от среднего по всей выборке значения в бОльшую сторону, а те значения, которые покрашены в синий цвет, отличаются в меньшую сторону на вычисленную для данной выборки величину ошибки. Глядя на такую таблицу, мы легко можем увидеть, где отличия являются статистически значимыми в большую или меньшую сторону, а где они таковыми не являются. Здесь важно понимать, что не все значения, которые различны между собой, являются статистически значимыми и в этом смысле описывают какие-то социальные различия. Для того, чтобы понять, статистическая это разница или нет, мы должны эту разницу вычислить, но вычислить это не для всей выборки, а для той части выборки, которую мы анализируем. Например, сравнивая старшее поколение и младшее поколение, мы берем объем подвыборок младшего поколения и старшего поколения, а не всю выборку в целом.

10.4. Коррекция объема выборки
В заключение я должен рассказать об изменениях в формуле вычисления объема выборки, которые вносятся различной спецификой той или иной генеральной совокупности

Прежде всего мы сталкиваемся (нечасто, но такие случаи бывают) с тем, что наша генеральная совокупность конечна, например, в случае опроса работников крупного предприятия или жителей небольшого села. Поэтому используется формула, которая учитывает конечность генеральной совокупности, которая приведена на этом слайде.

Другим случаем, когда приходится корректировать объем выборки, является пенетрация измеряемого признака в нашей генеральной совокупности. Например, мы опрашиваем абонентов какого-то одного сотового оператора. Понятно, что из тысячи опрошенных жителей города только часть из опрошенных будут абонентами данного оператора, поэтому мы должны сформировать выборку, которая бы учитывала тот факт, что не все опрошенные нами будут абонентами этого оператора. Предположим, что только каждый четвертый житель нашего города является абонентом этого оператора. Соответственно наша выборка вырастет также в 4 раза.

Также мы сталкиваемся со случаем, когда анкеты, собранные нами, оказываются неполностью заполненными, т.е. какая-то часть ответов, значимая для нас, остается нам неизвестной. Эта часть обычно бывает невелика (может быть 2%- 5%), но иногда она может быть большой (возрастает до 10%-15%). Иначе говоря, мы столкнемся с тем, что нашу расчетную выборку необходимо увеличить. Именно по этой причине выборки, которые реализуется в исследованиях, обычно чуть выше какого-то круглого числа. Например, не 1000 человек, а 1008 человек; не 1500, а 1505 и так далее. Чаще всего это получается именно потому, то часть ответов респондентов оказывается незаполненными. Для того, чтобы по каждому или по большинству ключевых вопросов у нас были ответы, мы проводим опрос бОльшего, чем расчетное, числа наших респондентов.

Нередко возникает необходимость сравнить какие-то параметры в перекрестных группах, например, мы хотим сравнить долю сторонников того или иного кандидата среди мужчин с доходом от 20000 до 40000 рублей и среди женщин с 2 и более детьми, конечно, в этом случае нам придется сделать поправку на то, что не все мужчины имеют такой доход и не все женщины имеют такое количество детей. И если мы рассчитаем, что доля таких мужчин и таких женщин будет в районе 15%, то соответственно наша выборка возрастет на единицу, деленную на 0,15 , т.е. наша выборка вырастет более чем в 6 раз.

Вы можете встретить формулы или найти какие-то расчеты, которые позволяют связать объем выборки и стоимость проведения исследования. Это бывает особенно важным, когда исследования проводятся в разных регионах страны или в разных странах. Соответственно, увеличивая например число опрошенных в том или ином регионе, и, уменьшая число респондентов в каком-то удаленном населенном пункте, мы таким образом манипулируем не только со стоимостью исследования, но и с выборкой. Конечно, очень хорошо, если эти параметры у нас связаны. И мы получаем надежные достоверные данные о том, как изменения экономия на каком-то одном параметре вызывает цепные изменения в структуре нашей выборки и влияет на точность, достоверность нашего измерения. Однако в реальности такие формулы чаще всего не используется, потому что очень сложно бывает сравнить затраты в разных регионах страны, а тем более между разными странами.

Итак, сегодня мы познакомились с тем, как можно и нужно рассчитывать объем выборки. Мы узнали, что объем выборки определяется 3 основными параметрами: заданной достоверностью измерения, заданной точностью измерения и величиной дисперсии генеральной совокупности, которую мы видим или которую мы ожидаем в выборочной совокупности.

Кроме того, мы узнали, что при измерении доли выборочной совокупности максимальный объем выборки при тех же самых точности и достоверности мы должны получать, если ожидаемая доля будет около 50%. И, наоборот, чем ближе к краям интервала (то есть меньше 10% и более 90%), при тех же достоверности и точности объем выборки может быть уменьшен.
Литература по теме лекции
Список источников для освоения материала лекции
1. Методы сбора информации в социологических исследованиях. Отв. ред. В.Г.Андреенков, О.М.Маслова. М., Наука,1990.
2. Ядов, В. А. Социологическое исследование: методология, программа, методы / В. А. Ядов; изд. 2-е, перераб. и доп. – М.: Наука, 1987. – 248 с.
3. Черчилль Г.А. Маркетинговые исследования: Пер. с англ. — СПб.: Питер, 2001. — 748 с.: ил.
Маркетинговые исследования. Практическое руководство. Нэреш К. Малхотра, 3-е изд., пер. с англ. - М.: 2002. — 960 с.
Кокрен У. Методы выборочного исследования / У. Кокрен ; пер. с англ. И. М. Сонина ; под ред. А. Г. Волкова ; предисл. к рус. пер. Н. К. Дружинина. М. : Статистика, 1976.
Ноэль Э. Массовые опросы: Введение в методику демоскопии / пер. с нем. ; общ. ред. и вступ. ст. Н.С.Мансурова. М. : Прогресс, 1978.
Паниотто В. И. Качество социологической информации: (методы оценки и процедуры обеспечения) / В. И. Паниотто ; отв. ред. В. Е. Хмель- ко. Киев : Наук. думка, 1986.
Чуриков А. В. Основы построения выборки для социологических ис- следований. — М.: Институт фонда «Общественное мнение», 2020. — 240 c.— ISBN 978-5-93947-034-6.
Made on
Tilda