Методы и методология социологического исследования
Лекция 15
Проверка статистических гипотез
Видео-курс Владимира Звоновского для социологов-бакалавров, читавшийся в СГЭУ в 2012-2021 гг.
Цель лекции: Дать представления о разнообразии статистических гипотез в социологическом исследовании и общих подходах в их формулировании
План лекции
1
Виды гипотез в социологическом исследовании
2
Правила формирования статистических гипотез
3
Виды статистических ошибок и их значение в социологическом исследовании
15.1. Виды гипотез в социологических исследованиях
Темой этой лекции является проверка гипотез. Гипотеза является необходимым элементом программы социологического исследования и вообще любого социологического исследования. В любом исследовании должна быть хотя бы одна гипотеза. Собственно говоря, ради ее проверки мы и затеваем исследование - если нет гипотезы, то исследование бессодержательно и бесцельно.

Гипотеза исследования представляет собой утверждение, которое по результатам данного исследования должно быть подтверждено или опровергнуто. Хорошее, качественное исследование - это вовсе не то исследование, гипотезы которого полностью подтверждаются. Опровержение гипотез является таким же позитивным результатом любого исследования, как и их подтверждение.

Гипотеза исследования содержит утверждение в отношении к ключевым понятиям исследования. Статистическая гипотеза формулируется в терминах, операционализирующих эти понятия и выраженных либо в значениях (числах), либо в их сравнениях (больше или меньше). Как и в любой статистической гипотезе, в ней есть нулевая гипотеза, то есть гипотеза, которая утверждает, что никаких различий между разными социальными группами, между разными группами генеральной совокупности не существует. Альтернативная гипотеза состоит в том, что такие различия существуют. Наша задача в том, чтобы опровергнуть нулевую гипотезу, и таким образом принять альтернативную. По этой причине альтернативная гипотеза формируется (формулируется?) как противоречащая нулевой гипотезе. То есть, если в нулевой гипотезе мы утверждаем, что никаких различий, например, между мужчинами и женщинами в восприятии того или иного политического деятеля нет, то альтернативная гипотеза будет состоять в том, что такие различия существуют.

Примеры гипотез.

Первый пример: среднее количество кинотеатров, которые посещают жители города, составляет 1,2. Это так называемая двусторонняя гипотеза о значении, то есть, мы вычисляем более или менее точное значение определенной переменной. Вот у нас есть переменная - среднее количество кинотеатров, которые посещают жители города, и есть значение этого количества – 1,2. То есть, нас не устроит значение, скажем, 1,0 или 1,5, поэтому наша гипотеза – именно двусторонняя гипотеза.

Второй пример: более 10% домохозяйств постоянно делают покупки в одних и тех же универмагах. Это будет односторонная гипотеза о значении, то есть, у нас есть переменная - количество домохозяйств, которые постоянно делают покупки в одних и тех же универмагах, и нас интересует только то, что значение этой переменной больше 10%. А насколько оно больше - скажем, это 12% или 20%, нас уже не интересует. Поэтому такие гипотезы называются односторонними.

Третий вариант гипотезы: сторонники двух различных кандидатов отличаются по своим социально-демографическим характеристикам. Это - гипотеза о различиях, где нас не интересует степень этих различий, а лишь то, что сторонники этих двух кандидатов различаются по своим социально- демографическим характеристикам. Например, среди сторонников одного кандидата доминируют мужчины, среди сторонников другого кандидата больше женщин. Или среди сторонников одного кандидата больше людей с высшим образованием, среди сторонников другого кандидата больше людей с неполным средним образованием.

Четвертый пример: одна гостиница имеет более привлекательный образ, чем ее ближайший конкурент. Это - гипотеза о направленных различиях, где мы не просто говорим о том, что два измеряемых объекта отличаются, мы говорим о том, что оценки одного объекта выше/больше/продолжительнее, чем оценки другого.

И наконец, последний пример - это гипотеза о связях. БОльшая осведомленность об авторе книги приводит к более позитивному отношению к его произведению. В данном случае выдвинута гипотеза о том, что значение одной из переменных (в данном случае - осведомленность об авторе книги) каким-то образом (в данном случае позитивно) влияет на отношение к его произведениям, то есть эти две переменные связаны.

Из статистики мы знаем, что для разного рода гипотез используются различные статистические критерии. Во-первых, это односторонний критерий (тест). Проверка нулевой гипотезы, когда альтернативная гипотеза выражена направленно. Например, предположение, что доля рынка, занятая данным сортом пива, превышает 20%, означает, что нулевая гипотеза состоит в том, что доля рынка, занятая данным сортом пива не превышает 20%: либо 20%, либо меньше. Альтернативная, соответственно, состоит в том, что доля выше, чем 20%. В данном случае нас интересует только то, что значение, доли рынка, занятой этим сортом пива просто больше 20%, но не интересует точное значение этого параметра.

Другим вариантом статистического теста является двусторонний критерий, то есть проверка нулевой гипотезы, когда альтернативная гипотеза выраженно не направлена. Например, мы предполагаем, что за нашего кандидата проголосуют 10% избирателей данного округа. Тогда нулевая гипотеза будет состоять в том, что за него проголосует не 10%, а, может быть, 8%, может быть, 12%. А альтернативная состоит именно в том, что за него проголосует 10%, и такой тест будет ненаправленный, или двусторонний.

Задачей любого прикладного исследования является получение информации для принятия управленческого решения. Если производитель решил вывести на рынок новый бренд пива в случае, если в целевой группе он будет занимать не менее 20%, то мы должны провести исследование и убедиться в том, что данный бренд пива занимает 20 или более процентов. Тогда нулевая гипотеза состоит в том, что данный бренд пива занимает 20 или менее процентов рынка. А альтернативная состоит в том, что он занимает более 20% рынка.

Мы можем принять верное решение в двух случаях: если нулевая гипотеза отвергнута, и, действительно, доля потребителей больше двадцати процентов, и второй вариант - когда нулевая гипотеза принята, и, действительно, доля потребителей пива меньше 20%. Мы можем совершить ошибку, если нулевая гипотеза отвергнута, но в действительности доля потребителей пива меньше 20% - такого рода ошибки называются ошибками первого рода. А ошибками второго рода называются случаи, когда нулевая гипотеза принята, но в действительности доля потребителей больше двадцати процентов.

Очевидно, что цена совершения ошибок первого и второго рода серьезно отличается. Если мы делаем ошибку первого рода и выводим на рынок пиво, которое не имеет большой доли на этом рынке, вероятно, мы понесем большие потери, то есть расходы на производство этого пива, на продажу этого пива, на рекламу этого пива и другие расходы. Если же мы совершим ошибку второго рода и не станем выводить этот сорт пива на рынок, мы, скорее всего, недополучим тот или иной объем прибыли, но не понесем и дополнительных расходов. То есть, то, что в статистическом смысле различается как ошибки первого и второго рода, в реальной бизнес-деятельности отличается видом либо прямых потерь и убытков, либо упущенной выгоды.
15.2. Выбор статистики
Для того, чтобы количественно измерить величину ошибки, мы используем различные статистики, то есть способ измерения отклонения измеряемого значения от тестируемого уровня. Если тестируется утверждение «превышает ли доля рынка уровень 20%?», значит, выбирается способ измерения значимости отличия измеренного значения от 20%. То есть, мы будем измерять просто величину ошибки, а не долю, которую занимает данный бренд пива. Чаще всего используется нормальное распределение для выборочной совокупности, и в этом случае используется так называемая z-статистика. Кроме этого используется би-номинальное распределение и распределение Стьюдента или хи-квадрат в том случае, если мы измеряем отклонение каких-то средних значений, а не долей.

В данном случае мы будем использовать z-распределение для доли, поскольку мы измеряем долю данного сорта пива на всём рынке. В этом случае величина z будет равна разности между вероятностью ожидаемого события (в данном случае 20%) и тем, что это событие не состоится (в данном случае 80%), делённая на дисперсию. Дисперсия, как мы знаем, будет равна корню квадратному из произведения вероятности события на вероятность того, что это событие не произойдет, делённое на объем выборки. Если в нашем исследовании примет участие 500 респондентов, то дисперсия будет равна примерно 0,018.

Следующий шаг, который мы должны сделать для проверки нашей гипотезы, - выбрать уровень значимости. Раньше, когда не было достаточного количества вычислительных средств, исследователи, в том числе социологи, использовали стандартно три уровня значимости: это 90%, 95% и 99%. На эти уровни значимости рассчитывались специальные статистические таблицы, которые располагались в соответствующих справочниках, и можно было достаточно быстро определить значение z-статистики для того или иного уровня значимости. Сегодня, с развитием компьютерных средств, не представляет большого труда вычислить значение z-статистики для любого уровня значимости - хоть 94%, хоть 92%, хоть 83%. Тем не менее, традиционно мы используем именно эти три уровня значимости: 90%, 95% и 99%.

Выбор уровня значимости - это выбор, при котором может произойти ошибка первого рода. Иначе говоря, если мы принимаем решение, что уровень значимости в нашем исследовании должен составлять 95%, это значит, что лишь в пяти процентах случаев мы получим ошибку первого рода, а в 95% случаев мы её избегнем. Если у нас уровень значимости 90%, это значит, что мы увеличиваем вероятность ошибки первого рода - теперь она у нас уже 10%, а не 5%.

Традиционно, мы выбираем уровень значимости в 95%. Это позволяет после получения выборочных значений как увеличить, так и уменьшить уровень значимости. Предположим, что из 500 респондентов, которых мы опросили, 110 сообщили нам о том, что являются потребителями изучаемой нами марки пива. Это значит, что доля этой марки пива на рынке составляет 22%. Если мы подставим это значение в наши формулы, то сначала мы вычислим собственно z-статистику, которая будет равна 1,111. Затем, по статистическим таблицам или с помощью онлайн-калькулятора, мы можем посчитать или увидеть, что площадь под кривой нормального распределения будет 0,733. Таким образом, вне площади под кривой оказалось примерно 27% вероятных результатов измерения. А поскольку мы приняли уровень значимости в 95% (то есть за пределами этой кривой должно было быть всего лишь 5% возможных измерений), то мы должны сделать вывод о том, что наша нулевая гипотеза не отвергается. То есть, на том уровне значимости, который мы приняли изначально (95%) мы не получили значения, отличающегося от нашего порогового значения (20%.)

Конечно, вместе с ошибками первого рода мы можем допускать и ошибки второго рода. Как я уже говорил, с точки зрения бизнес-процессов они могут не нести серьезную угрозу для управленческого решения, но так же неприятны, и их следует избегать. Для того, чтобы оценить в совокупности опасность, исходящую от ошибок первого и второго рода, используют такое понятие как мощность критерия. Под мощностью критерия понимают вероятность отклонения нулевой гипотезы, когда она ложна и должна быть отвергнута, то есть недопущения ошибки второго рода. Мощность критерия равна 1 - β, а β в данном случае - это вероятность ошибки второго рода, то есть принятия нулевой гипотезы, когда она ложна. Очевидно, что чем ниже (α)альфа, то есть вероятность ошибки первого рода, тем выше β (бета), то есть вероятность ошибки второго рода. Мы всегда можем найти критическое значение выбранной статистики, то есть значение, при котором вероятности ошибки первого и второго рода становятся равны.

Теперь мы можем создать некоторый алгоритм работы и порядок формирования гипотез. Прежде всего, мы должны сформулировать нулевую и альтернативную гипотезы. И они должны противоречить друг другу, то есть принятие нулевой гипотезы автоматически исключает альтернативную, а принятие альтернативной полностью исключает нулевую гипотезу.

После этого мы должны выбрать подходящую статистику для измерения величины ошибки. Как я уже говорил, чаще всего мы используем z-статистику нормального распределения. Также мы можем использовать биноминальное распределение для измерения ошибки между долями или распределение Стьюдента, если мы измеряем ошибку между средними значениями.

Следом нам необходимо выбрать тот или иной уровень значимости. Традиционно используют уровень значимости в 95%. Однако если в вашем измерении по результатам теста окажется, что на этом уровне значимости нулевая гипотеза верна, то можно попробовать этот уровень значимости снизить, например, до 90% и посмотреть, будет ли в этом случае верна нулевая гипотеза, или все-таки статистически значимое различие между двумя и более значениями существует. Если же измерения показывают надежность различий на уровне 95%, может быть, имеет смысл увеличить уровень значимости до 99%.

После того, как вы определились со всеми этими тремя параметрами, необходимо собственно собрать данные и рассчитать ту проверочную статистику, которую вы выбрали. После того, как вы произвели расчет, необходимо с помощью таблиц или онлайн-калькуляторов рассчитать вероятность выбранной статистики и сравнить ее с выбранным уровнем значимости. Если полученные вами значения статистики будут ниже выбранного уровня значимости, то следует принять нулевую гипотезу и отказаться от гипотезы о статистически значимых различиях. Если полученные значения статистики будет выше выбранного уровня значимости, значит, вы можете отклонить нулевую гипотезу и принять альтернативную. Вы можете сделать вывод по результатам измерения и на основе этого вывода принять то или иное управленческое решение.

Итак, сегодня я вам рассказал о том, каков алгоритм работы с гипотезами в рамках количественного социологического исследования.
Литература по теме
Список источников для освоения материала лекции
1. Власова М. Л. Социологические методы в маркетинговых исследованиях: учеб. пособие для вузов / М.Л.Власова; Гос. ун-т – Высшая школа экономики. – М.: Изд-во ГУ ВШЭ, 2006. – 712 с.
2. Методы сбора информации в социологических исследованиях. Отв. ред. В.Г.Андреенков, О.М.Маслова. М., Наука,1990.
3. Ядов, В. А. Социологическое исследование: методология, программа, методы / В. А. Ядов; изд. 2-е, перераб. и доп. – М.: Наука, 1987. – 248 с.
4. Теория статистики: Учебник / Под ред. Г.Л. Громыко. - 3-e изд., перераб. и доп. - М.: НИЦ Инфра-М, 2016. - 476 с.: 60x90 1/16. - (Высшее образование: Бакалавриат). (переплет). - ISBN 978-5-16-004857-4.
5. Черчилль Г.А. Маркетинговые исследования: Пер. с англ. — СПб.: Питер, 2001. — 748 с.: ил.
Маркетинговые исследования. Практическое руководство. Нэреш К. Малхотра, 3-е изд., пер. с англ. - М.: 2002. — 960 с.
6. Татарова Г.Г. Методология анализа данных в социологии. М., 1998
7. Малхорта, Нэреш К. Маркетинговые исследования. Практическое руководство, 3-е издание.: Пер. с англ. — М.: Издательский дом "Вильямc", 2002. — 960 c.: ил. — Парал.тит. англ.
Made on
Tilda