Темой этой лекции является проверка гипотез. Гипотеза является необходимым элементом программы социологического исследования и вообще любого социологического исследования. В любом исследовании должна быть хотя бы одна гипотеза. Собственно говоря, ради ее проверки мы и затеваем исследование - если нет гипотезы, то исследование бессодержательно и бесцельно.
Гипотеза исследования представляет собой утверждение, которое по результатам данного исследования должно быть подтверждено или опровергнуто. Хорошее, качественное исследование - это вовсе не то исследование, гипотезы которого полностью подтверждаются. Опровержение гипотез является таким же позитивным результатом любого исследования, как и их подтверждение.
Гипотеза исследования содержит утверждение в отношении к ключевым понятиям исследования. Статистическая гипотеза формулируется в терминах, операционализирующих эти понятия и выраженных либо в значениях (числах), либо в их сравнениях (больше или меньше). Как и в любой статистической гипотезе, в ней есть нулевая гипотеза, то есть гипотеза, которая утверждает, что никаких различий между разными социальными группами, между разными группами генеральной совокупности не существует. Альтернативная гипотеза состоит в том, что такие различия существуют. Наша задача в том, чтобы опровергнуть нулевую гипотезу, и таким образом принять альтернативную. По этой причине альтернативная гипотеза формируется (формулируется?) как противоречащая нулевой гипотезе. То есть, если в нулевой гипотезе мы утверждаем, что никаких различий, например, между мужчинами и женщинами в восприятии того или иного политического деятеля нет, то альтернативная гипотеза будет состоять в том, что такие различия существуют.
Примеры гипотез.
Первый пример: среднее количество кинотеатров, которые посещают жители города, составляет 1,2. Это так называемая двусторонняя гипотеза о значении, то есть, мы вычисляем более или менее точное значение определенной переменной. Вот у нас есть переменная - среднее количество кинотеатров, которые посещают жители города, и есть значение этого количества – 1,2. То есть, нас не устроит значение, скажем, 1,0 или 1,5, поэтому наша гипотеза – именно двусторонняя гипотеза.
Второй пример: более 10% домохозяйств постоянно делают покупки в одних и тех же универмагах. Это будет односторонная гипотеза о значении, то есть, у нас есть переменная - количество домохозяйств, которые постоянно делают покупки в одних и тех же универмагах, и нас интересует только то, что значение этой переменной больше 10%. А насколько оно больше - скажем, это 12% или 20%, нас уже не интересует. Поэтому такие гипотезы называются односторонними.
Третий вариант гипотезы: сторонники двух различных кандидатов отличаются по своим социально-демографическим характеристикам. Это - гипотеза о различиях, где нас не интересует степень этих различий, а лишь то, что сторонники этих двух кандидатов различаются по своим социально- демографическим характеристикам. Например, среди сторонников одного кандидата доминируют мужчины, среди сторонников другого кандидата больше женщин. Или среди сторонников одного кандидата больше людей с высшим образованием, среди сторонников другого кандидата больше людей с неполным средним образованием.
Четвертый пример: одна гостиница имеет более привлекательный образ, чем ее ближайший конкурент. Это - гипотеза о направленных различиях, где мы не просто говорим о том, что два измеряемых объекта отличаются, мы говорим о том, что оценки одного объекта выше/больше/продолжительнее, чем оценки другого.
И наконец, последний пример - это гипотеза о связях. БОльшая осведомленность об авторе книги приводит к более позитивному отношению к его произведению. В данном случае выдвинута гипотеза о том, что значение одной из переменных (в данном случае - осведомленность об авторе книги) каким-то образом (в данном случае позитивно) влияет на отношение к его произведениям, то есть эти две переменные связаны.
Из статистики мы знаем, что для разного рода гипотез используются различные статистические критерии. Во-первых, это односторонний критерий (тест). Проверка нулевой гипотезы, когда альтернативная гипотеза выражена направленно. Например, предположение, что доля рынка, занятая данным сортом пива, превышает 20%, означает, что нулевая гипотеза состоит в том, что доля рынка, занятая данным сортом пива не превышает 20%: либо 20%, либо меньше. Альтернативная, соответственно, состоит в том, что доля выше, чем 20%. В данном случае нас интересует только то, что значение, доли рынка, занятой этим сортом пива просто больше 20%, но не интересует точное значение этого параметра.
Другим вариантом статистического теста является двусторонний критерий, то есть проверка нулевой гипотезы, когда альтернативная гипотеза выраженно не направлена. Например, мы предполагаем, что за нашего кандидата проголосуют 10% избирателей данного округа. Тогда нулевая гипотеза будет состоять в том, что за него проголосует не 10%, а, может быть, 8%, может быть, 12%. А альтернативная состоит именно в том, что за него проголосует 10%, и такой тест будет ненаправленный, или двусторонний.
Задачей любого прикладного исследования является получение информации для принятия управленческого решения. Если производитель решил вывести на рынок новый бренд пива в случае, если в целевой группе он будет занимать не менее 20%, то мы должны провести исследование и убедиться в том, что данный бренд пива занимает 20 или более процентов. Тогда нулевая гипотеза состоит в том, что данный бренд пива занимает 20 или менее процентов рынка. А альтернативная состоит в том, что он занимает более 20% рынка.
Мы можем принять верное решение в двух случаях: если нулевая гипотеза отвергнута, и, действительно, доля потребителей больше двадцати процентов, и второй вариант - когда нулевая гипотеза принята, и, действительно, доля потребителей пива меньше 20%. Мы можем совершить ошибку, если нулевая гипотеза отвергнута, но в действительности доля потребителей пива меньше 20% - такого рода ошибки называются ошибками первого рода. А ошибками второго рода называются случаи, когда нулевая гипотеза принята, но в действительности доля потребителей больше двадцати процентов.
Очевидно, что цена совершения ошибок первого и второго рода серьезно отличается. Если мы делаем ошибку первого рода и выводим на рынок пиво, которое не имеет большой доли на этом рынке, вероятно, мы понесем большие потери, то есть расходы на производство этого пива, на продажу этого пива, на рекламу этого пива и другие расходы. Если же мы совершим ошибку второго рода и не станем выводить этот сорт пива на рынок, мы, скорее всего, недополучим тот или иной объем прибыли, но не понесем и дополнительных расходов. То есть, то, что в статистическом смысле различается как ошибки первого и второго рода, в реальной бизнес-деятельности отличается видом либо прямых потерь и убытков, либо упущенной выгоды.