Планирование выборочных исследований
Формирование выборки
основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которых выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автозаправочные станции города, то надо иметь список этих станций. Он и будет рассматриваться как контур, в пределах которого формируется выборка.
Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что может не быть полного официального списка всех автозаправочных станций большого города, включая и нелегальный бизнес в данной области.
Существуют три главные проблемы формирования выборки.
Исходя из сути рассматриваемой задачи необходимо определить, кто или что является единицей выборки. Например, производитель автомобилей решил изучить потенциальный рынок для своей продукции. Было принято решение изучить мнение по данному вопросу лиц, принимающих решения по выбору автомобилей в различных организациях, и глав семейств, определяющих данную политику в семье. В указанном примере единицы выборки — это руководители соответствующих служб организаций и главы семейств.
Важно определить контур выборки. Например, список всех предприятий определенного региона. В целях выполнения правила репрезентативности, то есть представительности проводимого исследования, необходимо тщательно подобрать метод, с помощью которого выбираются единицы выборки из контура выборки, и. спланировать структуру выборки.
Кроме того, необходимо определить объем выборки, то есть число изучаемых единиц. Обоснованный объем выборки не зависит от размера совокупности. Например, для отдельного региона он может быть не больше, чем для государства в целом, хотя сами единицы выборки должны отбираться по разным планам.
При формировании выборки предпочтительно использовать вероятностные, то есть случайные методы. Если все единицы выборки имеют определенную вероятность быть включенными в выборку, то выборка называется случайной. Нередко из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому применение термина «известная вероятность» далеко не всегда обосновано.
Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.
Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и одинакова для всех единиц совокупности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности. Простой случайный отбор может осуществляться с помощью таблиц или генераторов случайных чисел.
Могут использоваться генераторы случайных чисел, имеющиеся в средствах электронных офисов. Единицам совокупности присваивают порядковые номера, после чего генерируются случайные числа в диапазоне всей генеральной совокупности. Количество чисел должно быть равно объему выборки.
Особенно широко метод систематического отбора используется, когда для различных видов совокупностей имеются различные справочники, списки, спецификации, например справочники телефонных номеров.
Кластерный отбор основан на делении совокупности на подгруппы. К сожалению, методологические ошибки в применении кластерного отбора чрезвычайно широко распространены, они проникли даже в популярные учебники. При кластерном отборе необходимо основываться на большой совокупности статистических данных и методах прикладной статистики — кластерном и дискриминантном анализе.
Предположим, что исследуется мнение населения страны относительно какой-либо проблемы. Страна разбивается на четко определяемые части — 89 регионов. По каждому региону подбираются данные статистики о показателях, которые могут влиять на мнение населения по проблеме.
С помощью кластерного и дискриминантного анализа регионы группируются в группы — кластеры по близости характеристик. Далее в простейшем случае можно ограничиться выбором в каждом кластере одного из регионов случайным образом. Затем необходимо определить совокупность для отобранных регионов и проводить в них соответствующее исследование, а выводы обобщить для всей страны.
Формирование выборки можно осуществить на основе двухступенчатого подхода, использующего двухступенчатую кластеризацию. При этом, например, каждый кластер может быть разбит на более мелкие и более однородные кластеры.