Лето

Выборочная совокупность отличается от генеральной разным объемом. Стратегии построения групп

Множество социальных объектов, явлений, процессов, которые являются предметом изучения социологического исследования, образуют генеральную совокупность . Любую генеральную совокупность характеризует некоторый явно задаваемый признак (или набор признаков), по значению которого всегда можно однозначно определить, относится данный объект к генеральной совокупности или нет.

Часть объектов генеральной совокупности, выступающих в качестве объектов наблюдения, называется выборочной совокупностью .

Иными словами, если генеральная совокупность включает все без исключения единицы, составляющие объект исследования, то выборочная совокупность представляет собой специальным образом отобранную часть генеральной совокупности. Выборочная совокупность конструируется таким образом, чтобы при минимуме исследуемых объектов удавалось с необходимой степенью гарантии представить всю генеральную совокупность.

Единицей отбора называют элементы генеральной совокупности, которые выступают единицами счета в различных процедурах отбора, формирующих выборку.

Единицами наблюдения называют элементы сформированной выборочной совокупности, которые непосредственно подвергаются исследованию.

Единица отбора и единица наблюдения представляют собой социальные объекты, обладающие характеристиками, существенными для предмета конкретного социологического исследования. Они могут совпадать (в простых схемах отбора) и различаться (при сложных комбинированных схемах отбора). Единицами отбора могут выступать как отдельные индивиды, так и целые коллективы или целые группы (например, при проведении сплошного опроса).

При совпадении единицы наблюдения с единицей отбора применяется одноступенчатая (простая) выборка, при несовпадении – многоступенчатая (сложная) выборка.

Объем выборки зависит от ряда факторов:

· от цели и задач исследования,

· от степени однородности генеральной совокупности,

· от величины доверительной вероятности,

· от точности результатов (величины допускаемой ошибки репрезентативности).

В таблице 4 приведено соотношение генеральной совокупности и объема выборки.

Таблица 4. Соотношение объемов генеральной и выборочной совокупностей.

Представленная таблица отражает многолетний опыт работы социологов, нередко используется при отсутствии данных о генеральной совокупности, что делает невозможным применение формулы.

Определения объема выборочной совокупности недостаточно для ее изучения. Необходимо определиться с видом выборки.

Различаются выборки вероятностные и целенаправленные .

Модель вероятностной (случайной ) выборки связана с понятием вероятности, широко используемым во многих социальных науках. В самом общем случае вероятность некоторого ожидаемого события есть отношение числа всех возможных событий к числу ожидаемых. При этом общее число событий должно быть достаточно большим (статистически значимым). Кроме этого, необходимо создать условия равновероятности отбора единиц. Условие равновероятности должно гарантировать для каждого элемента генеральной совокупности попасть в выборочную. Такая ситуация возможна при равномерном распределении элементов генеральной совокупности.

Существуют различные методы вероятностной (случайной) выборки:

· метод собственно-случайного отбора,

· случайно-бесповторный метод,

· случайно-повторный,

· метод механической выборки (например, каждый десятый элемент генеральной совокупности включается в выборочную).

Нередко используется довольно точный метод отбора выборочной совокупности - метод серийной выборки. Суть этого метода заключается в расчленении генеральной совокупности на однородные части (серии) по заданному признаку. После этого отбор респондентов осуществляетсяв каждой серии по заданному признаку.

Кроме этого, существует метод гнездовой выборки . «Гнездо» представляет собой группу каких-либо объектов, состоящих из ряда элементов. В качестве единиц исследования используют не отдельных респондентов, а группы, коллективы.

Наряду с вероятностной выборкой в социологических исследованиях применяется также и целенаправленная выборка. Целенаправленная выборка осуществляется не с помощью теории вероятности, а при использовании ряда методов:

· стихийной выборки,

· основного массива,

· квотной выборки.

Стихийная выборка чаще всего применяется в журналистике. Примером стихийной выборки может служить почтовый опрос. Достоверность и качество полученной при этом информации очень низкие и распространяются только на опрошенную совокупность.

Метод основного массива применяется как «зондаж» при проведении пилотажного исследования, при этом изучается 60-70% генеральной совокупности.

Наиболее точным из методов целенаправленных выборок можно считать метод квотной выборки . Однако, применение этого метода возможно при наличии статистических данных о генеральной совокупности. Все данные о признаках генеральной совокупности выступают в качестве квот, а отдельные числовые значения – в качестве параметров квот. При квотной выборке респонденты отбираются целенаправленно с соблюдением параметров квот. В качестве квоты могут выступать не более четырех признаков. Например, пол, возраст, стаж работы, уровень образования и т.д.

Определение объема и вида выборки - недостаточное условие правомерности распространения выводов исследования на всю генеральную совокупность. Из всего многообразия возможных выборочных совокупностей необходимо отобрать одну, наиболее точную. Способность выборки отражать, моделировать значимые свойства генеральной совокупности – есть репрезентативность выборки.

Отклонение результатов выборочного исследования от существенных характеристик генеральной совокупности называется ошибкой репрезентативности .

Ошибки репрезентативности могут быть случайными и систематическими. Случайные ошибки репрезентативности носят вероятностный характер и при повторном измерении изменяются по вероятностным законам. Систематическими ошибками репрезентативности называют ошибки смещения, нарушающие точность выборочной совокупности. Систематические ошибки возникают при просчетах на стадии проектирования выборки, при отсутствии информации о социальном объекте, при неправильном выборочном отборе. Систематические ошибки репрезентативности могут быть также непреднамеренными (например, просчет на стадии проектирования выборки) и преднамеренными (обусловленными идеологическими, экономическими и т.д. факторами).

При исследовании генеральной совокупности выборочный метод значительно облегчает задачу исследователя, однако необходимо помнить о возможных трудностях связанных с методом выборочного исследования.

Статистическая совокупность


Статистическая совокупность состоит из материально существующих объектов (Работники, предприятия, страны, регионы), является объектом
статистического исследования . Статистическая совокупность
- множество единиц, обладающих массовостью, типичностью, качественной однородностью и наличием вариации.

Единица совокупности - каждая конкретная единица статистической совокупности.

Одна и таже статистическая совокупность может быть однородна по одному признаку и неоднородна по другому.

Качественная однородность - сходство всех единиц совокупности по какому-либо признаку и несходство по всем остальным.

В статистической совокупности отличия одной единицы совокупности от другой чаще имеют количественную природу. Количественные изменения значений признака разных единиц совокупности называются вариацией.

Вариация признака - количественное изменение признака (для количественного признака) при переходе от одной единицы совокупности к другой.

Признак - это свойство, характерная черта или иная особенность единиц, объектов и явлений, которая может быть наблюдаема или измерена. Признаки делятся на количественные и качественные. Многообразие и изменчивость величины признака у отдельных единиц совокупности называется вариацией .

Атрибутивные (качественные) признаки не поддаются числовому выражению (состав населения по полу). Количественные признаки имеют числовое выражение (состав населения по возрасту).

Показатель - это обобщающая количественно качестванная характеристика какого-либо свойства единиц или совокупности в цельм в конкретных условиях времени и места.

Система показателей - это совокупность показателей всесторонне отражающих изучаемое явление.

Например, изучается зарплата:
  • Признак - оплата труда
  • Статистическая совокупность - все работники
  • Единица совокупности - каждый работник
  • Качественная однородность - начисленная зарплата
  • Вариация признака - ряд цифр

Генеральная совокупность и выборка из нее

Основу статистического исследования составляет множество данных, полученных в результате измерения одного или нескольких признаков. Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений случайной величины , является выборкой , а гипотетически существующая (домысливаемая) - генеральной совокупностью . Генеральная совокупность может быть конечной (число наблюдений N = const ) или бесконечной (N = ∞ ), а выборка из генеральной совокупности - это всегда результат ограниченного ряда наблюдений. Число наблюдений , образующих выборку, называется объемом выборки . Если объем выборки достаточно велик (n → ∞ ) выборка считается большой , в противном случае она называется выборкой ограниченного объема . Выборка считается малой , если при измерении одномерной случайной величины объем выборки не превышает 30 (n <= 30 ), а при измерении одновременно нескольких (k ) признаков в многомерном пространстве отношениеn к k не превышает 10 (n/k < 10) . Выборка образует вариационный ряд , если ее члены являются порядковыми статистиками , т. е. выборочные значения случайной величины Х упорядочены по возрастанию (ранжированы), значения же признака называютсявариантами .

Пример . Практически одна и та же случайно отобранная совокупность объектов - коммерческих банков одного административного округа Москвы, может рассматриваться как выборка из генеральной совокупности всех коммерческих банков этого округа, и как выборка из генеральной совокупности всех коммерческих банков Москвы, а также как выборка из коммерческих банков страны и т.д.

Основные способы организации выборки

Достоверность статистических выводов и содержательная интерпретация результатов зависит от репрезентативности выборки, т.е. полноты и адекватности представления свойств генеральной совокупности, по отношению к которой эту выборку можно считать представительной. Изучение статистических свойств совокупности можно организовать двумя способами: с помощью сплошного инесплошного наблюдения . Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности , анесплошное (выборочное) наблюдение - только его части.

Существуют пять основных способов организации выборочного наблюдения:

1. простой случайный отбор , при котором объектов случайно извлекаются из генеральной совокупности объектов (например с помощью таблицы или датчика случайных чисел), причем каждая из возможных выборок имеют равную вероятность. Такие выборки называются собственно-случайными ;

2. простой отбор с помощью регулярной процедуры осуществляется с помощью механической составляющей (например, даты, дня недели, номера квартиры, буквы алфавита и др.) и полученные таким способом выборки называются механическими ;

3. стратифицированный отбор заключается в том, что генеральная совокупность объема подразделяется на подсовокупности или слои (страты) объема так что . Страты представляют собой однородные объекты с точки зрения статистических характеристик (например, население делится на страты по возрастным группам или социальной принадлежности; предприятия - по отраслям). В этом случае выборки называются стратифицированными (иначе, расслоенными, типическими, районированными );

4. методы серийного отбора используются для формирования серийных или гнездовых выборок . Они удобны в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или население при территориально-административном делении страны). Отбор серий можно осуществить собственно-случайным или механическим способом. При этом проводится сплошное обследование определенной партии товара, или целой территориальной единицы (жилого дома или квартала);

5. комбинированный (ступенчатый) отбор может сочетать в себе сразу несколько способов отбора (например, стратифицированный и случайный или случайный и механический); такая выборка называется комбинированной .

Виды отбора

По виду различаются индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе - качественно однородные группы (серии) единиц, а комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборку.

Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора. Приповторном отборе попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной (метод в социально-экономических исследованиях применяется редко). Однако, при большом N (N → ∞) формулы для бесповторного отбора приближаются к аналогичным для повторного отбора и практически чаще используются последние (N = const ).

Основные характеристики параметров генеральной и выборочной совокупности

В основе статистических выводов проведенного исследования лежит распределение случайной величины , наблюдаемые же значения(х 1 , х 2 , … , х n) называются реализациями случайной величины Х (n - объем выборки). Распределение случайной величины в генеральной совокупности носит теоретический, идеальный характер, а ее выборочный аналог является эмпирическим распределением. Некоторые теоретические распределения заданы аналитически, т.е. их параметры определяют значение функции распределения в каждой точке пространства возможных значений случайной величины . Для выборки же функцию распределения определить трудно, а иногда невозможно, поэтому параметры оценивают по эмпирическим данным, а затем их подставляют в аналитическое выражение, описывающее теоретическое распределение. При этом предположение (или гипотеза ) о виде распределения может быть как статистически верным, так и ошибочным. Но в любом случае восстановленное по выборке эмпирическое распределение лишь грубо характеризует истинное. Важнейшими параметрами распределений являются математическое ожидание и дисперсия .

По своей природе распределения бывают непрерывными и дискретными . Наиболее известным непрерывным распределением является нормальное . Выборочными аналогами параметров идля него являются: среднее значение и эмпирическая дисперсия . Среди дискретных в социально-экономических исследованиях наиболее часто применяется альтернативное (дихотомическое) распределение. Параметр математического ожидания этого распределения выражает относительную величину (или долю ) единиц совокупности, которые обладают изучаемым признаком (она обозначена буквой ); доля совокупности, не обладающая этим признаком, обозначается буквой q (q = 1 - p) . Дисперсия же альтернативного распределения также имеет эмпирический аналог .

В зависимости от вида распределения и от способа отбора единиц совокупности по-разному вычисляются характеристики параметров распределения. Основные из них для теоретического и эмпирического распределений приведены в табл. 9.1.

Долей выборки k n называется отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

k n = n/N .

Выборочная доля w - это отношение единиц, обладающих изучаемым признаком x к объему выборки n :

w = n n /n .

Пример. В партии товара, содержащей 1000 ед., при 5% выборке доля выборки k n в абсолютной величине составляет 50 ед. (n = N*0,05); если же в этой выборке обнаружено 2 бракованных изделия, то выборочная доля брака w составит 0,04 (w = 2/50 = 0,04 или 4%).

Так как выборочная совокупность отлична от генеральной, то возникают ошибки выборки .

Таблица 9.1 Основные параметры генеральной и выборочной совокупностей

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (последовательный анализ) и решает многие другие задачи. Ее определяют как науку о принятии решений в условиях неопределенности

Итак, общая задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.

Иногда проводят сплошное обследование, т.е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых произвол выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки п = 100.

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным, выборки подразделяют на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

На практике обычно пользуются бесповторным случайным отбором.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). Это значит, что следует исключить личные мотивы, иные психологически осмысленные и неосмысленные факторы при отборе объектов. Надо строго соблюдать случайность отбора объектов, обеспечить каждому объекту одинаковую с другими вероятность попадания в выборку.

На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:

1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относятся:

а) простой случайный бесповторный отбор;

б) простой случайный повторный отбор.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся:

а) типический отбор;

б) механический отбор;

в) серийный отбор.

Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Осуществить простой отбор можно различными способами. Например, для извлечения п объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию, затем карточку возвращают в пачку и процесс повторяют, т.е. карточки перемешивают, наугад вынимают одну из них и т.д. Так поступают п раз, в итоге получают простую случайную повторную выборку объема п.

Если извлеченные карточки не возвращать в пачку, то выборка является простой случайной бесповторной.

Если генеральная совокупность делится на типичные части, к примеру, патроны делятся по калибрам, то отбор производится не из всех патронов, а отдельно по калибрам. Такой отбор называется типическим.

Отбор типа «берется каждый пятый предмет в генеральной совокупности» называется механическим.

Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

Исследование обычно начинается с некоторого предположения, требующего проверки с привлечением фактов. Это предположение - гипотеза - формулируется в отношении связи явлений или свойств в некоторой совокупности объектов. Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить, например, тревожность у всех подростков. Поэтому при проведений исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.

Генеральная совокупность - это все множество объектов, в отношении которого формулируется исследовательская гипотеза. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать психологу. Обычно генеральная совокупность включает в себя очень большое число объектов- студентов вуза, школьников, работников предприятия, пенсионеров и т.д. Сплошное исследование генеральных совокупностей чрезвычайно затруднительно, поэтому, как правило, изучается небольшая часть генеральной совокупности, называемая выборочной совокупностью, или выборкой.

Выборка - это ограниченная по численности группа объектов (в психологии - испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

К выборке применяется ряд обязательных требований, определенных, прежде всего, целями и задачами исследования. Она должна быть такой, чтобы обосновалась генерализация выводов выборочного исследования - обобщение, распространение их на генеральную совокупность.

Выборка должна удовлетворять следующим условиям:



1. Это группа объектов, доступная для изучения. Объем выборки опре­деляется задачами и возможностями наблюдения и эксперимента.

2. Это часть заранее намеченной генеральной совокупности.

3. Это группа, отобранная случайным образом так, чтобы любой объект генеральной совокупности имел одинаковую вероятность попасть в выборку.

Основные критерии обоснованности выводов исследования - это репрезентативность выборки и статистическая достоверность (эмпири­ческих) результатов.

Репрезентативность - иными словами, ее представительность - это способность характеризовать соответствующую генеральную совокупность с определенной точностью и достаточной надежностью. Если выборка испытуемых по своим характеристикам репрезентативна генеральной совокупности, то есть основания, полученные при ее изучении результаты распространить на всю генеральную совокупность.

В идеале репрезентативная выборка должна быть такой, чтобы каж­дая из основных изучаемых психологом характеристик, черт, особенностей личности и т. п. представлялась в ней пропорционально этим же особенностям в генеральной совокупности.

Ошибки репрезентативности возникают в двух случаях:

1. Малая выборка, характеризующая генеральную совокупность.

2. Несовпадение свойств (параметров) выборки с параметрами генеральной совокупности.

Статистическая достоверность , или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода. Эти методы будут подробнее рассмотрены в теме «Проверка гипотез». Отметим, что они предъявляют определенные требования к численности, или объему выборки.

Наибольший объем выборки необходим при разработке диагности­ческой методики - от 200 до 1000-2500 человек.

Если необходимо сравнить 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой.

Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.

Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например по полу, возрасту и т.д. При этом, естественно, уменьшаются возможности генерализации выводов.

Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях - в зависимости от процедуры их организации. Независимые выборки характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

Наиболее типичным примером независимой выборки является, например, сравнение мужчин и женщин по уровню интеллекта.

Математическая статистика – это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.

Генеральная совокупность – это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.

Выборка это совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.

Статистическое распределение – это совокупность вариант x i и соответствующих им частот n i .

Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал n i или относительной частоте n i /n. Ширину интервала i можно определить по формуле Стерджеса :

I=(x max -x min)/(1+3,32lgn),

Где x max – максимальное; x min – минимальное значение вариант, а их разность носит название вариационный размах ; n – объем выборки.

Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами x i , n i .

5. Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).

Мода (М о ) это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.

Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.

Для определения моды интервальных рядов служит формула:

M 0 =x ниж +i*((n 2 -n 1 )/(2n 2 -n 1 +n 3 )),

где х ниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n 2 ; n 2 – частота модального класса; n 1 – частота класса, предшествующего модальному; n 3 – частота класса, следующего за модальным; i – ширина классового интервала.

Медиана (М е )- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.

Выборочная средняя – это среднее арифметическое значение вариант статистического ряда

Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:

Среднее квадратическое отклонение это квадратный корень из выборочной дисперсии:

S в =√(S в 2 )

6. Оценка параметров генеральной совокупности по ее выборке (точечная и интервальная). Доверительный интервал и доверительная вероятность.

Числовые значения, характеризующие генеральную совокупность, называются параметрами.

Статистическое оценивание может выполняться двумя способами:

1)точечная оценка – оценка, которая дается для некоторой определенной точки;

2)интервальная оценка – по данным выборки оценивается интервал, в котором лежит истинное значение с заданной вероятностью.

Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке.

Точечная оценка называется состоятельной , если при увеличении объема выборки выборочная характеристика стремится к соответствующей характеристике генеральной совокупности.

Точечная оценка называется эффективной , если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками.

Точечную оценку называют несмещенной , если ее математическое ожидание равно оценивающему параметру при любом объеме выборки.

Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя в:

в = i n i ,

где x i – варианты выборки; n i – частота встречаемости вариант x i ; n – объем выборки.

Интервальная оценка – это числовой интервал, который определяется двумя числами – границами интервала, содержащий неизвестный параметр генеральной совокупности.

Доверительный интервал – это интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность p это такая вероятность, что событие вероятности (1-р) можно считать невозможным. α=1-р – это уровень значимости. Обычно в качестве доверительных вероятностей используют вероятности, близкие к 1. Тогда событие, что интервал накроет характеристику, будет практически достоверным. Это р≥0,95, р≥0,99, р≥0,999.

Для выборки малого объема (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:

в - m t≤≤ в + m t (р≥0,95),

где – генеральное среднее; в – выборочное среднее; t – нормированный показатель распределения Стьюдента с(n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в данный интервал; m – ошибка выборочной средней.