Science
 

Гипергеометрическое распределение

Данная страница частично или полностью использует материалы российской Википедии, распространяемы на основе свободной лицензии.

Гипергеометрическое распределение
Функция вероятности
Функция распределения
Параметры math
math
math
Носитель math
Функция вероятности math
Функция распределения
Математическое ожидание math
Медиана
Мода
Дисперсия math
Коэффициент асимметрии math
Коэффициент эксцесса math
Информационная энтропия
Производящая функция моментов math
Характеристическая функция math

Гипергеометри́ческое распределе́ние в теории вероятностей моделирует количество удачных выборок без возвращения из конечной совокупности.

вытянутые не вытянутые всего
с дефектом k D − k D
без дефекта n − k N + k − n − D N − D
всего n N − n N

Типичный пример представлен вышестоящей таблицей: осуществлена поставка из N объектов, из которых D имеют дефект. Гипергеометрическое распределение описывает вероятность того, что в выборке из n различных объектов, вытянутых из поставки ровно k объектов являются бракованными.

В общем, если случайная величина X соответствует гипергеометрическому распределению с параметрами N, D и n, то вероятность получения ровно k успехов определяется формулой:

math

Эта вероятность положительна когда k лежит в промежутке между max{ 0, D + nN } и min{ n, D }.

Приведенная формула может трактоваться следующим образом: существует math возможных выборок(без возвращения). Есть math способов выбрать k бракованных объектов и math способов заполнить остаток выборки объектами без дефектов.

В случае, когда размер популяции является большим по сравнению с размером выборки(т.е., N намного больше чем n) гипергеометрическое распределение хорошо аппроксимируется биномиальным распределением с параметрами n (количество испытаний) и p = D / N (вероятность успеха в одном испытании).

Содержание

[править] Определение

Пусть имеется конечная совокупность, состоящая из math элементов. Предположим, что math из них обладают нужным нам свойством. Оставшиеся math этим свойством не обладают. Случайным образом из общей совокупности выбирается группа из math элементов. Пусть math - случайная величина, равная количеству выбранных элементов, обладающих нужным свойством. Тогда функция вероятности math имеет вид:

math,

где math обозначает биномиальный коэффициент. Пишем: math.

[править] Моменты

math,
math.

[править] Пример применения

Классическим применением гипергеометрического распределения является выборка без возвращения. Рассмотрим урну с двумя типами шаров: черными и белыми. Определим вытягивание белого шара как успех, а черного как неудачу. Если N является числом всех шаров в урне и D является числом белых шаров (called defective in the example above), то N − D является числом черных шаров.
Теперь предположим, что в урне находятся 5 белых и 45 черных шаров. Стоя радом с урной вы закрываете глаза и вытаскиваете 10 шаров. Какова вероятность p (k=4) того, что человек вытянуть ровно 4 белых шара (и, конечно, - 6 черных шаров) ?

Задача опиывается следующей таблицей:

вытянутые не вытянутые всегда
белые шары' 4 (k) 1 = 5 − 4 (Dk) 5 (D)
черные шары 6 = 10 − 4 (nk) 39 = 50 + 4 − 10 − 5 (N + k − n − D) 45 (N − D)
total 10 (n) 40 (N − n) 50 (N)

Вероятность Pr (k = x) того, что будут вытянуты ровно x белых шаров (= количество успехов) может быть посчитана с помощью формулы:

math

Отсюда, в нашем примере (x = 4), получим:

math

Таким образом, вероятность вытянуть ровно 4 белых шара достаточно мала (примерно 0.004). Это значит, что при проведении эксперимента (вытаскивание 10 шаров из урны с 50 шарами без возвращения) 1000 раз мы рассчитываем получить вышеупомянутый результат 4 раза.

Что касается вероятности вытянуть все 5 белых шаров, то интуитивно понятно, что она будет меньше, чем вероятность вытянуть 4 белых шара. Давайте посчитаем эту вероятность.

вытянутые не вытянутые всего
белые шары 5 (k) 0 = 5 − 5 (D − k) 5 (D)
черные шары 5 = 10 − 5 (n − k) 40 = 50 + 5 − 10 − 5 (N + k − n − D) 45 (N − D)
всего 10 (n) 40 (N − n) 50 (N)

Таким образом мы получаем вероятность:

math

Как и ожидалось, вероятность вытянуть 5 белых шаров меньше, чем вероятность вытянуть 4 белых шара.

Заключение:
Начальный вопрос можно расширить следующим образом: Если вытягиваются 10 шаров из урны (содержащей 5 белых и 45 черных шаров), какова вероятность вытянуть не менее 4 белых шаров? Для получения ответа на этот вопрос необходимо посчитать функцию распределения p(k>=4). Так как гипергеометрическое распределение является дискретным вероятностным распределением, функция распределения может быть легко посчитана как сумма соответствующих вероятностей.

В нашем примере достаточно сложить Pr (k = 4) и Pr (k = 5):

Pr (k ≥ 4) = 0.003964583 + 0.0001189375 = 0.004083520

[править] Симметричность

math

Эта симметричность интуитивно понятна, если перекрасить белые шары в черные и наоборот, таким образом, белые и черные шары просто меняются ролями.

math

Эта симметричность интуитивно понятна, если вместо вытягивания шаров, вы помечаете шары, которые вы бы вытянули. Оба выражения дают вероятность того, что ровно k шаров черные и помечены как вытянутые.

[править] Связь с другими распределениями

Вероятностные распределения
Одномерные Многомерные
Дискретные: Бернулли | биномиальное | геометрическое | гипергеометрическое | логарифмическое | отрицательное биномиальное | Пуассона | равномерное мультиномиальное
Абсолютно непрерывные: Бета | Вейбулла | Гамма | Колмогорова | Коши | логнормальное | Лоренца | нормальное (Гаусса) | равномерное | Парето | Стьюдента | Фишера | хи-квадрат | экспоненциальное | Эрланга многомерное нормальное
править
he:התפלגות היפרגאומטרית

hu:Hipergeometrikus eloszlásnl:Hypergeometrische verdelingsv:Hypergeometrisk fördelning