Какая из формул является функцией распределения. Определение функции распределения

Чтобы найти функции распределения случайных величин и их переменных, необходимо изучить все особенности данной области знаний. Существует несколько различных методов для нахождения рассматриваемых значений, включая изменение переменной и генерирование момента. Распределение - такое понятие, в основу которого легли такие элементы, как дисперсия, вариации. Однако они характеризуют только степень размаха рассеяния.

Более важными функциями случайных величин являются те, которые связаны и независимы, и одинаково распределены. Например, если X1 - вес случайно выбранного индивидуума из популяции самцов, X2 - вес другого, ..., а Xn - вес еще одного человека из мужского населения, тогда, необходимо узнать, как случайная функция X распределяется. В этом случае применима классическая теорема, называемая центральной предельной. Она позволяет показать, что при больших n функция следует стандартным распределениям.

Функции одной случайной переменной

Центральная предельная теорема предназначена для аппроксимации дискретных рассматриваемых значений, таких как биномиальное и Пуассона. Функции распределения случайных величин, рассматриваются, в первую очередь, на простых значениях одной переменной. Например, если X является непрерывной случайной величиной, имеющей собственное распределение вероятности. В данном случае исследуется, как найти функцию плотности Y, используя два разных подхода, а именно метод функции распределения и изменения переменной. Сначала рассматриваются только взаимно однозначные значения. Затем необходимо модифицировать технику изменения переменной, чтобы найти ее вероятность. Наконец, нужно узнать, как кумулятивного распределения может помочь моделировать случайные числа, которые следуют за определенными последовательными схемами.

Методика распределения рассматриваемых значений

Метод функции распределения вероятностей случайной величины применим для того, чтобы найти ее плотность. При использовании этого способа вычисляется кумулятивное значение. Затем, дифференцируя его, можно получить плотность вероятности. Теперь, при наличии метода функции распределения, можно рассмотреть еще несколько примеров. Пусть X - непрерывная случайная величина с определенной плотностью вероятности.

Какова функция плотности вероятности от x2? Если посмотреть или построить график функции (сверху и справа) у = х2, можно отметить, что она является возрастающей X и 0

В последнем примере большую осторожность использовали для индексирования кумулятивных функций и плотности вероятности либо с помощью X, либо с Y, чтобы указать, к какой случайной переменной они принадлежали. Например, при нахождении кумулятивной функции распределения Y получили X. Если необходимо найти случайную величину X и ее плотность, то ее просто нужно дифференцировать.

Техника смены переменных

Пусть X - непрерывная случайная величина заданная функцией распределения с общим знаменателем f (x). В этом случае, если поместить значение y в X = v (Y), то получится значение x, например v (y). Теперь, нужно получить функцию распределения непрерывной случайной величины Y. Где первое и второе равенство имеет место из определения кумулятивной Y. Третье равенство выполняется потому, что части функции, для которой u (X) ≤ y, также верно, что X ≤ v (Y). И последнее выполняется для определения вероятности в непрерывной случайной величине X. Теперь нужно взять производную от FY (y), кумулятивной функции распределения Y, чтобы получить плотность вероятности Y.

Обобщение для функции уменьшения

Пусть X - непрерывная случайная величина с общим f (x), определенная над c1

Для решения этого вопроса можно собирать количественные данные и использовать эмпирическую кумулятивную функцию распределения. Обладая этой информацией и апеллируя ею, нужно комбинировать образцы средств, стандартные отклонения, медиаданные и так далее.

Аналогично даже довольно простая вероятностная модель может иметь огромное количество результатов. Например, если перевернуть монету 332 раза. Тогда число получаемых результатов от переворотов больше, чем у google (10100) - число, но не менее 100 квинтиллионов раз выше элементарных частиц в известной вселенной. Не интересен анализ, который дает ответ на каждый возможный результат. Потребуется более простая концепция, такая ​​как количество головок или самый длинный ход хвостов. Чтобы сосредоточить внимание на вопросах, представляющих интерес, принимается определенный результат. Определение в данном случае следующее: случайная величина является вещественной функцией с вероятностным пространством.

Диапазон S случайной величины иногда называют пространством состояний. Таким образом, если X - рассматриваемое значение, то так N = X2, exp ↵X, X2 + 1, tan2 X, bXc и так далее. Последнее из них, округляя X до ближайшего целого числа, называют функцией пола.

Функции распределения

Как только определена интересующая функция распределения случайной величины х, вопрос обычно становится следующим: «Каковы шансы, что X попадает в какое-то подмножество значений B?». Например, B = {нечетные числа}, B = {больше 1} или B = {между 2 и 7}, чтобы указать эти результаты, которые имеют X, значение случайной величины, в подмножестве А. Таким образом, в приведенном выше примере можно описать события следующим образом.

{X - нечетное число}, {X больше 1} = {X> 1}, {X находится между 2 и 7} = {2

Случайные переменные и функции распределения

Таким образом, можно вычислить вероятность того, что функция распределения случайной величины x примет значения в интервале путем вычитания. Необходимо подумать о включении или исключении конечных точек.

Будем называть случайную переменную дискретной, если она имеет конечное или счетное бесконечное пространство состояний. Таким образом, X - число головок на трех независимых флипсах смещенной монеты, которая поднимается с вероятностью p. Нужно найти кумулятивную функцию распределения дискретной случайной величины FX для X. Пусть X - количество пиков в коллекции из трех карт. То Y = X3 через FX. FX начинается с 0, заканчивается на 1 и не уменьшается с увеличением значений x. Кумулятивная FX функция распределения дискретной случайной величины X является постоянной, за исключением прыжков. При скачке FX является непрерывной. Доказать утверждение о правильной непрерывности функции распределения из свойства вероятности можно с помощью определения. Звучит оно так: постоянная случайная величина имеет кумулятивную FX, которая дифференцируема.

Чтобы показать, как это может произойти, можно привести пример: мишень с единичным радиусом. Предположительно. дротик равномерно распределяется на указанную область. Для некоторого λ> 0. Таким образом, функции распределения непрерывных случайных величин плавно увеличиваются. FX обладает свойствами функции распределения.

Человек ждет автобуса на остановке, пока тот не прибудет. Решив для себя, что откажется, когда ожидание достигнет 20 минут. Здесь необходимо найти кумулятивную функцию распределения для T. Время, когда человек еще будет находиться на автовокзале или не уйдет. Несмотря на то, что кумулятивная функция распределения определена для каждой случайной величины. Все равно достаточно часто будут использоваться другие характеристики: масса для дискретной переменной и функция плотности распределения случайной величины. Обычно выводится значение через одно из этих двух значений.

Массовые функции

Эти значения рассматриваются следующими свойствами, которые имеют общий (массовый характер). Первое основано на том, что вероятности не отрицательны. Второе следует из наблюдения, что набор для всех x=2S, пространство состояний для X, образует разбиение вероятностной свободы X. Пример: броски необъективной монеты, результаты которой независимы. Можно продолжать выполнять определенные действия, пока не получится бросок голов. Пусть X обозначает случайную величину, которая дает количество хвостов перед первой головой. А p обозначает вероятность в любом заданном действии.

Итак, массовая функция вероятности имеет следующие характерные признаки. Поскольку члены образуют численную последовательность, X называется геометрической случайной величиной. Геометрическая схема c, cr, cr2,. , crn имеет сумму. И, следовательно, sn имеет предел при n 1. В этом случае бесконечная сумма является пределом.

Функция массы выше образует геометрическую последовательность с отношением. Следовательно, натуральных чисел a и b. Разность значений в функции распределения равна значению массовой функции.

Рассматриваемые значения плотности имеют определение: X - случайная величина, распределение FX которой имеет производную. FX, удовлетворяющая Z xFX (x) = fX (t) dt-1, называется функцией плотности вероятности. А X называется непрерывной случайной величиной. В основной теореме исчисления функция плотности является производной распределения. Можно вычислить вероятности путем вычисления определенных интегралов.

Поскольку собираются данные по нескольким наблюдениям, то должно рассматриваться более одной случайной величины за раз, чтобы моделировать экспериментальные процедуры. Следовательно, множество этих значений и их совместное распределение для двух переменных X1 и X2 означает просмотр событий. Для дискретных случайных величин определяются совместные вероятностные массовые функции. Для непрерывных рассматриваются fX1, X2, где совместная плотность вероятности удовлетворяется.

Независимые случайные переменные

Две случайные величины X1 и X2 независимы, если любые два связанных с ними события такие же. В словах вероятность того, что два события {X1 2 B1} и {X2 2 B2} происходят одновременно, y равно произведению переменных указанных выше, что каждая из них происходит индивидуально. Для независимых дискретных случайных величин имеется совместная вероятностная массовая функция, которая является произведением предельного объема ионов. Для непрерывных случайных величин являющихся независимыми, совместная функция плотности вероятности - произведение значений предельной плотности. В заключение рассматриваются n независимые наблюдения x1, x2,. , xn, возникающие из неизвестной плотности или массовой функции f. Например, неизвестный параметр в функциях для экспоненциальной случайной величины, описывающей время ожидания автобуса.

Имитация случайных переменных

Основная цель этой теоретической области - предоставить инструменты, необходимые для разработки умозаключительных процедур, основанных на обоснованных принципах статистической науки. Таким образом, одним из очень важных вариантов применения программного обеспечения является способность генерировать псевдоданные для имитации фактический информации. Это дает возможность тестировать и совершенствовать методы анализа перед необходимостью использования их в реальных базах. Это требуется для того, чтобы исследовали свойства данных посредством моделирования. Для многих часто используемых семейств случайных величин R предоставляет команды для их создания. Для других обстоятельств понадобятся методы моделирования последовательности независимых случайных величин, которые имеют общее распределение.

Дискретные случайные переменные и образец Command. Команда sample используется для создания простых и стратифицированных случайных выборок. В результате, если вводится последовательность x, sample (x, 40) выбирает 40 записей из x таким образом, что все варианты размера 40 имеют одинаковую вероятность. Это использует команду R по умолчанию для выборки без замены. Можно использовать также для моделирования дискретных случайных величин. Для этого нужно предоставить пространство состояний в векторе x и массовой функции f. Вызов для replace = TRUE указывает, что сэмплирование происходит с заменой. Затем, чтобы дать образец из n независимых случайных величин, имеющих общую массовую функцию f, используется образец (x, n, replace = TRUE, prob = f).

Определено, что 1 является наименьшим представленным значением, а 4 является наибольшим из всех. Если команда prob = f опущена, то образец будет выбирать равномерно из значений в векторе x. Проверить симуляцию против массовой функции, которая генерировала данные, можно обратив внимание на знак двойного равенства, ==. И пересчитав наблюдения, которые принимают каждое возможное значение для x. Можно сделать таблицу. Повторить это для 1000 и сравнить моделирование с соответствующей функцией массы.

Иллюстрирование трансформации вероятности

Сначала смоделировать однородные функции распределения случайных величин u1, u2,. , un на интервале . Около 10 % чисел должно находиться в пределах . Это соответствует 10 % симуляций на интервале для случайной величины с показанной функцией распределения FX. Точно так же около 10 % случайных чисел должно находиться в интервале . Это соответствует 10 % симуляций на интервале случайной величины с функцией распределения FX. Эти значения на x ось может быть получена из взятия обратной от FX. Если X - непрерывная случайная величина с плотностью fX, положительной всюду в своей области, то функция распределения строго возрастает. В этом случае FX имеет обратную функцию FX-1, известную как функция квантиля. FX (x) u только тогда, когда x FX-1 (u). Преобразование вероятности следует из анализа случайной переменной U = FX (X).

FX имеет диапазон от 0 до 1. Он не может принимать значения ниже 0 или выше 1. Для значений u между 0 и 1. Если можно моделировать U, то необходимо имитировать случайную величину с распределением FX через функцию квантиля. Взять производную, чтобы увидеть, что плотность u варьируется в пределах 1. Поскольку случайная величина U имеет постоянную плотность по интервалу своих возможных значений, она называется равномерной на отрезке . Он моделируется в R с помощью команды runif. Идентичность называется вероятностным преобразованием. Видно, как оно работает в примере с дротильной доской. X между 0 и 1, функция распределения u = FX (x) = x2, и, следовательно, функция квантиля x = FX-1 (u). Можно моделировать независимые наблюдения расстояния от центра панели дротика, и создавая при этом равномерные случайные величины U1, U2,. , Un. Функция распределения и эмпирическая основаны на 100 симуляциях распределения дартс-доски. Для экспоненциальной случайной величины, предположительно u = FX (x) = 1 - exp (- x), и, следовательно, x = - 1 ln (1 - u). Иногда логика состоит из эквивалентных утверждений. В этом случае нужно объединить две части аргумента. Тождество с пересечением аналогично для всех 2 {S i i} S, вместо некоторого значения. Объединение Ci равно пространству состояний S и каждая пара взаимно исключена. Поскольку Bi - разбита на три аксиомы. Каждая проверка основана на соответствующей вероятности P. Для любого подмножества. Используя тождество, чтобы убедиться, что ответ не зависит от того, включены ли конечные точки интервала.

Экспоненциальная функция и ее переменные

Для каждого результата во всех событиях в конечном счете используется второе свойство непрерывности вероятностей, которое считается аксиоматическим. Закон распределения функции случайной величины здесь показывает, что каждой свое решение и ответ.

Функция распределения является наиболее общей формой задания закона распределения. Она используется для задания как дискретных, так и непрерывных случайных величин. Обычно ее обозначают .Функция распределения определяет вероятность того, что случайная величина принимает значения, меньшие фиксированного действительного числа, т. е.. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения. Ее еще называют интегральной функцией распределения.

Геометрическая интерпретация функции распределения очень проста. Если случайную величину рассматривать как случайную точку оси(рис. 6), которая в результате испытания может занять то или иное положение на этой оси, то функция распределенияесть вероятность того, что случайная точкав результате испытания попадет левее точки.

Для дискретной случайной величины , которая может принимать значения,, … ,, функция распределения имеет вид

,

где неравенство под знаком суммы означает, что суммирование распространяется на все те значения, которые по своей величине меньше. Из этой формулы следует, что функция распределения дискретной случайной величиныразрывна и возрастает скачками при переходе через точки,, … ,, причем величина скачка равна вероятности соответствующего значения (рис. 7). Сумма всех скачков функции распределения равна единице.

Непрерывная случайная величина имеет непрерывную функцию распределения, график этой функции имеет форму плавной кривой (рис. 8).

Рис. 7. Рис. 8.

Рассмотрим общие свойства функций распределения.

Свойство 1. Функция распределения есть неотрицательная функция, заключенная между нулем и единицей:

Справедливость этого свойства вытекает из того, что функция распределения определена как вероятность случайного события, состоящего в том, что.

Свойство 2. Вероятность попадания случайной величины в интервал равна разности значений функции распределения на концах этого интервала, т. е.

Отсюда следует, что вероятность любого отдельного значения непрерывной случайной величины равна нулю.

Свойство 3. Функция распределения случайной величины есть неубывающая функция, т. е. при .

Свойство 4. На минус бесконечности функция распределения рана нулю, а на плюс бесконечности функция распределения рана единице, т. е. ,.

Пример 1. Функция распределения непрерывной случайной величины задана выражением

Найти коэффициент и построить график. Определить вероятность того, что случайная величинав результате опыта примет значение на интервале.

Решение. Так как функция распределения непрерывной случайной величины непрерывна, то приполучим:. Отсюда. График функцииизображен на рис. 9.

Исходя из второго свойства функции распределения, имеем:

.

4. Плотность распределения вероятности и ее свойства.

Функция распределения непрерывной случайной величины является ее вероятностной характеристикой. Но она имеет недостаток, заключающийся в том, что по ней трудно судить о характере распределения случайной величины в небольшой окрестности той или другой точки числовой оси. Более наглядное представление о характере распределения непрерывной случайной величины дает функция, которая называется плотностью распределения вероятности или дифференциальной функцией распределения случайной величины.

Плотность распределения равна производной от функции распределения, т. е.

.

Смысл плотности распределения состоит в том, что она указывает на то, как часто появляется случайная величинав некоторой окрестности точкипри повторении опытов. Кривая, изображающая плотность распределенияслучайной величины, называетсякривой распределения .

Рассмотрим свойства плотности распределения.

Свойство 1. Плотность распределения неотрицательна, т. е.

Свойство 2. Функция распределения случайной величины равна интегралу от плотности в интервале от до, т. е.

1.2.4. Случайные величины и их распределения

Распределения случайных величин и функции распределения . Распределение числовой случайной величины – это функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.

Первое – если случайная величина принимает конечное число значений. Тогда распределение задается функцией Р(Х = х), ставящей каждому возможному значению х случайной величины Х вероятность того, что Х = х .

Второе – если случайная величина принимает бесконечно много значений. Это возможно лишь тогда, когда вероятностное пространство, на котором определена случайная величина, состоит из бесконечного числа элементарных событий. Тогда распределение задается набором вероятностей P(a < X для всех пар чисел a, b таких, что a. Распределение может быть задано с помощью т.н. функции распределения F(x) = P(Xопределяющей для всех действительных х вероятность того, что случайная величина Х принимает значения, меньшие х . Ясно, что

P(a < X

Это соотношение показывает, что как распределение может быть рассчитано по функции распределения, так и, наоборот, функция распределения – по распределению.

Используемые в вероятностно-статистических методах принятия решений и других прикладных исследованиях функции распределения бывают либо дискретными, либо непрерывными, либо их комбинациями.

Дискретные функции распределения соответствуют дискретным случайным величинам, принимающим конечное число значений или же значения из множества, элементы которого можно перенумеровать натуральными числами (такие множества в математике называют счетными). Их график имеет вид ступенчатой лестницы (рис. 1).

Пример 1. Число Х дефектных изделий в партии принимает значение 0 с вероятностью 0,3, значение 1 с вероятностью 0,4, значение 2 с вероятностью 0,2 и значение 3 с вероятностью 0,1. График функции распределения случайной величины Х изображен на рис.1.

Рис.1. График функции распределения числа дефектных изделий.

Непрерывные функции распределения не имеют скачков. Они монотонно возрастают при увеличении аргумента – от 0 при до 1 при . Случайные величины, имеющие непрерывные функции распределения, называют непрерывными.

Непрерывные функции распределения, используемые в вероятностно-статистических методах принятия решений, имеют производные. Первая производная f(x) функции распределения F(x) называется плотностью вероятности,

По плотности вероятности можно определить функцию распределения:

Для любой функции распределения

Перечисленные свойства функций распределения постоянно используются в вероятностно-статистических методах принятия решений. В частности, из последнего равенства вытекает конкретный вид констант в формулах для плотностей вероятностей, рассматриваемых ниже.

Пример 2. Часто используется следующая функция распределения:

(1)

где a и b – некоторые числа, a. Найдем плотность вероятности этой функции распределения:

(в точках x = a и x = b производная функции F(x) не существует).

Случайная величина с функцией распределения (1) называется «равномерно распределенной на отрезке [a; b ]».

Смешанные функции распределения встречаются, в частности, тогда, когда наблюдения в какой-то момент прекращаются. Например, при анализе статистических данных, полученных при использовании планов испытаний на надежность, предусматривающих прекращение испытаний по истечении некоторого срока. Или при анализе данных о технических изделиях, потребовавших гарантийного ремонта.

Пример 3. Пусть, например, срок службы электрической лампочки – случайная величина с функцией распределения F(t), а испытание проводится до выхода лампочки из строя, если это произойдет менее чем за 100 часов от начала испытаний, или до момента t 0 = 100 часов. Пусть G(t) – функция распределения времени эксплуатации лампочки в исправном состоянии при этом испытании. Тогда

Функция G(t) имеет скачок в точке t 0 , поскольку соответствующая случайная величина принимает значение t 0 с вероятностью 1-F(t 0)> 0.

Характеристики случайных величин. В вероятностно-статистических методах принятия решений используется ряд характеристик случайных величин, выражающихся через функции распределения и плотности вероятностей.

При описании дифференциации доходов, при нахождении доверительных границ для параметров распределений случайных величин и во многих иных случаях используется такое понятие, как «квантиль порядка р », где 0 < p < 1 (обозначается х р ). Квантиль порядка р – значение случайной величины, для которого функция распределения принимает значение р или имеет место «скачок» со значения меньше р до значения больше р (рис.2). Может случиться, что это условие выполняется для всех значений х, принадлежащих этому интервалу (т.е. функция распределения постоянна на этом интервале и равна р ). Тогда каждое такое значение называется «квантилем порядка р ». Для непрерывных функций распределения, как правило, существует единственный квантиль х р порядка р (рис.2), причем

F(x p) = p . (2)

Рис.2. Определение квантиля х р порядка р .

Пример 4. Найдем квантиль х р порядка р для функции распределения F(x) из (1).

При 0 < p < 1 квантиль х р находится из уравнения

т.е. х р = a + p(b – a) = a(1- p) +bp . При p = 0 любое x < a является квантилем порядка p = 0. Квантилем порядка p = 1 является любое число x > b .

Для дискретных распределений, как правило, не существует х р , удовлетворяющих уравнению (2). Точнее, если распределение случайной величины дается табл.1, где x 1 < x 2 < … < x k , то равенство (2), рассматриваемое как уравнение относительно х р , имеет решения только для k значений p , а именно,

p = p 1 ,

p = p 1 + p 2 ,

p = p 1 + p 2 + p 3 ,

p = p 1 + p 2 + … + p m , 3 < m < k ,

p = p 1 + p 2 + … + p k .

Таблица 1.

Распределение дискретной случайной величины

Для перечисленных k значений вероятности p решение х р уравнения (2) неединственно, а именно,

F(x) = p 1 + p 2 + … + p m

для всех х таких, что x m < x < x m+1 . Т.е. х р – любое число из интервала (x m ; x m+1 ]. Для всех остальных р из промежутка (0;1), не входящих в перечень (3), имеет место «скачок» со значения меньше р до значения больше р . А именно, если

p 1 + p 2 + … + p m

то х р = x m+1 .

Рассмотренное свойство дискретных распределений создает значительные трудности при табулировании и использовании подобных распределений, поскольку невозможным оказывается точно выдержать типовые численные значения характеристик распределения. В частности, это так для критических значений и уровней значимости непараметрических статистических критериев (см. ниже), поскольку распределения статистик этих критериев дискретны.

Большое значение в статистике имеет квантиль порядка р = ½. Он называется медианой (случайной величины Х или ее функции распределения F(x)) и обозначается Me(X). В геометрии есть понятие «медиана» - прямая, проходящая через вершину треугольника и делящая противоположную его сторону пополам. В математической статистике медиана делит пополам не сторону треугольника, а распределение случайной величины: равенство F(x 0,5) = 0,5 означает, что вероятность попасть левее x 0,5 и вероятность попасть правее x 0,5 (или непосредственно в x 0,5 ) равны между собой и равны ½, т.е.

P (X < x 0,5) = P (X > x 0,5) = ½.

Медиана указывает «центр» распределения. С точки зрения одной из современных концепций – теории устойчивых статистических процедур – медиана является более хорошей характеристикой случайной величины, чем математическое ожидание . При обработке результатов измерений в порядковой шкале (см. главу о теории измерений) медианой можно пользоваться, а математическим ожиданием – нет.

Ясный смысл имеет такая характеристика случайной величины, как мода – значение (или значения) случайной величины, соответствующее локальному максимуму плотности вероятности для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины.

Если x 0 – мода случайной величины с плотностью f(x), то, как известно из дифференциального исчисления, .

У случайной величины может быть много мод. Так, для равномерного распределения (1) каждая точка х такая, что a < x < b , является модой. Однако это исключение. Большинство случайных величин, используемых в вероятностно-статистических методах принятия решений и других прикладных исследованиях, имеют одну моду. Случайные величины, плотности, распределения, имеющие одну моду, называются унимодальными.

Математическое ожидание для дискретных случайных величин с конечным числом значений рассмотрено в главе «События и вероятности». Для непрерывной случайной величины Х математическое ожидание М(Х) удовлетворяет равенству

являющемуся аналогом формулы (5) из утверждения 2 главы «События и вероятности».

Пример 5. Математическое ожидание для равномерно распределенной случайной величины Х равно

Для рассматриваемых в настоящей главе случайных величин верны все те свойства математических ожиданий и дисперсий, которые были рассмотрены ранее для дискретных случайных величин с конечным числом значений. Однако доказательства этих свойств не приводим, поскольку они требуют углубления в математические тонкости, не являющегося необходимым для понимания и квалифицированного применения вероятностно-статистических методов принятия решений.

Замечание. В настоящем учебнике сознательно обходятся математические тонкости, связанные, в частности, с понятиями измеримых множеств и измеримых функций, -алгебры событий и т.п. Желающим освоить эти понятия необходимо обратиться к специальной литературе, в частности, к энциклопедии .

Каждая из трех характеристик – математическое ожидание, медиана, мода – описывает «центр» распределения вероятностей. Понятие «центр» можно определять разными способами – отсюда три разные характеристики. Однако для важного класса распределений – симметричных унимодальных – все три характеристики совпадают.

Плотность распределения f(x) – плотность симметричного распределения, если найдется число х 0 такое, что

. (3)

Равенство (3) означает, что график функции y = f(x) симметричен относительно вертикальной прямой, проходящей через центр симметрии х = х 0 . Из (3) следует, что функция симметричного распределения удовлетворяет соотношению

(4)

Для симметричного распределения с одной модой математическое ожидание, медиана и мода совпадают и равны х 0 .

Наиболее важен случай симметрии относительно 0, т.е. х 0 = 0. Тогда (3) и (4) переходят в равенства

(6)

соответственно. Приведенные соотношения показывают, что симметричные распределения нет необходимости табулировать при всех х , достаточно иметь таблицы при x > x 0 .

Отметим еще одно свойство симметричных распределений, постоянно используемое в вероятностно-статистических методах принятия решений и других прикладных исследованиях. Для непрерывной функции распределения

P(|X|< a) = P(-a < X < a) = F(a) – F(-a),

где F – функция распределения случайной величины Х . Если функция распределения F симметрична относительно 0, т.е. для нее справедлива формула (6), то

P(|X|< a) = 2F(a) – 1.

Часто используют другую формулировку рассматриваемого утверждения: если

.

Если и - квантили порядка и соответственно (см. (2)) функции распределения, симметричной относительно 0, то из (6) следует, что

От характеристик положения – математического ожидания, медианы, моды – перейдем к характеристикам разброса случайной величины Х : дисперсии , среднему квадратическому отклонению и коэффициенту вариации v . Определение и свойства дисперсии для дискретных случайных величин рассмотрены в предыдущей главе. Для непрерывных случайных величин

Среднее квадратическое отклонение – это неотрицательное значение квадратного корня из дисперсии:

Коэффициент вариации – это отношение среднего квадратического отклонения к математическому ожиданию:

Коэффициент вариации применяется при M(X)> 0. Он измеряет разброс в относительных единицах, в то время как среднее квадратическое отклонение – в абсолютных.

Пример 6. Для равномерно распределенной случайной величины Х найдем дисперсию, среднеквадратическое отклонение и коэффициент вариации. Дисперсия равна:

Замена переменной дает возможность записать:

где c = (b a )/ 2. Следовательно, среднее квадратическое отклонение равно а коэффициент вариации таков:

По каждой случайной величине Х определяют еще три величины – центрированную Y , нормированную V и приведенную U . Центрированная случайная величина Y – это разность между данной случайной величиной Х и ее математическим ожиданием М(Х), т.е. Y = Х – М(Х). Математическое ожидание центрированной случайной величины Y равно 0, а дисперсия – дисперсии данной случайной величины: М(Y ) = 0, D (Y ) = D (X ). Функция распределения F Y (x ) центрированной случайной величины Y связана с функцией распределения F (x ) исходной случайной величины X соотношением:

F Y (x ) = F (x + M (X )).

Для плотностей этих случайных величин справедливо равенство

f Y (x ) = f (x + M (X )).

Нормированная случайная величина V – это отношение данной случайной величины Х к ее среднему квадратическому отклонению , т.е. . Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики Х так:

,

где v – коэффициент вариации исходной случайной величины Х . Для функции распределения F V (x ) и плотности f V (x ) нормированной случайной величины V имеем:

где F (x ) – функция распределения исходной случайной величины Х , а f (x ) – ее плотность вероятности.

Приведенная случайная величина U – это центрированная и нормированная случайная величина:

.

Для приведенной случайной величины

Нормированные, центрированные и приведенные случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства позволяют упростить обоснования методов, формулировки теорем и расчетные формулы.

Используются преобразования случайных величин и более общего плана. Так, если Y = aX + b , где a и b – некоторые числа, то

Пример 7. Если то Y – приведенная случайная величина, и формулы (8) переходят в формулы (7).

С каждой случайной величиной Х можно связать множество случайных величин Y , заданных формулой Y = aX + b при различных a > 0 и b . Это множество называют масштабно-сдвиговым семейством , порожденным случайной величиной Х . Функции распределения F Y (x ) составляют масштабно сдвиговое семейство распределений, порожденное функцией распределения F (x ). Вместо Y = aX + b часто используют запись

Число с называют параметром сдвига, а число d - параметром масштаба. Формула (9) показывает, что Х – результат измерения некоторой величины – переходит в У – результат измерения той же величины, если начало измерения перенести в точку с , а затем использовать новую единицу измерения, в d раз большую старой.

Для масштабно-сдвигового семейства (9) распределение Х называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-распределение и др. (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины Х рассматривают Y = lg X , где lg X – десятичный логарифм числа Х . Цепочка равенств

F Y (x) = P(lg X < x) = P(X < 10 x) = F(10 x)

связывает функции распределения Х и Y .

При обработке данных используют такие характеристики случайной величины Х как моменты порядка q , т.е. математические ожидания случайной величины X q , q = 1, 2, … Так, само математическое ожидание – это момент порядка 1. Для дискретной случайной величины момент порядка q может быть рассчитан как

Для непрерывной случайной величины

Моменты порядка q называют также начальными моментами порядка q , в отличие от родственных характеристик – центральных моментов порядка q , задаваемых формулой

Так, дисперсия – это центральный момент порядка 2.

Нормальное распределение и центральная предельная теорема. В вероятностно-статистических методах принятия решений часто идет речь о нормальном распределении. Иногда его пытаются использовать для моделирования распределения исходных данных (эти попытки не всегда являются обоснованными – см. ниже). Более существенно, что многие методы обработки данных основаны на том, что расчетные величины имеют распределения, близкие к нормальному.

Пусть X 1 , X 2 ,…, X n M (X i ) = m и дисперсиями D (X i ) = , i = 1, 2,…, n ,… Как следует из результатов предыдущей главы,

Рассмотрим приведенную случайную величину U n для суммы , а именно,

Как следует из формул (7), M (U n ) = 0, D (U n ) = 1.

(для одинаково распределенных слагаемых). Пусть X 1 , X 2 ,…, X n , …– независимые одинаково распределенные случайные величины с математическими ожиданиями M (X i ) = m и дисперсиями D (X i ) = , i = 1, 2,…, n ,… Тогда для любого х существует предел

где Ф(х) – функция стандартного нормального распределения.

Подробнее о функции Ф(х) – ниже (читается «фи от икс», поскольку Ф – греческая прописная буква «фи»).

Центральная предельная теорема (ЦПТ) носит свое название по той причине, что она является центральным, наиболее часто применяющимся математическим результатом теории вероятностей и математической статистики. История ЦПТ занимает около 200 лет – с 1730 г., когда английский математик А.Муавр (1667-1754) опубликовал первый результат, относящийся к ЦПТ (см. ниже о теореме Муавра-Лапласа), до двадцатых – тридцатых годов ХХ в., когда финн Дж.У. Линдеберг, француз Поль Леви (1886-1971), югослав В. Феллер (1906-1970), русский А.Я. Хинчин (1894-1959) и другие ученые получили необходимые и достаточные условия справедливости классической центральной предельной теоремы.

Развитие рассматриваемой тематики на этом отнюдь не прекратилось – изучали случайные величины, не имеющие дисперсии, т.е. те, для которых

(академик Б.В.Гнеденко и др.), ситуацию, когда суммируются случайные величины (точнее, случайные элементы) более сложной природы, чем числа (академики Ю.В.Прохоров, А.А.Боровков и их соратники), и т.д.

Функция распределения Ф(х) задается равенством

,

где - плотность стандартного нормального распределения, имеющая довольно сложное выражение:

.

Здесь =3,1415925… - известное в геометрии число, равное отношению длины окружности к диаметру, e = 2,718281828… - основание натуральных логарифмов (для запоминания этого числа обратите внимание, что 1828 – год рождения писателя Л.Н.Толстого). Как известно из математического анализа,

При обработке результатов наблюдений функцию нормального распределения не вычисляют по приведенным формулам, а находят с помощью специальных таблиц или компьютерных программ. Лучшие на русском языке «Таблицы математической статистики» составлены членами-корреспондентами АН СССР Л.Н. Большевым и Н.В.Смирновым .

Вид плотности стандартного нормального распределения вытекает из математической теории, которую не имеем возможности здесь рассматривать, равно как и доказательство ЦПТ.

Для иллюстрации приводим небольшие таблицы функции распределения Ф(х) (табл.2) и ее квантилей (табл.3). Функция Ф(х) симметрична относительно 0, что отражается в табл.2-3.

Таблица 2.

Функция стандартного нормального распределения.

Если случайная величина Х имеет функцию распределения Ф(х), то М(Х) = 0, D (X ) = 1. Это утверждение доказывается в теории вероятностей, исходя из вида плотности вероятностей . Оно согласуется с аналогичным утверждением для характеристик приведенной случайной величины U n , что вполне естественно, поскольку ЦПТ утверждает, что при безграничном возрастании числа слагаемых функция распределения U n стремится к функции стандартного нормального распределения Ф(х), причем при любом х .

Таблица 3.

Квантили стандартного нормального распределения.

Квантиль порядка р

Квантиль порядка р

Введем понятие семейства нормальных распределений. По определению нормальным распределением называется распределение случайной величины Х , для которой распределение приведенной случайной величины есть Ф(х). Как следует из общих свойств масштабно-сдвиговых семейств распределений (см. выше), нормальное распределение – это распределение случайной величины

где Х – случайная величина с распределением Ф(Х), причем m = M (Y ), = D (Y ). Нормальное распределение с параметрами сдвига m и масштаба обычно обозначается N (m , ) (иногда используется обозначение N (m , ) ).

Как следует из (8), плотность вероятности нормального распределения N (m , ) есть

Нормальные распределения образуют масштабно-сдвиговое семейство. При этом параметром масштаба является d = 1/ , а параметром сдвига c = - m / .

Для центральных моментов третьего и четвертого порядка нормального распределения справедливы равенства

Эти равенства лежат в основе классических методов проверки того, что результаты наблюдений подчиняются нормальному распределению. В настоящее время нормальность обычно рекомендуется проверять по критерию W Шапиро – Уилка. Проблема проверки нормальности обсуждается ниже.

Если случайные величины Х 1 и Х 2 имеют функции распределения N (m 1 , 1) и N (m 2 , 2) соответственно, то Х 1 + Х 2 имеет распределение Следовательно, если случайные величины X 1 , X 2 ,…, X n N (m , ) , то их среднее арифметическое

имеет распределение N (m , ) . Эти свойства нормального распределения постоянно используются в различных вероятностно-статистических методах принятия решений, в частности, при статистическом регулировании технологических процессов и в статистическом приемочном контроле по количественному признаку.

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных.

Распределение (хи - квадрат) – распределение случайной величины

где случайные величины X 1 , X 2 ,…, X n независимы и имеют одно и тоже распределение N (0,1). При этом число слагаемых, т.е. n , называется «числом степеней свободы» распределения хи – квадрат.

Распределение t Стьюдента – это распределение случайной величины

где случайные величины U и X независимы, U имеет распределение стандартное нормальное распределение N (0,1), а X – распределение хи – квадрат с n степенями свободы. При этом n называется «числом степеней свободы» распределения Стьюдента. Это распределение было введено в 1908 г. английским статистиком В. Госсетом, работавшем на фабрике, выпускающей пиво. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому ее руководство запрещало В. Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных В. Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета - Стьюдента показывает, что еще сто лет менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов принятия решений.

Распределение Фишера – это распределение случайной величины

где случайные величины Х 1 и Х 2 независимы и имеют распределения хи – квадрат с числом степеней свободы k 1 и k 2 соответственно. При этом пара (k 1 , k 2 ) – пара «чисел степеней свободы» распределения Фишера, а именно, k 1 – число степеней свободы числителя, а k 2 – число степеней свободы знаменателя. Распределение случайной величины F названо в честь великого английского статистика Р.Фишера (1890-1962), активно использовавшего его в своих работах.

Выражения для функций распределения хи - квадрат, Стьюдента и Фишера, их плотностей и характеристик, а также таблицы можно найти в специальной литературе (см., например, ).

Как уже отмечалось, нормальные распределения в настоящее время часто используют в вероятностных моделях в различных прикладных областях. В чем причина такой широкой распространенности этого двухпараметрического семейства распределений? Она проясняется следующей теоремой.

Центральная предельная теорема (для разнораспределенных слагаемых). Пусть X 1 , X 2 ,…, X n ,… - независимые случайные величины с математическими ожиданиями М(X 1 ), М(X 2 ),…, М(X n), … и дисперсиями D (X 1 ), D (X 2 ),…, D (X n), … соответственно. Пусть

Тогда при справедливости некоторых условий, обеспечивающих малость вклада любого из слагаемых в U n ,

для любого х .

Условия, о которых идет речь, не будем здесь формулировать. Их можно найти в специальной литературе (см., например, ). «Выяснение условий, при которых действует ЦПТ, составляет заслугу выдающихся русских ученых А.А.Маркова (1857-1922) и, в особенности, А.М.Ляпунова (1857-1918)» .

Центральная предельная теорема показывает, что в случае, когда результат измерения (наблюдения) складывается под действием многих причин, причем каждая из них вносит лишь малый вклад, а совокупный итог определяется аддитивно , т.е. путем сложения, то распределение результата измерения (наблюдения) близко к нормальному.

Иногда считают, что для нормальности распределения достаточно того, что результат измерения (наблюдения) Х формируется под действием многих причин, каждая из которых оказывает малое воздействие. Это не так. Важно, как эти причины действуют. Если аддитивно – то Х имеет приближенно нормальное распределение. Если мультипликативно (т.е. действия отдельных причин перемножаются, а не складываются), то распределение Х близко не к нормальному, а к т.н. логарифмически нормальному, т.е. не Х , а lg X имеет приблизительно нормальное распределение. Если же нет оснований считать, что действует один из этих двух механизмов формирования итогового результата (или какой-либо иной вполне определенный механизм), то про распределение Х ничего определенного сказать нельзя.

Из сказанного вытекает, что в конкретной прикладной задаче нормальность результатов измерений (наблюдений), как правило, нельзя установить из общих соображений, ее следует проверять с помощью статистических критериев. Или же использовать непараметрические статистические методы, не опирающиеся на предположения о принадлежности функций распределения результатов измерений (наблюдений) к тому или иному параметрическому семейству.

Непрерывные распределения, используемые в вероятностно-статистических методах принятия решений. Кроме масштабно-сдвигового семейства нормальных распределений, широко используют ряд других семейств распределения – логарифмически нормальных, экспоненциальных, Вейбулла-Гнеденко, гамма-распределений. Рассмотрим эти семейства.

Случайная величина Х имеет логарифмически нормальное распределение, если случайная величина Y = lg X имеет нормальное распределение. Тогда Z = ln X = 2,3026…Y также имеет нормальное распределение N (a 1 ,σ 1) , где ln X - натуральный логарифм Х . Плотность логарифмически нормального распределения такова:

Из центральной предельной теоремы следует, что произведение X = X 1 X 2 X n независимых положительных случайных величин X i , i = 1, 2,…, n , при больших n можно аппроксимировать логарифмически нормальным распределением. В частности, мультипликативная модель формирования заработной платы или дохода приводит к рекомендации приближать распределения заработной платы и дохода логарифмически нормальными законами. Для России эта рекомендация оказалась обоснованной - статистические данные подтверждают ее.

Имеются и другие вероятностные модели, приводящие к логарифмически нормальному закону. Классический пример такой модели дан А.Н.Колмогоровым , который из физически обоснованной системы постулатов вывел заключение о том, что размеры частиц при дроблении кусков руды, угля и т.п. на шаровых мельницах имеют логарифмически нормальное распределение.

Перейдем к другому семейству распределений, широко используемому в различных вероятностно-статистических методах принятия решений и других прикладных исследованиях, - семейству экспоненциальных распределений. Начнем с вероятностной модели, приводящей к таким распределениям. Для этого рассмотрим "поток событий", т.е. последовательность событий, происходящих одно за другим в какие-то моменты времени. Примерами могут служить: поток вызовов на телефонной станции; поток отказов оборудования в технологической цепочке; поток отказов изделий при испытаниях продукции; поток обращений клиентов в отделение банка; поток покупателей, обращающихся за товарами и услугами, и т.д. В теории потоков событий справедлива теорема, аналогичная центральной предельной теореме, но в ней речь идет не о суммировании случайных величин, а о суммировании потоков событий. Рассматривается суммарный поток, составленный из большого числа независимых потоков, ни один из которых не оказывает преобладающего влияния на суммарный поток. Например, поток вызовов, поступающих на телефонную станцию, слагается из большого числа независимых потоков вызовов, исходящих от отдельных абонентов. Доказано , что в случае, когда характеристики потоков не зависят от времени, суммарный поток полностью описывается одним числом - интенсивностью потока. Для суммарного потока рассмотрим случайную величину Х - длину промежутка времени между последовательными событиями. Ее функция распределения имеет вид

(10)

Это распределение называется экспоненциальным распределением, т.к. в формуле (10) участвует экспоненциальная функция e x . Величина 1/λ - масштабный параметр. Иногда вводят и параметр сдвига с , экспоненциальным называют распределение случайной величины Х + с , где распределение Х задается формулой (10).

Экспоненциальные распределения - частный случай т. н. распределений Вейбулла - Гнеденко. Они названы по фамилиям инженера В. Вейбулла, введшего эти распределения в практику анализа результатов усталостных испытаний, и математика Б.В.Гнеденко (1912-1995), получившего такие распределения в качестве предельных при изучении максимального из результатов испытаний. Пусть Х - случайная величина, характеризующая длительность функционирования изделия, сложной системы, элемента (т.е. ресурс, наработку до предельного состояния и т.п.), длительность функционирования предприятия или жизни живого существа и т.д. Важную роль играет интенсивность отказа

(11)

где F (x ) и f (x ) - функция распределения и плотность случайной величины Х .

Опишем типичное поведение интенсивности отказа. Весь интервал времени можно разбить на три периода. На первом из них функция λ(х) имеет высокие значения и явную тенденцию к убыванию (чаще всего она монотонно убывает). Это можно объяснить наличием в рассматриваемой партии единиц продукции с явными и скрытыми дефектами, которые приводят к относительно быстрому выходу из строя этих единиц продукции. Первый период называют "периодом приработки" (или "обкатки"). Именно на него обычно распространяется гарантийный срок.

Затем наступает период нормальной эксплуатации, характеризующийся приблизительно постоянной и сравнительно низкой интенсивностью отказов. Природа отказов в этот период носит внезапный характер (аварии, ошибки эксплуатационных работников и т.п.) и не зависит от длительности эксплуатации единицы продукции.

Наконец, последний период эксплуатации - период старения и износа. Природа отказов в этот период - в необратимых физико-механических и химических изменениях материалов, приводящих к прогрессирующему ухудшению качества единицы продукции и окончательному выходу ее из строя.

Каждому периоду соответствует свой вид функции λ(х) . Рассмотрим класс степенных зависимостей

λ(х) = λ 0 bx b -1 , (12)

где λ 0 > 0 и b > 0 - некоторые числовые параметры. Значения b < 1, b = 0 и b > 1 отвечают виду интенсивности отказов в периоды приработки, нормальной эксплуатации и старения соответственно.

Соотношение (11) при заданной интенсивности отказа λ(х) - дифференциальное уравнение относительно функции F (x ). Из теории дифференциальных уравнений следует, что

(13)

Подставив (12) в (13), получим, что

(14)

Распределение, задаваемое формулой (14) называется распределением Вейбулла - Гнеденко. Поскольку

то из формулы (14) следует, что величина а , задаваемая формулой (15), является масштабным параметром. Иногда вводят и параметр сдвига, т.е. функциями распределения Вейбулла - Гнеденко называют F (x - c ), где F (x ) задается формулой (14) при некоторых λ 0 и b .

Плотность распределения Вейбулла - Гнеденко имеет вид

(16)

где a > 0 - параметр масштаба, b > 0 - параметр формы, с - параметр сдвига. При этом параметр а из формулы (16) связан с параметром λ 0 из формулы (14) соотношением, указанным в формуле (15).

Экспоненциальное распределение - весьма частный случай распределения Вейбулла - Гнеденко, соответствующий значению параметра формы b = 1.

Распределение Вейбулла - Гнеденко применяется также при построении вероятностных моделей ситуаций, в которых поведение объекта определяется "наиболее слабым звеном". Подразумевается аналогия с цепью, сохранность которой определяется тем ее звеном, которое имеет наименьшую прочность. Другими словами, пусть X 1 , X 2 ,…, X n - независимые одинаково распределенные случайные величины,

X(1) = min (X 1 , X 2 ,…, X n ), X(n) = max (X 1 , X 2 ,…, X n ).

В ряде прикладных задач большую роль играют X (1) и X (n ) , в частности, при исследовании максимально возможных значений ("рекордов") тех или иных значений, например, страховых выплат или потерь из-за коммерческих рисков, при изучении пределов упругости и выносливости стали, ряда характеристик надежности и т.п. Показано, что при больших n распределения X (1) и X (n ) , как правило, хорошо описываются распределениями Вейбулла - Гнеденко. Основополагающий вклад в изучение распределений X (1) и X (n ) внес советский математик Б.В.Гнеденко. Использованию полученных результатов в экономике, менеджменте, технике и других областях посвящены труды В. Вейбулла, Э. Гумбеля, В.Б. Невзорова, Э.М. Кудлаева и многих иных специалистов.

Перейдем к семейству гамма-распределений. Они широко применяются в экономике и менеджменте, теории и практике надежности и испытаний, в различных областях техники, метеорологии и т.д. В частности, гамма-распределению подчинены во многих ситуациях такие величины, как общий срок службы изделия, длина цепочки токопроводящих пылинок, время достижения изделием предельного состояния при коррозии, время наработки до k -го отказа, k = 1, 2, …, и т.д. Продолжительность жизни больных хроническими заболеваниями, время достижения определенного эффекта при лечении в ряде случаев имеют гамма-распределение. Это распределение наиболее адекватно для описания спроса в экономико-математических моделях управления запасами (логистики).

Плотность гамма-распределения имеет вид

(17)

Плотность вероятности в формуле (17) определяется тремя параметрами a , b , c , где a >0, b >0. При этом a является параметром формы, b - параметром масштаба и с - параметром сдвига. Множитель 1/Γ(а) является нормировочным, он введен, чтобы

Здесь Γ(а) - одна из используемых в математике специальных функций, так называемая "гамма-функция", по которой названо и распределение, задаваемое формулой (17),

При фиксированном а формула (17) задает масштабно-сдвиговое семейство распределений, порождаемое распределением с плотностью

(18)

Распределение вида (18) называется стандартным гамма-распределением. Оно получается из формулы (17) при b = 1 и с = 0.

Частным случаем гамма-распределений при а = 1 являются экспоненциальные распределения (с λ = 1/ b ). При натуральном а и с =0 гамма-распределения называются распределениями Эрланга. С работ датского ученого К.А.Эрланга (1878-1929), сотрудника Копенгагенской телефонной компании, изучавшего в 1908-1922 гг. функционирование телефонных сетей, началось развитие теории массового обслуживания. Эта теория занимается вероятностно-статистическим моделированием систем, в которых происходит обслуживание потока заявок, с целью принятия оптимальных решений. Распределения Эрланга используют в тех же прикладных областях, в которых применяют экспоненциальные распределения. Это основано на следующем математическом факте: сумма k независимых случайных величин, экспоненциально распределенных с одинаковыми параметрами λ и с , имеет гамма-распределение с параметром формы а = k , параметром масштаба b = 1/λ и параметром сдвига kc . При с = 0 получаем распределение Эрланга.

Если случайная величина X имеет гамма-распределение с параметром формы а таким, что d = 2 a - целое число, b = 1 и с = 0, то 2Х имеет распределение хи-квадрат с d степенями свободы.

Случайная величина X с гвмма-распределением имеет следующие характеристики:

Математическое ожидание М(Х) = ab + c ,

Дисперсию D (X ) = σ 2 = ab 2 ,

Коэффициент вариации

Асимметрию

Эксцесс

Нормальное распределение - предельный случай гамма-распределения. Точнее, пусть Z - случайная величина, имеющая стандартное гамма-распределение, заданное формулой (18). Тогда

для любого действительного числа х , где Ф(х) - функция стандартного нормального распределения N (0,1).

В прикладных исследованиях используются и другие параметрические семейства распределений, из которых наиболее известны система кривых Пирсона, ряды Эджворта и Шарлье. Здесь они не рассматриваются.

Дискретные распределения, используемые в вероятностно-статистических методах принятия решений. Наиболее часто используют три семейства дискретных распределений - биномиальных, гипергеометрических и Пуассона, а также некоторые другие семейства - геометрических, отрицательных биномиальных, мультиномиальных, отрицательных гипергеометрических и т.д.

Как уже говорилось, биномиальное распределение имеет место при независимых испытаниях, в каждом из которых с вероятностью р появляется событие А . Если общее число испытаний n задано, то число испытаний Y , в которых появилось событие А , имеет биномиальное распределение. Для биномиального распределения вероятность принятия случайной величиной Y значения y определяется формулой

Число сочетаний из n элементов по y , известное из комбинаторики. Для всех y , кроме 0, 1, 2, …, n , имеем P (Y = y )= 0. Биномиальное распределение при фиксированном объеме выборки n задается параметром p , т.е. биномиальные распределения образуют однопараметрическое семейство. Они применяются при анализе данных выборочных исследований , в частности, при изучении предпочтений потребителей, выборочном контроле качества продукции по планам одноступенчатого контроля, при испытаниях совокупностей индивидуумов в демографии, социологии, медицине, биологии и др.

Если Y 1 и Y 2 - независимые биномиальные случайные величины с одним и тем же параметром p 0 , определенные по выборкам с объемами n 1 и n 2 соответственно, то Y 1 + Y 2 - биномиальная случайная величина, имеющая распределение (19) с р = p 0 и n = n 1 + n 2 . Это замечание расширяет область применимости биномиального распределения, позволяя объединять результаты нескольких групп испытаний, когда есть основания полагать, что всем этим группам соответствует один и тот же параметр.

Характеристики биномиального распределения вычислены ранее:

M (Y ) = np , D (Y ) = np (1- p ).

В разделе "События и вероятности" для биномиальной случайной величины доказан закон больших чисел:

для любого . С помощью центральной предельной теоремы закон больших чисел можно уточнить, указав, насколько Y / n отличается от р .

Теорема Муавра-Лапласа. Для любых чисел a и b , a < b , имеем

где Ф (х ) – функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1.

Для доказательства достаточно воспользоваться представлением Y в виде суммы независимых случайных величин, соответствующих исходам отдельных испытаний, формулами для M (Y ) и D (Y ) и центральной предельной теоремой.

Эта теорема для случая р = ½ доказана английским математиком А.Муавром (1667-1754) в 1730 г. В приведенной выше формулировке она была доказана в 1810 г. французским математиком Пьером Симоном Лапласом (1749 – 1827).

Гипергеометрическое распределение имеет место при выборочном контроле конечной совокупности объектов объема N по альтернативному признаку. Каждый контролируемый объект классифицируется либо как обладающий признаком А , либо как не обладающий этим признаком. Гипергеометрическое распределение имеет случайная величина Y , равная числу объектов, обладающих признаком А в случайной выборке объема n , где n < N . Например, число Y дефектных единиц продукции в случайной выборке объема n из партии объема N имеет гипергеометрическое распределение, если n < N . Другой пример – лотерея. Пусть признак А билета – это признак «быть выигрышным». Пусть всего билетов N , а некоторое лицо приобрело n из них. Тогда число выигрышных билетов у этого лица имеет гипергеометрическое распределение.

Для гипергеометрического распределения вероятность принятия случайной величиной Y значения y имеет вид

(20)

где D – число объектов, обладающих признаком А , в рассматриваемой совокупности объема N . При этом y принимает значения от max{0, n - (N - D )} до min{n , D }, при прочих y вероятность в формуле (20) равна 0. Таким образом, гипергеометрическое распределение определяется тремя параметрами – объемом генеральной совокупности N , числом объектов D в ней, обладающих рассматриваемым признаком А , и объемом выборки n .

Простой случайной выборкой объема n из совокупности объема N называется выборка, полученная в результате случайного отбора, при котором любой из наборов из n объектов имеет одну и ту же вероятность быть отобранным. Методы случайного отбора выборок респондентов (опрашиваемых) или единиц штучной продукции рассматриваются в инструктивно-методических и нормативно-технических документах. Один из методов отбора таков: объекты отбирают один из другим, причем на каждом шаге каждый из оставшихся в совокупности объектов имеет одинаковые шансы быть отобранным. В литературе для рассматриваемого типа выборок используются также термины «случайная выборка», «случайная выборка без возвращения».

Поскольку объемы генеральной совокупности (партии) N и выборки n обычно известны, то подлежащим оцениванию параметром гипергеометрического распределения является D . В статистических методах управления качеством продукции D – обычно число дефектных единиц продукции в партии. Представляет интерес также характеристика распределения D / N – уровень дефектности.

Для гипергеометрического распределения

Последний множитель в выражении для дисперсии близок к 1, если N >10 n . Если при этом сделать замену p = D / N , то выражения для математического ожидания и дисперсии гипергеометрического распределения перейдут в выражения для математического ожидания и дисперсии биномиального распределения. Это не случайно. Можно показать, что

при N >10 n , где p = D / N . Справедливо предельное соотношение

и этим предельным соотношением можно пользоваться при N >10 n .

Третье широко используемое дискретное распределение – распределение Пуассона. Случайная величина Y имеет распределение Пуассона, если

,

где λ – параметр распределения Пуассона, и P (Y = y )= 0 для всех прочих y (при y=0 обозначено 0! =1). Для распределения Пуассона

M (Y ) = λ, D (Y ) = λ.

Это распределение названо в честь французского математика С.Д.Пуассона (1781-1840), впервые получившего его в 1837 г. Распределение Пуассона является предельным случаем биномиального распределения, когда вероятность р осуществления события мала, но число испытаний n велико, причем np = λ. Точнее, справедливо предельное соотношение

Поэтому распределение Пуассона (в старой терминологии «закон распределения») часто называют также «законом редких событий».

Распределение Пуассона возникает в теории потоков событий (см. выше). Доказано, что для простейшего потока с постоянной интенсивностью Λ число событий (вызовов), происшедших за время t , имеет распределение Пуассона с параметром λ = Λt . Следовательно, вероятность того, что за время t не произойдет ни одного события, равна e - Λ t , т.е. функция распределения длины промежутка между событиями является экспоненциальной.

Распределение Пуассона используется при анализе результатов выборочных маркетинговых обследований потребителей, расчете оперативных характеристик планов статистического приемочного контроля в случае малых значений приемочного уровня дефектности, для описания числа разладок статистически управляемого технологического процесса в единицу времени, числа «требований на обслуживание», поступающих в единицу времени в систему массового обслуживания, статистических закономерностей несчастных случаев и редких заболеваний, и т.д.

Описание иных параметрических семейств дискретных распределений и возможности их практического использования рассматриваются в литературе.


В некоторых случаях, например, при изучении цен, объемов выпуска или суммарной наработки на отказ в задачах надежности, функции распределения постоянны на некоторых интервалах, в которые значения исследуемых случайных величин не могут попасть.

Предыдущая

Тема №11

На практике для задания случайных величин общего вида обычно используется функция распределения.

Вероятность того, что случайная величина х примет определенное значение х 0 , выражается через функцию распределения по формуле

р (х = х 0) = F(x 0 +0) – F(x 0). (3)

В частности, если в точке х = х 0 функция F(x) непрерывна, то

р (х = х 0) =0.

Случайная величина х с распределением р(А) называется дискретной, если на числовой прямой существует конечное или счетное множество W, такое, что р (W,) = 1.

Пусть W = {x 1 , x 2 ,…} и p i = p ({x i }) = p (x = x i ), i = 1,2,….Тогда для любого борелевского множества А вероятность р(А) определяется однозначно формулой

Положив в этой формуле А = {x i / x i < x}, x Î R , получим формулу для функции распределения F(x) дискретной случайной величины х :

F(x) = p (x < x ) =. (5)

График функции F(x) представляет собой ступенчатую линию. Скачки функции F(x) в точках х = х 1 , х 2 …(x 1 равны соответствующим вероятностям р 1 , p 2 , … .

Пример 1. Найдите функцию распределения

дискретной случайной величины х из примера 1§ 13.

Используя функцию распределения, вычислите

вероятности событий: х < 3, 1 £ x < 4, 1 £ x £ 3.

F(x)
0 х 1 х 2 х 3 х 4 х
Решение. Используя данные из таблицы,

полученной в § 13, и формулу (5), получим

функцию распределения:

По формуле (1) Р(x < 3) = F(3) = 0,1808; по формуле (2)

р(1 £ x < 4) = F (4) – F(1) = 0,5904 – 0,0016 = 0,5888;

p (1 £ x £ 3) = p (1 £ x <3) + p(x = 3) = F(3) – F(1) + F(3+0) – F(3) =

F(3+0) – F(1) = 0,5904 – 0,0016 = 0,5888.

Пример 2. Дана функция

Является ли функция F(x) функцией распределения некоторой случайной величины? В случае положительного ответа найдите . Построить график функции F(x).

Решение. Для того чтобы наперед заданная функция F(x) являлась функцией распределения некоторой случайной величины х, необходимо и достаточно выполнение следующих условий (характеристических свойств функции распределения):

1. F(x) – неубывающая функция.

3. При любом х Î R F(x – 0) = F(x ).

Для заданной функции F(x) выполнение

этих условий очевидно. Значит,

F(x) – функция распределения.

Вероятность вычисляем по

формуле (2):

График функции F(x ) представлен на рисунке 13.

Пример 3. Пусть F 1 (x ) и F 2 (x ) – функции распределения случайных величин х 1 и х 2 соответственно, а 1 и а 2 – неотрицательные числа, сумма которых равна 1.

Доказать, что F(x ) = a 1 F 1 (x ) + a 2 F 2 (x ) является функцией распределения некоторой случайной величины х .



Решение. 1) Так как F 1 (x ) и F 2 (x ) – неубывающие функции и а 1 ³ 0, а 2 ³ 0, то a 1 F 1 (x ) и a 2 F 2 (x ) - неубывающие, следовательно, их сумма F(x ) тоже неубывающая.

3) При любом х Î R F(x - 0) = a 1 F 1 (x - 0) + a 2 F 2 (x - 0)= a 1 F 1 (x ) + a 2 F 2 (x ) = F(x ).

Пример 4. Дана функция

Является ли F(x) функцией распределения случайной величины?

Решение. Легко заметить, что F(1) = 0,2 > 0,11 = F(1,1). Следовательно, F(x ) не является неубывающей, а значит, не является функцией распределения случайной величины. Заметим, что остальные два свойства для данной функции справедливы.

Контрольное задание №11

1. Дискретная случайная величина х

x ) и, используя ее, найдите вероятности событий: а) –2 £ х < 1; б) ½х ½£ 2. Постройте график функции распределения.

3. Дискретная случайная величина х задана таблицей распределения:

x i
p i 0,05 0,2 0,3 0,35 0,1

Найдите функцию распределения F(x ) и найдите вероятности следующих событий: а) x < 2; б) 1 £ х < 4; в) 1 £ х £ 4; г) 1 < x £ 4; д) х = 2,5.

4. Найдите функцию распределения дискретной случайной величины х , равной числу выпавших очков при одном бросании игральной кости. Используя функцию распределения, найдите вероятность того, что выпадет не менее 5 очков.

5. Производятся последовательные испытания 5 приборов на надежность. Каждый следующий прибор испытывается только в том случае, если предыдущий оказался надежным. Составьте таблицу распределения и найдите функцию распределения случайного числа испытаний приборов, если вероятность выдержать испытания для каждого прибора 0,9.

6. Задана функция распределения дискретной случайной величины х :

а) Найдите вероятность события 1 £ х £ 3.

б) Найдите таблицу распределения случайной величины х .

7. Задана функция распределения дискретной случайной величины х :

Составьте таблицу распределения данной случайной величины.

8. Монету бросают n раз. Составьте таблицу распределения и найдите функцию распределения числа появлений герба. Постройте график функции распределения при n = 5.

9. Монету бросают, пока не выпадет герб. Составьте таблицу распределения и найдите функцию распределения числа появлений цифры.

10. Снайпер стреляет по цели до первого попадания. Вероятность промаха при отдельном выстреле равна р . Найдите функцию распределения числа промахов.

Случайной величиной называется переменная, которая может принимать те или иные значения в зависимости от различных обстоятельств, и случайная величина называется непрерывной , если она может принимать любое значение из какого-либо ограниченного или неограниченного интервала. Для непрерывной случайной величины невозможно указать все возможные значения, поэтому обозначают интервалы этих значений, которые связаны с определёнными вероятностями.

Примерами непрерывных случайных величин могут служить: диаметр детали, обтачиваемой до заданного размера, рост человека, дальность полёта снаряда и др.

Так как для непрерывных случайных величин функция F (x ), в отличие от дискретных случайных величин , нигде не имеет скачков, то вероятность любого отдельного значения непрерывной случайной величины равна нулю.

Это значит, что для непрерывной случайной величины бессмысленно говорить о распределении вероятностей между её значениями: каждое из них имеет нулевую вероятность. Однако в некотором смысле среди значений непрерывной случайной величины есть "более и менее вероятные". Например, вряд ли у кого-либо возникнет сомнение, что значение случайной величины - роста наугад встреченного человека - 170 см - более вероятно, чем 220 см, хотя и одно, и другое значение могут встретиться на практике.

Функция распределения непрерывной случайной величины и плотность вероятности

В качестве закона распределения, имеющего смысл только для непрерывных случайных величин, вводится понятие плотности распределения или плотности вероятности. Подойдём к нему путём сравнения смысла функции распределения для непрерывной случайной величины и для дискретной случайной величины.

Итак, функцией распределения случайной величины (как дискретной, так и непрерывной) или интегральной функцией называется функция , которая определяет вероятность, что значение случайной величины X меньше или равно граничному значению х .

Для дискретной случайной величины в точках её значений x 1 , x 2 , ..., x i ,... сосредоточены массы вероятностей p 1 , p 2 , ..., p i ,... , причём сумма всех масс равна 1. Перенесём эту интерпретацию на случай непрерывной случайной величины. Представим себе, что масса, равная 1, не сосредоточена в отдельных точках, а непрерывно "размазана" по оси абсцисс Оx с какой-то неравномерной плотностью. Вероятность попадания случайной величины на любой участок Δx будет интерпретироваться как масса, приходящаяся на этот участок, а средняя плотность на этом участке - как отношение массы к длине. Только что мы ввели важное понятие теории вероятностей: плотность распределения.

Плотностью вероятности f (x ) непрерывной случайной величины называется производная её функции распределения:

.

Зная функцию плотности, можно найти вероятность того, что значение непрерывной случайной величины принадлежит закрытому интервалу [a ; b ]:

вероятность того, что непрерывная случайная величина X примет какое-либо значение из интервала [a ; b ], равна определённому интегралу от её плотности вероятности в пределах от a до b :

.

При этом общая формула функции F (x ) распределения вероятностей непрерывной случайной величины, которой можно пользоваться, если известна функция плотности f (x ) :

.

График плотности вероятности непрерывной случайной величины называется её кривой распределения (рис. ниже).

Площадь фигуры (на рисунке заштрихована), ограниченной кривой, прямыми, проведёнными из точек a и b перпендикулярно оси абсцисс, и осью Ох , графически отображает вероятность того, что значение непрерывной случайной величины Х находится в пределах от a до b .

Свойства функции плотности вероятности непрерывной случайной величины

1. Вероятность того, что случайная величина примет какое-либо значение из интервала (и площадь фигуры, которую ограничивают график функции f (x ) и ось Ох ) равна единице:

2. Функция плотности вероятности не может принимать отрицательные значения:

а за пределами существования распределения её значение равно нулю

Плотность распределения f (x ), как и функция распределения F (x ), является одной из форм закона распределения, но в отличие от функции распределения, она не универсальна: плотность распределения существует только для непрерывных случайных величин.

Упомянем о двух важнейших в практике видах распределения непрерывной случайной величины.

Если функция плотности распределения f (x ) непрерывной случайной величины в некотором конечном интервале [a ; b ] принимает постоянное значение C , а за пределами интервала принимает значение, равное нулю, то такое распределение называется равномерным .

Если график функции плотности распределения симметричен относительно центра, средние значения сосредоточены вблизи центра, а при отдалении от центра собираются более отличающиеся от средних (график функции напоминает разрез колокола), то такое распределение называется нормальным .

Пример 1. Известна функция распределения вероятностей непрерывной случайной величины:

Найти функцию f (x ) плотности вероятности непрерывной случайной величины. Построить графики обеих функций. Найти вероятность того, что непрерывная случайная величина примет какое-либо значение в интервале от 4 до 8: .

Решение. Функцию плотности вероятности получаем, находя производную функции распределения вероятностей:

График функции F (x ) - парабола:

График функции f (x ) - прямая:

Найдём вероятность того, что непрерывная случайная величина примет какое либо значение в интервале от 4 до 8:

Пример 2. Функция плотности вероятности непрерывной случайной величины дана в виде:

Вычислить коэффициент C . Найти функцию F (x ) распределения вероятностей непрерывной случайной величины. Построить графики обеих функций. Найти вероятность того, что непрерывная случайная величина примет какое-либо значение в интервале от 0 до 5: .

Решение. Коэффициент C найдём, пользуясь свойством 1 функции плотности вероятности:

Таким образом, функция плотности вероятности непрерывной случайной величины:

Интегрируя, найдём функцию F (x ) распределения вероятностей. Если x < 0 , то F (x ) = 0 . Если 0 < x < 10 , то

.

x > 10 , то F (x ) = 1 .

Таким образом, полная запись функции распределения вероятностей:

График функции f (x ) :

График функции F (x ) :

Найдём вероятность того, что непрерывная случайная величина примет какое либо значение в интервале от 0 до 5:

Пример 3. Плотность вероятности непрерывной случайной величины X задана равенством , при этом . Найти коэффициент А , вероятность того, что непрерывная случайная величина X примет какое-либо значение из интервала ]0, 5[, функцию распределения непрерывной случайной величины X .

Решение. По условию приходим к равенству

Следовательно, , откуда . Итак,

.

Теперь находим вероятность того, что непрерывная случайная величина X примет какое-либо значение из интервала ]0, 5[:

Теперь получим функцию распределения данной случайной величины:

Пример 4. Найти плотность вероятности непрерывной случайной величины X , которая принимает только неотрицательные значения, а её функция распределения .