а) Центральная предельная теорема для одинаково распределенных случайных величин
Дадим формулировку этой теоремы: если Х1, Х2, ..., Хn - независимые случайные величины, имеющие один и тот же закон распределения с математическим ожиданием mx и дисперсией σ2, то при неограниченном увеличении n закон распределения суммы
неограниченно приближается к нормальному с математическим ожиданием nmx и дисперсией nσ2.
Доказательство этой теоремы основано на понятии характеристической функции. По условию величины Xi имеют одинаковую плотность распределения вероятностей f(х). Если они непрерывные, то f(х) непрерывна, если дискретные, то f(х) состоит из дельта-функций.
Характеристическая функция определяется как обратное преобразование Фурье от функции f(x):
или с использованием двустороннего преобразования Лапласа, которое для функции f(х) определяется по формуле
имеем:
Если величины дискретные, то интеграл превращается в сумму
где pk - вероятность того, что X примет какое-то k-e дискретное значение.
Так как все величины X1, Х2, ..., Хn статистически независимы, то к их сумме Yn=Х1+Х2+...+Хn применима теорема о композиции [Л. 13, 15]. Плотность распределения вероятностей суммы таких величин равна кратному интегралу свертки от fx(х), а характеристические функции перемножаются, т. е.
f1yn(ω)=[f1x(ω)]n.
Одно из замечательных свойств нормального закона распределения заключается в том, что плотность распределения вероятности f(х) и характеристическая функция f1(ω) имеют один и тот же вид:
Случайная величина Yn в соответствии с формулами (1-7) и (1-8) имеет следующие математическое ожидание и дисперсию:
myn=nmx
Dyn=nDx=nσ2.
Если вместо Yn рассматривать величину с единичной дисперсией Zn=Yn/σn1/2, то соответствующие характеристические функции будут связаны соотношением
В этом нетрудно убедится с помощью формулы (1-21). Для доказательства теоремы достаточно показать, что функция
стремится к ехр(- ω2/2) при n→∞. Для этого разложим функцию f1x(ω) в ряд Тейлора:
где R - остаточный член порядка малости выше, чем ω2. Найдем коэффициенты этого ряда:
Отсюда
ḟ1x(0)=jM[X]=jmx
Положим mx=0. При этом не нарушается общность доказательства, так как всегда можно так изменить начало координат, чтобы mx=0:
Отсюда
так как mx=0. Поэтому ряд (1-23) запишется в виде
Перейдем от Yn к нормированной величине . При этом в соответствии с формулой (1-22) характеристические функции будут связаны соотношением
Заменив переменные в выражении (1-24), получим:
где R1 стремится к нулю быстрее, чем 1/n.
Далее, возьмем натуральный логарифм от обеих частей равенства (1-25). Учитывая, что величина
малая и стремится к нулю при n→∞ и что при этом справедливо соотношение
ln(1-χ)≈-χ,
получаем:
где R' - остаточный член, который стремится к нулю быстрее, чем 1/n. Умножая обе части (1-26) на n и учитывая (1-22), получаем:
поэтому
Функция, стоящая справа, - это характеристическая функция нормального распределения с m=0 и σ=1. Тем самым теорема доказана.
Аналогичным образом ЦПТ можно доказать для дискретных случайных величин.
Приведенные рассуждения основаны на том, что при стремлении последовательности характеристических функций к предельной характеристической функции соответствующая последовательность функций распределения тоже стремится к функции распределения, соответствующей этой предельной характеристической функции. Это положение может быть доказано и носит название теоремы Крамера [Л. 22].
Для общего случая, когда случайные величины независимы и имеют разные законы распределения, эту теорему можно доказать по методу А. М. Ляпунова. При этом необходимо, чтобы выполнялись условия
где bk= М{|Х0k|3} - третий абсолютный центральный момент величины Xk, Х0k=Xk - mk, k=1,2, ..., n; Dk - дисперсия величин Xk.
Более общим необходимым и достаточным условием справедливости ЦПТ является условие Линдеберга: при любом τ>0
где mk - математическое ожидание ; fk(х) - плотность распределения случайной величины Хk;
Оба условия (1-27) и (1-28) выражают одно и то же требование равноправия случайных величин в сумме. Например, если в сумме существенно выделяется Х3, то, очевидно, что
Если все Xk малые, то в числителе этого выражения стоят слагаемые с разными знаками и малые, в знаменателе - сумма положительных малых величин и при n→∞ отношение стремится к нулю.
Пример 1-4. Проиллюстрируем справедливость ЦПТ. Покажем, что сумма независимых случайных величин, распределенных по равномерному закону, стремится к нормально распределенной случайной величине [Л. 24]. Пусть случайные величины все распределены одинаково:
Обозначим через fyn(y) плотность вероятностей для величины Yn=Х1 + Х2 + ... + Хn. Тогда, используя теорему о композиции независимых случайных величин, получим:
С помощью этих формул нетрудно установить, что
Графики функций fy1(y), fy2(у), fy3(у), fy4(у) показаны на рис. 1-2. Кривая, представленная на рис. 1-2, в, состоит из трех парабол второго порядка и достаточно близка к нормальной. Кривая рис. 1-2, г практически уже не отличается от гауссовой. Таким образом, уже при четырех слагаемых закон распределения практически совпадает с нормальным. Обычно считают, что при сумме независимых случайных величин, содержащей более 10 слагаемых, наступает нормальный закон.
Центральная предельная теорема существенно упрощает расчет характеристик случайных величин. Рассмотрим несколько случаев.
Пусть имеется n случайных величин X1, Х2, ..., Хn с математическими ожиданиями m1, m2, ..., mnи дисперсиями D1, D2, ..., Dn, выполняются условия ЦПТ и величина Yn=∑Xi считается распределенной по нормальному закону. Тогда вероятность Y попасть в интервал [α,β] можно определить с помощью таблиц нормальной функции распределения (см. приложение 1)
по формуле
где
В этом случае не требуется знать закон распределения каждого слагаемого, достаточно знать их математические ожидания и дисперсии.
Рис. 1-2. Нормализация случайных величин при сложении
Иногда формулу (1-29) удобнее записать относительно нормированной случайной величины