М.А. МАТАЛЫЦКИЙ
ЭЛЕМЕНТЫ ТЕОРИИ СЛУЧАЙНЫХ ПРОЦЕССОВ Учебное пособие для студентов математических специальностей учрежде...
13 downloads
172 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
М.А. МАТАЛЫЦКИЙ
ЭЛЕМЕНТЫ ТЕОРИИ СЛУЧАЙНЫХ ПРОЦЕССОВ Учебное пособие для студентов математических специальностей учреждений, обеспечивающих получение высшего образования Допущено Министерством образования Республики Беларусь
Учреждение образования «Гродненский государственный университет имени Янки Купалы» 2004
УДК 519.2 ББК 22.171 М33 Рецензенты: кафедра теории вероятностей и математической статистики Белорусского государственного университета, заведующий кафедрой, профессор, доктор физико-математических наук Н.Н. Труш, заведующий кафедрой математического анализа Гомельского государственного университета имени Ф. Скорины, профессор, доктор физико-математических наук Ю.В. Малинковский.
Маталыцкий М.А. Элементы теории случайных процессов: Учеб. пособие / М33 М.А.Маталыцкий. – Гродно: ГрГУ, 2004. – 326 с. ISBN 985-417-471-9 В учебном пособии приведены теоретические сведения о марковских случайных процессах и цепях Маркова с дискретным и непрерывным временем, процессах с конечными моментами второго порядка (корреляционная теория), процессах с независимыми приращениями, стационарных и эргодических случайных процессах, стохастических интегралах и стохастических дифференциальных уравнениях. Рассмотрены вопросы применения случайных процессов при анализе математических моделей различных реальных объектов. Приведены решения более 100 различных типовых примеров. Для студентов математических специальностей вузов, а также научных и инженерных работников, которые интересуются теорией случайных процессов и ее применениями. УДК 519.2 ББК 22.171
ISBN 985-417-471-9
© М.А. Маталыцкий, 2004
Посвящается 30-ю кафедры теории вероятностей и математической статистики Белгосуниверситета и 60-ю математического факультета Гродненского госуниверситета
ПРЕДИСЛОВИЕ
За последние десятилетия значительно увеличился объем преподавания дисциплин, использующих вероятностные и статистические методы, в высших учебных заведениях. В университетах для студентов математических специальностей, таких, как «математика», «прикладная математика», «экономическая кибернетика», «актуарная математика», «математическая экономика», «компьютерная математика», читается годовой или полуторагодовой курс теории вероятностей и математической статистики. Курс состоит из трех основных разделов: элементы теории вероятностей, элементы теории случайных процессов и элементы математической статистики. По первому и третьему разделу издано достаточно большое число учебных пособий и сборников задач, в то время как по второму разделу имеется значительный пробел в этом направлении. Предлагаемое учебное пособие позволяет сократить этот пробел. Оно подготовлено на базе курса лекций и методических разработок по университетскому курсу теории вероятностей и случайных процессов, читаемому автором для студентов математических специальностей. Учебное пособие рассчитано на лиц, усвоивших раздел теории вероятностей и приступивших к изучению теории случайных процессов. Для облегчения такого изучения вначале в нем излагаются основные понятия и методы современной теории вероятностей, снабженные большим числом примеров. Автор надеется, что пособие будет полезно для студентов, магистрантов и аспирантов университетов, а также для различных специалистов, желающих познакомиться с основными методами и результатами теории в достаточно строгом, но не самом общем и исчерпывающем, изложении. На простых моделях изучаются наиболее характерные свойства различных типов случайных процессов. Рассматриваются теоретико-вероятностные задачи, представляющие интерес для приложений. Автор выражает благодарность рецензентам, сделавшим ряд полезных замечаний. 3
ВВЕДЕНИЕ При изучении различных явлений действительности мы сталкиваемся с процессами, предсказать развитие которых заранее не можем. Случайные процессы –удобная математическая модель функций времени, значениями которых являются случайные величины. Например: число запросов, поступающих в единицу времени на центральный сервер информационно-компьютерной сети, являясь случайной величиной, зависит от времени суток; расход электроэнергии в единицу времени также является функцией времени со случайными значениями; координата отдельной молекулы в газе, заключенном в сосуд, меняется со временем и принимает случайные значения. Таким образом, можно сказать, что случайный процесс – это семейство случайных величин, зависящих от времени. Теория случайных процессов, возникшая в результате построения математических моделей реальных физических процессов, представляет собой наиболее содержательную и более всего используемую в приложениях часть теории вероятностей. Она находит многочисленные применения в физике, технике, экономике, биологии, медицине и других дисциплинах, а также в различных разделах математики. Приведем некоторые исторические замечания. Первое математическое описание случайного процесса, называемого в настоящее время винеровским, или процессом броуновского движения, дал Л.Башелье в докладе, представленном им Парижской академии в 1900 г. [9]. Он предложил использовать этот процесс в качестве модели колебаний цены активов, стремился получить аналитические выражения для стоимости различных типов опционов и сравнить их с наблюдаемыми рыночными ценами опционов. Опцион является примером финансовой производной и дает его владельцу право купить указанное число долей акций по определенной цене в указанную дату или до нее. Вообще понятие случайного процесса принадлежит XX веку и связано с именами А.Н.Колмогорова, А.Я.Хинчина, Е.Е.Слуцкого, Н.Винера. То, что теория случайных процессов принадлежит к категории наиболее быстро 4
развивающихся математических дисциплин, в значительной мере определяется ее глубокими связями с практикой [3]. В 1905 г. двумя известными физиками, М.Смолуховским и А.Эйнштейном, была разработана теория броуновского движения, исходящая из теоретико-вероятностных предпосылок. Она привела математику к порогу создания теории случайных процессов. В исследованиях датского ученого А.К.Эрланга была начата новая важная область поисков, связанных с изучением загрузки телефонных сетей. Эти работы оказали значительное влияние не только на решение чисто телефонных задач, но и на формирование элементов теории случайных процессов, в частности, процессов гибели и размножения. Такие процессы позднее применялись при исследовании динамики биологических популяций, именно от задач биологии и пошло наименование этого частного типа случайных процессов. Изучение явления диффузии средствами теории вероятностей было предпринято в 1914 г. известными физиками – М.Планком и А.Фоккером. Н.Винер, основатель кибернетики, в середине 20-х годов при изучении броуновского движения ввел в рассмотрение процессы, названные винеровскими. Следует также отметить работы русского математика, профессора МГУ А.А.Маркова по изучению цепных зависимостей (цепи Маркова) и работы Е.Е.Слуцкого по теории случайных функций. В 1931 г. была опубликована известная большая статья А.Н.Колмогорова «Об аналитических методах в теории вероятностей», в которой были заложены основы теории марковских процессов: в ней получены прямые и обратные дифференциальные уравнения, которые управляют вероятностями перехода случайных процессов без последействия. В этой же работе был дан набросок теории скачкообразных процессов без последействия, подробное развитие которой позднее (1936 г.) было дано В.Фелером, получившим интегро-дифференциальное уравнение для скачкообразных марковских процессов. В 1934 г. в работе А.Я.Хинчина осуществлено построение основ стационарных случайных процессов на базе физических задач. Он ввел понятие стационарного процесса в узком и широком смыслах. Вышеупомянутые работы следует считать нача5
лом построения общей теории случайных процессов, они послужили основой для последующих исследований Г.Крамера, Г.Вальда, А.Н.Колмогорова и многих других известных ученых. Более подробно история развития теории случайных процессов изложена в [3]. Охарактеризуем ряд основных задач теории случайных процессов, большинство из которых рассматривается в данном учебном пособии. 1. Одной из основных задач является построение математической модели, допускающее строгое или формальное определение случайного процесса, и исследование общих свойств этой модели. 2. Важной задачей является классификация случайных процессов. Существующая классификация в теории случайных процессов заключается в выделении из всей совокупности таких процессов некоторых классов, допускающих более или менее конструктивное описание [2]. Каждый класс характеризуется тем, что достаточно дополнительно задать лишь конечное число функциональных характеристик, чтобы выделить из всего класса отдельный случайный процесс. Иногда рассматривают классы процессов, допускающих единообразное решение определенного набора задач. Можно отметить следующие широкие классы процессов: а) марковские процессы, включая, естественно, цепи Маркова, б) процессы с конечными моментами второго порядка (гильбертовы процессы), в) процессы с независимыми приращениями, г) стационарные в узком и широком смыслах случайные процессы, в частности, гауссовский и винеровский процессы; д) эргодические процессы. 3. Задача отыскания для различных классов случайных процессов аналитического аппарата, дающего возможность находить вероятность характеристики процессов, тесно связана с предыдущей. Для простейших вероятностных характеристик такой аппарат создан и использует, как правило, теорию обыкновенных дифференциальных уравнений и уравнений с частными производными, а также интегро-дифференциальные и интегральные уравнения, разностные уравнения, преобразования Фурье. 6
4. Изучение различных преобразований случайных процессов также является важной задачей теории случайных процессов. Эти преобразования используются для того, чтобы с их помощью изучать сложные процессы путем сведения их к более простым. К такой задаче можно отнести и анализ стохастических дифференциальных и интегральных уравнений, в которые входят случайные процессы. 5. Задача определения значений некоторого функционала от процесса по значениям других функционалов от этого же процесса играет также важную роль в формировании ряда разделов теории случайных процессов. Примером такой задачи является задача предсказания, позволяющая определить значение процесса в некоторые будущие моменты времени, наблюдая процесс в течение определенного промежутка времени. Опишем кратко некоторые основные области применения различных классов случайных процессов в настоящее время. Марковские процессы широко используются при разработке математических моделей информационно-компьютерных систем и сетей, в математической, в частности, финансовой экономике, в математической биологии, в теории каскадов космических частиц. В этой же теории применяются процессы с независимыми приращениями. Стационарные в узком и широком смыслах случайные процессы имеют широкое применение в радиоэлектронике и теории информации, а гауссовские процессы – также в радиоэлектронике и молекулярной теории газов. Вообще в последнее время методы теории случайных процессов находят все новые области применения, и сейчас ни одна из естественных наук и многие гуманитарные науки не избежали влияния этой теории.
7
ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ §1. СЛУЧАЙНЫЕ СОБЫТИЯ. КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ
Определение. Возможные события, порождаемые комплексом условий, называются элементарными, если: а) они различны (т.е. осуществление одного означает неосуществление любого другого); б) после выполнения комплекса условия обязательно происходит одно из них. Обозначим через Ω = {ω 1 , ω 2 , ..., ω n , ...} пространство элементарных событий. Определение. Любое объединение элементарных событий называется случайным событием, B ⊆ Ω . Событие B осуществляется тогда, когда происходит одно из элементарных событий ω ∈ B . В этом смысле пространство Ω может рассматриваться тоже как событие. Т.к. одно из элементарных событий происходит всегда, то и событие Ω происходит всегда, поэтому оно является достоверным событием. Событие, не содержащее ни одного элементарного события, является невозможным и обозначается ∅ . Таким образом, мы пришли к описанию случайных событий как множеств, получающихся объединением элементарных событий. В связи с этим для определения соотношений между случайными событиями в теории вероятностей принят язык теории множеств, который приобретает своеобразную вероятностную трактовку. Поясним некоторые из них при помощи таблицы 1.
8
Таблица 1 Язык теории множеств A= B!C
Соотношения между событиями на языке теории множеств Событие A (объединение событий B и C ) происходит тогда и только тогда, когда происходит хотя бы одно из событий B и C .
A = B"C
Событие A (пересечение событий B и C ) происходит тогда и только тогда,
B"C = ∅
События B и C являются несовместными. Если событие C происходит, то
когда происходят и событие B , и событие C .
событие B не происходит.
C⊆B A = Ω \ B,
(A = B )
Событие C влечет за собой событие B . Событие A является дополнительным (противоположным) по отношению к событию B . Событие A происходит тогда и только тогда, когда не происходит событие B .
1. A ! B = B ! A, A " B = B " A . Эти равенства следуют из определений. 2. A ! B = A " B . Доказательство следует из следующей цепочки импликаций:
ω ∈ A ! B ⇒ ω ∉ A ! B ⇒ ω ∉ A, ω ∉ B ⇒ ω ∈ A, ω ∈ B ⇒ ω ∈ A " B и наоборот
ω ∈ A " B ⇒ ω ∉ A, ω ∉ B ⇒ ω ∉ A ! B ⇒ ω ∈ A ! B . 3. A " B = A ! B . 4. A ⊂ B ⇒ B ⊂ A . Это следует из того, что если ω ∈ B , то
ω ∉ B , поэтому ω ∉ A и, значит, ω ∈ A . Из соотношений 2 – 4 следует, что если задана некоторая конструкция из событий, ее дополнение можно выразить, заменив в ней все события на противоположные, символы объединения, пересечения и включения – на символы пересечения, объединения и обратный к включению соответственно. Это свойство известно под
(
)
названием закона де Моргана, например, (A ! B ) " C = A " B ! C . 9
Определение (классическое определение вероятности). Пусть пространство элементарных событий состоит из конечного числа равновозможных элементарных событий Ω = {ω 1 , ω 2 , ...., ω N } и пусть случайное событие A состоит из n элементарных событий:
{
}
A = ω j1 , ω j2 , ..., ω jn , ω ji ∈ Ω, i = 1, n . Тогда вероятностью события
A называется число n . N Данная формула называется формулой классической вероятности. Пример 1.1. Монету бросают дважды. Найти вероятность того, что хотя бы один раз монета упадёт гербом вверх. Решение. Пространством элементарных событий является P (A ) =
множество Ω = {ГГ, ГЦ, ЦГ, ЦЦ} . Здесь, например, ГЦ означает, что при первом бросании появился герб, а при втором – цифра. Таким образом N = 4 . Пусть A ={хотя бы один раз появится герб}, тогда
3 . 4 Основной проблемой при решении задач с использованием формулы классической вероятности является подсчет числа способов, которыми могло произойти то или иное событие. В связи с этим такие задачи решаются, как правило, методами комбинаторики. Часто используется следующее очевидное правило (основной A = {ГГ, ГЦ, ЦГ} ⇒ n = 3 ⇒ P (Α ) =
принцип комбинаторики): если некий выбор A можно осуществить m различными способами, а некоторый другой выбор B можно осуществить n способами, то выбор A и B ( A или B ) можно осуществить mn (m + n ) способами. При этом классическое определение вероятности можно дать другими словами. 10
Определение. Рассмотрим эксперимент, имеющий N одинаково возможных исходов (любой мыслимый результат эксперимента называется элементарным событием). Предположим, что событию
A благоприятствует n из этих исходов (оно состоит из n элементарных событий). Тогда справедлива формула классической вероятности. При решении задач часто используют размещения, перестановки и сочетания. Если дано множество Ω = {ω1 , ω 2 , ..., ω n } , то размещением (сочетанием) из n элементов по k называется любое упорядоченное (неупорядоченное) подмножество из k элементов множества Ω . При k = n размещение называется перестановкой из n элементов. Пусть, например, дано множество Ω = {ω 1 , ω 2 , ω 3 }. Размещениями из трех элементов этого множества по два являются
(ω1 , ω 2 ), (ω1 , ω 3 ), (ω 2 ,ω 3 ), (ω 2 , ω1 ), (ω 3 , ω1 ), (ω 3 ,ω 2 ) ; сочетаниями: (ω1 , ω 2 ), (ω1 , ω 3 ), (ω 2 , ω 3 ) . Два сочетания отличаются друг от друга
хотя бы одним элементом, а размещения отличаются либо самими элементами, либо порядком их следования. муле
Число сочетаний из n элементов по k вычисляется по фор-
C kn = где A kn =
A kn n! = , Pk k!(n − k )!
n! = n(n − 1)... (n − k + 1) – (n − k )!
число размещений из n элементов по k , а Pk = k! – число перестановок из k элементов. Справедливость соотношения Á kn = k!C kn следует из того, что число всех k -элементных подмножеств мно11
k жества Ω равно C n и каждое такое подмножество можно упоря-
дочить k! способами. Рассмотрим перестановки с повторениями. Пусть из элементов ω 1 , ω 2 , ..., ω i образуются конечные последовательности, содержащие n членов, в которых ω1 повторяется k1 раз, ω 2 − k 2 раза, …, ω i − k i раз, k1 + k 2 + ... + k i = n . Такие последовательности называются перестановками с повторениями. Две перестановки считаются одинаковыми, если они совпадают порядком расположения элементов и считаются различными, если у них различный порядок расположения элементов. Число различных перестановок с повторениями равно n! . k1 ! k 2 !...k i ! Пример 1.2. Какова вероятность того, что из шести отмеченPn (k1 , k 2 , ..., k i ) =
ных чисел в карточке «Спортлото» (игра 6 из 49) k чисел будут выигрышными, k = 0, 6 . Решение. В данном примере эксперимент состоит в том, что случайным образом отмечаются 6 чисел из 49 в карточке «Спортлото». Поэтому равновозможными элементарными событиями будут наборы из шести отмеченных чисел. Т.к. для определения того, произойдет или не произойдет событие A , – среди отмеченных чисел k чисел выигрышные, – порядок чисел не существен, то в качестве равновозможных элементарных событий достаточно рассматривать неупорядоченные наборы 6 чисел из 49. Следовательно, число равновозможных элементарных событий равно C 649 . Событие A состоит из наборов 6 чисел, k из которых выигрышные, а 6 − k проигрышные. Набор из k выигрышных чисел можно выбрать C 6k способами, а набор 6 − k проигрышных чисел можно 12
выбрать C 643− k способами. Тогда по основному принципу комбинаторики набор из k выигрышных и 6 − k проигрышных чисел можно выбрать C 6k C 643− k способами, следовательно, P ( Α) =
C 6k C 643− k . C 649
(
)
Например, для k = 6 имеем P (A) ≈ 14 ⋅106 . Геометрическая вероятность является расширением понятия классической вероятности на случай несчетного множества эле−1
ментарных событий. В случае, когда Ù – несчетное множество, вероятность определяется не на элементарных событиях, а на их множествах. Пусть равновозможные элементарные события ω являются точками Ù – ограниченного множества n -мерного евклидова пространства, имеющего меру Лебега ì(Ù ) . Рассмотрим систему A измеримых по Лебегу подмножеств Ù . Для любого случайного события A ∈ A его вероятностью назовем число P (A ) =
ì(A ) , ì(Ù )
где µ (A) – мера Лебега – действительная, неотрицательная, счетно-аддитивная функция множеств, т.е. такая, что а) µ (A) ≥ 0 , б) µ (∅ ) = 0 , в) A ⊆ B ⇒ ì(A) ≤ ì(B) , г) A" B = ∅ ⇒ µ (A! B) = µ (A ) + µ (B) (в частных случаях – это длина, площадь, объем). Это определение называют геометрическим определением вероятности. Пример 1.3. На одной стороне ленты магнитофонной кассеты длиной 10 м записан гимн студентов-математиков Беларуси длиной 2 м, а на другой – 14-я соната Бетховена длиной 3 м, причем 13
их местоположение неизвестно. Случайным образом с обеих сторон ленты был поврежден (стерт) участок длиной 1 м, начинающийся на расстоянии 5 м от начала ленты. Найти вероятности следующих событий: A={гимн и соната не повреждены}, B={гимн поврежден, а соната – нет}, C={соната повреждена, а гимн – нет}, D={и гимн и соната повреждены}. Решение. Из того, что положение гимна и сонаты совершенно неизвестно, делаем предположение, что любое положение начала каждого из них, при котором они вмещаются на соответствующих сторонах ленты, столь же правдоподобно, как любое другое. Пусть x – абсцисса начала записи гимна, y – сонаты. Пространство элементарных событий
Ù = {(x, y ): 0 ≤ x ≤ 10 − 2, 0 ≤ y ≤ 10 − 3} – прямоугольник с площадью µ (Ω ) = 8 × 7 = 56 м 2 . На рис. 1 разными видами штриховки отмечены области, соответствующие повреждению гимна и сонаты, буквами A, B, C , D – области, соответствующие каждому из событий A, B, C , D . Используя геометрическое определение вероятности, можно легко найти вероятности этих событий, например, P(D ) =
ì(D ) 3 ⋅ 4 3 = = . ì(Ù ) 56 14
Рис. 1.
14
До сих пор мы рассматривали случаи, когда мера множества
Ω была ограниченной и все элементарные события равновозможны. Рассмотрим теперь определение вероятности, свободное от этих ограничений. При этом в основу полагается идея определения вероятности как неотрицательной, нормированной и счетно-аддитивной функции множеств, являющихся событиями, т.е. P( Α) , где
Α ⊆ Ω. Совокупность подмножеств из Ω , на которых может быть определена вероятностная функция, должна быть построена специальным образом. События, имеющие вероятность, образуют σ -алгебру, т.е. множество ствам:
F подмножеств Ω , удовлетворяющее следующим свой-
а) Ù ∈ F ; б) Α ∈ F ⇒ Á = Ù \ Á ∈ F ; ∞
∞
. = k 1 k Простейшими примерами σ -алгебр являются: тривиальная б) Αk ∈ F, k = 1,2,... ⇒
!=1
Αk ∈F " Αk ∈ F
σ -алгебра F, состоящая из двух событий (Ω, ∅ ) , где ∅ – невозможное событие; σ -алгебра F, состоящая из всех событий. Пример 1.4. Пусть
2 1 Ù = {ù : ù ∈ [0,1]}, Á = ù : ù ∈ 0 , , = ù : ù ∈ ,1 . 3 3
Описать σ -алгебру событий F на Ù , порожденную событиями A и B . Решение. Используя определение σ -алгебры получаем, что -алгебру событий F образуют следующие события (т.к. здесь σ Á ! Â = Ù , Á " Â = ∅ ):
2
1
∅ , Ù = {ù : ù ∈ [0 ,1]}, Á = ù : ù ∈ 0 , , Â = ù : ù ∈ ,1 , 3 3 15
1 2 2 1 Á = ù : ù ∈ ,1 , Â = ù : ù ∈ 0 , , Á " Â = ù : ù ∈ , , 3 3 3 3 1 2 Á ! Â = ù : ù ∈ 0 , ! ,1 . 3 3 Аксиоматическое определение вероятности. Вероятностью , определенной на σ -алгебре событий F, называется числовая P функция P ( A), A ∈ F, удовлетворяющая следующим аксиомам: 1. ∀ Α ∈ F P (A) ≥ 0 . 2. P (Ù ) = 1.
∞ ∞ 3. Ái " Ák = ∅ , i ≠ k ⇒ P Ák = P(Ák ). k =1 k =1
!
∑
Из данного определения следует, что 0 ≤ P(A) ≤ 1, и вероятность является нормированной мерой, т.е. мерой, для которой выполняется условие нормировки 2. Определение. Совокупность (Ω, F, P ) называется вероятностным пространством. Эквивалентным аксиоме 3 является требование аддитивности для конечного множества событий Ak и следующие аксиомы непрерывности (та или иная): а) пусть случайные события B1 , B2 , ..., Bn , ... ∈ F таковы, что
Bk +1 ⊂ Bk ,
∞
"B k =1
k
= B , тогда lim P(Bn ) = P (B ); n →∞
∞
б) пусть B1 , B2 , ..., Bn , ... ∈ F и Bk ⊂ Bk +1 , ! Bk = B , тогда также k =1
lim P(B n ) = P(B ) .
n →∞
16
Можно показать, что из аксиомы 3 при выполнении вышеуказанного условия следует аксиома непрерывности б) и наоборот. Пусть, например, справедлива аксиома непрерывности б). Предположим, что Ak ∈ F , k = 1,2,..., n,... и Ak " A j = ∅, k ≠ j . Определим Bn =
n
!A
k
k =1
; ясно, что Bn ⊆ Bn +1 . Определим также
B=
∞
!
Bn =
n =1
n Ak = n =1 k =1 ∞
!!
∞
!A
k
.
k =1
Из аксиомы непрерывности б) следует, что n ∞ n P Ak = P B = lim P(Bn ) = lim P Ak = lim P (Án ) = n →∞ n →∞ k =1 k =1 n→∞ k =1
( )
!
!
∑
∞
∑ P (Á ) , n
k =1
откуда вытекает аксиома 3.
Приведем свойства вероятности: а) P(∅ ) = 0 , следует из того, что ∅ ! Ù = Ù и
( )
P (∅ ! Ù ) = P (∅ ) + P (Ù ) ;
б) P Á = 1 − P (Á) , поскольку Á ! Á = Ù и
(
)
( )
P Á ! Á = P (Á) + P Á = P (Ù ) = 1;
в) если Á ⊆ Â , то P(Á) ≤ P(B ), следует из определения меры; г) P (Á ! Â ) = P (Á) + P (Â ) − P (Á " B ) , поскольку Á ! Â = Á ! (Â \ (Á " Â )) ;
д) P (Á ! Â ) ≤ P (Á ) + P(Â ), следует из предыдущего свойства;
равенство будет, если Á " Â = ∅ .
17
§2. УСЛОВНАЯ ВЕРОЯТНОСТЬ И НЕЗАВИСИМОСТЬ СОБЫТИЙ
Определение. Пусть задано вероятностное пространство
(Ω, F , P ) и A , B ∈ F. Предположим, что P (Β ) > 0 . Условной вероятностью события A при условии, что произошло событие B , называется отношение вероятности P(Α " Β ) к P(B ) и обозначается P (A / B ) , т.е.
P (A " B ) . P (B ) Она обладает следующими свойствами: P (A / B ) =
а) если Β ⊆ Α , то P(Α/Β ) = 1 , т.к. в этом случае Α " Β = Β ; б) если Α " Β = ∅ , то P ((Α ! Β ) / C ) = P (Α/C ) + P(B / C ) , т.к.
(Á " C ) " (B " C ) = ∅, P((Á ! Â ) " C ) = P(A " C ) + P(B " C ) ; в) P (Α /Β ) = 1 − P(Α/Β ) , т.к. 1 = P(Ω/Β ) = P ((Α ! Α )/Β ) = P (Α/Β ) + P (Α /Β ) .
Пример 1.5. Бросается игральный кубик. Какова вероятность
того, что выпало число очков большее трех (событие A ), если известно, что выпала четная грань (событие B )? Решение. Событию B соответствует выпадение чисел 2, 4, 6; событию A – выпадение чисел 4, 5, 6; событию Α " Β – 4, 6. Поэтому
P (A / B ) =
P( A " B ) 2 3 2 . = : = P(B ) 6 6 3
Определение. Два события A и B называются независимыми, если P(Α " Β ) = P(Α)P(B ) .
18
Определение. Два события A1 , A2 , ..., An называются независимыми в совокупности, если для любых наборов индексов
{i1, i2, ..., im } таких, что 1 ≤ i1 < i2 < ... < im ≤ n , 2 ≤ m ≤ n , имеет место равенство
) ∏ P(Á ). k =1
(
P Ái1 " Ái2 " ... " Áim =
m
ik
Если это равенство справедливо только для случая, когда m = 2 , то события называются попарно независимыми. Пример 1.6. Бросаются две монеты. Пусть событие A состоит в выпадении герба на первой монете, событие B состоит в вы-
падении цифры на второй монете; событие C – монеты выпадут разными сторонами. В этом случае: Ω = {ГЦ, ГГ, ЦГ, ЦЦ}, A = {ГЦ, ГГ} , B = {ГЦ, ЦЦ}, C = {ГЦ, ЦГ} ,
AB = {ГЦ};
P(ΑΒ ) =
1 1 = P (Α)P(Β ) ; P (ΑC ) = = P(A)P (C ) ; 4 4
1 1 1 = P(B )P(C ) ; P (ΑΒC ) = ≠ P (Α)P(Β )P (C ) = , 4 4 8 т.е. A, B, C – попарно независимы (но независимости в совокупности здесь нет). Следует отметить, что на практике независимость событий проверяется не из определения, а исходя из условий эксперимента: можно показать, что если события связаны с независимыми экспериментами, то и сами события будут независимыми. Справедливо следующее утверждение, известное как теореP(BC ) =
ма умножения вероятностей. Пусть Ák ∈ F,
m k = 1, 2, ..., n; P Αk > 0 для всех 1 ≤ m ≤ n , тогда k =1
"
19
n −1 m n P Ák = P (Á1 ) P Ám +1 / " Ák . k =1 m =1 k =1 Пример 1.7. Абонент забыл последнюю цифру номера телефона и поэтому набирает ее наугад. Определить вероятность того, что ему придется звонить не более чем три месяца.
∏
"
Решение. Обозначим через Ai событие, заключающееся в том, что абонент звонит i -й раз и ему соответствует неудача, i = 1, 3 . Тогда имеем:
1 9 8 7 = , P (Α2 /Α1 ) = , P (Α3 /Α1 Α2 ) = . 10 10 9 8 Искомая вероятность равна P (Α1 ) = 1 −
1 − P(Α1 Α2 Α3 ) = 1 − P (Α1 )P (Α2 /Α1 )P (Α3 /Α1 Α2 ) = 0,3 . Определение. Пусть задано вероятностное пространство
(Ω, F , P ) . Совокупность событий A1 , A2 , ..., An ∈ F, называется полной группой событий, если выполнены следующие условия: n
а)
!A
k
k =1
= Ω ; б) Ai " Ak = ∅ , i ≠ k ; в) P(Ak ) > 0 , k = 1,n .
Если A1 , A2 , ..., An образуют полную группу событий, то для любого события n n B = B " Ω = B " Ak = (B " Ak ) , k =1 k =1
!
и поэтому
!
n n n P(B ) = P (B " Ak ) = P(B " Ak ) = P( Ak )P(B/Ak ) . = = 1 1 k k k =1 Формула
∑
!
P (B ) =
∑
n
∑ P(A )P(B/A ) k
k =1
20
k
называется формулой полной вероятности для случайных событий. Если P(B ) > 0 , то P (Ak " B ) = P (B )P(Ak /B ) = P (Ak )P(B/Ak ) . Отсюда следует, что
P (Ak /B ) =
P(Ak )P (B/Ak ) n
∑ P(A )P(B/A ) i
, k = 1,n ,
i
i =1
т.е. имеет место формула Байеса для случайных событий:
P (Ak /B ) =
P(Ak )P (B/Ak ) n
∑ P(A )P(B/A ) i
, k = 1,n .
i
i =1
При решении задач удобно применять следующую формулировку: если событие B ∈ F может происходить только с одним из событий A1 , A2 , ..., An , образующих полную группу событий, то при P(B ) > 0 справедливы формула полной вероятности и формула Байеса. Пример 1.8. Для контроля продукции из трех партий деталей взята на проверку одна деталь. Какова вероятность выявления бракованной продукции, если в одной партии 2/3 деталей – бракованные, а в двух других все доброкачественные.
Решение. Пусть B ={взятая деталь – бракованная}, Ak ={деталь берется из k -й партии}, k = 1, 3 . Тогда 1
2
3
3
P(Ak ) = ,k = 1, 3; P(B/A1 ) = и поэтому P (B ) =
, P(B/A2 ) = P(B/A3 ) = 0
3
2 ∑ P(A )P(B/A ) = 9 . k
k
k =1
Пример 1.9. Прибор состоит из двух узлов; работа каждого узла необходима для работы прибора в целом. Надежность (веро21
ятность безотказной работы в течение времени t ) первого узла равна p1 , второго p 2 . Прибор испытывался в течение времени t , в результате чего обнаружено, что он вышел из строя (отказал). Найти вероятность того, что отказал только первый узел, а второй исправен.
Решение. Пусть A1 ={оба узла исправны}, A2 ={первый узел отказал, а второй исправен}, A3 ={первый узел исправен, а второй отказал}, A4 ={оба узла отказали}. Эти события образуют полную группу событий. Найдем их вероятности.
P(A1 ) = p1 p 2 , P(A2 ) = (1 − p1 ) p 2 , P (A3 ) = p1 (1 − p 2 ) , P (A ) = (1 − p )(1 − p ). 4
1
2
Поскольку наблюдалось событие B = {прибор отказал}, то P(B/A1 ) = 0 , P(B/A2 ) = P(B/A3 ) = P(B/A4 ) = 1 . По формуле Байеса находим: P(A2 /B ) =
(1 − p1 )p 2 (1 − p1 )p 2 = (1 − p1 )p 2 + p1 (1 − p 2 ) + (1 − p1 )(1 − p 2 ) 1 − p1 p 2
.
§3. СХЕМА НЕЗАВИСИМЫХ ИСПЫТАНИЙ БЕРНУЛЛИ
Определение. Испытанием (экспериментом, опытом) называется последовательность из двух актов: 1) создание комплекса условий, 2) наблюдение появившегося события. Испытания называются независимыми, если наблюдаемые события являются независимыми. Определение. Независимыми испытаниями Бернулли называются такие испытания, для которых вероятности появления событий в каждом испытании одинаковы и не меняются от испытания к испытанию. Нас будет интересовать следующая задача. Пусть производятся n испытаний Бернулли. В каждом испытании возможно появления события A с вероятностью p и невозможно с вероятнос22
тью q = 1 − p . Нужно определить Pn (m) – вероятность того, что в n испытаниях событие A появляется ровно m раз. Результат n испытаний удобно описать набором букв длиной
n , который состоит из букв A и B : ω = (A A B... A B A), где буква A означает, что в испытании появилось событие A , а B – что в испытании появилось противоположное событие A . Каждый набор интересующих нас исходов содержит m букв A и n − m букв B , поэтому все такие исходы имеют одинаковую вероятность p m q n − m . Разные наборы отличаются только размещением букв A и B , поскольку число случаев, в которых появляется событие A , фиксировано. Размещение букв A и B однозначно определяется m выбором m элементов из n , что можно сделать C n способами. Поэтому
Pn (m ) = C mn p m q n − m = C mn p m (1 − p ) , m = 0, n. Эта формула называется формулой Бернулли. Очевидно, что n− m
n
∑ P ( m) = 1 . n
m =0
Пример 1.10. В течение смены, которая длится время t , эксплуатируется n ПЭВМ. Каждая ПЭВМ имеет надежность (вероятность безотказной работы) p и выходит из строя независимо от других. Найти вероятность P ( A) того, что инженер-электроник, вызванный по окончании времени t для ремонта неисправных ПЭВМ, справится со своей задачей за время τ , если на ремонт каждой неисправной ПЭВМ ему требуется время τ 0 . Решение. Событие A равносильно тому, что число вышедших из строя ПЭВМ меньше, чем l = [τ / τ 0 ] , где [τ / τ 0 ] – наибольшее целое число, которое меньше либо равно τ / τ 0 . Поэтому 23
P ( A) =
l
∑ C (1 − p )
m
m n
p n− m .
m =0
Когда число испытаний велико, для вычисления Pn (m ) можно пользоваться приближенными формулами, которые вытекают из предельной теоремы Пуассона и локальной предельной теоремы Муавра–Лапласа. В частности, имеет место предельная теорема Пуассона: если
n → ∞, p → 0 , так, что np → ë, 0 < ë < ∞ , то → Pn (m) n →∞
ëm −λ . e m!
Она выполняется потому, что если положить np = ën , то Pn (m ) =
n! p m (1 − p) n −m = m!(n − m)!
ë n(n − 1)...(n − m + 1) ën = 1 − n m! n n m
n −m
= −m
n
ëm ë ën 1 2 m − 1 = n 1 − n 1 − 1 − ...1 − 1 − . m! n n n n n Далее путем предельного перехода при n → ∞ получим утверждение теоремы. Приближенная формула, которая следует из этой теоремы, имеет вид (при больших n и малых p ) ëm −λ e , m = 0 ,n . m! Она применяется при решении задач, в основном, когда Pn (m ) ≈
ën = np ≤ 10.
24
Пример 1.11. Вероятность появления события в каждом испытании равна 0,001. Проведено 5000 испытаний. Найти вероятность, что событие в них произойдет не менее двух раз. Решение. ën = np = 5000 ⋅ 0,001 = 5 < 10. Искомая вероятность равна
P{m ≥ 2}=
n
∑ P (m ) = 1 − P (0) − P (1) = 1 − P (0) − P (1) = n
n
5000
n
5000
m=2
= 1 − e −5 − 5e −5 = 1 − 6e −5 ≈ 0,9596 .
Заметим, что в данном примере p ≈ 0 , а найденная вероятность P{m ≥ 2} ≈ 1. При n → ∞ имеет место также локальная предельная теорема Муавра–Лапласа:
Pn (m) 1 2πnp (1 − p )
где x = m
m − np np (1 − p)
e
−
xm2
→1 , n →∞
2
, − ∞ < a ≤ x m ≤ b < +∞.
Из нее при больших n вытекает следующая приближенная формула
Pn (m )
2
1 2πnp (1 − p)
x − m e 2
.
На практике ею обычно пользуются, когда ën = np > 10 . Она даёт хорошие приближения при p ≈ да n > 100 , np (1 − p ) > 20 . 25
1 и часто используется, ког2
Интегральная предельная теорема Муавра–Лапласа имеет вид: 2
b t − m − np 1 P a ≤ e 2 dt. ≤ b → n → ∞ np (1 − p) 2π a Для того чтобы показать, что она имеет место, можно восполь-
∫
зоваться предыдущей теоремой, из которой следует: ∀ ε > 0 ∃ nε , такое, что ∀ n ≥ nε
Pn (m) 1 2πnp (1 − p )
2
x − m e 2
<ε ,
т.е.
(1 − ε )
2
1 2π
e
x − m 2
1 np (1 − p )
Пусть − ∞ < a ≤ b < +∞,
< Pn (m) < (1 + ε ) *
∑
1 2π
∑
= m:a ≤
m − np
np (1− p )
2
e
x − m 2
≤b
m − np Pn (m) = P a ≤ ≤ b , ∆xm = xm +1 − xm = np (1 − p ) можно записать
1 (1 − ε ) 2π
2
*
∑e
x − m 2
1 m − np ∆xm < P a ≤ ≤ b < (1 + ε ) 2π np (1 − p )
Если n → ∞ ,то ∆x m → 0 , поэтому при n → ∞ :
26
.
np(1 − p )
, тогда, учитывая, что
*
∑
1
1 , np (1 − p ) 2
*
∑e
x − m 2
∆xm.
2
2
b t b t − − m − np 1 1 2 ( ) < + ≤ − < ≤ e dt P a b e 2 dt . (1 ε ) 1 ε np(1 − p ) 2π a 2π a Из данной теоремы вытекает приближенная формула
∫
∫
P a ≤
где Φ (x ) =
1 2π
x
∫e
−
m − np ≤ b ≈ Φ (b ) − Φ(a ) , np(1 − p )
t2 2
dt – интеграл Лапласа;
0
Φ (0) = 0 ; Φ (− x ) = −Φ (x ) ; Φ (x ) ≈ 0,5, x ≥ 5.
Таблица значений функции Φ (x ) приведена в Приложении 2. Пример 1.12. Театр, вмещающий 1000 зрителей, имеет два входа. У каждого входа имеется свой гардероб. Сколько мест должно быть в каждом из гардеробов, чтобы в среднем в 99 случаях из 100 все зрители могли раздеться в гардеробе того входа, через который они вошли? Предполагается, что зрители приходят парами и каждая пара независимо от других выбирает с вероятностью 0,5 любой из входов. Решение. Пусть число мест в каждом гардеробе равно N , для его нахождения составим уравнение. Занумеруем гардеробы номерами 1 и 2. Выбор зрителями того или иного гардероба можно рассматривать как испытание Бернулли, в каждом из которых определенная пара с вероятностью 0,5 выбирает гардероб, например, №1. По условию задачи n = 500, p = 0,5 . Пусть событие A состоит в том, что зрители разденутся в гардеробе того входа, куда они зашли, m – число пар зрителей, выбравших гардероб №1. Событие A будет происходить, если 500 −
P ( A) = 0,99 . Поэтому 27
N N ≤ m ≤ . По условию 2 2
N N 0,99 = P( A) = P 500 − ≤ m ≤ = 2 2 N 500 − − np 2 = P ≤ np (1 − p ) N N − 250 250 − 2 − Φ ≈ Φ 2 125 125
С
помощью
− np 2 ≈ np (1 − p ) N
m − np np(1 − p)
≤
N N − 250 − 250 = 2Φ 2 , т.е. Φ 2 ≈ 0,495. 125 125
таблицы
для N
Φ (2,56 ) ≈ 0,495, таким образом, 2
функции
− 250 125
Φ(x ) находим
≈ 2,56, откуда следует, что
N ≈ 556. Из интеграла предельной теоремы Муавра–Лапласа получаем m m − np P − p ≤ ε = P − ε ≤ ≤ ε = n n −ε n m − np ≤ = P ≤ p(1 − p ) np(1 − p )
t2
1 ∞ −2 → ∫−∞ e dt = 1, n→∞ p(1 − p ) 2π ε n
т.е. P m − p ≤ ε Последнее соотношение n n→ ∞ →1 ∀ε > 0. носит название закона больших чисел в форме Бернулли. Из него следует, что при большом числе испытаний частота появления события почти не отличается от вероятности этого события.
28
4. CЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ РАСПРЕДЕЛЕНИЯ
Пусть F– ó -алгебра множеств пространства Ù . Пара (Ω, F) называется измеримым пространством. Отображение î одного измеримого пространства в другое называется измеримой функцией, т.е. если ù ∈ Ù и ξ (ω ) ∈ R, то ξ (.): (Ω, F) → (R,
â ) Здесь
â – ó -алгебра множеств пространства R . Другими словами,
î(ù ) – измеримая функция, если для любого борелевского множества
 {ω:ξ (ω) ∈ Β} ⊂ F. Пусть теперь (Ω, F , P ) – вероятностное пространство, R – числовая ось, â – ó -алгебра, порожденная интервалами на числовой оси (эту ó -алгебру называют системой борелевских множеств или борелевским полем множеств). Определение. Измеримая функция î(ù ) , т.е. такая, что
∀Β∈
â {ω:ξ (ω) ∈ Β} ⊂ F называется случайной величиной (СВ).
Пример 1.13. Пусть Ù – множество студентов на факультете. Каждый отдельный студент – элемент ù ∈ Ù . Определим на элементах ù функцию î(ù ) , которая принимает значения, равные году рождения студента, который является элементом ù . Таким образом определенная функция является случайной величиной (имеется в виду, что, кроме Ù , задана вероятностная функция P (ù ) ). Пример 1.14. По промежуткам времени безотказной работы приборы делятся на несколько типов, например, первый, второй, третий. Пусть Ù(ω ) – множество значений, которые могут принимать промежутки времени безотказной работы прибора, а î(ù ) – номер типа, который присваивается прибору с промежутком безотказной работы ω . Тогда î(ù ) является СВ.
29
Определение. Действительная функция f ( x) , x ∈ R , называется борелевской, если прообраз f −1 ( Â ) = {x:f ( x) ∈ Â} любого борелевского множества B числовой прямой является борелевским множеством. Пример 1.15. Покажем, что если î(ù ) – СВ, а f (x) – борелевская функция, то η (ω ) = f (ξ (ω )) – также СВ. Пусть (Ω, F , P ) – вероятностное пространство, на котором задана î(ù ) и B – ó -алгебра борелевских множеств прямой, Β ∈ ская функция, то f
−1
â . Т.к. f (x) – борелев-
( B) = B1 ∈ â . Но η −1 ( B) = ξ −1 ( B1 ) ∈ F и,
следовательно, ç(ù ) – СВ. Определение. Пусть Â x = (− ∞, x ]. Функция
Fî ( x) = P{ù:î(ù ) ∈ Â x } = P{ù:î(ù ) ≤ x} = P{î ≤ x} называется функцией распределения (ф.р.) случайной величины î(ù ) . Теорема 1.1. (свойства ф.р.). 1) Fî (x) – монотонно неубывающая функция; 2) lim Fî ( x) = 0 , lim Fξ ( x) = 1 ; 3) Fî (x) – неx →+∞
x → −∞
прерывная справа функция. Доказательство.
1) Поскольку {ù:î(ù ) ≤ x1 } ≤ {ù:î(ù ) ≤ x 2 } для x1 ≤ x 2 , то
P {ù:î(ù ) ≤ x1 } ≤ P{ù:î(ù ) ≤ x 2 } ⇒ Fî ( x1 ) ≤ Fî ( x 2 ) . → ∅ ⇒ по аксиоме непрерывности 2) {ù:î(ù ) ≤ x} x → −∞ → Ù ⇒ по → P (∅) = 0 ; {ù:î(ù ) ≤ x} P{ù:î(ù ) ≤ x} x → +∞ x → −∞ → P (Ù ) = 1. аксиоме непрерывности P{ù:î(ù ) ≤ x} x → +∞ 3)Пусть x1 > x2 > ..., lim xk = x, {ù:î(ù ) ≤ xk }= Ák , {ù:î(ù ) ≤ x}= Á,тогда Á = k →∞
" k
30
Ák ⇒
по аксиоме непрерывности P( Á) = Fξ ( x) = lim P( Α k ) = lim Fξ ( xk ) . xk → x
xk → x
Теорема 1.2. Если функция F (x) обладает свойствами 1)–3), то существует вероятностное пространство (Ω, F , P) и СВ î(ù ) , определенная на нем, такая, что Fξ ( x) = F ( x) . Рассмотрим дискретное вероятностное пространство, в этом случае пространство элементарных событий состоит из дискретного множества элементарных событий (счетного или конечного)
Ù = {ù 1 ,ù 2 , ..., ù k , ...}. Пусть x k = ξ(ω k ), ξ(ω) ∈ {x1 , x 2 , ..., x k , ...}, Αk = {ω : ξ(ω) = x k }, k = 1, 2, ... . Случайные величины, которые могут принимать только конечное или счетное множество значений, называются дискретными. Для их описания удобно пользоваться набором вероятностей
{p1 , p 2 , ..., p k , ...}, где
p k = P ( Ak ) = P{ù:î(ù ) = x k }, который называ-
ется распределением вероятностей дискретной СВ î(ù ) . Поскольку ∞
!
k =1
Αk = Ω, Αi " Α j = ∅ , i ≠ j,
∞ ∞ то P Αk = P ( Αk ) = P (Ω ) = k =1 k =1 Совокупность
!
∑
∞
∑p
k
= 1 (условие нормировки).
k =1
x1 , x 2 ,..., x k ,... p1 , p 2 ,...,p k ,... называется дискретным законом (рядом) распределения вероятностей. Установим связь между распределением вероятностей и функцией распределения: { Fî ( x) = P{ù:î(ù ) ≤ x} = P ù:î(ù ) = x k } = {k :x ≤ x} k
!
31
=
∑ P{ù:î(ù ) = x } = { ∑ }p , k
{k:xk ≤ x}
k
k:xk ≤ x
p k = Fî ( x k ) − Fî ( x k −1 ) , если считать, что Fî ( x 0 ) = 0. В связи с тем, что свойства СВ полностью определяются свойствами их функций распределения, их принято классифицировать по характеру этих функций. I. Дискретные СВ (ф.р.). В этом случае множество значений
∑
p k ; ф.р. {k:xk ≤ x} обладает, кроме основных, следующими свойствами: 1) Fξ (x) имеет конечное или счетное множество точек разрыва первого рода, 2) если x – точка непрерывности Fξ (x) , то î(ù ): x1 , x 2 ,..., x k ,.. – счетно либо конечно, Fξ (x) =
∃
dFξ (x )
dFξ (x )
= 0. dx dx Примеры дискретных распределений CB : и
1) СВ имеет распределение Бернулли, если î(ù ) ∈ {0 ,1},
p k = P{ω:ξ (ω) = k } = p k (1 − p)1− k , k = 0 ,1, 0 < p < 1, рис. 2, 0 , x < 0 , Fξ ( x) = 1 − p, 0 ≤ x < 1, рис. 3. 1, x ≥ 1, Fξ (x) 1
1− p 0 Рис. 2
1 Рис. 3
32
x
2) СВ î(ù ) имеет биномиальное распределение, если î(ù ) ∈ {0 ,1, 2 ,...,n}
pk = P{ù:î(ù ) = k } = Cnk p k (1 − p ) n − k , k = 0,1, 2 ,..., n, 0 < p < 1, l C nk p k (1 − p ) n −k , l ≤ x < l + 1, k =0 Fξ ( x ) = 1, x ≥ n, 0 , x < 0 ,
∑
отметим, что, как следует из формулы Бернулли, число появлений события в n независимых испытаниях Бернулли имеет биномиальное распределение; 3) СВ î(ù ) имеет геометрическое распределение, если
ξ (ω ) ∈ {0, 1, 2, ...k , ...}, p k = P{ù:î(ù ) = k } = p (1 − p) k ,k = 0 ,1, 2,..., 0 < p < 1, 0 , x < 0 0 , x < 0 , = Fξ ( x) = l k l p(1 − p ) , l ≤ x < l + 1 1 − (1 − p ) , l ≤ x < l + 1; k =0
∑
4) CB î(ù ) имеет распределение Пуассона с параметром ë > 0, если î(ù ) ∈ {0 ,1, 2 ,...k,...},
p k = P{ω : ξ (ω ) = k } =
λk −λ e , k = 0, 1, 2, ..., рис. 4, k! 33
0, x < 0, рис. 5; Fξ ( x) = −λ l λ k e , l x l 1 , ≤ < + k! k =0
∑
Fξ (x)
0 Рис. 4
1
2
3
4
5
x
Рис. 5
Дадим интерпретацию некоторых из этих СВ. Предположим, что студент идет сдавать зачет. На некоторые вопросы по сдаваемому предмету он знает ответы, а на остальные – нет. Поэтому события, заключающиеся в том, что он получит зачет, являются случайными. Определим СВ следующим образом: если зачет сдан, то ξ = 1 , если нет, то ξ = 0 . Таким образом определенная СВ является бернуллиевой, параметр p в том случае соответствует относительному числу вопросов, на которые студент знает ответ. Пусть студенту необходимо сдать n зачетов и он делает по одной попытке получить каждый из этих зачетов. Определим СВ ξ как число зачетов, которые получит студент. Такая СВ будет биномиальной. Число студентов, которых успел выслушать преподаватель на зачете за фиксированный интервал времени, а также число заданий, которые выполняет ЭВМ за фиксированный промежуток времени, являются СВ, распределенными по закону Пуассона с соответственно определенными параметрами λ . Пример 1.16. Производятся последовательные испытания трех приборов на надежность. Каждый следующий прибор испытывается только в том случае, если предыдущий оказался надежным. Составить таблицу распределения и найти ф.р. случайного числа 34
испытанных приборов, если вероятность надежности каждого прибора равна q = 1 − p = 0, 9 . Решение. СВ ξ , описывающая число испытанных приборов, имеет распределение вероятностей
p (1 − p) k −1 , k = 1, 2, pk = P{ξ = k } = (1 − p ) k −1 , k = 3, поэтому таблица распределения имеет k
1
2
3
pk
0,1
0,9?0,1
(0,9)2?0,1
0, x < 1, k а ф.р. F ( x) = p , k ≤ x < k + 1, i ξ i =1 1, x ≥ 3.
∑
II. Непрерывные СВ (СВ с абсолютно непрерывными ф.р.). x
В этом случае Fξ (x) − непрерывная функция и Fξ ( x) =
∫
pξ (t )dt.
−∞
Ясно, что pξ ( x) =
dFξ ( x)
в точках существования производной. dx Функция pξ (x) называется плотностью распределения вероятностей СВ ξ (ω ). Она обладает следующими свойствами: 1) pξ ( x) ≥ 0 (как производная неубывающей функции); ∞
2)
∫
pξ ( x)dx = 1 условие нормировки (следует из свойства ф.р.
−∞
Fξ (+∞) = 1) ; 35
3) кроме того,
P{ω : x1 < ξ (ω ) ≤ x 2 }= Fξ ( x 2 ) − Fξ ( x1 ) =
x2
∫
pξ (t )dt.
x1
Рассмотрим примеры непрерывных СВ: 1) СВ ξ (ω ) имеет равномерное распределение на отрезке
[a, b] , если 0, x < a, 1 x − a , x ∈ [a, b] рис. 6, , Fξ ( x) = , a < x ≤ b, рис. 7, pξ ( x) = b − a 0, x ∉ [a, b] b − a 1, x > b;
Рис. 6
Рис. 7
2) СВ ξ (ω ) имеет показательное (экспоненциальное) распределение с параметром λ > 0, если
0, x < 0 , рис. 8, F ( x) = 0, x < 0 , рис. 9; pξ ( x) = − λx ξ − λx e , x 0 1 e , x 0 ≥ − ≥ λ
36
Рис. 8
Рис. 9
3) СВ ξ (ω ) имеет нормальное распределение с параметрами
a, σ 2 , ξ (ω ) ~ N (a, σ 2 ) , если 1
pξ ( x) = Fξ ( x) =
2 πσ 1
e
−
x
∫
2 πσ − ∞
e
Рис. 10
если
( x −a ) 2 2σ2
−
, рис. 10,
(t −a ) 2 2 σ 2 dt ,
рис. 11;
Рис. 11
4) СВ ξ (ω ) имеет распределение Коши с параметром a > 0 ,
pξ ( x) =
a x 1 , Fξ ( x) = arctg . 2 π a π(a + x ) 2
37
В частности, интервалы времени между соседними автомобилями на дорогах являются экспоненциально распределенными СВ с соответствующими параметрами λ > 0. Если ξ (ω ) – СВ, имеющая экспоненциальное распределение, то ∀ô≥ 0 P(ξ > x + τ / ξ > τ ) =
=
P(ξ > x + τ , ξ > τ ) P (ξ > x + τ ) 1 − P(ξ ≤ x + τ ) = = = 1 − P (ξ ≤ τ ) P (ξ > τ ) P (ξ > τ )
1 − 1 − e −λ ( x + τ) = e −λx = 1 − Fξ ( x) = 1 − P (ξ ≤ x) = P(ξ > x) ⇒ − λτ 1−1− e
⇒ P (ξ − τ ≤ x / ξ > τ) = P (ξ ≤ x), следовательно, см. рис. 1.12, СВ ξ − τ имеет то же экспоненциальное распределение, что и СВ ξ .
Рис. 12
Нормальное распределение является наиболее широко применяемым на практике непрерывным распределением. В частности, оно применяется при моделировании броуновского движения, которое мы рассмотрим в главах, посвященных случайным процессам. Пример 1.17. Проверим, что функция p( x) =
1 2ð
e
−
x2 2
явля-
ется плотностью распределения вероятностей. Решение. Ясно, что f ( x) > 0 . Нужно еще проверить условие нормировки. Это можно сделать несколькими способами: а) пользу1 2
∞
ясь равенством Г = π , где Г (k ) = ∫ t k −1e −t dt – гамма-функция; 0
38
∞
б) возводя интеграл
∫
f ( x)dx в квадрат и переходя в двойном ин-
−∞
теграле к полярным координатам. Рассмотрим первый способ: ∞
1 2π
∫
e
−
x2 2
dx =
−∞
1 π
∞
∫
e
−
x2 2
0
x2 2
∞ − x2 1 t 2 e −t dt = = = t = π 0 2 Второй способ дает:
∫
1
2
∞ ∞ 1 f ( x)dx = 2π −∞ −∞
∫
∞
∫ ∫
e
−
−
1 2
x2 d 2
=
1 Г 2 =1. π
x2 + y 2 2
dxdy =
−∞
1 = [x = r cos ϕ, y = r sin ϕ] = 2π
2π
∫ 0
∞
∫
dϕ e
−
r2 2
rdr = 1 ,
0
откуда следует тот же результат. Плотность p(x) называют плотностью стандартного нормального распределения, у которого
a = 0, σ = 1 .
III. СВ с сингулярными ф.р. Кроме дискретных и непрерывных СВ, существуют другие СВ. В частности, кроме величин, которые на одних интервалах являются непрерывными, а на других дискретными, существуют величины, не являющиеся ни на одном интервале ни дискретными, ни непрерывными. К таким СВ относятся, например, те, ф.р. которых непрерывные, но при этом возрастают только на множестве лебеговской меры нуль. В качестве примера можно привести величину, ф.р. которой – известная кривая 39
Кантора. Кривая («лестница») Кантора строится следующим образом (рис. 13). В итоге ф.р. Fξ (x)
Fξ ( x) =
1 1 2 , x ∈ , , 2 3 3
Fξ ( x) =
1 1 2 , x ∈ , , 4 9 9
Fξ ( x) =
3 7 8 , x ∈ , , 4 9 9
• • • и т.д. до бесконечности Рис. 13
оказывается определенной на счетном множестве интервалов, которые являются интервалами смежности некоторого нигде не плотного совершенного множества меры нуль. На этом множестве доопределим функцию Fξ (x) по непрерывности. Величина ξ с таким образом определенной ф.р. не дискретна, поскольку ее ф.р. непрерывна, но в то же время не абсолютно непрерывна, т.к. ее ф.р. не является интегралом от своей производной. Теорема Лебега. Любую ф.р. Fξ (x) однозначно можно представить в виде (разложение Лебега)
Fξ ( x) =a 1 F1 ( x) + a 2 F2 ( x) + a 3 F3 ( x), где ai ≥ 0, i = 1,3, a1 + a 2 + a 3 = 1, F1 ( x), F 2 ( x), F3 ( x) – дискретная, абсолютно непрерывная и сингулярная ф.р. соответственно. Покажем, что если P{ω : ξ (ω ) = x} = 0, то x является точкой непрерывности функции Fξ (x) . Действительно, ∀ε > 0
P{ω : x − ε ≤ ξ (ω ) ≤ x + ε }≥ Fξ ( x + ε ) − Fξ ( x − ε ) ≥ 0. 40
Отсюда имеем
[
]
P{ω : ξ (ω ) = x}= lim P{x − ε ≤ ξ (ω ) ≤ x + ε } = lim Fξ ( x + ε ) − Fξ ( x − ε ) = 0. ε →0
ε →0
Справедливо и обратное утверждение: если x – точка непрерывности функции Fξ (x) , то P{ω : ξ (ω ) = x} = 0 . Пусть ξ (ω ) – СВ с абсолютно непрерывной ф.р. Fξ (x) и плотностью распределения pξ ( x), y = f ( x) – непрерывная возрастающая функция. Тогда для CB η (ω ) = f (ξ (ω ))
{
}
Fη ( y ) = P{η ≤ y} = P{f (ξ ) ≤ y} = P ξ ≤ f −1 ( y ) = Fξ ( f
−1
( y )),
и если, кроме того, f (x) – дифференцируемая функция, то
(
pη ( y ) = pξ f −1 ( y )
) df dy( y) . −1
Если же функция f (x) – убывающая, то
Fη ( y ) = 1 − F ξ ( f
−1
( y )), pη ( y ) = − pξ ( f
−1
( y ))
df
−1
( y) . dy
Пример 1.18. Случайная величина ξ имеет показательное распределение с параметром λ . Найти плотность распределения СВ
η = ξ. Решение.
{
} {
}
2
Fη ( y ) = P ξ ≤ y = P ξ ≤ y 2 = 1 − e − λy , 2
pη ( y ) = Fη ( y ) = 2λye − λy , y ≥ 0. '
Пример 1.19. Пусть СВ ξ равномерно распределена на отрезке [0,1]. Найти ф.р. и плотности распределения СВ: а) η1 = ξ 2 , πξ б) η 2 = ξ , в) η 3 = sin 2 . 2
41
Решение.
{
} {
}
а) F ( x) = P ξ 2 ≤ x = P ξ ≤ x = x , 0 ≤ x ≤ 1 , η1 p η1 ( x) = Fη'1 ( x) =
1 2 x
, 0 < x ≤ 1;
б) Fη ( x) = P{ ξ ≤ x}= P{ξ ≤ x 2 }= x 2 , pη ( x) = Fη' ( x) = 2 x, 0 ≤ x ≤ 1; в) 2
2
2
πξ 2 πξ Fη 3 ( x) = P sin 2 ≤ x = P sin ≤ x = P ξ ≤ arcsin x ,0 ≤ x ≤ 1, π 2 2
pη3 ( x) = Fη'3 ( x) =
1
π x(1 − x)
,0 < x < 1.
Пример 1.20. Найти плотности распределения СВ: а) η1 = ξ 3 , б) η 2 = ξ , если известна плотность распределения СВ ξ . Решение. а) pη1 ( y ) = pî (3 y )(3 y )′ = б)
13 2 y pî (3 y ); 3 y
Fη 2 ( y ) = P(η 2 ≤ y ) = P ( − y ≤ î ≤ y ) =
∫
−y
y
∫
pî ( x) dx = [ pî ( x) + pî ( − x )]dx, y > 0, 0
откуда следует, что pη 2 ( y ) = pî ( y ) + pî (− y ), y > 0, согласно определению плотности. Пример 1.21. При проведении математических экспериментов на ЭВМ поведение построенной модели многократно наблюдают при различных случайных исходных условиях. Такой способ исследования называется методом статистических испытаний, или методом «Монте-Карло». При этом возникает задача получения случайных чисел, распределенных по любому какому угодно заданному закону. В ЭВМ эта задача решается при помощи функци42
онального преобразования случайных чисел, распределенных равномерно в интервале [0,1], методы получения которых хорошо разработаны. Это делается следующим образом. Пусть СВ ξ (ω) равномерно распределена на интервале [0,1]. Надо найти такое преобразование f (x) , чтобы СВ η (ω ) = f (î(ω )) имела заданную ф.р. F ( y ) . Т.к. 0 ≤ F ( y ) ≤ 1 , выберем f (x) в виде
f ( x) = F −1 ( x) . Рассмотрим СВ η (ω ) = F −1 (î(ω )) . Для нее pη ( y ) = pî ( F ( y ))
∂F ( y ) , но т.к. î(ω ) равномерно распределена на ∂y
интервале [0,1], то pî ( F ( y )) = 1 , и мы получаем pη ( y ) =
∂F ( y ) ∂y
(знак модуля здесь можно снять, т.к. F ( y ) – неубывающая функция). Таким образом, Fη ( y ) = F ( y ) , что и требовалось доказать. Модой дискретной СВ называется ее наиболее вероятное значение, модой непрерывной СВ ξ – значение аргумента x , при котором ее плотность распределения pξ (x) максимальна. Медианой СВ ξ называется значение аргумента x , при котором
Fξ ( x) = 0,5. Рассмотрим теперь многомерные СВ. Пусть на некотором вероятностном пространстве (Ω, F , P ) определены n измеримых функций СВ ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω ) . Совокупность этих функций
ξ (ω ) определяет отображение (Ω, F) → ( R n , â n ) , где R n – n -мерное действительное пространство, â
n
– система борелевских мно-
жеств на R n . Такая совокупность ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) называется многомерной СВ (или случайным вектором). 43
Функция n аргументов Fξ (x ) = Fξ1 ξ2 ... ξn (x1, x2 , ..., xn ) = P{ω : ξ1 (ω ) ≤ x1 , ξ 2 (ω ) ≤ x2 , ..., ξ n (ω ) ≤ xn } называется n -мерной ф.р. n -мерной СВ.
Пример 1.22. Пусть ξ1 (ω ) – СВ, равномерно распределенная на отрезке [0, 1], ξ 2 (ω ) = ξ12 (ω ) . Тогда ξ (ω ) = (ξ1 (ω ), ξ 2 (ω )) – двумерная СВ. Найдем ее ф.р.
{
}
Fξ1 ξ 2 (x1 , x 2 ) = P{ω : ξ 1 (ω ) ≤ x1 , ξ 2 (ω ) ≤ x 2 }= P ω : ξ1 (ω ) ≤ x1 , ξ12 (ω ) ≤ x 2 .
При
x1 < 0, x 2 < 0 это выражение равно 0, а при
x1 ≥ 0, x 2 ≥ 0
{
} { ), если min(x , x )≤ 1, если min (x , x ) > 1,
Fξ1 ξ 2 (x1 , x 2 ) = P ω : ξ1 (ω) ≤ x1 , ξ1 (ω) ≤ x 2 = P ω : ξ1 (ω) ≤ min( x1,
(
min x1 , x 2 = 1,
1
2
1
2
}
x2 ) =
Ф.р. многомерной СВ имеет следующие свойства: 1) Fξ (x ) является неубывающей по всем аргументам; 2) lim Fξ1 ... ξn (x1 , ..., xn ) = 0 ; xk →−∞
3)
lim
xk →+∞ , k =1,n
Fξ1 ...ξn (x1 , ..., xn ) = 1 ;
4) Fξ1 ...ξ n ( x1 , ..., xn ) непрерывна справа по всем аргументам; 5) условие согласованности:
lim Fξ1 ξ k −1 ξ k ξ k +1 ... ξ n (x1 , ..., x k −1 , x k , x k +1 , ..., x n ) =
x k → +∞
= Fξ1 ξ k −1 ξ k +1 ... ξ n ( x1 , ..., x k −1 , x k +1 , ..., x n ) . Ф.р. меньшей размерности, которая получается из ф.р. большей размерности, если применить для нее условие согласованности, называется маргинальной; 44
6) отметим, что, для того чтобы некоторая функция F (x1 , ..., xn ) была ф.р. n -мерной CB , недостаточно, чтобы для нее были выполнены условия 1) – 5). Необходимо также выполнение еще одного условия. Пусть ak < bk , Ak = {x : ak < x ≤ bk }, k = 1, n. Нетрудно видеть, что P{ω : ξ1 (ω) ≤ x1 , ..., ξ k −1 (ω) ≤ x k −1 , a k < ξ k (ω) ≤ bk , ξ k +1 (ω) ≤ x k +1 , ..., ξ n (ω) ≤ x n } =
= Fξ1 ... ξ n (x1 , ..., x k −1 , bk , x k +1 , ..., x n ) − Fξ1 ... ξ n (x1 , ..., x k −1 , a k , x k +1 , ..., x n ) =
{
= ∆ k Fξ1 ... ξ n (x1 , ..., x n ) ,
}
а также P ω : ξ k (ω ) ∈ Ák , k = 1, n = ∆1 ∆ 2 ... ∆ n Fξ1 ...ξ n (x1 , ..., x n ) . Отсюда ясно, что для многомерной ф.р. должно выполняться условие
∆1∆ 2 ... ∆ n Fξ1 ... ξn (x1 , ..., xn ) ≥ 0 . Это условие не следует из свойств 1) – 5). Покажем это на примере. Пример 1.23. Пусть n = 2 , 0, x1 < 0, x2 < 0, x1 + x2 < 1, Fξ1ξ2 (x1 , x2 ) = 1, в остальных случаях. Для такой функции, что легко проверить, выполняются свой 1 ства 1) – 5). Пусть Αk = ω : < ξ k (ω ) ≤ 1 , тогда 3 1 P{ω : ξ k (ω )∈ Ák , k = 1, 2} = ∆ 1 ∆ 2 Fξ1 ξ 2 (x1 , x 2 ) = ∆ 1 Fξ1 ξ 2 (x1 , 1) − Fξ1 ξ 2 x1 , = 3 1 1 1 1 = Fξ1 ξ 2 (1, 1) − Fξ1 ξ 2 , 1 − Fξ1 ξ 2 1, + Fξ1ξ 2 , = 1 − 1 − 1 + 0 = −1 3 3 3 3
Таким образом, получили, что если Fξ1 ξ2 (x1 , x2 ) – ф.р., то найденная вероятность –отрицательная. Это невозможно, значит, выполнение условий 1) – 5) является недостаточным для того, чтобы
Fξ1ξ2 (x1 , x2 ) была ф.р. 45
Так же, как и в одномерном случае, Fξ (x ) относится к дискретному типу, если каждая из СВ ξ k (ω ), k = 1, n , принимает значения из счетного или конечного множества. Дискретную СВ
ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) удобно описывать распределением вероятностей Pξ (x ) = P{ω : ξ1 (ω ) = x1 , ξ 2 (ω ) = x 2 , ..., ξ n (ω ) = x n },
∑ P (x ) = 1 , ξ
x
где x = (x1 , x2 , ..., xn ) .
Fξ (x ) относится к абсолютно непрерывному типу распределения, если ее можно представить в виде Fξ (x ) = Fξ1 ... ξn (x1 , ..., xn ) =
xn
x1
∫
dt1 ...
−∞
∫p
ξ1 ... ξ n
(t1 , ..., tn )dt n .
−∞
n , Здесь ∂ Fξ1 ... ξn (x1 , ..., xn ) = p ξ1 ... ξ n (x1 , ..., xn ) ∂x1 ... ∂xn
pξ1 ...ξ n (x1 , ..., x n ) ≥ 0,
+∞
∫
+∞
dx1 ...
−∞
∫p
ξ1 ... ξ n
(x1 , ..., x n )dx n = 1 .
−∞
Функция pξ (x ) = pξ1 ...ξn (x1 , ..., xn ) , обладающая перечисленными свойствами, называется плотностью распределения вероятностей многомерной СВ ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) (совместной плотностью вероятностей величин ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω ) . Из условия согласованности для Fξ (x ) вытекает следующее свойство для совместной плотности вероятностей +∞
∫p
ξ1 ... ξ k −1 ξ k ξ k +1 ... ξ n
(x1 , ... x k −1 , x k , x k +1 , ..., x n )dx k
−∞
= p ξ1 ... ξ k −1 ξ k +1 ... ξ n (x1 , ..., x k −1 , x k +1 , ..., x n ) . 46
=
Плотность распределения, стоящая справа, называется маргинальной по отношению к исходной. Справедлива также следующая важная формула:
P{ω : (ξ1 (ω ), ..., ξ n (ω ))∈ G} =
∫ ...∫ p
ξ1 ... ξ n
(x1 , ... x n )dx1 ... dx n ,
G
например,
{
} ∫∫ p
P ω : ξ12 (ω ) + ξ 22 (ω ) ≤ Z =
ξ1 ξ 2
(x1 , x2 )dx1dx2 .
x12 + x22 ≤ Z
Рассмотрим примеры многомерных распределений. 1. Полиномиальное распределение имеет дискретная СВ
ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) , где ξ k (ω )∈ {0, 1, 2, ..., N },
n
∑ ξ (ω ) = N , k
k =1
Pξ (x ) = Pξ1 ... ξ n (x1 , ..., x n ) = N!
n
∏ k =1
p kxk , 0 ≤ x k ≤ N , k = 1, n, xk !
0 < p k < 1, k = 1, n,
n
∑p
k
n
∑x
k
= N,
k =1
=1.
k =1
2. Многомерное нормальное распределение имеет СВ ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) , непрерывного типа, для которой p ξ (x ) = p ξ1 ... ξ n (x1 , ..., x n ) = (2π )
−
n 2
1 (xi − a i )g ij x j − a j G exp− 2 i, j =1 n
∑
(
),
где G =|| g ij ||n×n – положительно определенная матрица, G – ее определитель. Пример 1.24. Пусть (ξ (ω ), η (ω )) – двумерная СВ, имеющая нормальное распределение,
pξ η (x, y ) =
1 x − a T x − a G , G =|| g ik || 2×2 . exp− − − y b y b 2π 2 G
47
Найдем плотности распределения СВ ξ (ω ) и η (ω ) : pξ (x ) =
pξ η (x, y )dy =
1 g g (g + g 21 )2 (x − a )2 , 1 g11 − 12 21 exp − g11 − 12 2π 4 g 22 g 22 2
∫ p (x, y )dy =
1 (g + g 21 )2 ( y − b )2 . g g 1 g 22 − 12 21 exp − g 22 − 12 g11 4 g11 2π 2
∞
∫
−∞
pη (x ) =
∞
ξη
−∞
∞
Из условий нормировки
∫
pξ (x )dx =
−∞
∞
∫ p (y )dy = 1 для элеменη
−∞
тов матрицы G вытекает следующее требование:
g12 = g 21 , g 11 g 22 − g 12 g 21 = G > 0 , т.е. матрица G должна быть симметричной и положительно определенной. Пусть (Ω, F , P ) – вероятностное пространство, A, B ∈ F. Если P(Β ) > 0 , то условная вероятность события A
P( Α " Β ) P (Β ) существует и, как мы видели раньше, удовлетворяет свойствам вероятностной функции P . Если зафиксировать событие B , то эту условную вероятностную функцию событий A ∈ F можно рассматривать как элемент для построения нового вероятностного пространства (Ω, F , P ) . Ранее была определена ф.р. P (Α/Β ) =
Fξ (x ) CB ξ (ω ) = (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) , рассматриваемой на вероятностном пространстве (Ω, F , P ) . Аналогично можно определить ф.р. СВ ξ (ω ) на (Ω, F , P ) . Эта функция называется условной ф.р. СВ ξ (ω ) при условии B и обозначается Fξ (x / Β ). Ее определяют следующим образом: пусть 48
Α = {ω : ξ1 (ω ) ≤ x1 , ξ 2 (ω ) ≤ x2 , ..., ξ n (ω ) ≤ xn }, тогда (x , ..., x / Β ) = P(Α/Β ) . Когда F (x / Β ) – абсолютF (x / Β ) = F ξ
ξ1 ... ξ n
1
ξ
n
но непрерывная функция, то она имеет плотность распределения вероятностей
pξ (x / B ) =
∂ n Fξ (x / B ) , ∂x1 ... ∂xn
которая называется условной плотностью вероятностей СВ ξ (ω ) . Часто в качестве условия B используется событие, связанное с тем, что некоторая СВ ξ (ω ) приняла определенное значение. Допустим, что на (Ω, F , P ) определена многомерная СВ
η (ω ) = (η1 (ω ), η2 (ω ), ..., ηm (ω )). Пусть
{
}
Bå = {ω : y ≤ η (ω ) ≤ y + ε } = ω : y k ≤ η k (ω ) ≤ y k + ε , k = 1, m . Если существует lim Fξ (x / Bε ) = Fξ (x / y ) , то он называется усε →0
ловной ф.р. СВ ξ (ω ) при условии η (ω ) = y .
Fξ (x / y ) = lim Fξ (x / Âε ) = lim Fξ (x / y ≤ η(ω) ≤ y + ε ) = ε →0
ε →0
= lim P (ξ(ω) ≤ x / y ≤ η(ω) ≤ y + ε ) = ε →0
Fξ η (x, y + ε ) − Fξ η (x, y ) P (ξ(ω) ≤ x, y ≤ η(ω) ≤ y + ε ) = lim , ε →0 ε → 0 F (∞, y + ε ) − F (∞, y ) P( y ≤ η(ω) ≤ y + ε ) ξη ξη
= lim
где Fξ η (x, y ) – известная (n + m ) -мерная ф.р. СВ ξ (ω ) и η (ω ) . Предположим, что Fξ η (x, y ) – абсолютно непрерывная ф.р., тогда, пользуясь ее определением и правилом Лопиталя, будем иметь: 49
x y +ε
lim
ε →0
Fξ η (x, y + ε ) − Fξ η (x, y )
Fξ η (∞, y + ε ) − Fξ η (∞, y )
∫ ∫ p (t, τ )dτ dt ξη
= lim
−∞ y
ε →0
y +ε
=
∫ p (τ )dτ η
y
y +ε
∫
=
−∞
∫ p (t ,τ )dτ ξη
x
lim
ε →0
y y +ε
x
dt =
∫ p (τ )dτ
∫
−∞
η
pξ η (t , y ) dt = pη ( y )
x
∫ p (t / y )dt , ξ
−∞
y
если предел под интегралом существует, т.к. '
y +ε y +ε p (t , τ )dτ = p ' (t , τ )dτ + ( y + ε )' p (t , y + ε ) − ξη ξη ε ξη y y ε
∫
∫
− 0 ⋅ p ξ η (t , y ) ε → p ξ η (t , y ) . →0 x
В этих формулах
∫
dt означает n -мерный интеграл
−∞ xn
x1
∫
−∞
dt1 ...
∫
−∞
dt n . Таким образом, x
Fξ (x / y ) =
∫ p (t / y )dt , ξ
−∞
где pξ (x / y ) – условная плотность вероятностей, которая определяется равенством
pξ (x / y ) =
pξ η (x / y ) .
50
pη ( y )
Из условия согласованности следует: ∞
∞
−∞
−∞
p ξ (x ) = ∫ p ξ η (x; y )dy = ∫ p ξ (x / y ) p η ( y )dy ,
p ξ (x / y ) =
p ξ η (x, y ) pη ( y )
=
p ξ (x ) pη ( y / x ) .
∞
∫ p ξ (x ) p η ( y / x )dx
−∞
Формула pξ (x ) =
∞
∫ p (x / y )p (y )dy ξ
η
называется формулой
−∞
полной вероятности для плотностей распределения, а формула
pξ (x / y ) =
pξ (x ) pη ( y / x ) ∞
–
∫ p (x )p (y / x )dx ξ
η
−∞
формулой Байеса для плотностей распределения. Пример 1.25. Найдем условие плотности распределения вероятностей для СВ, рассматриваемых в предыдущем примере.
p ξ (x / y ) =
p ξ η (x, y ) pη (y )
=
g11 g 1 exp − g11 (x − a ) + 12 ( y − b ) 2π g11 2
2
,
2 q 22 g 21 1 (x − a ) . = pη (y / x ) = exp − g y−b+ 22 2π 2 p η (x ) g 22 Рассмотрим вопросы, связанные с независимостью и функ-
p ξ η (x, y )
циональными преобразованиями СВ. Пусть ξ k (ω ), k = 1, n, – СВ, определенные на вероятностном пространстве (Ω, F , P )
Αk = {ω : ξ k (ω)∈ Βk }, где Bk – борелевское множество. 51
Определение. СВ ξ k (ω ), k = 1, n, называются независимыми в совокупности, если, как бы ни выбирались борелевские множества Bk , k = 1, n, случайные события Ak , k = 1, n, являются независимыми в совокупности, т.е. m m P " Α ji = ∏ P ( Α ji ) ∀ m ≤ n, 1 ≤ j1 < j 2 < ... < j m ≤ n. i =1 i =1 Определение. СВ ξ k (ω), k = 1, n, называется независимыми
парами, если ∀ 1 ≤ i < k ≤ n и для любых борелевских множеств Bi и Bk события Ai и Ak являются независимыми, т.е.
( )
P (Αi " Αk ) = P Αi P(Αk ). Ясно, что СВ, независимые в совокупности, являются и независимыми парами. Теорема 1.3. Пусть ξ k (ω ), k = 1, n, – независимые в совокупности СВ, а f k (x ), k = 1, n, – борелевские функции. Тогда СВ η k (ω) = f k (ξ k (ω)), k = 1, n, также независимы в совокупности. Доказательство. Пусть Β j1 , B j2 ,..., Β jm – борелевские множества ∀ m ≤ n и 1 ≤ j1 < j 2 < ... < j m ≤ n. Тогда
{
(
} {
)
( ) (ξ (ω))∈ Β }.
}
P ω:f jk ξ jk (ω) ∈ Β jk , k = 1,m = P ω:ξ jk (ω)∈ f j−k 1 Β jk , k = 1, m = m
{
( )}
m
{
= ∏ P ω:ξ jk (ω)∈ f j−k1 Β jk = ∏ P ω : f jk k =1
k =1
jk
jk
Приведем два критерия независимости СВ в совокупности. Теорема 1.4. Для того чтобы СВ ξ k (ω ), k = 1, n, были независимыми в совокупности, необходимо и достаточно, чтобы
∀ x k , k = 1, n, Fξ1...ξ n (x1,..., xn ) =
52
n
∏ F (x ). k =1
ξk
k
Если Fξ1...ξ n (x1, ..., xn ) – абсолютно непрерывная функция, то имеет место следующее утверждение. Теорема 1.5. Для того чтобы СВ ξ k (ω ), k = 1, n, были независимыми в совокупности, необходимо и достаточно, чтобы
pξ1...ξ n (x1, ..., xn ) =
n
∏ p (x ). k =1
ξk
k
Доказательство следует из предыдущей теоремы и определения абсолютно непрерывной ф.р. Докажем, например, необходимость x1
Fξ1...ξ n (x1, ..., xn ) =
∫
xn
dt1... pξ1...ξ n (t1 , ...,tn )dt n =
∫
−∞
=
n
−∞
xk
∏ ∫ p (t )dt k =1 − ∞
ξk
k
xn
x1 k
=
∫
dt1...
−∞
n
∏ F (x ) = k =1
ξk
k
n
∫ ∏ p (t )dt .
− ∞ k =1
ξk
k
k
Поскольку это выполняется ∀x1 , x2 , ..., xn , то отсюда следует, что pξ1...ξ n (t1, ..., tn ) =
n
∏ p (t ). k =1
ξk
k
Отметим, что из приведенных выше теорем следует, что если
ξ (ω ) и η(ω ) – независимых СВ, то Fξ (x/y ) = Fξ (x ), p ξ (x/y ) = p ξ (x ), т.е. условная ф.р. и плотность распределения совпадают с безусловными. Пример 1.26. Из примеров 1.24 и 1.25 следует, что, для того, чтобы нормально распределенные СВ ξ (ω ) и η(ω) были независимыми, необходимо и достаточно, чтобы диагональные элементы матрицы G были равны нулю, т.е. q12 = q 21 = 0. Приведем аналогичное утверждение для дискретных СВ.
53
Теорема 1.6. Пусть ξ1 (ω ), ξ 2 (ω), ..., ξ n (ω) − СВ, каждая из которых может принимать не более, чем счетное число значений. Они являются независимыми тогда и только тогда, когда
∀ x1 , x 2 , ..., x n P{ω:ξ1 (ω ) = x1, ξ 2 (ω) = x2 , ..., ξ n (ω) = xn } =
n
∏ P{ω:ξ (ω) = x }. k
k
k =1
Доказательство основано на следующих соотношениях. Пусть B1 , ..., Bn – произвольные борелевские множества на прямой, тогда P{ω:ξ 1 (ω )∈ Β1 , ..., ξ n (ω)∈ Β n } = P ω:
! {ξ (ω) = x }, ..., ! {ξ (ω) = x }, 1
1
j1
n
n
jn
объединение здесь берется по всем элементам множеств
B1 , ..., Bn положительной вероятности. Значит, P{ù : 1 (îù )∈ Â1 , ..., în (ù )Â n }=
∑∑ ...∑ P{ù j1
=
∑∑ ...∑ P{ù j1
=
j2
jn
j2
jn
}
1
{
}
(ù ) = x j1 ⋅... ⋅P ù : nî(ù ) = x jn = : 1î
∑ P{ù:î (ù ) = x }⋅ ... ⋅ ∑ P{ù j1
}
: 1 (îù ) = x j1 , ..., în (ù ) = x jn =
j1
jn
}
: n î(ù ) = x jn =
= P{ù : 1 (îù )∈ Â1 , ..., în (ù )∈ Â n }. Пример 1.27. Пусть (Ω, F , P ) – вероятностное пространство, причем Ω состоит ровно из n точек, каждая из которых имеет положительную вероятность. Покажем, что на этом вероятностном пространстве не существует двух независимых СВ, каждая из которых принимает n различных значений. Возьмем произвольное из n элементарных событий ω1 . Пусть ξ и η – произвольные СВ, определенные на этом вероятностном пространстве и принимающие n различных значений каждая. Положим ξ (ω 1 ) = a, η(ω 1 ) = b. Тогда P (ξ = a ) = P({ω1}) = P (η = b ), по-
54
скольку не существует других элементарных событий, на которых СВ ξ принимала бы значение a или СВ η принимала бы значение b . Следовательно,
P (ξ = a, η = b ) = P ({ω1 }), P (ξ = a )P (η = b ) = P 2 ({ω1 }), и т.к. P ({ω}) ≠ P 2 ({ω}), то СВ ξ и η – зависимы. Определение. Пусть â n – система борелевских множеств в
R n , â – система борелевских множеств на прямой R . Функция n аргументов f (x )∈ R, x = (x1 , ..., x n )∈ R n , называется борелевской −1 (измеримой по Борелю), если f (Β ) = {x:f (x )∈ Β}∈ â
∀ B∈ â, т.е. прообраз борелевского множества из R является борелевским n
множеством в R n . Теорема 1.7 (о суперпозиции измеримых функций). Пусть
ξ (ω ) − n -мерная СВ, определенная на вероятностном простран-
стве (Ω, F , P ) , f (x ) – борелевская функция на R n . Тогда
η (ω) = f (ξ (ω )) = f (ξ 1 (ω), ..., ξ n (ω)) также является СВ на (Ω, F , P ) . Доказательство. Пусть Т.к. Β∈ â .
{ω:f (ξ (ω))∈ Β} = {ω:ξ (ω)∈ f −1 (B )} и
f −1 (Β ) – борелевское множе-
ство из R n , то
{ω : ξ (ω)∈ f
(B )}= ξ −1 ( f −1 (B ))∈ F , т.е. {ω : η(ω )∈ Β}∈ F, что и нужно было доказать. −1
Рассмотрим следующую задачу. Пусть f k (x1, x2 , ..., xn ), k = 1, m – борелевские функции на R n . Определим СВ
η k (ω) = f k (ξ1 (ω), ξ 2 (ω ), ..., ξ n (ω )), k = 1, m. 55
Если ξ (ω ) = (ξ 1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) − n -мерная СВ, то η(ω) = (η1 (ω ), η 2 (ω), ..., η m (ω )) будет m -мерной СВ. Пусть Fξ (x ) и Fη ( y ) − ф.р. соответственно СВ ξ (ω ) и η(ω) . Нужно выразить Fη ( y ) через Fξ (x ) и систему функций f k (x ), k = 1, m. Допустим, что ф.р. Fξ (x ) – абсолютно непрерывная. Рассмотрим следующие случаи: 1) пусть m = n и все функции f k (x ), k = 1, n, являются дифференцируемыми и функционально независимыми, для последнего достаточно, чтобы det Α = det ||a ik || = det
∂f i (x ) ≠ 0 ∀ x. ∂x k
В данном случае будем иметь:
{
}
Fη (y ) = P{η1 ≤ y1 , ..., ηn ≤ y n } = P f k (ξ 1 , ..., ξ n ) ≤ y k , k = 1, n =
∫
= dx1 . . .
{f
k
∫ p (x , ..., x )dx ξ
1
( x1, ..., xn )≤ yk ,k =1, n }
n
n
.
Cделаем замену переменных f k (x1 , ..., x n ) = z k , k = 1, n, тогда x k = q k (z1 , ..., z n ), f k [q1 (z1 , ..., z n ), ..., q n (z1 , ..., z n )] =
= z k , q( f 1 (x1 , ..., x n ), ..., f k (x1 , ..., x n )) = x k , k = 1, n, и поэтому Fη ( y ) = dq1 (z1 , ..., z n )... p ξ (q1 (z1 , ..., z n ), ..., q n (z1 , ..., z n ))dq n (z1 , ..., z n ) =
∫
{z
y1
=
∫
k ≤ y k ,k =1,n
}
∫
yn
dz1 ... p ξ (q1 (z1 , ...,z n ), ..., q n (z1 , ...,z n ))
−∞
∫
−∞
∂ (q1 , ..., q n ) dz n , ∂ (z1 , ..., z n )
где ∂ (q1, ..., qn ) – якобиан невырожденного преобразования ∂ (z1, ..., zn )
x k = q k (z1 , ..., z n ), k = 1, n, т.е. определителем ( n × n ) – матрицы G 56
с элементами q ik =
∂q i (z1 , ..., z n ) . Таким образом, Fη ( y ) также абсо∂z k
лютно непрерывная ф.р., и плотность распределения СВ η(ω) равна
∂ (q1 , ..., q n ) . ∂ ( y1 , ..., y n ) Данное выражение можно записать в более краткой форме:
p η ( y1 , ..., y n ) = p ξ (q1 ( y1 , ..., y n ), ..., q n (y1 , ..., y n ))
) ∂f∂(y()y ) .
(
pη ( y ) = pξ f −1 ( y )
−1
где f ( y ) = ( f1 ( y ), ..., f n ( y )) = ( f 1 ( y1 , ..., y n ), ..., f n ( y1 , ..., y n )) ;
∂fi (x ) = m ∀x . В этом случае ∂xk систему функций f k (x ), k = 1, m, можно дополнить (n − m ) функциями f m + j (x ),1 ≤ j ≤ n − m, так, чтобы они были непрерывно дифференцируемы и все вместе функционально независимыми. Новая система функций определит n -мерную СВ η (ω) . Тогда из условия согласованности и предыдущего случая будем иметь: 2) пусть теперь m < n и rang
p ç ( y1 , ..., y m ) =
∞
∫
∞
dy m +1 ... p ç ( y1 , ..., y n )dy n =
∫
−∞
−∞
∂ (q1 , ..., q n ) dy n . ∂ ( ) , ..., y y 1 n −∞ −∞ Пример 1.28. Пусть у нас есть двумерная СВ ξ (ω ) = (ξ1 (ω ), ξ 2 (ω)). Образуем СВ η(ω) = ξ1 (ω) + ξ 2 (ω ) и найдем ее плотность распределения. В данном случае n = 2 , m = 1 , f1 (x1, x2 ) = x1 + x2 = y1 . Т.к. m < n , n − m = 1 , то нужно ввести еще ∞
=
∫
∞
dy m +1... p î (q1 ( y1 , ..., y n ), ..., q n ( y1 , ..., y n ))
∫
одну функцию, выберем f 2 (x1, x2 ) = x2 = y2 . Тогда обратное преобразование определяется функциями 57
x1 = q1 ( y1, y2 ) = y1 − y2 , x2 = q2 ( y1, y2 ) = y2. Поэтому ∞ ∂(q1, q2 ) 1 − 1 = = 1 и pη ( y ) = pξ (y − y2 , y2 )dy2. ∂( y1, y2 ) 0 1 −∞
∫
Если ξ1 (ω) и ξ 2 (ω ) – независимые СВ, то
pη ( y ) =
∞
∫ p (y − y )p (y )dy . 2
ξ1
2
ξ2
2
−∞
Эта формула известна в литературе как свертка для плотностей распределения вероятностей и обозначается p η = pξ1 ∗ pξ 2 . Пример 1.29. Пусть СВ ξ1 (ω ), ξ 2 (ω ) независимы и имеют стандартные гамма–распределения с параметрами p1 и p 2 соответственно: pξ i (x ) = Γ −1 ( pi )x pi −1e − x , x ≥ 0 , i = 1, 2,
где Г ( p ) =
+∞
∫x
p −1 − x
e dx – гамма-функция. Покажем, что СВ
0
η(ω ) = ξ1 (ω ) + ξ 2 (ω ) имеет гамма–распределение с параметром p1 + p2 . Согласно формуле для плотности суммы независимых СВ имеем
pη ( y ) = Γ
y
−1
( p1 )Γ ( p2 )∫ (y − y2 )p −1 e− ( y − y −1
1
2
)
y2
p 2 −1 − y 2
e
0
= Γ −1 ( p1 )Γ −1 ( p2 )e − y
y
∫ (y − y ) 2
0
58
p1 −1
y2
p 2 −1
dy2 .
dy2 =
Верхний предел в интеграле равен у, поскольку в данном соотношении должно быть y − y 2 > 0 . Сделав замену переменной y = y 2 u , получим
pη ( y ) = Γ
−1
( p1 )Γ ( p2 )y −1
p1 + p 2 −1 − y
e
1
∫ u (1 − u )
p1 −1
p 2 −1
du.
0
∞
Т.к. должно выполняться условие нормировки
∫ p (y )dy = 1, то веξ
0
1
p −1 −1 −1 личина c = Γ ( p1 )Γ ( p2 ) u 2 (1 − u ) 1 du должна быть равна
∫
p −1
0
Γ −1 ( p1 + p2 ). Отметим также попутно доказанное равенство 1
∫ u (1 − u )
p1 −1
p 2 −1
du =
0
Γ ( p1 )Γ ( p2 ) . Γ ( p1 + p2 )
Пример 1.30. Пусть ξ 1 (ω ), ξ 2 (ω ), ..., ξ n (ω ) – независимые СВ, имеющие экспоненциальное распределение с параметром λ , т.е.
λe − λx , x ≥ 0, pξ i (x ) = 0 , x < 0. Найдем распределение СВ ηn (ω ) = ξ1 (ω ) + ξ 2 (ω ) + ... + ξ n (ω ). Пусть n = 2 . Имеем y
pη2 (y ) = λe
∫
− λ(y − y2 )
y
λe
− λy 2
2 − λy
dy2 = λ e
0
∫ dy
2
= λ 2 ye − λy , y ≥ 0.
0
Предположим, что для некоторого n ≥ 1 справедлива формула
p ηn ( y ) = λ
(λy )n −1 e − λy , y ≥ 0. (n − 1)! 59
Докажем, что она справедлива также и для n + 1 . По той же формуле для плотности суммы двух независимых СВ
ηn +1 (ω) = ηn (ω) + ξ n +1 (ω) получаем
[λ(y − y2 )]n −1 − λ( y − y ∫0 (n − 1)! e y
pηn+1 ( y ) = λ
)
2
λ n +1 − λy ( y − y2 )n −1 dy2 = λ (λy ) e − λy , y ≥ 0. e (n − 1)! 0 n! y
λe − λy 2 dy2 =
n
∫
Распределение с плотностью p ηn ( y ) называется распределением Эрланга n -го порядка. Если СВ ξ1 (ω) , ξ 2 (ω) независимы и дискретны, то формула для распределения вероятностей их суммы η(ω) = ξ1 (ω) + ξ 2 (ω) имеет вид Pη ( y ) = P{ω:ξ1 (ω) + ξ 2 (ω) = y}= =
∑ P{ω:ξ (ω) = y }P{ω:ξ
{y1,y 2:y1 + y2 = y }
1
1
=
∑P
ξ1
{y2 }
∑ P{ω:ξ (ω) = y , ξ
{y1, y2 : y1 + y2 = y }
= y 2 }=
2 (ω)
1
1
∑P
ξ1
2 (ω)
= y 2 }=
( y1 ) Pξ 2 ( y 2 ) =
{y1,y2:y1 + y 2 = y}
( y − y 2 ) Pξ 2 ( y 2 ).
Пример 1.31. Пусть СВ ξ1 (ω) , ξ 2 (ω) независимы и имеют биномиальные распределения:
Pξ (# ) = Cm# p # (1 − p )
n −#
1
, Pξ (k ) = Cnk p k (1 − p )
n−k
, #,k = 0 ,n.
2
Найдем распределение вероятностей СВ η(ω ) = ξ1 (ω ) + ξ 2 (ω ) : Pη (k ) =
n
∑C i =0
k −i m
p k −i (1 − p )
m − k +i
C ni p i (1 − p )
n −i
= C nk+ m p k (1 − p )n
= p k (1 − p )
n+ m−k
n
∑C C i =0
+ m−k
,k = 0,n.
Здесь на последнем шаге использовано тождество n
∑C C i n
k −i m
i =0
60
= C nk+ m .
i n
k −i m
=
Пример 1.32. Пусть СВ ξ1 (ω) , ξ 2 (ω) независимы и имеют пуассоновские распределения с параметрами λ, μ:
Pξ1 (k ) =
λ k −λ μ# −μ e , Pξ 2 (# ) = e , k,# = 0 ,1,2,... k! #!
Покажем, что их сумма ξ1 (ω) + ξ 2 (ω) = η(ω) имеет пуассоновское распределение с параметром λ + μ:
(λ + μ )k e −(λ+ μ ), k! λ k −i − λ μ i − μ e − λ − μ k e e = μ i λ k −i = i! k! i =0 i!(k − i )! k! i =0 (k − i )! поскольку справедлива формула бинома Ньютона Pη (k ) =
k
∑
∑
k
(μ + λ ) = ∑ C ki μ i λ k −i . i =0
Пример 1.33. Пусть имеем двумерную СВ ξ (ω) = (ξ1 (ω) , ξ 2 (ω) ) непрерывного типа, для которой известна плотность распределения pξ (x1 , x 2 ). Необходимо найти p η ( y ) , где η(ω) =
ξ 1 (ω) . В данном случае опять n = 2 , m = 1 . При этом ξ 2 (ω)
x1 = y1 и введем функцию f 2 (x1 , x2 ) = x 2 = y 2 . Обратx2 ное преобразование имеет вид: f1 (x1 , x 2 ) =
x1 = q1 ( y1, y2 ) = y1 y2 , x2 = q2 ( y1, y2 ) = y2 . Якобиан этого преобразования равен
∂ (q1, q2 ) y2 = 0 ∂ ( y1, y2 )
y1 1
= y2 .
Поэтому pη ( y1, y2 ) = pξ ( y1 y2 , y2 ) y2 , и, таким образом
pη (y ) =
∞
∫ p (yy , y ) y 2
ξ
−∞
61
2
2
dy 2 .
Если СВ ξ1 (ω) и ξ 2 (ω) независимы, то
pç (y ) =
∞
∫y
p î1 ( yy 2 )p î2 ( y 2 )dy 2 =
2
0
∞
= y 2 p î1 ( yy 2 )p î2 ( y 2 )dy 2 −
∫
0
∫y
2
p î1 ( yy 2 ) p î2 ( y 2 )dy 2 .
−∞
0
Используя этот результат, можно найти также плотность распределения произведения СВ η(ω) = ξ1 (ω)ξ 2 (ω) :
pη (y ) =
∞
y 1 dy 2 , 2 y2
∫ p y , y ξ
2
−∞
а если они независимы, то
pη (y ) =
∞
1
∫y
−∞
2
y pξ1 ( y 2 ) pξ 2 dy 2 . y2
§5• . ПРОСТРАНСТВА С МЕРОЙ, ИНТЕГРАЛ ЛЕБЕГА
Пусть × – произвольное множество элементов, назовем его пространством. Пространство × называется измеримым и обозначается ( X , F ) , если на нем выбрана некоторая σ -алгебра подмножеств F. Говорят, что в измеримом пространстве ( X , F ) введена мера, если на элементах σ -алгебры F (т.е. на подмножествах × , которые принадлежат F ) задана неотрицательная функция µ = µ (Α ) , которая является счетно-аддитивной, т.е. для любого числа непересекающихся множеств Α1, Α 2 , ...∈ F
µ ! Α k = ∑ µ (Α k ). k k
•
Данный параграф является вспомогательным для изучения дальнейших параграфов
62
Значение μ(Α ), Α ∈ F, называется мерой множества Α , совокупность ( X , F, µ ) называется пространством с мерой. Ранее введенное вероятностное пространство ( X , F, P) – это пространство с нормированной мерой, Ρ(Ω ) = 1. Рассмотрим, как строится мера Лебега в пространстве R n . Для n мерного параллелепипеда ∆ = {x = (x1 , x 2 , ...x n ) : α i < x i < b i , i = 1, n } мера Лебега равна ì(∆ ) = (b1 − a1 )(b2 − a 2 ) ... (bn − a n ). Пусть теперь Α ∈ R n – произвольное множество в R n . Покроем это множество конечным либо счетным числом параллелепипедов ∆1, ∆ 2 , ..., ∆ k , ... . Нижняя грань чисел
∑ ì(∆ ) , которая берется по k
k
всевозможным покрытиям множества Á , называется верхней ме* рой m (Α ) множества Α . Нижняя мера m* (Α ) определяется как m(∆ ) − m* Α , где ∆ – некоторый параллелепипед, содержащий множество Α, Α – множество всех точек этого параллелепипеда, которые не принадлежат множеству Α . Множества, для которых верхняя мера равна нижней, называются измеримыми по Лебегу, а общее значение m(Α ) верхней и нижней мер – мерой Лебега множества Α . Допустим, что ì(× ) < +∞ . Напомним некоторые определения. Функция f (x ) , заданная на ( X , F, µ ) , называется измеримой, если f −1 (Â ) = {x : x ∈ ×,f (x )∈ Â}⊂ F, где Â – любое борелевское множество на числовой прямой. Измеримая действительная функция f (x ) называется простой (дискретной), если множество её значений не более чем счетно. Например, индикатор множества Á
()
1, x ∈ Α, Ι Α (x ) = 0 , x ∉ Α является простой функцией. Любую простую функцию f (x ) можно представить в виде
f (x ) =
∑ c É (x ) , i
i Αi
где c1 , c2 , ... – значения, которые принимает f (x ) , 63
Αi = {x : f (x ) = ci }, i = 1, 2... . Интегралом Лебега от простой функции по мере ì называется число
∫ f (x )ì(dx) = ∑ c ì(Α ), i
i
i
×
если ряд в правой части сходится абсолютно. Пример 1.34. Пусть f (x ) – конечная неотрицательная простая функция. Вывести неравенство
∫ f (x )ì(dx ) ≤ max{f (x )}ì{x : f (x ) > å}+ åì{x : 0 < f (x ) ≤ å}. x
×
Решение. Интеграл в левой части неравенства можно записать в виде
∫
f (x )ì(dx ) =
3
∑ ∫ f (x )ì(dx ), i =1 × i
×
где
× 1 = {x : f (x ) > å}, × 2 = {x : 0 < f (x ) ≤ å}, × 3 = {x : f (x ) = 0}. На множестве × 1 воспользуемся неравенством f (x ) ≤ max{f (x )}, на множестве × 2 – неравенством f (x ) ≤ å. Тогx да, применив свойство монотонности интеграла от простой функции (
∫ f (x )ì(dx) ≤ ∫ f (x )ì(dx ) при f (x ) ≤ f (x ), что легко прове1
×
2
1
2
×
рить, используя определения интеграла для простых функций), получаем требуемое неравенство. Пусть f (x ) – измеримая функция, заданная на пространстве с мерой ( X , F, µ ) . Теорема 1.8. Для любой измеримой функции f (x ) существует последовательность {f n (x )} простых функций, сходящаяся при n → ∞ к f (x ) равномерно. 64
Для доказательства достаточно положить f n (x ) =
+∞
k ∑ n É (x ), где
k = −∞
Α nk
k k + 1 −1 k k + 1 Α nk = x : x ∈ ×, < f (x ) ≤ = f , . n n n n Тогда, если x 0 ∈ × – произвольная точка, такая, что
k k0 k +1 , то f n (x 0 ) = 0 , откуда следует, что < f (x0 ) ≤ 0 n n n 1 . n Интеграл Лебега от произвольной измеримой функции f n (x 0 ) − f (x 0 ) ≤
f (x ) определяется следующим образом: ∞
k + 1 . n →∞ n →∞ n k = −∞ × × Основные свойства этого интеграла аналогичны свойствам интеграла Римана. Приведем некоторые из них:
∫
f (x )ì(dx ) = lim f n (x )ì(dx ) = lim
∫
1)
k
k
∑ n ì x : n < f (x ) ≤
∫ cì(dx) = cì(× ), где c – константа; ×
2)
∫ cf (x)ì(dx ) = c ∫ f (x )ì(dx ) ; ×
3)
×
∫ [ f (x) + f (x )]ì(dx) = ∫ f (x )ì(dx ) + ∫ f (x )ì(dx ) ; 1
2
1
×
×
4) если f 1 (x ) ≥ f 2 (x ), то
∫ f (x )ì(dx) ≥ ∫ f (x )ì(dx) ; 1
×
5) если Χ =
∞
!Α, i
i =1
2
×
2
×
Αi ∈ F , Αi " A j = ∅, i = j , то
65
∫
f (x )ì(dx ) =
∞
∑ ∫ f (x )ì(dx). i =1 Α i
×
Пусть теперь f = ( f 1 , f 2 , ..., f n ) – вектор-функция, заданная на
(X ,
F µ ) , компоненты которой являются измеримыми функция-
ми. Она индуцирует на борелевских множествах пространства R n меру ì f , заданную равенством
{
}
ì f (Â ) = ì{x : x ∈ × ,f (x ) = ( f1 (x ), f 2 (x ), ..., f n (x ))∈ Â} = ì f −1 (Â ) . Теорема 1.9 (формула замены переменных в интеграле Лебега). Пусть g (x ) = g (x1 , x 2 , ..., x n ) – борелевская функция, заданная на R n . Тогда имеет место следующая формула:
∫ g ( f (x))ì(dx ) = ∫ g (y )ì (dy ). f
Rn
×
Для доказательства левую и правую часть этого равенства приведем к одному и тому же выражению. Тогда будем иметь: ∞
k
k
∫ g ( f (x ))μ(dx ) = lim ∑ n μ x : x ∈ Χ , n < g ( f (x )) ≤
Χ
= lim
∞
n→∞
n →∞
k = −∞
k
∑ n μ x : x ∈ Χ, f (x )∈ g
∫
Rn
g ( y )ì f (dy ) = lim
n →∞
∞ k k + 1 k k + 1 k μ f g −1 , = nlim , , → ∞ n n n n n k = −∞
−1
k = −∞
∞
∑
k
∑ nì
f
k = −∞ ∞
k + 1 = n
k + 1 n k y : y ∈ R , < g (y ) ≤ = n n
−1 k k + 1 . g , n→ ∞ n n k = −∞ Перейдем от ( X , F , µ ) к вероятностному пространству (Ω, F, P ) . Заметим, что измеримая функция î(ù ) , которую мы назвали случайной величиной и которая задается на (Ω, F, P ) , = lim
k
∑ nì
f
66
индуцирует на борелевских множествах Â ⊂ R меру Ñî = ìî , для которой
(
)
Ñî (Â ) = Ñ{ù : î(ù )∈ Â} = Ñ î−1 (Â ) .
Если Â = (x, x + ∆x ] , то
Ñ (∆ù ) = Ñ{ù : x < î(ù ) ≤ x + ∆x} = Ñ î ((x, x + ∆x ]) = = Fî (x + ∆x ) − Fî (x ) = ∆Fî (x ) . Из предыдущей теоремы следует
∫ g (î(ù ))Ñ(dù ) = ∫ g (x )dFî (x ), R
Ù
что означает переход от интеграла Лебега по вероятностной мере к интегралу Лебега–Стилтьеса, в котором интегрирующей функцией является функция распределения. Интегралом Лебега–Стилтьеса называют интеграл Лебега по мере Лебега–Стилтьеса. Мерой Лебега–Стилтьеса называется неотрицательная счетно-аддитивная функция ì(Α ) множеств Α ⊂ R , для которой выполняется дополнительное условие: ì((a, b]) = F (b ) − F (a ) ,
где F (x ) – неубывающая, непрерывная справа функция. Вероятность является частным случаем меры Лебега–Стилтьеса, при этом Fî (− ∞ ) = 0, Fî (+ ∞ ) = 1. Рассмотрим определение интеграла Римана–Стилтьеса от
функции g (x ) с интегрирующей функцией F (x ) по ограниченному интервалу [a, b ] . Пусть
a = x 0 < x1 < ... < x n = b, ∆ = max(x k − x k −1 ) . 1≤ k ≤ n
Предел
b
n
lim ∑ g (x k )[F (x k ) − F (x k −1 )] = ∫ g (x )dF (x ) ,
n → ∞ k =1 ∆ →0
a
67
если он существует, называется интегралом Римана–Стилтьеса. Заметим, что если функция g (x ) непрерывна на интервале [a, b ] , то интеграл Римана–Стилтьеса совпадает с интегралом Лебега– Стилтьеса по этому интервалу. Разобьем интервал [a, b ] на малые
(
]
части Α in = xi(n ), xi(+n1) точками a = x1(n ) < x 2(n ) < ... < x n(n+)1 = b. Когда g (x ) – непрерывная функция, то последовательность
g n (x ) =
∑ g (x ( ) )É (x ) n
n i =1
i =1
Α in
→ 0 для всех i . равномерно к ней сходится, если xi(+n1) − x i(n ) n →∞ Значит,
(интеграл Л.-С-) ∫ g(x )dF (x ) = nlim ∑ g (x i(+n1) )μ(Αin ) = →∞ b
n
i =1
a
( )[ ( ) ( )]
n
b
= lim ∑ g x i(+n1) F x i(+n1) − F x i(n ) = ∫ g(x )dF (x ) (интеграл Р.-С-). n→∞ i =1
a
Слева в данной формуле стоит интеграл Лебега–Стилтьеса, а справа – Римана–Стилтьеса. При определении несобственных интегралов Римана–Стилтьеса поступают таким же образом, как и в случае определения несобственных интегралов в обычном смысле Римана. В этом случае для того, чтобы интегралы Лебега–Стилтьеса и Римана–Стилтьеса совпадали, достаточно, чтобы последний существовал в смысле абсолютной сходимости. Если Fî (x ) абсолютно непрерывная функция, то
∫ g (î(ù ))Ñ(dù ) = ∫ g (x )dF (x ) = ∫ g (x )p (x )dx , î
Ù
R
î
R
и вычисление рассматриваемых интегралов сводится к вычислению обычных интегралов Римана. Следует отметить, что в основе построения интегралов Лебега и Римана лежат разные идеи. При построении интегралов Лебе68
га исходят из разбиения значений интегрируемой функции и определения слагаемых в интегральной сумме через меру множества точек, которым соответствуют близкие значения интегрируемой функции. В интегральной сумме Римана исходят из разбиения значений переменной и определения слагаемых через меру множества точек, которым соответствуют близкие значения переменной. Результатом этих разных подходов является то, что соответствующие интегральные суммы Римана имеют предел лишь для не слишком разрывных функций, а интегральные суммы Лебега сходятся к предельным значениям для более широкого класса функций. Если ф.р. Fî (x ) не имеет сингулярной компоненты, как это обычно бывает в приложениях, то интегралы Лебега–Стилтьеса и Римана– Стилтьеса по этой интегрирующей функции совпадают, если они существуют. Используя интегралы, рассмотренные выше, некоторые результаты, сформулированные ранее для абсолютно непрерывных ф.р. можно записать в более общей форме: 1) для любой СВ î(ù ) (если она и не имеет абсолютно непрерывной ф.р.) Ñ{ù : î(ù )∈ G} = ∫ dFî (x ) ; G
2) для любых СВ î(ù ), ç(ù ) (они могут не иметь абсолютно непрерывные ф.р.) +∞
Fç (y ) = ∫ Fç (y/x )dFî (x ) ; −∞
3) если ç(ù ) = î1 (ù ) + î2 (ù ) , то
Fç ( y ) =
+∞
∫ F (y − x)dF (x ) , т.е. F î1
î2
ç
= Fî1 ∗ Fî2 ,
−∞
здесь также не обязательно, чтобы СВ î1 (ù ) , î2 (ù ) имели абсолютно непрерывные ф.р. 69
§6. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
Перед тем как дать формальное определение первой числовой характеристики математического ожидания, рассмотрим несколько примеров. Пример 1.35 (доход телефонной станции). На телефонной станции в любой момент x в течение промежутка времени É фиксируется число f (x ) телефонных разговоров. Цена ì одного разговора за промежуток времени является функцией множества, которая ставит в соответствие каждому интервалу És ⊂ É цену одного разговора за время És , µ i : Ι s → µ (Ι s ) . Необходимо найти ожидаемый доход телефонной станции за промежуток времени É. Для этого заметим, что f (x ) принимает конечное число значений. Пусть f i – возможные значения f (x ) , а {x : f (x ) = f i } – множество моментов времени, в которых велось ровно f i разговоров, i = 1, n . Тогда ожидаемый доход будет равен n
∑ f μ{x : f (x ) = f }. i
i
i =1
Таким образом, эта величина является интегралом Лебега от простой функции f (x ) , принимающей конечное число значений, по мере ì . Его принято обозначать
∫ f (x )ì(dx ) . É
Пример 1.36 (урожай с поля). Пусть f (x ), x ∈ Q , – урожайность пшеницы на поле Q , например, Q – участок посева семян района, области под пшеницей; ì – площадь, т.е. функция множеств (участка), которая ставит в соответствие каждому участку Qi ⊂ Q число, равное его площади μ(Qi ), μ : Qi → μ(Qi ). Необходимо найти величину урожая с поля Q . Здесь в отличие от предыдущего примера значения функции f (x ) непрерывно заполняют некоторый промежуток. В качестве единицы измерения урожайности выберем число ε , например, ε = 1 ц , 10 ц и т.д. Пусть Α k, ε = {x : kε < f (x ) ≤ (k + 1) ε} – участок поля, на котором урожайность меняется от kε до (k + 1)å. Под урожайностью на Α k, ε будем понимать величину kå. Рассмот70
рим на Q функцию f å (x ) , принимающую конечное число значений, а именно, f å (x ) = kå для x ∈ Α k, ε , т.е. f å (x ) – величина урожайности, измеренная с точностью до ε . В качестве величины урожая с поля Q естественно рассматривать величину
∑ kεµ{x : kε < f (x ) ≤ (k + 1)ε} – k
интеграл Лебега от функции f (x ) по мере ì , т.е.
∫ f (x )ì(dx ) .
Q
Пример 1.37 (среднее значение СВ). Пусть î(ù ) – СВ со значениями на числовой оси R , заданная на вероятностном пространстве (Ω, F , Ρ ) . Нужно найти среднее значение СВ – значение, которое СВ принимает в среднем. Как и в предыдущем примере, сначала выберем единицу измерения å значений СВ ξ (ω ) и рассмотрим множество точек Α k, ε = {ω : kε < ξ (ω ) ≤ (k + 1)ε}, т.е. Α k, ε – множество точек пространства элементарных событий Ω , в которых î(ù ) принимает значения от kå до (k + 1)ε, k = 1, 2 ,... . На пространстве Ω рассмотрим последовательность СВ ξ ε (ω ) , которые зависят от параметра å , положив îå (ù ) = kå для ω ∈ Α k, ε , k = 1, 2 , ... . В качестве среднего значения СВ ξ (ω ) естественно рассматривать величину
lim ε →0
∑ kεΡ{ω : kε < ξ (ω) ≤ (k + 1)ε} = ∫ ξ (ω)Ρ(dω) , k
Ω
являющуюся интегралом Лебега от СВ ξ (ω ) по вероятностной мере Ñ , которую принято называть математическим ожиданием СВ ξ (ω ) (средним значением СВ ξ (ω ) )
1 . Таким обn разом, математическим ожиданием СВ ξ = ξ (ω ) , заданной на вероятностном пространстве (Ω, F , Ρ ) , называется число, равное Определение. Возьмем в качестве å величину
Μξ = lim
n →∞
∞
k
k
∑ n Ρω : n < ξ (ω) ≤
k = −∞
где Fî (x ) – ф.р. СВ ξ .
k + 1 , = ξ (ω)Ρ (dω ) = xdFξ (x ) n Ω Χ
71
∫
∫
Из этого определения вытекают следствия: а) если î(ù ) – дискретная СВ, которая принимает значения из множества {x1, x2 , ..., xk , ...}, то
Μξ =
∑ x Ρ{ω : ξ (ω) = x }= ∑ x k
k
k =1
k
pk ;
k =1
б) если î(ù ) имеет абсолютно непрерывное распределение (плотность p î (x ) ), то +∞
Ìî =
∫ xp (x)dx ; î
−∞
в) математическое ожидание Ìî существует, если Ì î < +∞ . Пример 1.38. Найдем математическое ожидание СВ ξ , распределенной по закону Пуассона. Решение. Для такой СВ
ξ (ω )∈ {0 ,1, 2, ..., k, ...}, pk = Поэтому
∞ ∞ λk −λ λ k −1 λr = e− λ λ = e − λ λe λ = λ . e = e− λ λ ( ) − k! k ! r! 1 k =0 k =1 r =0 Пример 1.39. Пусть î принимает значения x k = (− 1)k 2 k с ве-
Μξ =
∞
λk −λ e , k = 0,1, 2 , ... . k!
∑
∑
k
∑
1 , k = 1, 2 , ... . Попарно просуммировав после2k довательные значения x k p k , получим x2 k −1 p2 k −1 + x2 k p2 k = 0, k = 1, 2 , ... . На первый взгляд может показаться, что Ìî = 0 . Однако
роятностями pk =
∑} { k : xk >0
xk p k =
∞
∑
2 2 k 2 − 2 k = ∞,
k =1
∑} { k : xk <0
поэтому Ìî не существует.
72
xk p k = −
∞
∑2 n =1
2 k −1 1− 2 k
2
= −∞ ,
Пример 1.40. Найдем математическое ожидание СВ ξ , равномерно распределенной на отрезке [a, b] . Решение. Данная СВ непрерывного типа. Учитывая для нее вид плотности распределения, будем иметь b
Ìî =
x
∫ b − a dx = a
a+b , 2
т.е. математическое ожидание равно середине отрезка [a,b ] . Пример 1.41. СВ ξ имеет гамма-распределение с параметром
p (см. пример 1.28.). Найдем Ìî . Решение. ∞
Μξ =
∫ 0
x Г ( p + 1) pГ ( p ) 1 = =p x p −1e − x dx = x p e − x dx = Г (p) Г (p) 0 Г (p) Г (p) ∞
∫
для целых p . Поскольку математическое ожидание определяется в общем случае в виде интеграла Лебега, то его свойства в основном следуют из свойств этого интеграла. Рассмотрим основные из них (будем предполагать, что соответствующие математические ожидания, входящие в приведенные в данных свойствах соотношения, существуют). 1. Если Ρ(ω : ξ (ω ) ≥ 0 ) = 1 , то Ìî ≥ 0 . 2. Ì (cî) = cÌ ξ , где c – константа, Ìc = c . 3. Если Ρ (ω : ξ (ω ) ≥ η(ω )) = 1 , то Ìî ≥ Ìç . 4. Ì (î + ç) = Ìî + Ìç . 5. Ìî ≤ Ì î .
73
1, ω ∈ Α , Α ∈ F. Такая СВ называется инди6. Пусть Ι Α (ω ) = 0 , ω ∉ Α катором случайного события Α . Тогда
ΜΙ Α (ω) = Ι Α (ω)Ρ(dω) = Ρ (dω ) = Ρ(Α) ,
∫
∫
Ω
Α
т.е. математическое ожидание такой СВ равно вероятности события Α . 7. Пусть î и ç – независимые СВ, тогда Ì (îç) = ÌîÌç . Докажем это свойство. Рассмотрим два случая. а) Пусть î и ç – дискретные СВ, ξ ∈ {a1, a2 , ...}, η ∈ {b1, b2 , ...}. Тогда, введя случайные события Αi = {ω : ξ (ω) = ai }, Β j = ω : η(ω ) = b j , можно с помощью их записать наши СВ
{
î(ù ) =
}
∑ a É (ù ), ç(ù ) = ∑ b É (ù ) , i Αi
i
j Âj
j
и поэтому в этом случае будем иметь
ÌîÌç = =
∑ a Ñ(Á ) ∑ b Ñ(Â ) = i
i
i
j
j
j
∑ a b Ñ(Á )Ñ(Â ) = ∑ a b Ñ(Á Â ) = Ì (î,ç). i
j
i,j
i
j
i
j
i
j
i,j
б) Пусть теперь î и ç – произвольные СВ. Введем дискретные СВ
în (ù ) =
k + 1 , k , если k ù ∈ ù : < î(ù ) ≤ n n n
k k + 1 k , если ω ∈ ω : < η(ω ) ≤ , k ∈ {..., − 2 , − 1, 0,1, 2 , ...}. n n n Они независимы, как функции от независимых СВ, поэтому Ì (în çn ) = Ìî n Ìç n . Кроме того, как было показано в предыдущем çn (ù ) =
74
параграфе, în n → î, n çn → ç равномерно. Рассмотрим →∞ →∞ разность
Ì (îç) − Ì (în çn ) = Ì (îç− în çn ) =
= Ì (îç− în ç + în ç − în çn ) = Ì [(î − în )ç]+ Ì [în (ç − çn )] . При n → ∞ ξ − ξ n ≤
1 1 1 , т.е. în ≤ î + , ç − çn ≤ , следовательно, n n n
Ì (îç) − Ì (în çn ) ≤
1 1 1 → 0 , Ì ç + Ì î + n →∞ n n n
что и доказывает свойство в данном случае.
8. Пусть ξ – СВ, g (x ) – измеримая функция. Тогда g (ξ ) также является СВ и, если Μ g (ξ ) < +∞ , то
Μg (ξ ) = g (x )dFξ (x ) ,
∫ R
в частности,
Μg (ξ ) =
∞
∑ g (x )p k
k
, если î – дискретная СВ,
k =1
Μg (ξ ) =
+∞
∫ g (x )p (x )dx , если î – непрерывная СВ. ξ
−∞
Пример 1.42. Правомерно ли следующее рассуждение: «От общежития до университета расстояние равно 1 км, студент ходит в среднем со скоростью 5 км/ч, следовательно, в среднем на дорогу у него будет уходить 12 мин.»? Решение. Прежде всего уточним формулировку задачи: имеется в виду, что скорость – случайная величина, математическое ожидание которой равно 5 км/ч. Рассуждение является неправомерным, т.к. из свойства 8 следует, что, вообще говоря, Ì
75
1 1 ≠ . î Ìî
Для многомерной СВ ξ = (ξ1, ξ 2 , ..., ξ n ) математическое ожидание определяется в виде вектора
Μξ = (m1, m2 , ..., mn ) , где mk = Μξ k = ξ k (ω)Ρ (dω), k = 1, n .
∫
Ω
Если, например, СВ ξ – дискретного типа и
ξ k ∈ {0 ,1, 2 , ..., N }, k = 1, n,
n
∑ ξ (ω) = N ∀ω ∈ Ω , то k
k =1
mk =
N N − x1
N − x1 − x2 − ...− xn −1
∑ ∑ ...
∑ x Ρ{ξ k
x1 = 0 x2 = 0
1
= x1, ξ 2 = x2 , ..., ξ n = xn }, k = 1, n .
xn = 0
Если СВ ξ = (ξ1, ξ 2 , ..., ξ n ) непрерывного типа и g (x1, x2 , ..., xn ) – измеримая функция, то
Μg (ξ1, ξ 2 , ..., ξ n ) =
+∞
+∞
−∞
−∞
... g (x1, x2 , ..., xn )pξ1ξ2...ξ n (x1, x2 , ..., xn )dx1dx2 ...dxn,
∫ ∫
где pξ1ξ 2...ξ n (x1, x2 , ..., xn ) – плотность распределения n -мерной СВ ξ . В частности,
mk = Μξ k =
+∞
+∞
−∞
−∞
... xk pξ1ξ 2...ξ n (x1, x2 , ..., xn )dx1dx2 ...dxn .
∫ ∫
Рассмотрим понятие условного математического ожидания. Ранее было введено определение условной ф.р. (см. п.7):
Ρ(ω : ξ (ω) ≤ x, ω ∈ Β ) , Ρ(ω : ω ∈ Β ) причем в качестве Â можно взять событие Β = {ω : η(ω) = y}, где ç(ù ) – некоторая СВ. Условным математическим ожиданием СВ ξ (ω ) при условии события Â называется Fξ (x/Β ) =
Μ (ξ/Β ) = xdFξ (x/Β ) = ξ (ω)Ρ (dω / B ) = (Ρ(Β ))
∫ R
∫
−1
Ω
∫ ξ (ω)Ρ(dω) . Β
76
Если случайные события Β1, Β2 , ..., Βk , ... образуют полную группу событий, то Μξ = ξ (ω )Ρ (dω ) =
∫
∞
∑∫
ξ (ω )Ρ(dω ) =
k =1 Βk
Ω
Формула Ìî =
∞
∑ Ρ(Β )Μ (ξ/Β ). k
k
k =1
∞
∑ Ñ(Â )Ì (î/Â) называется формулой полной k
k
k =1
вероятности для математического ожидания. Пусть î(ù ) – неотрицательная СВ, определенная на вероят-
F , Ρ) , â
– σ -алгебра, содержащаяся в F, и пусть Ìî < +∞ . Условное математическое ожидание СВ ξ ностном пространстве (Ω, относительно σ -алгебры летворяющая условиям:
â определяется как СВ M (ξ / B ) , удов-
а) M (ξ /
â ) измерима относительно â ;
б) ∀B ∈
â
∫ ξ (ω )P(dω ) = ∫ M (ξ / B ) P(dω ) . B
B
Условным математическим ожиданием СВ относительно СВ η называется условное математическое ожидание ξ относительно σ -алгебры, порожденной ç . Пример 1.43. Пусть СВ ξ и ç независимы и имеют биномиальные распределения с параметрами n, p и m, p соответственно. Найдем условное математическое ожидание Ì (î/î+ ç) . Решение. СВ ξ + η имеет биномиальное распределение с параметрами n + m, p (см. пример 8.6.).Найдем условное распределение î при условии î + ç : Ñ{î = k/î + ç = l} = =
Ñ{î = k,î + ç = l} = Ñ{î + ç = l}
Ñ{î = k,ç = l − k } Ñ{î = k }Ñ{ç = l − k } = = Ñ{î + ç = l} Ñ{î + ç = l}
77
C nk p k (1 − p )
n−k
=
C ml − k p l − k (1 − p )
m −l − k
=
C nk C ml − k
. n + m −l C nl + m C nl + m p l (1 − p ) Поэтому, используя тождество из примера 1.31, получаем
Μ (ξ/ξ + η = l ) =
∑k k
C nk C ml − k C nl + m
=n
∑ k
C nk−−11C ((nl −+1m)−−(1k)−−1(n) −1)
(n + m ) l
Ì (î/î+ n ) =
C nl −+1m −1
=
l⋅n , n+m
(î + ç)n .
n+m Рассмотрим неравенства, справедливые для математических ожиданий. 1) Неравенство Чебышева. Пусть f (x ) – неотрицательная, монотонно неубывающая борелевская функция, определенная на интервале [0, + ∞ ) со значениями в R . Тогда для любой СВ ξ и ∀ ε > 0
Ñ î≥å ≤
Ìf ( î ) , f (å)
в частности,
Ñ{î ≥ å}≤
Ì î k
å
k
∀k ≥ 0 –
это неравенство называется неравенством Маркова. При k = 1 имеем:
Ñ{î ≥ å}≤
Ì î. å Неравенство Чебышева справедливо, поскольку Μf ( ξ ) =
∫ f (ξ (ω) )Ρ(dω) = {
Ω
∫ f (ξ (ω) )Ρ(dω) =
ω : ξ (ω ) ≥ ε }!{ω : ξ (ω ) < ε }
78
= ≥
∫
f ( ξ (ω ) )Ρ (dω ) + f ( ξ (ω ) )Ρ(dω ) ≥ {ω : ξ (ω ) ≥ ε } {ω : ξ (ω ) < ε }
{ω : ξ (ω ) ≥ ε }
∫
∫
f ( ξ (ω ) )Ρ(dω ) ≥
f (ε )Ρ(dω ) = f (ε )Ρ{ξ ≥ ε}. {ω : ξ (ω ) ≥ ε }
∫
2) Неравенство Иенсена. Напомним, что функция g (x ) со значениями в R , заданная на интервале É⊂ R , называется выпуклой на нем вниз (вверх), если для любого x 0 ∈ É найдется число ë(x 0 ) такое, что для всех x ∈ É: g (x 0 ) + λ(x 0 )(x − x 0 ) ≤ g (x ) (g (x 0 ) + λ(x 0 )(x − x 0 ) ≥ g (x )) . Т.к. y = g (x0 ) + λ(x0 )(x − x0 ) является уравнением прямой, которая проходит через точку (x0 , g (x0 )) с угловым коэффициентом ë(x 0 ) , то выпуклость вниз (вверх) означает, что в любой точке (x0 , g (x0 )) можно провести касательную прямую так, что график функции g (x ) лежит выше (ниже) этой прямой. Пусть g (x ) – выпуклая вниз (вверх) борелевская функция на R . Тогда, если Ì î < +∞ , выполняется неравенство Иенсена g (Μξ ) ≤ Μg (ξ ) (g (Μξ ) ≥ Μg (ξ )) , в частности, (Μξ )2 ≤ Μξ 2 , Μξ r ≤ Μ ξ r , r ≥ 1 . Поясним, почему неравенство Иенсена имеет место, например, для выпуклой вниз функции g (x ) . Для такой функции g (x0 ) + λ(x0 )(x − x0 ) ≤ g (x ), x ∈ R . Положим x0 = Μξ , x = ξ , тогда g (Μξ ) + λ(Μξ )(ξ − Μξ ) ≤ g (ξ ) . Взяв в этом неравенстве математическое ожидание в левой и правой части, получим требуемое неравенство.
3) Неравенство Гёльдера. Пусть
(
Ì îç ≤ Ì î
) (Ì ) .
1 p p
79
1 1 + = 1, p > 0 , q > 0 , тогда p q 1 q q ç
t
s
1
s
Если в неравенстве Гёльдера положить ξ = ξ , η = 1, p = s , q = 1 − t , где 0 < s < t , то получим неравенство Ляпунова:
(Ì î ) ≤ (Ì î ) . 1 s s
1 t t
При p = q = 2 из неравенства Гёльдера получаем неравенство Коши–Буняковского (Шварца):
Ì îç ≤ Ìî 2 Ìç 2 . Докажем неравенство Гёльдера. Введем CB
á=
î
(Ìî )
1 p p
, â=
ç
(Ìç )
1 q q
.
Тогда нам требуется доказать, что Ìáâ ≤ 1 . Рассмотрим функцию ln x . Она является выпуклой кверху функцией, поэтому ∀ λ ∈ [0,1] ln[(1 − ë)x1 + ëx2 ] ≥ (1 − ë)ln x1 + ëln x 2 = ln x11− ë x 2ë , x1 ,x 2 > 0 , т.е. справедливо неравенство
(
)
(1 − ë)x1 + ëx2 ≥ x11− ë x 2ë . Положим x1 = á p , x 2 = â q , ë =
1 1 , (1 − ë) = . Тогда из этого q p
неравенства будем иметь
1 p 1 q á + â ≥ áâ , p q откуда следует, что
1 1 1 1 Ìá p + Ìâ q = + = 1 , p q p q что и требовалось доказать. Ì (áâ) ≤
80
Пример 1.44. Показать, что
Ñ
1 n îi ≥ å ≤ Ì îi . å i =1 i =1 n
∑
∑
Решение. Применив неравенство Чебышева и свойство 5 математического ожидания, получим n n 1 1 n Ñ îi ≥ å ≤ Ì îi ≤ Ì îi . å i =1 i =1 å i =1 Приведем практический пример, иллюстрирующий, как можно использовать понятие математического ожидания. Пример 1.45. Продавец получает N единиц товара в день и стремится заказать число N таким образом, чтобы максимизировать ожидаемую прибыль. Найти оптимальный параметр N * , если число покупателей товара в данный день следует закону Пуассона с параметром ë > 0 . Прибыль, получаемая от единицы проданного товара, равна a , убыток от нереализованной единицы товара – b , c – убыток, если покупатель желает приобрести товар, но запас товаровисчерпан. Решение. Пусть î – число покупателей в данный день, тогда чистая прибыль продавца имеет вид
∑
∑
∑
aξ − b(N − ξ ), если ξ ≤ N, g n (ξ ) = aN − c(ξ − N ), если ξ > N . Ожидаемая прибыль является математическим ожиданием GN = Μg N (ξ ) . Изменение ожидаемой прибыли при добавлении еще одной единицы товара равно G N +1 − G N = Μ [g N +1 (ξ ) − g N (ξ )] = Μ [− b + (a + b + c )u (ξ − N )],
1, x > 0 где u (x ) = – функция Хевисайда. Поскольку 0 , x ≤ 0 Ìu (ç) = 1 ⋅ Ñ{ç > 0} + 0 ⋅ Ñ{ç ≤ 0}= Ñ{ç > 0}, то приращение ожидаемой прибыли равно
81
G N +1 − G N = −b + (a + b + c )Ìu (î − N ) = −b + (a + b + c )Ñ{î > N }. Для нахождения max GN достаточно решить уравнение N G N = G N +1 , откуда получаем Ñ{î > N } =
b b , т.е. 1 − F (N ) = . î a+b+c a+b+c
Т.к. для закона Пуассона
Fî (N ) =
N
ëk
∑ k! e
−ë
,
k =0
то уравнение для нахождения оптимального N * имеет вид: N*
∑ k =0
λk −λ b +1, e = k! a+b+c
или, в неявной форме,
b N * = Fξ−1 + 1 . a+b+c
Числовое значение данного выражения можно найти, воспользовавшись таблицей распределения Пуассона. Рассмотрим теперь другие различные числовые характеристики СВ, которые являются математическими ожиданиями определенных функций от СВ. Моменты СВ. Определение. Начальным моментом порядка N СВ ξ называется m N = Ìî N , а центральным моментом порядка N N − ìN = Ì (î − Ìî ) . Определение. В случае многомерных СВ смешанным начальным моментом порядка NCBî = (î1 , î2 , ..., în ) называется
Ì
[
î1k1 î2k2
⋅ ... ⋅ înkn
]
, где
n
∑k
i
= N, ki – целые неотрицательные чис-
i =1
ла. Смешанным центральным моментом порядка N называется Ì (î1 − Ìî 1 )k1 (î2 − Ìî 2 )k 2 ...(în − Ìî n )k n .
[
]
82
Пример 1.46. Найдем моменты СВ, имеющей нормальное распределение с параметрами a, σ 2 . Сделаем это вначале для случая a = 0 , σ = 1 , плотность распределения СВ при этом имеет вид
pî (x ) = поэтому
1
e
2ð
n
m n = Ìî =
−
x2 2
, − ∞ < x < +∞ ,
∞
1
∫x
2ð − ∞
n
e
−
x2 2
dx .
При нечетных n этот интеграл равен нулю как интеграл нечетной функции по симметричному промежутку интегрирования. Таким образом, остается найти m n при четных n . Пусть n = 2 , тогда
Ìî = 2
1 2ð
∞
∫
2
x e
−∞
−
x2 2
∞ ∞ x2 − x2 2 2 −2 2 dx = x e dx = xd − e 2 ð0 ð0
∫
x2
2 −2 xe − ð ∞
x2
∞
∞
x2
2 −2 e dx = + ð0
∫
0
2 −2 1 = e dx = ð0 2ð
∫
∫
=
∞
∫
e
−
x2 2
∞
∫ p (x )dx = 1 ;
dx =
−∞
î
−∞
при этом мы использовали предел lim x e ÷→ ∞
−
x2 2
dx = 0 , который легко
проверяется по правилу Лопиталя. Аналогично, проинтегрировав интеграл, выражающий Ìî n , по частям, получим
83
Ìî = n
∞
1 2ð
∫
n
x e
−
−∞
x2 2
x2 x2 ∞ ∞ 2 n −2 2 n −1 − 2 dx = x e dx = x d −e ð0 ð0
∫
∞
x2
2 n −1 − 2 =− x e ð = (n − 1)
1
∫
∞
∞
∫x
x2
2 n−2 − 2 + (n − 1) x e dx = ð0
∫
0
=
n−2
e
−
x2 2
dx = (n − 1)Ìî n − 2 .
2ð − ∞ Итак, доказана рекуррентная формула
Mξ n = (n − 1)Mξ n− 2 , Mξ = 0.
Отсюда
Ìî n = (n − 1)Ìî n − 2 = (n − 1)(n − 3)Ìî n − 4 = ... = = ... = (n − 1)(n − 3)⋅ ...⋅ 3Ìî 2 = (n − 1)(n − 3)...3 ⋅1. Положим n = 2k . Тогда
(n − 1)(n − 3)⋅ ... ⋅1 = (2k − 1)(2k − 3) ...1 = (2k − 1)! (2k − 1)! . = = k −1 [2(k − 1)][2(k − 2)]⋅ ... ⋅ 2 2 (k − 1)!
Таким образом,
m2 k = Ìî 2 k =
(2k − 1)! , k = 1, 2, ... 2 k −1 (k − 1)!
.
Найдем теперь центральные моменты распределения СВ ç с плотностью p ç (x ) =
1 2ðσ
e
−
( x − a )2 2σ 2
84
, -∞ < x < +∞ .
Если ввести СВ î по формуле î =
1
p î (x ) =
2ð
e
−
x2 2
ç− a , то имеем σ
, а из формулы ç = a + σî находим
Μη = a + σ Μξ = a . Рассмотрим центральные моменты СВ ç любых порядков. Т.к. η − a = σ ξ , то Μ (η − Μη ) = Μ (σ ξ ) n
n
0, n = 2k − 1, = σ Μξ = σ 2 k (2k − 1)! k = 1, 2 , ... . = , n 2 k, 2 k −1 (k − 1)! n
n
Дисперсия и ее свойства. Определение. Дисперсией СВ î называется ее центральный момент второго порядка:
Dî = Ì (î − Ìî )2 , Dî называется средним квадратичным отклонением СВ î . Дисперсия служит характеристикой (хотя и не полной) рассеяния значений СВ от ее среднего значения. Из определения следует, что
[
]
Dî = Ì î2 − 2îÌî + (Ìî )2 = Ìî 2 − 2(Ìî )2 + (Ìî )2 = Ìî 2 − (Ìî )2. Рассмотрим свойства дисперсии. 1. Dî ≥ 0 . 2. Dî = 0 только в том случае, когда P (î = const ) = 1 .
3. D(cî) = Ì (cî − cÌ ξ )2 = c 2 Ì (î − Ìî )2 = c 2 Dî . 2 2 4. D(c + î) = Ì [c + î − Ì (c + î)] = Ì (î − Ìî ) = Dî . 5. Пусть î и ç – независимые СВ, тогда
D(î + ç) = Ì [î + ç − Ì (î + ç)]2 = Ì [(î − Ìî ) + (ç − Ìç )]2 = 85
= Ì (î − Ìî ) + Ì (ç − Ìç ) + 2Ì [(î − Ìî )(ç − Ìç )] = 2
2
= Dî + Dç + 2[Ì (îç) + ÌîÌç − 2 ÌîÌç ] = Dî + Dç,
поскольку для независимых СВ Ì (îç) = ÌîÌç . 6. Если в неравенстве Чебышева для математического ожидания в качестве f (x ) взять x 2 , а в качестве СВ взять (î − Ìî ) (или, что то же самое, в неравенство Маркова вместо î подставить î − Ìî ), то получим неравенство Чебышева для дисперсии:
P{î − Ìî ≥ å}≤
Dî ∀å > 0. å2 Пример 1.47. Из предыдущего примера следует, что дисперсия СВ ç , имеющей нормальное распределение с параметрами 2 a, σ 2 , равна σ 2 , т.е. Dç = σ . Пример 1.48. Найдем дисперсию СВ î , равномерно распре-
деленной на отрезке [a, b] .
a+b (см. пример 1.40). Найдем 2 начальный момент второго порядка: Решение. Для такой СВ Ìî =
∞
m 2 = Ìî 2 = Поэтому
∫
−∞
x 2 p î (x )dx =
b
1 b 3 − a 3 a 3 + ab + b 3 . = x 2 dx = 3(b − a ) 3 b−a a
∫
Dî = Ìî 2 − (Ìî ) = 2
(b − a )2 .
12 Пример 1.49 (правило «трех сигм»). Используя неравенство Чебышева, оценить вероятность того, что любая СВ î отклонится от своего среднего значения менее чем на три средних квадратичных отклонения этой величины. 86
Решение. Из неравенства Чебышева следует
P{î − Ìî < å}≥ 1 −
Dî . å2
В нашем случае å = 3σ , где σ = Dî – среднее квадратичное 2 отклонение. Поэтому P{î − Ìî < 3σ }≥ 1 − σ 2 , т.е. 9σ
8 P{î − Ìî < 3σ }≥ . 9
Таким образом, полученная вероятность не меньше, чем Ковариация и ее свойства.
8 . 9
Определение. Ковариацией СВ î и ç называется 0 0 cov(ξ,η ) = Μ ξ ⋅η = Μ [(ξ − Μξ )(η − Μη )] , 0
0
здесь î = î − Ìî, ç = ç − Ìç – центрированные СВ по отношению к СВ î и ç . Рассмотрим свойства ковариации. 2 1. cov(î,î) = Ì (î − Ìî ) = Dî .
2. Если СВ î и ç независимы, то cov(î,ç) = 0 , это следует из определения ковариации и свойства 6 математического ожидания. 3. Для произвольных СВ î и ç
D(î + ç) = Dî + Dç + 2 cov(î,ç) , что следует из определения дисперсии и ковариации. 4. Пусть î1 = xî − ç , где x принимает действительные значения. Рассмотрим дисперсию СВ î1 87
Dî1 = Ì [xî − ç − Ì (xî − ç)]2 = Ì [(xî − Ì (xî)) − (ç − Ìç )]2 = = x 2 Ì (î − Ìî )2 − 2 xÌ [(î − Ìî )(ç − Ìç )]+ Ì (ç − Ìç )2 = = x 2 Dî − 2 x cov(î,ç) + Dç . Это выражение является квадратным трехчленом относительно x . Поскольку Dî1 ≥ 0, то дискриминант [2 cov(î,ç)] − 4 Dξ Dη должен быть меньше либо равен нулю, т.е. должно выполняться неравенство 2
[cov(î,ç)]2 ≤ DξDη ,
т.е.
cov(î,ç) ≤ Dî Dη ,
или
− Dî Dη ≤ cov(î,ç) ≤ Dî Dη . Коэффициент корреляции и его свойства. Нормированной 0 СВ по отношению к СВ î называется СВ î =
î − Ìî ; очевидно, Dî
что Ìî 0 = 0 , Dî0 = 1 . Определение. Коэффициентом корреляции СВ î и ç называется
(î − Ìî )(ç − Ìç ) r (î,ç) = Ì î0 ç0 = Ì . Dî Dç
(
)
Он характеризует меру степени зависимости между СВ î и
ç . СВ î и ç называются некоррелированными, если r (ξ,η) = 0 (cov(ξ, η) = 0). Пример 1.50. Приведем два примера, показывающие, что из равенства нулю коэффициента корреляции двух случайных величин не следует их независимость. 88
1. Пусть вероятностное пространство (Ω, F , P ) представляет собой отрезок [0,1] с σ -алгеброй F борелевских подмножеств и мерой Лебега P . Рассмотрим СВ î и ç , определенные следующим образом:
1 1 1, 0 ≤ ù ≤ 4 , 0, 0 ≤ ù ≤ 2 , 1 1 3 1 î = î(ù ) = − 1, < ù < , ç = ç(ù ) = 1, < ù ≤ , 4 2 4 2 1 3 0 , 2 < ù ≤ 1, − 1, 4 < ù ≤ 1. Найдем их математические ожидания:
1 1 1 1 1 Ìî = 1 ⋅ P ù : 0 ≤ ù ≤ − 1 ⋅ P ù : < ù < = − = 0 , 4 2 4 4 4 3 1 3 1 1 Ìç = 1 ⋅ P ù : < ù ≤ − 1 ⋅ P ù : < ù ≤ 1 = − = 0. 4 2 4 4 4 Очевидно также, что îç= 0 при всех ù ∈ [0,1] . Поэтому
cov(î,ç) = Ì (îç) − ÌîÌç = 0 , т.е. СВ î и ç некоррелированы. Но
эти СВ зависимы, т.к. P{ù :î(ù ) = 1, ç(ù ) = 1} = 0, а P{ù : î(ù ) = 1}P{ù : ç(ù ) = 1} =
1 1 1 , т.е. ⋅ = 4 4 16
P{ù : î(ù ) = 1, ç(ù ) = 1} ≠ P{ù : î(ù ) = 1}P{ù : ç(ù ) = 1}. 2. Рассмотрим теперь две непрерывные СВ î и ç . Пусть СВ − x2 î имеет плотность распределения p î (x ) = Αe , − ∞ < x < +∞ , а ç = î2 . Тогда
cov(î,ç) = Ì (îç) − ÌîÌç = Ìî 3 − ÌîÌî 2 = 89
∞
∫
3 −x2
=Á x e
∞
∫
dx − Á xe − x dx Ì ξ 2 = 0 − 0 Ìî 2 = 0 ,
−∞
2
−∞
т.к. подынтегральные функции в интегралах – нечетные, и, следовательно, cov(î,ç) = r (î,ç) = 0 , т.е. СВ î и ç некоррелированы, в 2 то время как они связаны функциональной зависимостью ç = î . Рассмотрим свойства коэффициента корреляции.
1. r (î,ç) ≤ 1 . Оно выполняется поскольку
(
)
(
( ) + Ì (ç ) ± 2Ì (î ç ) = = 2[1 ± Ì (î ç )]⇒ 1 ± Ì (î ç ) ≥ 0 ⇒ r (î,ç) ≤ 1.
0 ≤ D î0 ± ç0 = Ì î0 ± ç0 0
)
2
= Ì î0
0
0
2
0 2
0
0
0
2. r (î,ç) = ±1 тогда и только тогда, когда î и ç связаны линейной зависимостью. Докажем вначале необходимость. Пусть r (î,ç) = ±1 . Рассмотрим выражение î − Ìî ç − Ìç = 1 ± 2r (î,ç) + 1 = 2[1 ± r (î,ç)]. ± 0≤Ì Dî Dç
Отсюда следует, что если r (î,ç) = ±1 , то î − Ìî ± ç − Ìç = 0 , т.е. Dî Dç
î= $
Dî ç± Ì Dç
Dî + Ìî , Dç
значит, î и ç линейно зависимы. Достаточность следует из того, что, если ç = aî + b, a ≠ 0 , то r (î,ç) =
Ì [(î − Ìî )(ç − Ìç )] Dî Dç
=
aÌ (î − Ìî )
2
a Dî
90
=
1, a > 0 , a = signa = a − 1, a < 0.
3. Если î и ç – независимые СВ, то r (î,ç) = 0 . Обратное утверждение не обязательно, но оно будет справедливо, когда î и ç – нормально распределенные СВ. Важной характеристикой n -мерной СВ является ковариационная матрица Ê = Ê ij ковариационный
n×n
[
(
, где Ê ij = Ì (îi − Ìî i ) î j − Ìî j
момент
СВ
îi
и
îj ;
ясно,
)] – что
Ê ij = Ê ji , Ê ii = Dîi , i,j = 1,n . Нормированной ковариационной (корреляционной) матрицей R называется матрица, элементами которой являются коэффициенты корреляции СВ îi и î j :
Ê ij
, rij = r ji , rii = 1, i, j = 1, n . Dîi Dîj Энтропия. Количество информации. Часто числовыми характеристиками СВ являются функционалы, определяющие различие между двумя распределениями вероятностей. Такое различие необходимо знать, например, если, кроме факта зависимости между двумя СВ, нужно знать, насколько велика эта зависимость. Рассмотрим случай абсолютно непрерывных распределений. В качестве величины, измеряющей степень зависимости двух СВ, R = rij
n×n
, rij =
можно использовать расстояние между распределениями pîç(t, ô) и p î (t )p ç (ô) . Расстояние между двумя распределениями измеряется различными способами. Одним из них является так называемое количество информации Шеннона. Определение. Энтропией называется функционал ∞
Ç (î) = Ì [ln p î (î)] =
∫ ln(p (x ))p (x )dx . î
−∞
î
В физике это мера беспорядка (неопределенности); чем больше неопределенность, тем больше энтропия. 91
Следует отметить, что î может быть и многомерной СВ, т.е. может быть, что Ç (î) = Ç (î1 , î2 , ..., în ) . Определение. Количеством информации Шеннона называется величина É(î,ç ) = − Ç (î) − Ç (ç) + Ç (î,ç) .
В теории информации эта величина означает, что СВ î содержит É(î,ç) информации о СВ ç . Т.к.
p î (x ) =
∞
∞
∫ p (x, y )dy, Ç (î) = ∫ ln(p (x))p (x )dx = îç
î
−∞ ∞
=
∞
∞ ∞
∫ ln p (x ) ∫ p (x, y )dydx = ∫ ∫ ln(p î
−∞
î
−∞
îç
−∞
Ç (ç) =
ξ ( x)
)p
ξη ( x,
y )dy dx ,
− ∞− ∞
∞ ∞
∫ ∫ ln(p (y ))p (x, y )dydx , то ç
îç
− ∞− ∞
É(î,ç) =
∞ pîç(x, y ) dx ln dy. ( ) ( ) p x p y î ç −∞ −∞ ∞
∫ ∫
) = 0 , т.е. никакой инЕсли î и ç – независимые СВ, то É(î,ç формации СВ î не содержит о СВ ç . В этом случае Ç (î,ç) = Ç (î) + Ç (ç) . §7. ФУНКЦИОНАЛЬНЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
Определение. Характеристической функцией СВ î(ù ) называется комплекснозначная функция
92
ϕ î (t ) = Ìe itî(ù ) = e it (ù ) Ñ (dù ) = e itx dFî (x ) ,
∫
∫
Ù
×
где t − действительная переменная. Таким образом, характеристическая функция является преобразованием Фурье–Стилтьеса ф.р. Fî (x ) . Если Fî (x ) – абсолютно непрерывная ф.р., то ϕ î (t ) является обычным преобразованием Фурье плотности распределения p î (x ) : ∞
ϕ î (t ) =
∫e
itx
p î (x )dx ;
−∞
если î – СВ, принимающая значения x0 , x1, ..., xk , ... соответственно с вероятностями p0 , p1, ..., pk , ... , то ∞
ϕ î (t ) = ∑ e itxk p k . k =0
Характеристическая функция существует всегда, т.к.
ϕ î (t ) =
+∞
+∞
−∞
−∞
∫
e itx dFî (x ) ≤
∫
e itx dFî (x ) =
+∞
∫ dF (x ) = 1 , î
−∞
очевидно, что ее можно записать в виде
ϕ î (t ) = Ìe itî = Ì cos(tî) + iÌ sin (tî) . Рассмотрим свойства характеристических функций. 1. ϕ î (0 ) = 1, ϕ î (t ) ≤ 1 . 2. ϕ aξ + b (t ) = Μeit (aξ + b ) = eitbϕ ξ (at ) , где a и b – константы. 3. Пусть î1, î2 , ...,în – независимые CB . Тогда ϕ î1 + î2 + ...+ în (t ) = Ìe it (î1 + î2 + ...+ în ) = Ìe itî1 Ìe itî2 ⋅ ... ⋅ Ìe itîn =
= ϕ î1 (t )ϕ î2 (t )...ϕ în (t ) . 93
4. ϕ î (t ) – равномерно непрерывная функция, т.е. ∀å > 0 ∃ä > 0 , такое, что ϕ î (t + ä) − ϕ î (t ) < å для всех t . k 5. Если Ì î < +∞, k ≥ 1 , то существует непрерывная k -я про-
изводная характеристической функции ϕ î (t ) и
ϕ î(k ) (0 ) = i k Ìî k . Поясним это свойство. Т.к. +∞
∫ ix e
itx
dFî (x ) ≤
−∞ +∞
то интеграл
∫ ix e
itx
+∞
∫ x dF (x) = Ì î
î < +∞ ,
−∞
dFî (x ) сходится равномерно относительно t ,
−∞
поэтому возможно дифференцирование под знаком интеграла и +∞
ϕ 'î (t ) = i ∫ xe itx dFî (x ) , т.е. ϕ 'î (0 ) = iÌ ξ ; −∞
далее доказательство можно провести по индукции. k
Из этого свойства вытекает, в частности, что, если Ì î < +∞ , в окрестности точки t = 0 справедливо разложение функции ϕ î (t ) в ряд:
( )
k
i j Ìî j j t + 0 tk . j ! j =1
ϕ î (t ) = 1 + ∑
6. ϕ ξ (t ) = ϕ ξ (− t ) = ϕ −ξ (t ) , где ϕ î (t ) – функция, комплексно сопряженная функции ϕ î (t ) . Отсюда следует, что, если Fî (x ) = 1 − Fî (− x ) (или, что для непрерывной СВ эквивалентно
тому, что плотность распределения p î (x ) симметрична относительно нуля), характеристическая функция является действительной.
94
Пример 1.51. Найдем характеристическую функцию СВ, распределенной по нормальному закону. Рассмотрим вначале случай стандартного нормального распределения, когда a = 0, σ 2 = 1 . В этом случае x2
1 −2 1 pξ (x ) = e , ϕ ξ (t ) = 2π 2π
∞
∫e
itx −
x2 2
dx .
−∞
Продифференцировав функцию ϕ î (t ) по t (см. свойство 5), получим:
ϕ'î
(t ) =
=−
+∞
1 2ð i
2ð
∫
ix e
itx −
x2 2
−∞
itx
e e
−
x2 2
− x2 dx = − e d e 2 2ð − ∞
+∞
− −∞
+∞
t 2ð
∫e
=
+∞
i
∫
itx −
x2 2
itx
dx = −tϕ î (t ) ,
−∞
откуда следует, что d (ln ϕ î (t )) = −t, ln ϕ î (t ) = −c1
ϕ î (t ) = ce
−
t2 2
−
t2 , т.е. 2
t2 2
. Поскольку ϕ î (0 ) = 1 , то c = 1 и ϕ î (t ) = e . Если СВ î имеет нормальное распределение с произвольны-
ми параметрами a, σ 2 , то СВ η =
ξ −a является нормированной σ
по отношению к ней, Ìç = 0, Dç = 1 , и ξ = σ η + a . Тогда, поскольку ϕση = e
−
(σ t )2 2
, то
ϕ ξ (t ) = Μe = e Μe itξ
ita
itση
95
=e e ita
−
σ 2t 2 2
=e
ita −
σ 2t 2 2
.
Пример 1.52. Найдем характеристическую функцию дискретной СВ, распределенной по закону Пуассона. Используя свойство 8 для математического ожидания (см. п.1.6), имеем ∞
ëk − ë , e k!
ϕ î (t ) = ∑ e itk k =0
поэтому ∞
ëk − ë e = ië e it k ! k =0 откуда следует, что
ϕ 'î (t ) = i ∑ ke itk
∞
∑
e it (k −1)
k =1
ëk −1 − ë e = iëe it ϕ î (t ) , (k − 1)!
t ϕ î (t ) = c expië∫ e ix dx = c exp ë e it − 1 . 0
[(
)]
Т.к. ϕ î (0 ) = 1 , то c = 1 , таким образом,
[(
)]
ϕ î (t ) = exp ë e it − 1 . Пример 1.53. Выяснить, является ли функция f (t ) = e −t характеристической функцией. 4
Решение. Найдем первую и вторую производные функции f (t )
(
)
4 4 ϕ 'î (t ) = −4t 3 e −t , ϕ "î (t ) = 4t 2 e − t 4t 4 − 3 . Поскольку из свойства 5 дисперсии следует, что
[
]
2 Dî = Ìî 2 − (Ìî ) = −ϕ "î (0) + ϕ î' (0 ) , то дисперсия нашей СВ дол2
жна была бы равняться нулю. Но тогда Ñ (î = const ) = 1 , т.е. f (t ) – характеристическая функция вырожденного распределения, и, согласно определению, по модулю должна равняться единице, что противоречит условию задачи. Характеристическая функция многомерной СВ определяется следующим образом
96
n
ϕ î1î2...în (t1, t 2 , ..., t n ) = Ìe
i
∑ tk îk k =1
n
=
∫e
i
∑ tk xk k =1
dFî1î2...în (x1, x2 , ..., xn ) .
×n
Приведем для нее свойство, аналогичное свойству 5 характеристических функций одномерных СВ:
∂ ϕ ξm1ξ 2 ...ξ n (t1,t2 ,...,tn ) ∂
t1k1
∂
t2k 2 ...
∂
tnk n
(
)
= i m Μ ξ1k1 ξ 2k 2 ...ξ nk n , t` 1 = t 2 = ...= t n = 0
где m = k1 + k 2 + ... + k n . Рассмотрим одну важную теорему. Теорема 1.10 (об обращении характеристической функции). Если Fî (x) – ф.р. СВ î , ϕ î (t ) – ее характеристическая функция, то для любых точек непрерывности x и y функции Fî (x ) :
∫(
)
ô
1 1 e −itx − e −ity ϕ î (t ) dt . ô→ ∞ 2ð it −ô
Fξ ( y ) − Fξ (x ) = lim
Если Fî (x ) – абсолютно непрерывная функция, то это соотношение легко получить из обычной формулы обратного преобразования Фурье
p î (x ) = поскольку Fî (y ) − Fî (x ) =
y
∫
+∞
1 e −itx ϕ î (t )dt , 2ð − ∞
∫
p î (z )dz =
x
+∞
=
1 2ð
+∞
y
y +∞
∫ ∫e
− itx
ϕ î (t )dtdz =
x −∞
(
)
1 1 1 ϕ î (t ) e −itz dzdt = ϕ î (t ) e −itx − e −ity dt . it 2ð −∞ 2ð − ∞ x
∫
∫
∫
97
Из этой теоремы вытекает теорема единственности: характеристическая функция СВ î однозначно определяет ее ф.р. Когда СВ î является целочисленной, т.е. множество ее значений – числа натурального ряда, то характеристическая функция является функцией z = e it и, согласно свойству 8 для математического ожидания (см. п.1.6), имеем вид ∞
ϕ î (t ) = ø î (z ) = Ìz î = ∑ z k p k , k =0
где pk = Ñ (î = k ), k = 0 ,1, 2, ... . Определение. Функция
ø î (z ) = p 0 + p1 z + p 2 z 2 + ... + p k z k + ..., z ≤ 1 , называется производящей функцией СВ î . Пример 1.54. Пусть СВ î имеет геометрическое распределение, в этом случае pk = p(1 − p ) , k = 0 ,1, 2, ..., 0 < p < 1 , поэтому k
ø î (z ) =
∞
∑ z p(1 − p ) k
k
=p
k =0
∞
∑ [(1 − p )z ] k =0
k
=
p . 1 − (1 − p )z
Она имеет следующие свойства. 1. Функция ø î (z ) = ϕ î (t ) , рассматриваемая как функция аргумента t , является периодичной с периодом 2ð , поэтому достаточно знать поведение ø î (z ) на окружности z = 1 , чтобы полностью описать все свойства ϕ î (t ) . 2. Из определения следует, что
ø î (0) = p 0 , ø î (1) = p 0 + p1 + ... + p k + ... = 1 . 3. По значениям ø î (z ) однозначно определяются вероятности p 0 , p1 , ..., p k , ... . Например,
98
p1 =
p2 =
dø î (z ) dz
[
]
= p1 + 2 p 2 z + ... + kp k z k −1 + ... z = 0 , z =0
2 1 d ø î (z ) 1 = p 2 + 6 p 3 z + ... + k (k − 1) p k z k − 2 + ... z =0 , 2 2 dz z = 0 2
[
]
общее выражение имеет вид
pk =
1 dk k ø î (z ) , k = 0,1, 2 , ... k ! dz z =0
4. Если Ì î < +∞ , то
dø î (z ) dz
z =1
∞ ∞ = kz k −1 p k = kp k = Ìî , z =1 k =0 k =0
∑
∑
d 2 ø î (z ) ∞ k −2 = − ( ) k k z p 1 = k 2 dz z =1 k =1 z =1 в общем случае
∑
∞
∑ k (k − 1)p
k
= Ì [î(î − 1)] ,
k =1
dk , если Ì î k < +∞ . k ø î (z ) = Ì [î(î − 1)...(î − k + 1)] z =1 dz 5. Пусть î1, î2 , ..., în – целочисленные независимые одинаково распределенные СВ, ç – независимая от них целочисленная СВ,
Ì î < +∞ , Ì η < +∞ , ô = î1 + î2 + ... + în (т.е. ô является суммой случайного числа СВ). Тогда поскольку
[
]
ø ô (z ) = ø ç ø î1 (z ) , ø ô (z ) = Ìz ô =
∑ Ì (z ∞
k =0
99
ô
)
/ç = k =
=
∞
∑ Ìz
î1 + î2 + ...+ îk
Ñ (ç = k )Ìz î1 + î2 + ...+ îk Ñ (ç = k ) =
k =0
∞
∑ Ìz
î1
Ìz î2 ⋅ ... ⋅ Ìz îk Ñ (ç = k ) =
k =0
=
∑ [ø (z )] Ñ(ç = k ) =ø [ø (z )]. ∞
k =0
k
î1
ç
î1
6. Пусть î и ç – независимые СВ. Тогда
ø î+ ç (z ) = Ìz î+ ç = Ìz î Ìz ç = ø î (z )ø ç (z ) . Пример 1.55. Найти распределение вероятностей, которому соответствует производящая функция 1− z ln (1 − z ). z Решение. Разложим производящую функцию в ряд по степеням z: ø î (z ) = 1 +
ø î (z ) = 1 + = 1−
1 z
∞
∑ k =1
1 ln (1 − z ) − ln (1 − z ) = z
∞ ∞ ∞ zk zk zk zk + = 1− + = k k =1 k k =0 k + 1 k =1 k
∑
∑
∑
∞
1 k 1 z = − k +1 k =1 k
∑
∞
∑ k =1
zk . k (k + 1)
Таким образом, функция ø î (z ) является производящей функцией СВ, которая может принимать целые положительные значения 1,2 ,...,k,... и
pk = Ñ (î = k ) =
1 , k = 1, 2 , ... . k (k + 1)
§8. СХОДИМОСТЬ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Со сходимостью случайных последовательностей в теории вероятностей связан ряд классических результатов, рассматриваемых в данном параграфе.
100
Определение. Последовательность CB {îk (ù ), k = 1, 2 , ...} сходится
к
CB
î(ù )
по
вероятности
(обозначается
P
→ î(ù )), если îk (ù ) k →∞ ∀ε > 0 lim P{ω : ξ k (ω) − ξ (ω) ≥ ε}= 0 . k →∞
Существует еще несколько типов сходимости случайных последовательностей: – сходимость почти наверное (п.н.) (с вероятностью 1):
ξ k (ω )
п. н. P =1 ξ (ω) ξ k (ω ) ξ (ω) , если → ∞ k →∞ k
{
}
P ù : lim îk (ù ) = î(ù ) = 1 ; k →∞
можно показать, что это соотношение эквивалентно следующему
{ù : în (k ) − î(ù ) ≥ å} = 0 ; P k ≥1 n ≥ k – сходимость в среднем порядка r (предполагается, что
"!
Ì îk (ù ) < +∞ ): r
{
}
r ср. п. r Μ ξ k (ω) − ξ (ω) = 0 ; î(ù ) , если klim →∞ k →∞ если r = 1 , то имеем сходимость в среднем; если r = 2 – то сходимость в среднем квадратичном, которая записывается в виде
îk (ù )
l.i.m. ξ k (ω) = ξ (k ) (limit in the mean); k →∞
– сходимость по распределению (слабая сходимость): îk (ù )
D Fîk (x ) = Fî (x ) во всех точках неî(ù ) , если klim →∞ k →∞
прерывности ф.р. Fî (x ) .
101
Пример 1.56. Пусть î(ù ) – CB, îk (ù ) = min{î(ù ), k }. Докажем, что последовательность CB {îk (ù )}, k = 1, 2 , ... , сходится к CB î(ù ) почти наверное. Имеем: P{ù : îk (ù ) = î(ù ), k ≥ N } = P{ù : min{î(ù ), k } = î(ù ), k ≥ N } = = P{ù : î(ù ) ≤ N }.
Вместе с тем при любом конкретном ù , если
îk (ù ) = î(ù ), k ≥ N , то îk (ù ) k → î(ù ) , т.е. →∞
{ù : îk (ù ) = î(ù ), k ≥ N } ⊆ {ù : îk (ù ) → î(ù )}. k →∞
Поэтому
{
}
→ î(ù ) ≥ P{ù : îk (ù ) = î(ù ), k ≥ N } = P ù : îk (ù ) k →∞ = P{ù : î(ù ) ≤ N } = Fî (N ). Далее, т.к. lim Fî (N ) = 1 и вероятность случайного события N →∞
не может быть больше единицы, то, устремив N к ∞ , получаем P ù : î (ù ) → î(ù ) = 1 .
{
k
k →∞
}
Пример 1.57. Пусть на вероятностном пространстве
(Ω, F , P ) , где
Ù = [0 ,1], F – σ -алгебра борелевских множеств на Ù , P – мера Лебега, задана CB 1 1 k α , ù ∈ 0 , , k îk (ù ) = 0 , ù ∉ 0 , 1 . k
102
á
Поскольку Ì îk (ù )
á
1 1 1 = k α P ù : ù ∈ 0, = k ⋅ = 1 , то k k
последовательность {îk (ù ), k = 1, 2 , ...} не сходится к нулю в среднем порядка α . Для любых видов сходимости в математике существуют критерии типа Коши. Приведем такие критерии для некоторых типов сходимости случайных последовательностей. Например, для того чтобы îk (ù )
ср.п. r î(ù ) , необходимо и достаточно, чтобы посk →∞
ледовательность {îk (ù ), k = 1, 2 , ...} была фундаментальной в среднем порядка r , т.е.
{
Ì îk (ù ) − în (ù ) Аналогично: P
→ î(ù ) ⇔ ∀å > 0 îk (ù ) k →∞
r
}→ 0 . k, n→∞
lim P{ù : îk (ù ) − în (ù ) > å}= 0 ,
k, n→∞
п.н. → î(ù ) ⇔ ∀å > 0 P ù : sup îk + n (ù ) − îk (ù ) > å = 0 . îk (ù ) k ←∞ k ≥1 n≥0 Теорема 1.11 (достаточный признак сходимости почти
"
наверное). Если ∀å > 0 с вероятностью 1 происходит лишь конечное число событий
Ák (å) = {ù : îk (ù ) − î(ù ) ≥ å}, k = 1, 2 , ... , п.н.
то î (ù ) → î(ù ) . k л→∞
103
Приведем краткое доказательство теоремы. Пусть å =
1 Â и n – n
1 событие, заключающееся в том, что число событий Ák являетn
ся конечным. Очевидно, что Â1 ⊇ Â2 ⊇ ... ⊇ Ân ⊇ ... , и по аксиоме непрерывности для Â =
∞
"Â
n
имеем Ñ (Â ) = lim Ñ (Ân ) . Но n→∞
n =1
P (Ân ) = 1 ∀n > 0 , поэтому P(Â ) = 1 и
P {число событий Ák (0) = {ù : îk (ù ) − î(ù ) > 0} – конечно} = 1 ,
{
}
следовательно, P ω : lim ξ k (ω ) = ξ (ω) = 1 . k →∞
При исследовании сходимости случайных последовательностей часто используется следующая лемма. Лемма Бореля–Кантелли (закон нуля и единицы). Пусть {Ák , k = 1, 2, ...} – последовательность случайных событий, заданных на вероятностном пространстве (Ω, F , P ) , Á – событие, заключающееся в том, что произойдет бесчисленное множество событий Ák , т.е. Α =
∞
∞
"! Α
k
. Тогда:
n =1 k = n
∞
а) если
∑ P(Á ) < +∞ , то P(Á) = 0 , k
k =1 ∞
б) если
∑ P(Á ) = +∞ и события k
k =1
Ák , k = 1, 2, ... , независимы
в совокупности, то P (Á ) = 1 . Часть а) данной леммы, например, вытекает из того, что
104
∞ ∞ → 0 . Ák ∀n ≥ 1 , P (Á) ≤ P Ák ≤ P (Ák ) n→∞ k =n k =n k =n Теорема 1.12 (о связи между сходимостью в среднем квадÁ⊆
∞
!
∑
!
ратичном и почти наверное). Если îk (ù ) но быстро, в том смысле, что
ср.кв. î(ù ) достаточk →∞
∑ Ì { î (ù ) − î(ù ) }< +∞ , ∞
2
k
k =1
п.н. î(ù ) . k →∞ Для доказательства теоремы можно воспользоваться неравенством Чебышева, из которого следует, что то îk (ù )
P (Ák (å)) ≤ поэтому
{
}
2 1 Ì îk (ù ) − î(ù ) , 2 å
∑ P(Á (å)) ≤ å ∑ Ì { î (ù ) − î(ù ) }< +∞ . ∞
1
k
2
k =1
∞
2
k
k =1
Таким образом, по лемме Бореля–Кантелли, при этом с вероятностью 1 происходит лишь конечное число событий Ák (å) , откуда следует, что п.н.
→ î(ù ) . îk (ù ) k →∞ Для рассмотрения очень важного критерия сходимости в среднем квадратичном нам понадобится следующая лемма. Лемма. Пусть ср.кв. ср.кв. → î(ù ), çn (ù ) → ç(ù ) . îk (ù )
Тогда
k →∞
n→∞
105
→ Ì {î(ù )ç(ù )}. Ì {îk (ù )în (ù )} k, n→∞ Доказательство ее следует из соотношения
Ì {îk (ù ) çn (ù ) − î(ù ) ç(ù )} = Ì {[îk (ù ) − î(ù )][çn (ù ) − ç(ù )]}+
+ Ì {[îk (ù ) − î(ù )] ç(ù )}+ Ì {[çn (ù ) − ç(ù )]î(ù )} и неравенства Шварца для математических ожиданий, которое используется для каждого слагаемого в правой части этого соотношения, например, Ì [îk (ù ) − î(ù )] [çn (ù ) − ç(ù )] ≤ 2
≤ Ì [îk (ù ) − î(ù )] Ì [çn (ù ) − ç(ù )] k,n → →0 ⇒ ∞ 2
2
⇒ Ì {[îk (ù ) − î(ù )] [çn (ù ) − ç(ù )]} k, → 0. n →∞
Теорема 1.13 (критерий сходимости в среднем квадратичном). Для того чтобы последовательность {îk (ù ), k = 1, 2, ...} сходилась в среднем квадратичном к некоторой CB, необходимо и достаточно, чтобы существовал предел
lim Ì {îk (ù )în (ù )} = Α < +∞ .
k, n→∞
ср.кв.
→ î(ù ) . Положим Докажем необходимость. Пусть îk (ù ) k →∞ çn (ù ) = în (ù ), тогда, по лемме, будем иметь
→ Ìî 2 (ù ) Ì {îk (ù )çn (ù )} = Ì {îk (ù )în (ù )} k, n→∞ 2 и в качестве Á можно взять Ìî (ù ) .
Достаточность. Пусть ∃ lim Ì {îk (ù )în (ù )} = Á . Тогда k, n→∞
Ì {îk (ù ) − în (ù )}2 = , = Ìî k2 (ù ) + Ìç n2 (ù ) − 2Ì {îk (ù )çn (ù )} → Á + Á − 2 Á = 0 , k, n → ∞
106
следовательно, последовательность {îk (ù ), k = 1, 2, ...} является фундаментальной в среднем квадратичном и поэтому сходится в этом смысле. Рассмотрим непосредственные соотношения между различными типами сходимости случайных последовательностей. Очевидно, что
P {ù : în (ù ) − î(ù ) ≥ å} ≥ P{ù : îk (ù ) − î(ù ) ≥ å}, n≥k откуда вытекает, что из сходимости почти наверное следует сходимость по вероятности. Используя неравенства Чебышева и Ляпунова для математических ожиданий, получаем, что
!
P{ω : ξ k (ω) − ξ (ω) ≥ ε}≤ ≤
(
)
1
(
1 Μ ξ k (ω) − ξ (ω) ≤ ε
)
1
1 1 r q Μ ξ k (ω) − ξ (ω) r ≤ Μ ξ k (ω) − ξ (ω) q ∀ε > 0 , q > r > 1. ε ε Поэтому из сходимости в среднем порядка q следует сходи-
мость в среднем порядка r < q , в частности, сходимость в среднем; из сходимости в среднем следует сходимость по вероятности. Пример 1.58. Покажем, что из сходимости по вероятности следует сходимость по распределению. P
→ î(ù ) и x – точка непрерывности ф.р. Fî (x ) . Пусть îk (ù ) k →∞ Тогда ∀ ε > 0 имеем
Fîk (x ) = P{ù : îk (ù ) ≤ x} = P{ù : îk (ù ) ≤ x, îk (ù ) − î(ù ) ≤ å}+ + P{ù : îk (ù ) ≤ x, îk (ù ) − î(ù ) > å}.
Если îk (ù ) ≤ x, îk (ù ) − î(ù ) ≤ å, то î(ù ) ≤ x + å, и поэтому Fîk (x ) ≤ P{ù : î(ù ) ≤ x + å}+ P{ù : îk (ù ) − î(ù ) > å}.
107
Аналогично
(ù ) ≤ x, îk (ù ) − î(ù ) ≤ å}≥ Fîk (x ) ≥ P{ù : k î ≥ P{ù : (ù î ) + å ≤ x, îk (ù ) − î(ù ) ≤ å}≥
≥ P{ù : (ù î ) ≤ x − å}− P{ù :îk (ù ) − î(ù ) > å}. Переходя в полученных неравенствах к пределу при k → ∞ с учетом того, что lim P{ù : îk (ù ) − î(ù ) > å}= 0 , будем иметь k →∞
Fî (x − å) ≤ lim Fîk (x ) ≤ Fî (x + å) . k →∞
Взяв предел при å → 0 , получим требуемый результат. Соотношение между различными типами сходимости случайных последовательностей можно отобразить на следующей схеме (рис. 14). ср.п.q
q> r
→ ξ (ω ) ⇒ ξ k (ω) k →∞
ср.п.r
→ î(ù ) îk (ù ) k →∞
⇓ P
→ î(ù ) →∞ îk (ù ) k → î(ù ) ⇒ îk (ù ) k →∞ п. н.
⇒
ср.п.r
→ î(ù ) îk (ù ) k →∞
Рис. 14
§ 9. ЗАКОН БОЛЬШИХ ЧИСЕЛ
С законом больших чисел в форме Бернулли мы познакомились в §3. Из приведенного там утверждения следует, что доля успешных испытаний из n независимых испытаний Бернулли при n → ∞ приближается к вероятности одного успешного испытания (частота появления события стремится к вероятности данного события). P 1 n (îk (ù ) − a k ) n →0 , где →∞ n k =1 a k = Ìî k (ù ) , то говорят, что для последовательности CB {ξ k (ω), k = 1, 2, ...} выполняется закон больших чисел.
Определение.
Если
∑
108
Используя определение сходимости по вероятности, получаем, что в этом случае
1 lim Ρ ω : n →∞ n или, что то же самое,
n
∑ (ξ (ω) − a ) ≥ ε = 0 , k
k
k =1
1 n ( lim Ρ ω : ξ k (ω) − ak ) < ε = 1 . n →∞ n k =1 Пример 1.59 (закон больших чисел в форме Чебышева). Пусть
∑
CB ξ1 (ω ), ξ 2 (ω ),... независимы и имеют одинаковые математические ожидания Ìî k (ù ) = a и дисперсии Dξ k (ω ) = σ 2 . Тогда для них имеет место закон больших чисел, т.е. 1 n lim Ρ ω : ξ k (ω ) − a < ε = 1 . n →∞ n k =1 Это вытекает из неравенства Чебышева для дисперсий, из которого следует, что
∑
1 n D ξ k (ω ) n 2 2 n 1 = 1 ⋅ nσ = σ . Ρ ω : ξ k (ω) − a ≥ ε ≤ k =12 n k =1 ε n2 ε2 nε 2 Отметим, что аналогичный результат имеет место и в случае,
∑
∑
когда CB ξ1 (ω ), ξ 2 (ω), ... независимы, одинаково распределены и имеют конечное математическое ожидание (теорема Хинчина). Смысл закона больших чисел состоит в том, что среднее арифметическое CB ξ1 (ω), ξ 2 (ω ), ..., ξ n (ω) при достаточно большом n будет с большой вероятностью почти не отличаться от
1 n
n
∑ Ìî (ù ) , или, в частности, от a . k
k =1
109
В экспериментальных науках среднее арифметическое
1 n xk результатов x1, x2 , ..., xn измерений некоторой величиn k =1 ны a рассматривают как более точное приближение к истинному значению a этой величины по сравнению с отдельным измерением. Вероятностная модель измерений дается последовательностью x=
∑
CB ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω ) . Если измерения не содержат систематической ошибки, т.е. отклонение xi − a объясняется чисто случайными погрешностями, то следует предположить, что Ì (îk (ù ) − a ) = 0 , т.е. Μξ k (ω) = a, k = 1, n . Если к тому же измере-
ния независимы и одинаково точны, т.е. Dξ k (ω) = σ 2 , k = 1, n , то закон больших чисел позволяет объяснить экспериментально на-
блюдаемую закономерность о стабилизации с ростом n средних арифметических x вблизи a . Качество приближения к a оценки S (x1, x2 , ..., xn ) = x при конечных n можно характеризовать неравенством Чебышева DS σ 2 , = 2 ε2 nε оценивающим степень конкретизации распределения вероятносP{ω : S (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) − a ≥ ε}≤
тей CB S (ξ1 (ω ), ξ 2 (ω ), ..., ξ n (ω )) вокруг точки a . Таким образом, точность приближения S (x1, x2 , ..., xn ) = x ≈ a можно оценивать одним числом – дисперсией DS. С помощью закона больших чисел в форме Чебышева можно легко доказать утверждение для схемы Бернулли, приведенное в начале параграфа. Именно, пусть
1, если k − e испытание успешно, ξ k (ω) = 0, если k − e испытание неудачно, 110
n
p – вероятность успеха в отдельном испытании. Тогда
∑ î (ù ) – k
k =1
число успехов в n испытаниях, а
1 n ξ k (ω) – доля успехов в n n k =1
∑
Μξ k (ω ) = p
испытаниях. Поскольку
и
îk2 (ù ) = îk (ù ) , то
Ìî k2 (ù ) = p , и поэтому Dîk (ù ) = p − p 2 . Легко проверить, что p − p2 ≤
1 , таким образом, 4
1 n → 0 . ξ k (ω) − p ≥ ε P ω : →∞ n k =1 n Приведем результаты, связанные с выполнением закона больших чисел в более общих ситуациях. Теорема 1.14. Для того чтобы для последовательности CB
∑
{ξ k (ω ), k = 1, 2, ...} (они могут быть и зависимыми) выполнялся закон больших чисел, необходимо и достаточно, чтобы 2 n (îk (ù ) − a k ) k =1 =0. lim Ì 2 n →∞ n 2 n + (îk (ù ) − a k ) k =1
∑
∑
Доказательство.
çn (ù ) =
1 n
Необходимость.
n
∑ (î (ù ) − a ) . Тогда k
k
k =1
111
Пусть
∞
y2 y2 = ( ) P{ω: ηn (ω ) ≥ ε}= dFηn ( y ) ≥ dF y dFηn ( y ) − η n 1+ y2 1+ y2 −∞ y ≥ε y ≥ε
∫
−
∫
ηn2 (ω ) y2 ( ) ≥ dF y Μ ηn 2 1 + η 2 (ω) − + 1 y n y <ε
∫
∫
η 2 (ω ) 2 −ε . y 2 dFηn ( y ) ≥ Μ n 2 ( ) + 1 η ω n y <ε
∫
Отсюда следует, что
η 2 (ω) 2 ≤ ε + P{ω : ηn (ω) ≥ ε}. 0 ≤ Μ n 2 + η ω 1 ( ) n В необходимости нам дано, что lim P{ω : ηn (ω ) ≥ ε}= 0 . Поэтоn →∞
му, если выбрать ε достаточно малым, а n достаточно большим, мы можем сделать правую часть неравенства сколь угодно малой.
çn2 (ù ) = 0 . Поскольку Ì lim Достаточность. Нам дано, что n →∞ 2 1 + çn (ù ) P{ù : çn (ù ) ≥ å}=
∫
dFçn ( y ) ≤
y ≥å
1 + å2 ≤ 2 å
1 + å2 å2
y2 dFçn ( y ) ≤ 1+ y2 y ≥å
∫
2 y2 1 + å2 çn (ù ) , dFçn ( y ) = 2 Ì 2 å 1+ y2 1 + çn (ù ) −∞ ∞
∫
то lim P{ù:çn (ù ) ≥ å}= 0 . n →∞ Рассмотрим следствия из этой теоремы. Теорема Маркова. Если
n D îk (ù ) k =1 = 0, lim 2 n →∞ n то имеет место закон больших чисел.
∑
112
Это вытекает из соотношения
çn2 (ù ) . 1 n 2 ( ) ( ) = ≥ D î ù Ìç ù Ì k n 1 + ç2 (ù ) n 2 k =1 n Теорема Чебышева. Если последовательность независимых
∑
CB {ξ k (ω), k = 1, 2 , ...} (не обязательно одинаково распределенных) такова, что Dξ k (ω ) ≤ c, k = 1, 2, ... , где c – некоторая константа, то имеет место закон больших чисел. Это следует из теоремы Маркова и независимости CB, поскольку
1 1 n D îk (ù ) = 2 2 n k =1 n
∑
n
c
∑ Dî (ù ) ≤ n . k
k =1
Пример 1.60. Пусть {ξ k (ω ), k = 1, 2 , ...} – последовательность независимых CB и
{
}
P ω : ξ k (ω) = ±2 k = 2 − (2 k +1) , P{ω : ξ k (ω ) = 0} = 1 − 2 −2 k . В данном случае Μξ k (ω) =
2k 2 2 k +1
−
2k 2 2 k +1
=
22 k 1 1 1 − = 0, Μξ k2 (ω) = 2 k +1 = , 2 2 2 2
1 , и из теоремы Чебышева следует, что эта пос2 ледовательность удовлетворяет закону больших чисел. Приведем вспомогательное неравенство, известное как неравен-
поэтому Dîk (ù ) =
ство Гаека–Реньи: пусть {ξ k (ω ), k = 1, 2 , ...} последовательность независимых CB, Μξ k (ω) = ak , Dξ k (ω) = σ k2 , k = 1, 2 , ... . Если c1, c2 , ... – невозрастающая последовательность неотрицательных чисел, то для любых целых m и n , таких, что m < n, и ∀ ε > 0 ,
P ω : max ck m ≤ k ≤ n
k
1 2 c 2 m
∑ (ξ (ω) − a ) ≥ ε ≤ ε i
i =1
i
113
m
∑σ i =1
2 i
+
n
∑c σ
i = m +1
2 i
2 i
.
Теорема 1.15 (усиленный закон больших чисел в форме Колмогорова). Пусть {ξ k (ω ), k = 1, 2 , ...} – последовательность незави∞
σ k2 < ∞ . Тогда для нее выполняется усиленный закон ∑ 2 k =1 k больших чисел, т.е.
симых CB
п.н. 1 n (îk (ù ) − a k ) n→∞ →0 n k =1 (в отличие от закона больших чисел здесь вместо сходимости по вероятности рассматривается сходимость почти наверное).
∑
Доказательство. В неравенстве Гаека–Реньи положим c k =
1 k
и, т.к. оно справедливо ∀ n , то 1 P ω : max ≤ m k k
k
i =1
∑ (ξi (ω) − ai ) ≥ ε ≤ ∞
1 1 ε 2 m 2
m
∑ i =1
σ i2 +
σ i2 . 2 i = m +1 i ∞
∑
σi σ2 = 0 . В связи с этим, устПоскольку ∑ 2i < ∞ , то mlim ∑ 2 →∞ i i = + 1 i m i =1 ремляя m к ∞ , получаем ∞
2
1 k ( lim P ω : max ξ i (ω ) − ai ) ≥ ε = 0 , m→ ∞ m≤ k k i =1 что и доказывает теорему. Аналогом теоремы Хинчина для закона больших чисел является следующее утверждение.
∑
Теорема 1.16 (Колмогорова). Пусть {ξ k (ω ), k = 1, 2 , ...} – последовательность независимых одинаково распределенных CB. Для выполнения усиленного закона больших чисел необходимо и достаточно существования у CB конечного математического ожидания.
114
Пример 1.61. Вернемся к схеме независимых испытаний Бернулли. Пусть νn (ω) – число успехов в n испытаниях Бернулли с вероятностью успеха p . Тогда, как рассмотрено выше,
ín (ù ) =
n
∑ î (ù ) , где ξ (ω), k = 1, n – независимые одинаково расk
k
k =1
пределенные CB, P{ω : ξ k (ω ) = 1}= p, P{ω : ξ k (ω ) = 0} = 1 − p . Поскольку Mξ (ω ) = p, k = 1, n , то ín (ù ) п.н. n → p . →∞ n § 10. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
В данном параграфе рассмотрим группу предельных теорем теории вероятностей, устанавливающих сходимость законов распределения для последовательностей сумм случайных величин. Эта группа теорем ввиду ее особой важности, как для теории, так и для приложений, носит название центральной предельной теоремы. Две из таких теорем, а именно, теоремы Муавра–Лапласа, мы рассматривали в §3. Они являются частными случаями более общих теорем, которые мы ниже рассмотрим. Теорема 1.17 (Линдеберга). Если последовательность независимых CB ξ1 (ω ), ξ 2 (ω ), ... при любых ô > 0 удовлетворяет условию Линдеберга
1 n→∞ Â 2 n lim
n
∑ ∫ (x − a ) dF (x ) = 0 , 2
k
k =1 x − ak > ôÂn
îk
n где Fîk (x ) – ф.р. CB ξ k (ω), ak = Μξ k (ω), Βn2 = D ξ k (ω) , то при k =1 равномерно относительно n→∞ x
∑
115
2
x t − 1 n 1 2 dt . (ξ k (ω) − ak ) < x → P ω : e n →∞ 2π − ∞ Βn k =1 Теорему Линдеберга используют в основном в теоретических работах, требующих большой общности рассмотрения. В приложениях чаще применяют теорему Ляпунова, условия которой проверяются более эффективно. Теорема 1.18 (Ляпунова). Если для последовательности не-
∑
∫
зависимых CB ξ1 (ω ), ξ 2 (ω ), ... можно подобрать такое ä > 0 , что n
1
∑ Ì î (ù ) − a k
 n2 + ä k =1
2+ä k
n → 0 , →∞
то справедлива центральная предельная теорема. Для ее доказательства достаточно показать, что из условия Ляпунова вытекает условие Линдеберга. Если x − ak > τΒn , то δ
x − ak τ δ Βnδ
поэтому 1 Â n2 ≤
n
>1,
n
1 ∑ ∫ (x − a ) dF (x ) ≤ ô Â ∑ ∫ x − a 2
k
k =1 x − ak > ôÂn
1 ä 2+ä ô Ân
n
∞
∑ ∫ x−a k =1 − ∞
2+ä k
îk
dFîk (x ) =
ä
2+ä k =1 x − a k > ôÂn n
1 ä 2+ä ô Ân
n
∑ Ì î (ù ) − a k
k =1
2+ä
dFîk (x ) ≤
2+ ä
n → 0 →∞
k
k
т.е. действительно из условия Ляпунова следует условие Линдеберга. Пример 1.62. Пусть CB ξ1 (ω ), ξ 2 (ω ), ... независимы и
Ìî k (ù ) = 0 , Ì ξ k2 = σ k2 , 0 < σ k2 < ∞, Ì îk (ù ) < ∞, k = 1, 2 , ... . 3
(
)
1
2 2 2 Тогда Βn = σ 1 + σ 2 + ... + σ n 2 . Предположим, что выполнено условие Ляпунова
116
1 n 3 →0 . Ì îk (ù ) n →∞ 3 Â n k =1 Воспользуемся неравенством Ляпунова для математического ожидания
∑
(Μ ξ (ω) ) ≤ (Μ ξ (ω) ) k
1 s s
t
k
из которого вытекает, что
(
1 t,
0<s
)
3
3 σ k3 = Μξ k2 (ω) 2 ≤ Μ ξ k (ω ) ,
и поэтому
1 1 max σ k3 ≤ 3 3 k ≤n Βn Βn
n
∑σ k =1
3 k
→ 0 . n→∞
Но т.к. σ k < Βn , k = 1, n , то 1 max σ k2 → 0 , 2 k ≤n n →∞ Βn а из этого соотношения следует условие Линдеберга, т.е. в данном случае справедлива центральная предельная теорема. Нужно отметить, что, если все ξ k (ω ), k = 1, 2, ... , независимы и одинаково распределены, Dξ k (ω ) = σ 2 < ∞, k = 1, 2 , ... , условие Линдеберга также выполняется и n îk (ù ) − na x t2 − 1 k =1 < x → e 2 dt . P ù : n→∞ σ n 2ð − ∞ Практический смысл центральной предельной теоремы состоит в следующем: если некоторый процесс происходит под воздействием большого числа независимо действующих случайных факторов, каждый из которых лишь очень мало изменяет ход процесса, то распределение суммарного действия этих случайных факторов можно очень близко аппроксимировать нормальным законом.
∑
∫
117
Пример 1.63. Нагрузка потребительской сети (телефонной, информационной, электрической и т.п.) в данный момент времени является результатом суммирования большого числа элементарных нагрузок, вносимых индивидуальными потребителями. Поскольку случайности, определяющие поведение потребителей, естественно считать независимыми, то имеет место суммирование большого числа независимых CB, пренебрежимо мало влияющих на сумму. Различные статистические исследования подтверждают нормальный закон нагрузки. Пример 1.64. Всякое измерение неизбежно сопряжено с погрешностями; систематические погрешности можно устранить, случайные же ошибки измерения полностью никогда не могут быть устранены. Случайная погрешность измерения вызывается многими причинами, каждая из которых лишь незначительно влияет на результат. Каждая из причин порождает свою, так называемую элементарную, погрешность измерения. Например, при взвешивании некоторого тела на точных весах случайная ошибка в определении его веса складывается из элементарных погрешностей, вызываемых атмосферными причинами (колебаниями температуры, влажности воздуха, воздушными потоками); попаданием на чаши весов пылинок; неточностями, допущенными измерителем при снятии показаний со шкалы весов; незначительными вибрациями основания весов (которые в свою очередь могут вызываться многими причинами) и т.п. Реально наблюдаемая случайная погрешность измерения есть сумма элементарных погрешностей. Так как количество элементарных погрешностей велико и роль каждой из них в образовании случайной погрешности измерения мала, то в силу теоремы Ляпунова случайная погрешность измерения должна быть распределена приближенно по нормальному закону. Опыт показывает, что наблюдающиеся распределения вероятностей случайных ошибок измерения очень хорошо согласуются с нормальным законом. Итак, при прямых измерениях случайная погрешность измерения распределена по закону, близкому к нормальному. Пример 1.65. Дано 5000 независимых одинаково распределенных CB с дисперсией 50. Найти вероятность того, что среднее арифметическое этих CB отклонится от своего математического ожидания не более, чем на ∆ = 0,12 . 118
Решение. Пусть Μξ k (ω) = a, Dξ k (ω) = σ 2 . Тогда искомая вероятность равна n 1 σ îk (ù ) − a ≤ ∆ = P ù : P = P ù : n n k =1
∑
= P ù :
n
∑ î (ù ) − a k
k =1
σ n
x
n
∑ î (ù ) − a k
k =1
σ n
≤ ∆ =
n n n n ≤ ∆ ≈ Ö ∆ − Ö − ∆ = 2Ö ∆ σ , σ σ σ
t2
− 1 где Φ (x ) = e 2 dt . 2π 0 Подставляя значения n = 5000, σ = 50 , ∆ = 0,12 , получаем P ≈ 2Φ (1,2 ) = 0.7698 .
∫
b
Пример 1.66. Для вычисления интеграла É =
∫ f (x )dx
часто
a
используют метод статистических испытаний (Монте-Карло), при котором
É ≈ Én =
1 n
n
∑ f (î (ù )), k
k =1
где ξ k (ω ), k = 1, n , – независимые, равномерно распределенные на отрезке [a, b] CB. Сколько нужно провести статистических испыð 2
таний при вычислении интеграла
∫ cos xdx , чтобы с вероятностью 0
119
0,9 можно было считать относительную погрешность в вычисленном значении интеграла меньшей, чем 5 %? Решение. Интеграл ð 2
2 2 É= cos xdx ð ð0
∫
можно рассматривать как математическое ожидание функции
cos(ξ (ω )) , где ξ (ω ) – равномерно распределенная на интервале π CB. Тогда приближенное значение интеграла равно 0 , 2
Én =
ð 2n
n
∑ cos x
k
,
k =1
ð где x k – случайные числа из интервала 0 , . Т.к. cos x k незави 2 симы, одинаково распределены и имеют конечную, отличную от нуля, дисперсию, то
DÉn = и
ð2 ð2 − 8 D cos(î(ù )) = 4n 8n
É − É 8n P n Én − É < å ≈ < å = P 2 ð − 8 DÉn ≈ Φ (ε ) − Φ (− ε ) = 2Φ (ε ) − 1 = 0,9 , 1
где Φ1 (x ) =
1 2π
x
∫e
−
t2 2 dt
1
1
. Отсюда с помощью таблицы для функ-
−∞
ции Ö 1 (x ) находим ε = 1,645 . Для того чтобы относительная по120
грешность
Én − É
была меньше 0,05 , учитывая, что É = 1 , необÉ ходимо провести столько опытов, чтобы
8n 0,05 > 1,645 , π −8 2
откуда получаем n > 252 .
121
ГЛАВА 2. ОСНОВНЫЕ ПОНЯТИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ §11. ОПРЕДЕЛЕНИЕ СЛУЧАЙНОГО ПРОЦЕССА И ПРИМЕРЫ
При изучении различных реальных явлений рассматривают всевозможные величины, зависящие от времени: x = x(t ) . Такие величины принято называть процессами. Говоря о случайных процессах, как правило, имеют в виду некоторую СВ ξ(t ) , меняющуюся с течением времени t . Будем называть случайным процессом
ξ(t ) функцию от действительного параметра t ∈ T (времени), значения которой при каждом t являются СВ. Строгое определение случайного процесса состоит в следующем. Определение. Набор ξ(t ) = {ξ(t , ω), t ∈ T , ω ∈ Ω} СВ, определенных на одном и том же вероятностном пространстве ( Ù ,F,P), называется случайной функцией. Определение. Пусть ( Ù ,F,P) – вероятностное пространство,
T – некоторое множество моментов времени. И пусть каждому ω ∈ Ω поставлена в соответствие функция ξ t = ξ(t ) = ξ(t , ω) , t ∈ T , со значениями в n -мерном пространстве (n ≥ 1) такая, что при каждом фиксированном t ∈ T функция ξ(t , ω) является СВ. Эта функция называется случайным процессом. Следовательно, случайный процесс – это совокупность СВ, зависящих от времени. Естественно, его можно рассматривать как функцию двух переменных: t и ω . Как следует из определения,
ξ(t , ω) является n –мерной СВ при любом фиксированном t . Определение. При фиксированном ω ∈ Ω функция ξ(t , ω) называется реализацией (траекторией или выборочной функцией)
122
случайного процесса. Совокупность всех реализаций случайного процесса называется ансамблем (семейством) реализаций. Пример 2.1. На метеорологической станции фиксируется температура воздуха ξ(t , ω) , которая является функцией двух переменных: времени и элементарного события ù . Пусть t * – некоторый настоящий момент времени. На основании проведенных измерений мы знаем, как вел себя процесс ξ(t ) в прошлом при t < t * , и не знаем, как он будет вести себя в будущем. Мы можем только знать прогнозы, как он поведет себя при t > t * , но их точность уменьшается с ростом разности t − t * . При каждом фиксированном t > t * температура ξ(t ) является случайной величиной. Обычно мы не имеем возможности точно предсказать, какой будет температура в будущем; она зависит от многих случайных факторов, совместное влияние которых можно записать как элементарное событие ω . Поэтому температура воздуха как функция данных двух переменных является случайным процессом. То же самое можно сказать о количестве атмосферных осадков, уровне воды в реке в зависимости от времени и места. Пример 2.2. Частица находится в начальный момент времени t = 0 в точке ζ на оси и затем движется вдоль этой оси со скорос-
тью η . Причем (η, ζ) является двумерной СВ, имеющей нормальное распределение с параметрами N (a η , a ζ , σ η2 , σ ζ2 ) . Положение частицы на оси можно выразить соотношением
ξ(t , ω) = η(ω)t + ζ (ω) . Реализациями случайного процесса ξ(t , ω) являются полупрямые вида ξ(t ) = at + b , t ≥ 0 , где (a, b) – значение двумерной СВ (η(ω) + ζ (ω)) при некотором фиксированном ω = ω .
123
Данный случайный процесс можно трактовать также как семейство реализаций вида η(ω)t + ζ (ω) , где ω ∈ Ω , а также как семейство СВ ξ(t , ω) , таких, что в каждый фиксированный момент времени t = t * ≥ 0 СВ ξ(t * , ω) имеет нормальное распределение с 2
параметрами N (a η t + a ζ , σ η t 2 + 2rσ η σ ζ t + σ ζ 2 ) , где r – коэффициент корреляции СВ η(ω) и ζ (ω) . Это можно показать, используя функциональные преобразования СВ. Определение. Случайный процесс ξ(t ) , t ∈ T , у которого множество T не более чем счетно, называется процессом с дискретным временем или случайной последовательностью. Если множество T совпадает с промежутком прямой, например, T = [0; + ∞) , то ξ(t ) называется процессом с непрерывным временем. Пример 2.3. Важным примером случайного процесса с непрерывным временем, T = [0; + ∞) , является пуассоновский процесс [4], который обозначим ν(t ) = ν(t , ω) . Его реализация представляет собой число наступлений некоторого события за период [0, t ) . Очевидно, всякая возможная реализация является неубывающей ступенчатой функцией, которая возрастает единичными скачками в некоторые случайные моменты времени t1 , t 2 , ... (рис 15). Очевидно также ν(0) = 0 . Конкретными примерами наблюдаемых величин, образующих подобного рода процессы, являются: число телефонных вызовов на коммутатор телефонной станции; число фотонов, испускаемых веществом при радиоактивном распаде; число происшествий на данном перекрестке; число ошибок в тексте, набираемом на компьютере; число выходов из строя некоторого устройства; число вызовов, поступающих на станцию скорой помощи; число запросов, поступающих на сервер компьютерной сети. Рассмотрение этих процессов как пуассоновских основыва124
ется на законе редких событий. Представим себе большое число испытаний Бернулли с малой вероятностью наступления события и постоянным средним числом таких наступлений. При этих условиях локальная предельная теорема Пуассона утверждает, что число наступлений события подчиняется закону Пуассона.
v(t )
t Рис. 15
Предположим, что число наступлений события в некотором интервале не зависит от числа наступлений этого события в любом другом не пересекающемся с ним интервале. Предположим также, что СВ ν(t 0 + t ) − ν(t 0 ) , зависит только от t и не зависит от
t 0 или значения ν(t 0 ) . Сформулируем еще два предположения, согласующихся с интуитивным описанием процесса, данным выше: а) вероятность того, что за период времени ∆ t произойдет по меньшей мере одно событие, равна p(∆ t ) = λ ∆ t + o(∆ t ), ∆ t → 0, λ > 0 , напомним, что
o( ∆ t ) = 0; → 0 ∆t
lim ∆ t
б) вероятность того, что за время ∆ t произойдут два или более события, есть o(∆ t ) ; это предположение равнозначно исключению возможности более чем однократного одновременного на125
ступления события; в приведенных нами физических процессах это условие обычно выполняется. Пусть Pk (t ) означает вероятность того, что за время t произойдет ровно k событий, т.е.
Pk (t ) = P{ν (t ) = k}, k = 0, 1, 2, ... .
(2.1)
∞
Условие б) можно записать в виде ∑ Pk (∆ t ) = o(∆ t ) и, очеk =2
∞
видно, p(∆ t ) = ∑ Pk (∆ t ) . В силу предположения о независимости k =1
имеем и поэтому
P0 (t + ∆ t ) = P0 (t ) P (∆ t ) = P0 (t )(1 − p( ∆ t )) , P0 (t + ∆ t ) − P0 (t ) p(∆ t ) =− P0 (t ) . ∆t ∆t
Из предположения a) следует, что
lim ∆ t →0
p(∆ t ) = λ . Поэтому ∆t
вероятность P0 (t ) того, что событие не наступит на интервале
[0, t ) ,
удовлетворяет
дифференциальному
уравнению
P0 ' (t ) = −λ P0 (t ) , общее решение которого имеет вид P0 (t ) = c e − λ t .
Константа c определяется из начального условия P0 (t ) = 1 , из которого следует, что c = 1 . Поэтому
P0 (t ) = e − λ t .
(2.2)
Найдем теперь P (t ) ∀ k ≥ 1 . Легко видеть, что k
k
Pk (t + ∆ t ) = Pk (t ) P0 (∆ t ) + Pk −1 (t ) P1 (∆ t ) + ∑ Pk −i Pi (∆ t ). (2.3) i=2
126
Поскольку по определению P0 (∆ t ) = 1 − p (∆ t ) и из предположения a) следует, что P1 (∆ t ) = p (∆ t ) + o(∆ t ) , а также справедливо очевидное неравенство k
k
i=2
i=2
∑ Pk −i Pi (∆ t ) ≤ ∑ Pi (∆ t ) = o (∆ t ) ,
так как
Pk −i (t ) ≤ 1, i = 2, k , то (2.3) мы можем переписать в виде k
Pk (t + ∆ t ) − Pk (t ) = − Pk (t ) p ( ∆ t ) + P k −1 (t ) P1 ( ∆ t ) + ∑ Pk −i Pi ( ∆ t ) = i=2
= −λ Pk (t )∆ t + λ P k −1 (t ) ∆ t + o (∆ t ) . Отсюда следует, что Pk (t + ∆ t ) − Pk (t ) o (∆ t ) , = −λ Pk (t ) + λPk −1 (t ) + ∆t ∆t
и при ∆ t → 0 , получаем
Pk ' (t ) = −λ Pk (t ) + λPk −1 (t ), k = 1, 2, ...
(2.4)
при начальных условиях Pk (0) = 0, k = 1, 2, ... . Для решения разностно–дифференциальных уравнений (2.4) введем функции
Qk (t ) = Pk (t ) e − λ t , k = 0,1, 2, ... . Подставляя Q (t ) в (2.3), будем иметь k
Qk (t ) = λ Qk −1 (t ), k = 1, 2, ... ,
(2.5)
где Q0 (t ) = 1 , поскольку имеет место соотношение (2.2); начальные условия остаются теми же: Qk (0) = 0, k = 1, 2, ... . Последовательно решая уравнения (2.5), получаем:
Q1 ' (t ) = λ или Q1 (t ) = λ t + c1 , поэтому Q1 (t ) = λ t ; 127
Q2 ' (t ) = ⋅
(λ t ) 2 ; (λ t ) 2 λ2 t или Q2 (t ) = + c 2 , поэтому Q2 (t ) = 2 2 2! ⋅
⋅
(λ t ) k (λ t ) k . λk t k −1 или Qk (t ) = + c k , поэтому Qk (t ) = ( k − 1)! k! k! Следовательно, имеем
Q k ' (t ) =
Pk (t ) =
(λ t ) k − λ t e , k = 0, 1, 2, ... k!
(2.6)
Другими словами, при каждом t СВ ν(t ) подчиняется распределению Пуассона с параметром λ t . В частности, среднее число наступлений события за время t равно λ t . Для нахождения значений функции Pk (t ) можно воспользоваться таблицей из Приложения 3. Пуассоновский процесс является одним из важных случайных процессов, широко используемых в математическом моделировании, поэтому позднее мы еще вернемся к этому процессу. Определение. При фиксированном t для случайного процесса ξ(t , ω) получаем СВ, которую назовем сечением случайного процесса в момент времени t . В дальнейшем случайный процесс ξ(t , ω) для удобства будем обозначать ξ(t ) . Рассмотрим сечение случайного процесса ξ(t1 ) в момент t1 . Функция F ( x1 , t1 ) = P(ξ(t1 ) ≤ x1 ) носит название одномерной ф.р. случайного процесса в момент времени t1 . Если зафиксировать два момента времени t1 и t 2 , то вероятность совместного выполнения случайных событий { ξ(t1 ) ≤ x1 } и { ξ(t 2 ) ≤ x 2 } задает двумерную ф.р. случайного процесса 128
F ( x1 , t1 ; x2 , t2 ) = P(ξ(t1 ) ≤ x1 , ξ(t2 ) ≤ x2 ) . Определение. Пусть t1 < t2 < ... < t n – некоторые фиксированные моменты времени. Рассмотрим n -мерную СВ (ξ(t1 ), ξ(t 2 ),..., ξ(t n )) . Распределение вероятностей этой СВ называется n -мерным распределением вероятностей случайного процесса, а ф.р. этой СВ
F ( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ) =
(2.7) = P(ξ(t1 ) ≤ x1 , ξ(t 2 ) ≤ x2 , ... , ξ(t n ) ≤ xn ) соответственно n -мерной ф.р. случайного процесса. Заметим, что n -мерная ф.р. случайного процесса является функцией 2n переменных x1 , x2 , .... , xn , t1 , t2 , ... , tn , в то время как ф.р. n -мерной СВ является функцией n переменных x1 , x2 , .... , xn . Отметим также, что для функции F ( x1 , t1; x2 , t 2 ; ... ; xn , tn ) должны выполняться условия согласованности:
F ( x1 , t1 ; x2 , t 2 ; ... ; xm , t m ; + ∞, t m+1 ; ... ; + ∞, t n ) = = F ( x1 , t1 ; x2 , t 2 ; ... ; xm , t m ) ∀ m < n F ( xi 1 , ti1 ; xi2 , ti2 ; ... ; xin , tin ) = F ( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ) ,
(2.8) (2.9)
где i1 , i2 , .... , in – любая перестановка индексов 1, 2, ... , n . Теперь можно сформулировать еще одно определение случайного процесса. Определение. Случайным процессом ξ(t ) , заданным на множестве T , t ∈ T , называется семейство распределений (2.7), удовлетворяющее условиям согласованности (2.8), (2.9). Набор функций F ( x1 , t1; x2 , t 2 ; ... ; xn , tn ) для n = 1, 2, ... называют конечномерным распределением случайного процесса.
129
Приведем один из простейших примеров случайного процесса – так называемый веерный процесс и его одномерную ф.р. [6]. Пример 2.4. Пусть η – любая одномерная СВ. Определим случайный процесс формулой ξ(t ) = η (t − t 0 ) + b, − ∞ < t < + ∞ , где t 0 , b – фиксированные числа. При фиксированном t функция ξ(t ) является СВ, при этом
x−b , t > t 0 , Fη t − t0 x F ( x, t ) = P(η (t − t 0 ) + b ≤ x) = ∫ δ (t − b) dt , t = t 0 , −∞ x−b + 0 , t < t 0 . 1 − Fη t − t0 Здесь δ (⋅) – δ -функция Дирака, которая определяется задаb
нием интеграла ∫ f ( x) δ ( x) dx для любой непрерывной функции a
f (x) следующим образом: b
f (0), 0 ∈ [a, b],
a
∫ f ( x) δ ( x) dx = 0, 0 ∉ [a, b],
аналогично b
f (τ), τ ∈ [a, b],
a
∫ f ( x) δ ( x − τ) dx = 0, τ ∉ [a, b],
поэтому в нашем случае x
1, b ∈ [−∞, x],
∫ δ (t − b) dt = 0, b ∉ [−∞, x]. −∞
130
Если зафиксировать η , то реализация случайного процесса
ξ(t ) представляет собой линейную функцию, график которой проходит через точку (t 0 , b) . Различные траектории процесса в данном случае представляют собой пучок прямых («веер») (рис. 16), откуда и название процесса. ξ(t )
b
t0
t
Рис. 16
Определение. Если существует неотрицательная функция p( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ) , такая, что ∀ x1 , x2 , ... , xn
F ( x1 , t1 ; x2 , t 2 ;...; xn , t n ) = x1 x2
xn
= ∫ ∫ ... ∫ p ( y1 , t1 ; y 2 , t 2 ;...; y n , t n ) dy1 dy 2 ... dy n , −∞ −∞ −∞
то она называется n -мерной плотностью распределения случайного процесса. Очевидно, что в точках непрерывности плотности распределения имеем
∂ n F ( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ) . ∂x1 ∂x2 ... ∂xn При этом условие согласованности (2.8) принимает вид
p( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ) =
131
p ( x1 , t1 ; x2 , t 2 ;...; xm , t m ) = ∞ ∞
∞
= ∫ ∫ ... ∫ p( x1 , t1 ; x2 , t 2 ;...; xn , t n ) dxm+1 dxm+ 2 ... dxn . − ∞ −∞ −∞
Характеристическая функция конечномерного распределения вводится аналогично, как для многомерных случайных величин: n
i ∑ uk ξ ( tk )
ϕ(u1 , t1; u 2 , t 2 ; ... ; u n , t n ) = Me k =1 ∞
∞
n
= ∫ ... ∫ e −∞
−∞
=
i ∑ u k xk k =1
p ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ) dx1 dx 2 ... dx n
(2.10)
До сих пор мы рассматривали описание одного случайного процесса. При решении многих задач приходится иметь дело с несколькими случайными процессами. Для задания, например, двух случайных процессов η(t ) и ξ(t ) вводится конечномерная ф.р. размерности n + m :
F ( x1 , t1 ; x2 , t 2 ; ... ; xn , t n ; y1 , τ1; y2 , τ 2 ; ... ; ym , τ m ) = = P(ξ(t1 ) ≤ x1 , ξ(t 2 ) ≤ x2 , ... , ξ(t n ) ≤ xn ; η(τ1 ) ≤ y1 , η(τ 2 ) ≤ y2 , ... , η(τ m ) ≤ ym ). Она в общем случае не обладает свойством симметрии относительно всех перестановок аргументов. Реально протекающие явления, как правило, описываются случайными процессами, принимающими действительные значения. Однако иногда бывает полезным воспользоваться понятием комплексного случайного процесса ζ(t ) = ξ(t ) + i η(t ), который можно рассматривать как двумерный случайный процесс, каждая компонента которого является действительным процессом. Конечномерное распределение порядка n случайного процесса ζ(t ) задается 2n -мерным совместным распределением процессов ξ(t ) и η(t ), т.е. Fζ ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ; y1 , t1 ; y 2 , t 2 ; ... ; y n , t n ) . 132
§12. СТАТИСТИЧЕСКИЕ СРЕДНИЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ПРОЦЕССОВ
Конечномерные распределения дают исчерпывающую характеристику случайного процесса. Однако во многих случаях представляют интерес более сжатые характеристики, отражающие основные свойства случайных процессов. Роль таких характеристик играют моментные функции или статистические средние. Определение. Средним значением случайного процесса ξ(t ) (статистическим средним) mξ (t ) называется математическое ожидание сечения случайного процесса в момент времени t : ∞
m ξ (t ) = M ξ(t ) = ∫ x dF ( x, t ).
(2.12)
−∞
Оно определяется одномерной функцией распределения F ( x, t ) . Определение. Дисперсией случайного процесса ξ(t ) называется дисперсия сечения случайного процесса, которая также определяется одномерным распределением: ∞
Dξ (t ) = M [ ξ(t ) − mξ (t )] 2 = ∫ [ x − m ξ (t )] dF ( x, t ). (2.13) −∞
Определение. Корреляционной функцией случайного процесса ξ(t ) называется математическое ожидание произведения двух сечений случайного процесса в моменты времени t , t : 1 2 ∞ ∞
Rξ (t1 , t 2 ) = M [ ξ(t1 ) ξ(t 2 )] = ∫ ∫ x1 x 2 dF ( x1 , t1 ; x 2 , t 2 ).
(2.14)
− ∞ −∞
Она определяется двумерной функцией распределения
F ( x1 , t1 ; x 2 , t 2 ) . Эту функцию также называют функцией автокорреляции.
133
Определение. Ковариационная функция случайного процесса – это математическое ожидание произведения центрированных сечений процесса в моменты времени t1 , t 2 :
[
]
K ξ (t1 , t 2 ) = cov( ξ(t1 ) ξ(t 2 ) ) = M ( ξ(t1 ) − mξ (t1 ) )( ξ(t 2 ) − mξ (t 2 ) ).
Величину
rξ (t1 , t 2 ) =
K ξ (t1 , t 2 ) Dξ (t1 ) Dξ (t 2 )
=
(2.15)
K ξ (t1 , t 2 ) K ξ (t1 , t1 ) K ξ (t 2 , t 2 )
называют нормированной ковариационной функцией, или коэффициентом корреляции случайного процесса. Очевидно, что при t1 = t 2 = t ковариационная функция совпадает с дисперсией случайного процесса: 2
K ξ (t , t ) = Dξ (t ) = σ ξ (t ). Для двух случайных процессов ξ(t ) и η(t ) вводится понятие взаимной функции корреляции, или функции кросс-корреляции: (2.16) Rξη (t1 , t 2 ) = M [ ξ(t1 ) η(t 2 )], а совместная корреляционная функция двух случайных процессов определяется как матричная функция
Rξ (t1 , t 2 ) Rξη (t1 , t 2 ) Rηξ (t1 , t 2 ) Rη ( t1 , t 2 ) . Пример 2.5. Пусть случайный процесс ξ(t ) является семейством трех реализаций {ξ1 (t ) , ξ 2 (t ) , ξ 3 (t ) } и определяется следующим образом (рис. 17):
k , k = 1, 3 , T = [0, + ∞). 6 Тогда из формул (2.12) – (2.15) следует ξ k (t ) = kt , P (ξ(t ) = ξ k (t ) ) =
134
1 2 3 14 7 mξ (t ) = M ξ(t ) = t + ⋅ 2t + ⋅ 3t = t = t , 6 6 6 6 3 7 7 5 K ξ (t1 , t 2 ) = M ξ(t1 ) − t1 , ξ(t 2 ) − t 2 = t1t 2 , 3 3 9 Dξ (t ) =
5 , t2 9
rξ (t1 , t 2 ) = 1.
mξ (t )
ξ(t )
3 2 1 0 t
1
Рис. 17
Пример 2.5. Пусть случайный процесс ξ(t , ω) определяется выражением ξ(t , ω) = α(ω) cos λt + β(ω) sin λt , (2.17) где λ > 0, T = [0, + ∞), α(ω), β(ω) ~ N (0, σ 2 ) , и эти СВ независимы. Его можно переписать в виде ξ(t , ω) = γ (ω) cos (λt + ϕ(ω) ) , 135
то есть
ξ(t , ω) = γ (ω) [cos λt cos ϕ(ω) − sin λt sin ϕ(ω)] = = [γ (ω) cos ϕ(ω)]cos λt − [γ (ω) sin ϕ(ω) ]sin λt. Приравнивая выражения (2.17), (2.18), имеем α(ω) = γ (ω) cos ϕ(ω), β(ω) = − γ (ω) sin ϕ(ω) , откуда находим γ (ω) = α 2 (ω) + β 2 (ω) ,
cos ϕ(ω) =
(2.18)
α(ω)
. α 2 (ω) + β 2 (ω) Процесс (2.17) характеризует случайные колебания, амплитуда которых γ (ω) и фаза ϕ(ω) являются СВ. Реализация процесса – периодические функции с периодом 2π (рис. 18). λ ξ(t ) Dξ (t ) = σ mξ (t ) = 0 t
− Dξ (t ) = −σ
Рис. 18
Найдем среднее значение процесса и его ковариационную функцию :
mξ (t ) = Mα(ω) cos λt + Mβ(ω) sin λt = 0, K ξ ( t1 , t 2 ) = M [( α(ω) cos λt1 + β(ω) sin λt1 ), ( α(ω) cos λt 2 + β(ω) sin λt 2 )] =
136
(
) (
)
= M α 2 (ω) cos λt1 cos λt 2 + M β 2 (ω) sin λt1 sin λt 2 = σ 2 cos λ (t 2 − t1 ) ,
(2.19) поскольку M (α(ω) β(ω) ) = Mα(ω) Mβ(ω) = 0 . Используя (2.19), находим дисперсию процесса и нормированную ковариационную функцию: Dξ (t ) = K ξ (t , t ) = σ 2 , rξ (t1 , t 2 ) = cos λ (t 2 − t1 ). (2.20) Пример 2.7. Обобщим случайный процесс (2.17) на сумму случайных колебаний. Рассмотрим процесс n
ξ(t , ω) = ∑ (α k (ω) cos λ k t + β k (ω) sin λ k t ),
(2.21)
k =1
где λ k > 0, k = 1, n , T = [0, + ∞), α k (ω), β k (ω) ~ N (0, σ 2 ) , причем k СВ α (ω), β (ω), k = 1, n , независимы. Для такого процесса буk k дем иметь
mξ (t ) = 0,
n
2 K ξ (t1 , t 2 ) = ∑ σ k cos λ k (t 2 − t1 ) . k =1
Перечислим основные свойства корреляционной функции случайного процесса ξ(t ) . 1. Корреляционная функция является симметричной функцией своих аргументов:
Rξ (t1 , t 2 ) = Rξ (t 2 , t1 ) , что следует из ее определения.
(2.22)
2. Rξ (t1 , t 2 ) ≤ Rξ (t1 , t1 ) Rξ (t 2 , t 2 ) , это свойство следует из неравенства Коши–Буняковского для математических ожиданий
M 2 (uv ) ≤ Mu 2 Mv 2 . Обозначив в нем u = ξ(t1 ), v = ξ(t 2 ) , имеем M 2 [ξ(t1 ) ξ(t 2 )] = M ξ 2 (t1 ) M ξ 2 (t 2 ) . 3. Корреляционная функция случайного процесса является положительно определенной, т.е. ∀ n и действительных λ 1 , λ 2 , ... , λ n
137
n
∑ R ξ ( t i , t j ) λ i λ j ≥ 0.
i , j =1
Это следует из того, что
∑ Rξ (ti , t j )λi λ j = ∑ M [ξ(ti )ξ(t j )]λ i λ j = M ∑ ξ(ti )ξ(t j )λ i λ j = n
i , j =1
n
n
i , j =1
i , j =1
n n = M ∑ ξ(t i )λ i ∑ ξ(t j )λ j = M j =1 i =1
2
∑n ξ(t )λ ≥ 0 . i =1 i i
n
4. Пусть ξ(t ) = ∑ ξ i (t ) . Тогда i =1
n
n
i =1
i≠ j
Rξ (t1 , t 2 ) = ∑ Rξi (t1 , t 2 ) + ∑ Rξi ξ j (t1 , t 2 ) ,
(2.23)
т.е., корреляционная функция суммы случайных процессов равна сумме корреляционных функций плюс сумма всех взаимных корреляционных функций. Очевидно, что для некоррелированных случайных процессов n
Rξ (t1 , t 2 ) = ∑ Rξi (t1 , t 2 ) . i =1
138
(2.24)
ГЛАВА 3 ПРОЦЕССЫ С КОНЕЧНЫМИ МОМЕНТАМИ ВТОРОГО ПОРЯДКА. КОРРЕЛЯЦИОННАЯ ТЕОРИЯ §13. СХОДИМОСТЬ В СРЕДНЕМ КВАДРАТИЧНОМ ДЛЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
Понятие сходимости, а следовательно, непрерывности, дифференцируемости и интегрируемости для случайных процессов в определенной мере отличается от соответствующих понятий в математическом анализе. Наиболее удобно и просто эти понятия вводятся для процессов, удовлетворяющих условию M ξ(t ) < +∞ , которые называются процессами с конечными моментами второго порядка, или гильбертовыми процессами. Физически это означает, что процесс имеет конечную мощность, что выполнимо для большинства реальных процессов. Сформулируем основные типы сходимости для случайных 2
процессов [10]. Пусть случайный процесс ξ h (t ) зависит от некоторого параметра h . Определение. Последовательность ξ h (t ) сходится к ξ(t ) по вероятности при h → h0 , если
lim P{ξ h (t ) − ξ(t ) > ε}= 0 ,
h → h0
что обозначается аналогично, как для сходимости случайных последовательностей, то есть P ξ h (t ) → ξ(t ) . h → h0
Определение. Последовательность ξ h (t ) сходится к ξ(t ) в среднем квадратичном при h → h0 , если
139
{
}
lim M ξ h (t ) − ξ(t ) = 0 ,
h → h0
2
что также обозначим аналогично, как для такого же типа сходимости случайных последовательностей, то есть кв . . ξ h (t ) = ξ(t ) . ξ h (t ) ср . → ξ(t ) или lh.i→.m h h → h0
0
Напомним, что сходимость в среднем квадратичном – более сильная сходимость, чем по вероятности. Именно такой тип сходимости будем использовать при определении непрерывности, дифференцируемости и интегрируемости случайных процессов в данной главе. .кв .кв Лемма. Если ξ (t ) ср → ξ(t ) и η h (t ) ср → η(t ) , то h h → h0
h → h0
(3.1) → M {ξ(t1 )η(t 2 )}. M {ξ h (t1 )η l (t 2 )}h ,l → h0 Доказательство. Рассмотрим математическое ожидание разности
M {ξ h (t1 )ηl (t 2 ) − ξ(t1 )η(t 2 )} = M {(ξ h (t1 ) − ξ(t1 )(η l (t 2 ) − η(t 2 ))}+ + M {(ξ h (t1 ) − ξ(t1 ))η(t 2 )}+ M {(ηl (t 2 ) − η(t 2 ))ξ(t1 )}. Далее во всех слагаемых воспользуемся неравенством Коши– Буняковского: M 2 {(ξ h (t1 ) − ξ(t1 ))(η l (t 2 ) − η(t 2 ))}≤
{
} { } M {(ξ (t ) − ξ(t ))η(t )}≤ M {(ξ (t ) − ξ(t )) }Mη (t ) , M {(η (t ) − η(t ))ξ(t )}≤ M {(η (t ) − η(t )) }Mξ (t ) . ≤ M (ξ h (t1 ) − ξ(t1 )) 2 M (ηl (t 2 ) − η(t 2 )) 2 ,
2
1
h
2
l
2
1
2
2
1
h
1
l
2
1
2
2
2
2
2
2
1
Так как мы рассматриваем процессы с ограниченными моментами второго порядка, то
Mξ 2 (t1 ) < +∞ , Mη2 (t 2 ) < +∞ . По условию леммы и определению сходимости в среднем квадратичном, остальные сомножители в правой части стремятся к нулю при h, l → h0 . Поэтому 140
→ 0 . M {ξ h (t1 )η l (t 2 ) − ξ(t1 )η(t 2 )}h ,l →h0 На основании этой леммы можно доказать критерий сходимости в среднем квадратичном. ср.кв. → ξ(t ) , необходимо Теорема 3.1. Для того чтобы ξ h (t ) h → h0 и достаточно, чтобы существовал предел
lim M {ξ h (t )ξ l (t )}= A < +∞ .
(3.2)
h , l → h0
Доказательство теоремы во многом аналогично доказательству теоремы 1.13, хотя оно было приведено сокращенно. ср.кв.
→ ξ(t ) . В качестве η (t ) Необходимость. Пусть ξ h (t ) h → h0 l кв . . → η(t ) . Тогда, по только что докавозьмем ξ l (t ) , тогда η h (t ) ср h → h0
занной лемме,
→ Mξ 2 (t ) < +∞ . M {ξ h (t )ηl (t )} = M {ξ h (t )ξ l (t )} h ,l → h0 Достаточность. Пусть существует конечный предел
lim M {ξ h (t )ξ l (t )} = A .
h , l → h0
Тогда
{
}
{
}
→ A + A − 2 A = 0 , M (ξ h (t ) − ξ l (t ) ) = Mξ h2 (t ) + Mξ l2 (t ) − 2M ξ h (t )ξ l (t ) h ,l → h 2
(3.3)
0
то есть последовательность ξ h (t ) сходится. Тогда по лемме Больцано–Вейерштрасса из нее можно выделить подпоследовательность, сходящуюся к ξ(t ) : кв. ξ h1 (t ), ξ h2 (t ), . . ., ξ hn (t ) ср . → ξ(t ) . hi → h0
141
(3.4)
Осталось показать, что наша подпоследовательность ξ h (t ) сходится к этому же пределу ξ(t ) . Используя неравенство
(a + b) 2 ≤ 2a 2 + 2b 2 , имеем
{
}
{[
M (ξ h (t ) − ξ(t )) 2 = M (ξ h (t ) − ξ hi (t )) + (ξ hi (t ) − ξ(t ))
{
}
{
}
] }≤ 2
≤ 2M (ξ h (t ) − ξ hi (t )) 2 + 2 M (ξ hi (t ) − ξ(t )) 2 . Тогда с учетом (3.3), (3.4) получаем, что
{
}
→ 0 , M (ξ h (t ) − ξ(t ) ) h →h0 что и доказывает теорему. 2
Следствие. Для того чтобы l.i.m. ξ h (t ) = η , где η – СВ с коh → h0
нечным вторым моментом, необходимо и достаточно, чтобы 2 lim M {ξ h (t )ξ l (t )} = Mη .
(3.5)
h ,l → h0
Доказательство следует из предыдущей леммы и теоремы. §12. НЕПРЕРЫВНОСТЬ СЛУЧАЙНЫХ ПРОЦЕССОВ
Непрерывность случайных процессов определяется по-разному, в зависимости от выбранного типа сходимости. Сходимость по вероятности определяет стохастическую непрерывность процесса. Это самый слабый вид непрерывности. Определение. Случайный процесс ξ(t ) называется стохастически непрерывным в точке t 0 , если
lim P{ξ(t ) − ξ(t 0 ) > ε}= 0 .
h ,l → h0
Стохастическая непрерывность процесса относится свойствам, однозначно определяемым ее двумерным распределением. Определение. Случайный процесс ξ(t ) называется непрерывным в среднем квадратичном в точке t 0 , если 142
кв . ξ h (t ) ср . → ξ(t 0 ) . t →t 0
Из непрерывности в среднем квадратичном в точке t следует стохастическая непрерывность ξ(t ) в той же точке. Это следует из неравенства Чебышева:
{
}
M (ξ(t + ∆t ) − ξ(t ) ) . ε2 Обратное утверждение в общем случае неверно. P{ξ(t + ∆t ) − ξ(t ) > ε}≤
2
Пример 3.1. Случайный процесс ξ(t ) называется процессом Коши, если его приращения ξ(t + ∆t ) − ξ(t ) независимы и подчиняются распределению Коши, т.е. имеют плотность распределения
(∆t ) 2 . π((∆t ) 2 + x 2 ) Этот процесс стохастически непрерывен, но не является непрерывным в среднем квадратичном, так как для распределения Коши p( x) =
{
}
M (ξ(t + ∆t ) − ξ(t )) 2 = ∞ . Стохастическая непрерывность и непрерывность в среднем квадратичном не означает, что реализации случайного процесса непрерывны с вероятностью 1. Примером является процесс Пуассона, который принимает целочисленные значения и является непрерывным в среднем квадратичном. Теорема 3.2 (критерий непрерывности случайного процесса в среднем квадратичном). Для того чтобы процесс ξ(t ) был непрерывным в среднем квадратичном в точке t 0 , необходимо и достаточно, чтобы его корреляционная функция R (t1 , t 2 ) была непрерывной в точке t 0 = t1 = t 2 . 143
Доказательство. Необходимость. Пусть случайный процесс
ξ(t ) непрерывен в среднем квадратичном в точке t 0 , т.е. (3.6) → 0 . M (ξ(t ) − ξ(t 0 )) 2 t →t0 Рассмотрим модуль разности, применяя для него неравенство Коши–Буняковского,
R (t 0 + h, t 0 + l ) − R (t 0 , t 0 ) = M [ξ(t 0 + h)ξ(t 0 + l ) ] − Mξ 2 (t 0 ) =
= M [(ξ(t 0 + h) − ξ(t 0 ))ξ(t 0 + l )] + M [(ξ(t 0 + l ) − ξ(t 0 ))ξ(t 0 )] ≤
≤ M (ξ(t 0 + h) − ξ(t 0 )) 2 Mξ 2 (t 0 + l ) + + M (ξ(t 0 + l ) − ξ(t 0 )) 2 Mξ 2 (t 0 ) . Используя (3.6), получим, что при h, l → 0 правая часть неравенства стремится к нулю, а это означает, что функция R (t1 , t 2 ) непрерывна в точке t 0 = t1 = t 2 . Достаточность. Имеем:
M (ξ(t ) − ξ(t 0 )) 2 = Mξ 2 (t ) − 2M [ξ(t )ξ(t 0 )] + + Mξ 2 (t 0 ) = R (t , t ) − 2 R(t , t 0 ) + R (t 0 , t 0 ) = = [R (t , t ) − R (t , t 0 )] + [R (t 0 , t 0 ) − R(t , t 0 )].
Поскольку ковариационная функция R (t1 , t 2 ) непрерывна в точке t 0 = t1 = t 2 , то обе последние разности стремятся к нулю при t → t 0 , а это означает, что соотношение (3.6) выполняется.
Приведем сокращенный вариант другого доказательства данной теоремы, используя критерий сходимости в среднем квадратичном (теорема 3.1). Пусть ξ h (t 0 ) = ξ(t 0 + h). Тогда, используя этот критерий, имеем:
144
(3.7) → R (t 0 , t 0 ), M [ξ(t 0 + h)ξ(t 0 + l )] = R (t 0 + h, t 0 + l ) h , l →0 а это в свою очередь есть не что иное как условие непрерывности корреляционной функции R (t1 , t 2 ) в точке t 0 = t1 = t 2 . Теорема 3.2. Если R (t , t ) непрерывна ∀ t ∈ T , то R (t1 , t 2 ) непрерывна ∀ t1 , t 2 ∈ T , т.е. из непрерывности корреляционной функции при совпадающих аргументах следует ее непрерывность при несовпадающих аргументах. Доказательство. Так как R (t1 , t1 ) и R (t 2 , t 2 ) непрерывны, то из предыдущей теоремы следует, что кв . кв . ξ(t1 + h) ср . → ξ(t1 ) , ξ(t 2 + h) ср . → ξ (t 2 ) . h →0
h →0
Тогда из леммы имеем
→ M [ξ(t1 )ξ(t 2 )] = R(t1 , t 2 ), M [ξ(t1 + h)ξ(t 2 + l )] = R (t1 + h, t 2 + l ) h , l →0 §15. ДИФФЕРЕНЦИРУЕМОСТЬ СЛУЧАЙНЫХ ПРОЦЕССОВ
Определение. Случайный процесс ξ(t ) называется дифференцируемым в среднем квадратичном точке t 0 , если существует предел
ξ(t 0 + h) − ξ(t 0 ) (3.8) = ξ′(t 0 ) . h h →0 Случайная функция ξ ′(t 0 ) называется среднеквадратичной производной процесса в точке t 0 . Теорема 3.4 (критерий дифференцируемости случайного про-
l.i.m.
цесса в среднем квадратичном). Для того чтобы процесс ξ(t ) имел производную в среднем квадратичном в точке t 0 , необходимо и достаточно, чтобы существовала смешанная частная производная второго порядка корреляционной функции 145
∂ 2 R (t1 , t 2 ) в точке t 0 = t1 = t 2 . ∂ t1∂ t 2
Доказательство. Обозначим
ξ h (t 0 ) =
ξ (t 0 + h ) − ξ (t 0 ) , ξ(t + l ) − ξ(t 0 ) . ξ l (t 0 ) = 0 h l
Тогда по критерию сходимости в среднем квадратичном (3.2) для существования производной ξ′(t ) необходимо и достаточно 0 существование предела
ξ(t 0 + h) − ξ(t 0 ) ξ(t 0 + l ) − ξ(t 0 ) . ⋅ h l
lim M
h ,l → 0
Имеем:
ξ(t + h) − ξ(t 0 ) ξ(t 0 + l ) − ξ(t 0 ) ⋅ M 0 = h l =
1 [R(t 0 + h, t 0 + l ) − R(t 0 , t 0 + l ) − R(t 0 + h, t 0 ) + R(t 0 , t 0 )] = hl
1 R (t + h, t 0 + l ) − R(t 0 , t 0 + l ) 1 R(t 0 + h, t 0 ) − R(t 0 , t 0 ) = 0 → −l h →0 l h h
→ h →0
1 ∂R(t1 , t 0 + l ) l ∂ t1
− t1 =t 0
1 ∂R (t1 , t 0 ) l ∂ t1
t1 =t0
l → →0
∂ 2 R(t1 , t 2 ) ∂ t1 ∂ t 2
, t 0 =t1 =t 2
а последняя частная производная, по условию теоремы, существует. Тогда, используя критерий (3.2), получаем, что существует предел (3.8). Теорема 3.5. Если для всех t ∈ T существует вторая смешанная производная от корреляционной функции при совпадающих 2 аргументах ∂ R (t1 , t 2 ) ∂ t1 ∂ t 2
, то ∀ t , t ∈ T существуют первые и 1 2 t1 = t 2
вторая смешанная производные при несовпадающих аргументах
∂R (t1 , t 2 ) ∂R(t1 , t 2 ) ∂ 2 R(t1 , t 2 ) . , , ∂ t1 ∂ t2 ∂ t1 ∂ t 2 146
Доказательство. Действительно, исходя из предыдущей тео2 означает существование ремы, существование ∂ R (t1 , t 2 ) ∂ t1 ∂ t 2 t = t 1
2
ξ′(t1 ) . Обозначив ξ(t1 + h) − ξ(t1 ) , η h (t 2 ) = ξ(t 2 ) , h из леммы получаем, что существует предел ξ h (t1 ) =
ξ(t1 + h) − ξ(t1 ) ⋅ ξ(t 2 ) = h h→ 0 . R (t1 + h, t 2 ) − R (t1 , t 2 ) ∂R (t1 , t 2 ) = lim = h ∂t1 h →0
lim M
Аналогично доказывается существование остальных производных. Пример 3.2. Покажем, что случайный процесс с корреляционной функцией R (t1 , t 2 ) = min(t1 , t 2 ) не дифференцируем в среднем квадратичном. Пусть 0 < h < # . Легко проверить, что функция R(t1 , t 2 ) обладает своим свойством корреляционной функции. Имеем (см. доказательство теоремы 3.4): ∂ 2 R (t , t ) ∂t 2
= lim h →0
= lim [R (t + h, t + h) − R(t , t + h) − R (t + h, t ) + R (t , t )] = h→0
1 [min(t + h, t + h) − min(t , t + h) − min(t + h, t ) + min(t , t )] = h2 = lim h →0
1 [t + h − t − t + t ] = lim 1 = ∞, 2 h →0 h h
147
поэтому на основании критерия из теоремы 3.4 получаем, что процесс с такой корреляционной функцией не дифференцируем в среднем квадратичном. §16. ИНТЕГРИРОВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ
Пусть случайный процесс ξ(t ) и не случайная функция g (t ) заданы на интервале [a, b]. Разобьем этот интервал точками
a = t1 < t 2 < ... < t n = b Определение. Случайный процесс ξ(t ) интегрируем в среднем квадратичном на отрезке [a, b] , если существует конечный предел в среднем интегральных сумм: n −1
a
max( t i +1 −t i )→ 0 i =1 t i ∈[ t i , t i +1 )
b
∑ g (t i )ξ(t i )(t i +1 − t i ) = ∫ g (t )ξ(t )dt .
l.i.m.
(3.9)
Теорема 3.6 (критерий интегрируемости случайного процесса в среднем квадратичном). Для того чтобы процесс ξ(t ) был интегрируем в среднем квадратичном, необходимо и достаточно, чтобы существовал двойной интеграл от его корреляционной функции b
b
a
a
∫ ∫ g (t )g (n )R(t , u )dtdu < +∞ .
(3.10)
Доказательство. По критерию сходимости (3.2), для существования интеграла (3.9) необходимо и достаточно существование предела
lim
max(ti +1 − ti ) →0 , i
max ( u j +1 − u j ) →0 ,
M ∑ g (t i )ξ(t i )(t i +1 − t i )∑ g u j ξ u j t j +1 − t j = A. j i
( ) ( )(
j
ti ∈[ti ,ti +1 ),
[
u j ∈ u j ,u j +1
) 148
)
Но поскольку % M ∑ g (t i )ξ(t i )(t i +1 − t i )∑ g u j ξ u j u j +1 − u j i j = M ∑ g (t i )g u j ξ(t i )ξ u j (t i +1 − t i ) u j +1 − u j
( ) ( )( ) = ( ) ( ) ( )= ∑ g (t )g (u )R(t , u )(t − t )(u − u ) ( )→ i
j
i
j
i
j
i +1
j +1
i
j
max t i +1 − t i → 0 i
(
)
max u j +1 − u j → 0 j
b
b
max → ∫ ∫ g (t )g (u )R (t , u )dtdu , − t i )→ 0 (ti +1 i a a max (u j +1 − u j )→ 0 j
то как раз в качестве A можно взять двойной интеграл (3.10). Под несобственными интегралами в среднем квадратичном ∞
∞
−∞
a
∫ g (t )ξ(t )dt или ∫ g (t )ξ(t )dt будем понимать соответственно предеb
b
a → −∞ a b → +∞
b → +∞ a
лы lim ∫ g (t )ξ(t )dt , lim ∫ g (t )ξ(t )dt. Для того чтобы они существовали, необходимо и достаточно существование интегралов ∞
∞
∞ ∞
∫ ∫ g (t )g (u )R(t , u )dtdu и ∫ ∫ g (t )g (u )R(t , u )dtdu .
−∞ −∞
a
a
Пример 3.3. Вернемся к случайному процессу, рассмотренному в примере 2.6. Поскольку среднее значение процесса равно нулю, то его корреляционная и ковариационные функции совпадают и, на основании (2.19),
R (t1 , t 2 ) = σ 2 cos[λ(t 2 − t1 )]. Тогда из теорем 3.3, 3.5, 3.6 следует, что такой процесс непрерывен и дифференцируем в среднем квадратичном ∀ t ∈ [0, + ∞ ) . Покажем, что его среднеквадратичная производная является случайным процессом ξ′(t , w) , определяемым соотношением 149
(3.11) ξ ′(t , w) = −λα (w)sin λt + λβ( w) cos λt . Для этого воспользуемся определением (3.8) и определением сходимости в среднем квадратичном: 2 ξ(t + h ) − ξ(t ) − ξ′(t ) = h
lim M h→0
= lim M α(w) h →0
cos λ(t + h) − cos λt ) sin λ(t + h ) − sin λt + β(w) + h h + λα (w)sin λt − λβ(w)cos λt = 2
cos λ (t + h ) − cos λt = lim M α(w) + λ sin λt + h h →0 sin λ(t + h ) − sin λt + β(w) − λ cos λt h
2
=
2 = M α(w) (cos λt )′ + λ sin λt + β(w) (sin λt )′ − λ cos λt = 0, поэтому формула (3.11) справедлива. Покажем теперь, что b
1
1
∫ ξ(t )dt = λ α(w)(sin λb − sin λa ) − λ β(w)(cos λb − cos λa ). (3.12)
a
Для этого также воспользуемся определением сходимости в среднем квадратичном и определением интеграла (3.9). Поскольку
n −1 M lim ∑ (α(w)cos λt i + β(w)sin λt i )(t i +1 − t i ) − n →∞ i =1 −
1 1 α(w)(sin λb − sin λa ) + β(w)(cos λb − cos λa ) λ λ 150
2
=
2 n −1 1 = lim M α(w)∑ (cos λt i )(t i +1 − t i ) − (sin λb − sin λa ) − λ n →∞ i =1 n −1
− β(w)∑ (sin λt i )(t i +1 − t i ) + i =1
1 (cos λb − cos λa ) λ
2
= 0,
то соотношение (3.12) имеет место. §17. СТОХАСТИЧЕСКИЕ ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Под стохастическим обыкновенным дифференциальным уравнением обычно понимается обыкновенное дифференциальное уравнение относительно среднеквадратичной производной случайного процесса. Рассмотрим линейное дифференциальное уравнение первого порядка
ξ′(t ) + a(t )ξ(t ) = η(t ),
(3.13)
удовлетворяющее начальному условию ξ(0) = x 0 , где a (t ) действительная функция, n(t ), t ≥ 0 , – известный случайный процесс, x 0 – заданное число. Кроме моментных функций, определяемых соотношениями (2.12), (2.14), рассмотрим взаимную функцию корреляции процессов ξ(t ) и η(t ) Rξη (t1 , t 2 ), имеющую вид (2.16). Определяя среднее значение от обеих сторон уравнения (3.13), получим
mξ′ (t ) + a(t )mξ (t ) = mη (t ), m(t 0 ) = x 0 . Найдем теперь дифференциальное уравнение для корреляционной функции Rξ (t1 , t 2 ) . Сначала умножим обе стороны уравнения (3.13) при t = t1 , на η(t 2 ) и определим средние значения для обеих сторон. Тогда будем иметь ∂ Rξη (t1 , t 2 ) + a(t1 )Rξη (t1 , t 2 ) = Rη (t1 , t 2 ) . ∂t1
151
(3.14)
Можно найти решение этого уравнения при начальном условии Rξη (0, t 2 ) = x 0 mη (t 2 ) . Далее, умножив обе стороны уравнения (3.13) при t = t 2 на ξ(t1 ) и определив средние значения, получим
∂ Rξ (t1 , t 2 ) + a (t 2 )Rξ (t1 , t 2 ) = Rξη (t1 , t 2 ) , ∂t 2
(3.15)
для которого можно также найти решение при начальном условии
Rξ (t1 , 0 ) = x 0 mξ (t1 ) . Рассмотренный метод можно также применить в случае, когда в качестве x 0 берется некоторая СВ. Пример 3.4. Найдем среднее значение, корреляционную функцию и дисперсию процесса ξ(t ) , удовлетворяющего дифференциальному уравнению (3.16) ξ ′(t ) + ξ(t ) = η(t ) с начальным условием ξ(0 ) = 0 , где η(t ) – случайный процесс, определенный в примере 2.6, причем σ 2 = 1 . Естественно, что
mξ′ (t ) + mξ (t ) = 0 , и поэтому из начального условия для уравнения (3.16) вытекает условие mξ (0) = 0 , откуда следует, что mξ (t ) = 0 . Из уравнения (3.14) и (2.19) получаем
∂ Rξη (t1 , t 2 ) + Rξη (t1 , t 2 ) = cos λ(t 2 − t1 ) ∂t1 и начальное условие Rξη (0, t 2 ) = 0 . Решением этого уравнения является Rξη (t1 , t 2 ) =
1 [cos λ(t 2 − t1 ) − sin λ(t 2 − t1 )] + 2λ
152
e −λt1 [sin λt 2 − cos λt 2 ] = f (t1 , t 2 ) 2λ Тогда из (3.15) будем иметь уравнение +
∂ Rξ (t1 , t 2 ) + Rξ (t1 , t 2 ) = f (t1 , t 2 ) ∂t 2
с начальным условием R (t , 0 ) = 0 . Его решением является функция ξ 1
[
]
1 cos λ(t 2 − t1 ) + e −λ (t1 + t 2 ) − cos λt1e − λt 2 − cos λt 2 e − λt1 . 2 2λ Поскольку m (t ) = 0 , то K (t , t ) = R (t , t ) . Поэтому для
Rξ (t1 , t 2 ) =
ξ
ξ
1
2
ξ
1
2
дисперсии процесса ξ(t ) получаем
Dξ (t ) =
(
)
2 1 2 sin λt + e − λt − cos λt . 2 2λ
§18. РАЗЛОЖЕНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ ПО ОРТОГОНАЛЬНЫМ ФУНКЦИЯМ
Пусть случайный процесс ξ(t ) задан на интервале [0, Τ] с корреляционной функцией R (t1 , t 2 ) и нулевым математическим ожиданием, mξ (t ) = 0 . Рассмотрим интегральное уравнение Τ
∫ R (t , u )ϕ(u )du = λϕ(t ) ,
(3.17)
0
которое называется однородным интегральным уравнением Фредгольма II рода. Из теории интегральных уравнений известно, что его решение существует при счетном наборе постоянных λ 1 ≥ λ 2 ≥ ... ≥ λ n , называемых собственными числами уравнения
Фредгольма. Решение ϕ i (t ) , соответствующее λ i , называется соб-
153
ственной функцией ядра R(t , u ) . Собственные функции могут быть сделаны ортогональными, то есть Τ
∫ ϕ i (t )ϕ j (t )dt = δ ij ,
(3.18)
0
где δ – символ Кронекера. Так как ядро уравнения (3.17) являетij ся корреляционной функцией R (t , u ) , а значит, положительно определенной, то все λ > 0 , и по теореме Мерсера [10] ядро может i быть представлено в виде ряда по собственным функциям ∞
R (t , u ) = ∑ λ i ϕ i (t )ϕ i (u ) .
(3.19)
i =1
Теорема 3.7. Случайный процесс ξ(t ) можно представить в виде ряда n
ξ(t ) = l.i.m. ∑ ξ k (w)ϕ k (t ),
(3.20)
n → ∞ k =1
Τ
где ξ k (w) = ∫ ξ(t )ϕ k (t )dt – некоррелированные СВ с Mξ k (w) = 0 , 0
Dξ k (w) = λ k .
Доказательство. Рассмотрим свойства СВ ξ k (w), k = 1,2,... . Поскольку Mξ(t ) = 0 , то
Τ Τ Mξ k (w) = M ∫ ξ(t )ϕ k (t )dt = ∫ Mξ(t )ϕ k (t )dt = 0 . 0 0 Найдем корреляционный момент M {ξ k (w)ξ l (w)}:
Τ Τ M {ξ k (w)ξ l (w)} = M ∫ ∫ ξ(t )ξ(u )ϕ k (t )ϕ l (u )dtdu = 0 0
154
Τ
Τ
0
0
= ∫ ϕ k (t )dt ∫ R(t , u )ϕ l (u )du С учетом (3.17) и (3.18) имеем Τ
M {ξ k (w)ξ l (w)}= λ l ∫ ϕ k (t )ϕ l (t )dt = λ l δ kl . 0
Отсюда видно, что СВ ξ k (w), k = 1, 2,... , некоррелированы и
Dξ k (w) = λ k . Найдем также вспомогательное выражение Τ Τ M {ξ k (w)ξ(t )} = M ξ(t )∫ ξ(u )ϕ k (u )du = ∫ R(t , u )ϕ k (u )du = λ k ϕ k (t ) . 0 0 Докажем теперь основное утверждение теоремы. Рассмотрим предел 2
n lim M ξ(t ) − ∑ ξ k (w)ϕ k (t ) = n→∞ k =1 n n = lim R(t , t ) − 2 ∑ {ξ(t )ξ k (w)}ϕ k (t ) + ∑ λ k ϕ k2 (t ) = n →∞ k =1 k =1 n = lim R(t , t ) − ∑ λ k ϕ 2k (t ) = 0, n →∞ k =1
согласно (3.19). Используя определение сходимости в среднем квадратичном, получаем представление (3.20). Разложение (3.20) является единственным разложением случайного процесса в ряд по ортогональным функциям с некоррелированными коэффициентами [10]. Основное достоинство этого разложения заключается в том, что оно позволяет вместо случайного процесса ξ(t ) рассматривать ряд (3.20) с некоррелированными СВ ξ (w), ξ (w),..., ξ (w),... . 1
2
k
155
ГЛАВА 4 ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ. ГАУССОВСКИЙ И ВИНЕРОВСКИЙ СЛУЧАЙНЫЕ ПРОЦЕССЫ §19. ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ
Рассмотренное в §4 понятие независимости СВ играет важную роль в теории случайных процессов. На основе этого понятия был введен класс процессов с независимыми приращениями. Определение. Случайный процесс ξ(t ) называется процессом с независимыми приращениями, если для любого n и для любых моментов времени
t1 < t 2 < ... < t n СВ ξ(t1 ) , ξ(t 2 ) − ξ(t1 ),..., ξ(t n ) − ξ(t n−1 ) независимы.
Определение. Процесс с независимыми приращениями ξ(t )
называется однородным, если ξ(0 ) = 0 и для любых моментов времени t1 < t 2 распределение СВ ξ(t 2 ) − ξ(t1 ) зависит только от разности t 2 − t1 и не зависит от t1 . Пример 4.1. Одним из важных примеров процесса с независимыми приращениями является пуассоновский процесс (см. пример 2.3). Введем понятие данного процесса несколько по другому. Назовём пуассоновским процессом v(t ) процесс с независимыми приращениями, для которого при любых t1 < t 2 СВ v(t 2 ) − v(t1 ) принимает только неотрицательные целые значения, v(0) = 0 , а также k λ (t 2 − t1 )] [ P{v(t 2 ) − v(t1 ) = k } =
e − λ (t 2 −t1 ) , k = 0, 1, 2, ...
(4.1) k! Очевидно, что пуассоновский процесс является однородным, так как распределение СВ v(t 2 ) − v(t1 ) зависит только от разности 156
t 2 − t1 . Вероятность того, что на интервале времени [t1 , t 2 ) не наступит изменение состояния процесса (вероятность того, что реализация процесса на этом интервале является константой), равна P0 (t 2 − t1 ) = e − λ (t 2 −t1 ) . Вероятность того, что значение процесса увеличится на 1 (произойдет единичный скачок) на интервале времени [t1 , t 2 ) , равна
P1 (t 2 − t1 ) = λ(t 2 − t1 )e − λ (t 2 −t1 ) , и так далее. Реализации процесса являются ступенчатыми неубывающими функциями, поскольку с вероятностью 1 СВ ξ(t 2 ) − ξ(t1 ) принимает только неотрицательные значения, и вероятность того, что на интервале времени [t1 , t 2 ) не произойдет изменение значения процесса положительна. Остановимся ещё на одном свойстве пуассоновского процесса. Поскольку v(0) = 0 , то очевидно, что v(t ) имеет такое же распределение, как v(t ) − v(0 ), т.е распределение пуассоновского процесса в момент времени t совпадает с распределением приращения v(t ) − v(0 ) в этот момент. Поэтому знание распределения вероятностей данной разности определяет распределение процесса. Если v(t ) означает число событий, наступивших на интервале времени [0, t ) , то v(t 2 ) − v(t1 ) является числом событий, наступивших на интервале времени [t1 , t 2 ) . Обозначим через t ′, t ′′ две соседние точки скачков реализации процесса, т.е. v(t 2 ) − v(t1 ) = 0 для t ′ < t1 ≤ t 2 < t ′′ ,
v(t ), lim v(t ) < lim v(t ) . lim v(t ) < lim ′ ′′ ′′
t →t ′− 0
t →t + 0
t →t − 0
t →t + 0
Рассмотрим ф.р. СВ t ′′ − t ′ :
P (t ′′ − t ′ ≤ t ) = 1 − P (t ′′ − t ′ > t ) = 1 − P (t ′′ > t ′ + t ) =
= 1 − P(v(t ′ + t ) − v(t ′) = 0 ) = 1 − e − λt , согласно (4.1). Отсюда следует, что время пребывания процесса в каждом из состояний имеет экспоненциальное распределение.
157
Найдем средние характеристики пуассоновского процесса. Из соотношения (4.1) следует (2.6), откуда (см. §6, пример ) имеем ∞
m j (t ) = ∑ k
(λt )k
(4.2) e − λt = λt . k! Используя (2.6), (4.1), (4.2) можно найти ковариационную функцию k =0
K v (t1 , t 2 ) = M [v(t1 )v(t 2 )] − mv (t1 )mv (t 2 ) , которая при t < t равна 1 2 ∞
K v (t1 , t 2 ) = ∑ k1 k 2 P(v(t1 ) = k1 , v(t 2 ) = k 2 ) − λ2 t1t 2 = ∞
k1 , k 2 = 0 k1 ≤ k 2
[
]
= ∑ k1 (k 2 − k1 ) + k12 P (v(t1 ) = k1 )P (v(t 2 ) − v(t1 ) = k 2 − k1 ) − λ2 t1t 2 = k1 , k 2 = 0 k1 ≤ k
= λt1 λ(t 2 − t1 ) + λt1 + λ2 t12 − λ2 t1t 2 = λt1 . Отсюда следует, что дисперсия процесса имеет вид
Dv (t ) = K v (t , t ) = λt , а корреляционная функция Rv (t1 , t 2 ) = λt1 (λt 2 + 1) . Корреляционная функция является непрерывной и поэтому из теоремы 3.2 вытекает, что пуассоновский процесс является непрерывным в среднем квадратичном. Из (4.3) следует, что ∂ 2 Rv (t , t ) ∂t
2
=
∂ 2 K v (t , t ) ∂t
2
+ λ2 ,
2 поэтому ∂ Rv (t , t ) существует тогда и только тогда, когда суще∂t 2 2 ствует ∂ K v (t , t ) . ∂t 2
158
Но (см. пример 3.2) ∂ 2 K v (t , t ) ∂t
2
1 [K v (t + h, t + h ) − K v (t , t + h) − K v (t + h, t ) + K v (t , t )] = 2 →0 h
= lim h
2
1 [K v (t + h, t + h) − K v (t , t + h) − K v (t , t + h ) + K v (t , t )] = 2 h 2 →0 h λ 1 = lim 2 [λ(t + h ) − λt − λt + λt ] = lim = ∞, h→0 h h 2 →0 h
= lim
следовательно, на основании теоремы 3.5, пуассоновский процесс не дифференцируем в среднем квадратичном. §20. ОБОБЩЕННЫЙ ПУАССОНОВСКИЙ ПРОЦЕСС
Пусть t1 , t 2 , ..., t n , ... – моменты изменения состояний пуассоновского процесса. Таким образом, t1 , t 2 − t1 , ..., t n − t n −1 , ... – независимые СВ с плотностью распределения p(x ) = λe − λx , x ≥ 0 . Пусть η1 , η 2 , ..., η n , ... – СВ с общей ф.р. H (x ) . Допустим, что СВ (t1 , t 2 , ..., t n , ...; η1 , η 2 , ..., η n , ...) независимы в совокупности. Обозначим v (t )
ξ(t ) = ∑ η n = ∑ η n , t n
n =1
где v(t ) – пуассоновский процесс с параметром λ . Случайный процесс ξ(t ) , определенный этим равенством, называется обобщенным пуассоновским процессом. Основное свойство обобщенного пуассоновского процесса – независимость его приращений в непересекающихся интервалах времени: если n ≥ 2 – любое число, 0 ≤ τ 0 < τ1 < ... < τ n , то СВ ζ 1 = ξ(τ1 ) − ξ(τ 0 ), ..., ζ n = ξ(τ n ) − ξ(τ n −1 ) независимы в совокупности. Действительно,
ζi =
∑
ηn τi −1
.
По формуле полной вероятности имеем 159
P (ζ i ≤ xi , i = 1, n ) =
=
∑
k 0 , k1 ,...,k n
(
P (vi = k i , i = 1, n )P ζ i ≤ xi , i = 1, n vi = k i , i = 1, n
),
где vi = v(τ i ) − v(τ i −1 ), i ≥ 1, v 0 = v(τ 0 ) . На основании свойства пуассоновского процесса и формулы (4.1) можно записать
(
)
n
P v i = k i , i = 1, n = ∏
[λ(τ i − τ i −1 )]k
i
ki !
i=0
e −λ (τi − τi −1 ) ,
(4.6)
где предполагается, что a = 0 . Если теперь зафиксировать −1 , то v = k , v = k , ..., v = k 0
0
1
1
n
n
ξ(τ 0 ) = η1 + η 2 + ... + η k0 ,
ξ(τ1 ) = η1 + η 2 + ... + η k0 + k1 , ... ξ(τ n ) = η1 + η 2 + ... + η k0 + k1 +...+ k n . Отсюда
ζ 1 = η k0 +1 + η k 0 + 2 + ... + η k0 + k1 , ζ 2 = η k0 + k1 +1 + η k0 + k1 + 2 + ... + η k0 + k1 + k 2 ,
(4.7)
... ζ n = η k0 +...+ kn −1 +1 + η k0 +...+ k n −1 + 2 + ... + η k0 + k n . Таким образом, ξ i при фиксированных k 0 , k1 , ..., k n представляет собой суммы независимых СВ (разных для различных i ). Пусть H (m ) (x ) = P(η + η + ... + η ≤ x ) , тогда 1 2 m
P (ζ i ≤ xi , i = 1, n v 0 = k 0 , v1 = k1 , ..., v n = k n ) = =H
(k1 )
(x1 )H (k ) (x 2 ) ⋅ ... ⋅ H (k ) (x n ). 2
160
n
(4.8)
Подставив соотношения (4.8), (4.6) в формулу (4.5), найдем
(λτ 0 )k
∞
P(ζ i ≤ xi , i = 1, n ) = ∑
k 0 =0
k0 !
0
[λ(τ i − τ i −1 )]k e −λ (τ −τ
∞
n
e −λτ 0 ∏ ∑
i
i
i −1
ki !
i =1 k i = 0
)
H (ki ) (xi ) .
Просуммировав по k 0 от 0 до ∞ , приходим к формуле
(
)
n
P ξ i ≤ x i , i = 1, n = ∏
[λ(τ i − τ i −1 )]k
i
ki !
i =1
e −λ (τ i − τ i −1 ) H (k i ) (x i ) ,
(4.9)
откуда следует, что ζ i независимы в совокупности. Если
(τ i − τ i −1 ) = τ, i = 1, n , то
ζ i одинаково распределены.
Положим n = 1, τ 0 = 0, τ1 = t , k1 = k . Тогда из формулы (4.9) находим ∞
(λt )k
k =0
k!
Fξ (t ) (x ) = P(ξ(t ) ≤ x ) = ∑
Пусть ∞
∞
−∞
−∞
e − λt H (k ) (x ) .
(4.10)
ψ(θ) = ∫ e iθx dH (x ), ϕ t (θ ) = ∫ e iθx dFξ (t ) (x ) .
Тогда
∞
ψ k (θ) = ∫ e iθx dH (k ) (x )
(4.11)
−∞
как характеристическая функция суммы независимых одинаково распределенных СВ. Умножая левую и правую части (4.10) на e iθx , проинтегрировав от − ∞ до ∞ и учитывая равенство (4.11), получим ∞
ϕ t (θ) = ∑
[λtψ(θ)]k
e − λθ = e − λt [1− ψ (θ )] .
(4.12) k! Пусть, например, интервалы между поступлениями запросов на центральный сервер компьютерной сети имеют экспоненциальk =0
ное распределение с параметром λ . Длительности обработки запросов – независимые СВ с ф.р. H (x ) . Тогда характеристическая 161
функция суммарного времени обработки запросов, которые поступили на сервер за время t , определяется формулой (4.12). Найдем среднее значение этой СВ. Предположив, что Mη1 < ∞ , имеем
M ζ = −iϕ′t (0) = −iλtψ ′(0 ) = −iλtiMη1 = λtMη1 . §21. ГАУССОВСКИЙ СЛУЧАЙНЫЙ ПРОЦЕСС
Важную роль во многих прикладных задачах играют случайные процессы, конечномерное распределение которых является нормальным (гауссовским). Процессы такого рода возникают тогда, когда складывается большое число независимых или слабозависимых случайных процессов примерно одинаковой мощности. В этом случае, как показано ниже, с увеличением числа слагаемых сумма сходится к гауссовскому (нормальному) случайному процессу независимо от того, как распределены отдельные слагаемые. Пусть случайный процесс ξ(t ) задан n сечениями ξ(t1 ), ξ(t 2 ), ..., ξ(t n ) , для которых известны математические ожида-
(
)
ния Mξ(t i ) = a i , i = 1, n , и матрица ковариаций K = K t i , t j ,
i, j = 1, n , где
(
[
)
)]
(( )
K t i , t j = M (ξ(t i ) − a i ) ξ t j − a j . Определение. Случайный процесс ξ(t ) называется гауссовским, или нормальным, если его n -мерная плотность распределения является нормальной p(x1 , t1 ; x 2 , t 2 ; ...; x n , t n ) =
1
(2π)
n 2
1 n exp− ∑ (xi − a i )K ij x j − a j 2 K i , j =1 K
[
(
)]
для любого n > 0 . Здесь K – определитель матрицы K , K i , j – ал-
(
)
гебраическое дополнение элемента K ti , t j матрицы K .
162
Почти все свойства гауссовских процессов вытекают из свойств многомерных нормальных СВ. Например, коэффициенты разложения гауссовского случайного процесса в ряд по ортогональным функциям являются независимыми нормальными СВ. Это следует из того, что линейное преобразование многомерной нормальной СВ является также многомерной нормально распределенной СВ. Теорема 4.1 (центральная предельная теорема для случайных процессов). Пусть дана последовательность сумм случайных процессов mn
η n (t ) = ∑ ξ nk (t ), n = 1, 2, ... , k =1
и выполняются следующие условия: а) при фиксированном n и любых моментах времени
t1 , t 2 , ..., t mn
( )
СВ ξ n1 (t1 ), ξ n2 (t 2 ), ..., ξ nm t mn независимы и имеют конечные
[
n
]
моменты Mξ nk (t ) = 0 , M ξ 2nk (t ) = b n2k (t ) ; б) существует предел
lim Rn (t1 , t 2 ) = R(t1 , t 2 ) ,
n →∞
где R n (t1 , t 2 ) = M [η n (t1 )η n (t 2 )] –- корреляционная функция процесса η n (t ) ; в) суммы η n (t ) при любом t удовлетворяют условию Линдеберга 1
mn
∑ ∫ x 2 dFn (x, t ) m→ 0 ∀τ > 0 ,
B n2 (t ) k =1 x ≥ τBn2
k
n →∞
где m
n Bn2 (t ) = ∑ bnk (t ) = R n (t , t ), Fnk (t ) - ф.р. СВ ξ nk (t ) .
k =1
163
Тогда случайный процесс η n (t ) при n → ∞ сходится к гауссовскому случайному процессу с нулевым математическим ожиданием и дисперсией R(t1 , t 2 ) . Эта теорема вытекает из центральной предельной теоремы для сумм независимых СВ. §22. ВИНЕРОВСКИЙ СЛУЧАЙНЫЙ ПРОЦЕСС
История возникновения этого случайного процесса началась с наблюдений английского ботаника Р.Броуна в 1827 г., заметившего, что маленькие частицы, помещенные в жидкость, совершают непрерывное беспорядочное движение. В 1905 г. А.Эйнштейн объяснил это явление тем, что наблюдаемые молекулы подвержены непрерывным соударениям с молекулами окружающей среды. Выведенные А.Эйнштейном аналитические результаты были позднее проверены экспериментально и обобщены другими физиками и математиками. Первое математически чёткое построение теории таких процессов было дано Н.Винером в 1918 г. и в его более поздних работах. Пусть ξ(t ) – расстояние броуновской частицы от начальной точки в момент времени t . Смещение ξ(t 2 ) − ξ(t1 ) за интервал времени [t1 , t 2 ) можно рассматривать как сумму большого числа малых смещений. В этой ситуации применима центральная предельная теорема, поэтому естественно ожидать, что ξ(t 2 ) − ξ(t1 ) имеет нормальное распределение. Аналогично естественно предположить, что распределения величин ξ(t 2 ) − ξ(t1 ) и ξ(t 2 + τ) − ξ(t1 + τ) совпадают при любом τ > 0 , если среда находится в равновесии. Наконец, интуитивно ясно, что смещение ξ(t 2 ) − ξ(t1 ) должно зависеть только от t 2 − t1 , а не от момента начала наблюдения. Винеровский процесс, называемый также процессом броуновского движения, играет фундаментальную роль при изучении мно164
гих случайных процессов других типов и широко применяется в различных областях, в частности, в финансовой математике и экономике [9] (см. главу 11). Определение. Однородный гауссовский процесс с независимыми приращениями ξ(t ) , для которого
m ξ (t ) = 0 , Dξ (t ) = σ 2 t , называется винеровским процессом (или процессом броуновского движения). вид
Ковариационная функция такого процесса при t1 < t 2 имеет
[
]
K (t1 , t 2 ) = M [ξ(t1 )ξ(t 2 )] = M ξ(t1 )(ξ(t 2 ) − ξ(t1 )) + ξ 2 (t1 ) = = Mξ(t1 )M [ξ(t 2 ) − ξ(t1 )] + Mξ 2 (t1 ) = Mξ 2 (t1 ) = σ 2 t1 . (4.13) Отсюда следует, что винеровский процесс является непрерывным, но не является дифференцируемым в среднем квадратичном; это можно показать аналогично, как для пуассоновского процесса. Ковариационная матрица винеровского процесса записывается в виде t1 2 t1 K =σ t 1
t1
.
.
.
t2 .
.
.
.
.
.
t2
.
.
.
t1 t2 . t n
Определение. Винеровский процесс, у которого σ = 1, ξ(0 ) = 0 , называется стандартным винеровским процессом (стандартным броуновским движением) и обычно обозначается W (t ) . Найдем n -мерную плотность распределения такого процесса. Введем обозначения
η1 = W (t1 ), η i = W (t i ) − W (t i −1 ) , где i > 1, t1 < t 2 < ... < t n . Из (4.13), (4.14) следует, что 165
(4.14)
Mη12 = t1 , Mη i2 = M [ξ(t i ) − ξ(t i −1 )] = (t i − 2t i −1 + t i +1 ) = t i − t i −1 , i = 2, 3, ..., n . 2
(
)
[
( ( )
(4.15)
( ))]=
M η i η j = M (W (t i ) − W (t i −1 )) W t j − W t j −1 = (t i − t i −1 − t i + t i −1 ) = 0 , 1 < i < j < n .
СВ (η1 , η 2 ,..., η n ) является n -мерной СВ, имеющей нормальное распределение. Её плотность распределения записывается в виде ~ p ( y , t ; y , t ; ...; y , t ) = 1
1
2
2
n
n
y2 n y i2 1 exp − 1 ∏ exp − , 2πt1 2t1 i = 2 2π(t i − t i −1 ) 2(t i − t i −1 ) поэтому n -мерная плотность распределения винеровского процесса имеет вид =
1
p(x1 , t1 ; x 2 , t 2 ; ...; x n , t n ) = =
(x − x i −1 )2 x2 n 1 exp − 1 ∏ exp − i . 2πt1 2(t i − t i −1 ) 2t1 i = 2 2π(t i − t i −1 ) 1
166
ГЛАВА 5. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ §23. ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ
Марковские случайные процессы, или процессы без последствия, являются удобной математической моделью для многих реальных процессов. Рассмотрим систему, которая может находиться в различных состояниях, и пусть ее эволюция во времени носит стохастический характер, то есть состояние системы в момент времени t в общем случае не определяется однозначно состояниями системы в предыдущие моменты s < t . Тогда состояние этой системы можно описать некоторым случайным процессом ξ(t ) , заданным на интервале времени T и принимающим значения из множества X . Пусть заданы n сечений этого процесса ξ(t1 ), ξ(t 2 ),..., ξ(t n +1 ) в моменты t1 < t 2 < ... < t n +1 . Рассмотрим условную плотность вероятностей p( x n +1 , t n +1 / x1 , t1 ; x 2 , t 2 ;...; x n , t n ) =
p( x1 , t1 ; x 2 , t 2 ;...; x n +1 , t n +1 ) . (5.1) p ( x1 , t1 ; x 2 , t 2 ;...; x n , t n )
Случайный процесс ξ(t ) называется марковским, если его условная плотность распределения (5.1) не зависит от значений процесса в моменты t1 , t 2 ,..., t n −1 , а определяется лишь значением
ξ(t n ) = x n , т.е. p( xn+1 , t n+1 / x1 , t1 ; x2 , t 2 ;...; xn , t n ) = p ( x n+1 , t n+1 / xn , t n ) . (5.2) Эту условную плотность вероятностей называют вероятностью перехода системы из состояния x n , в котором она находилась в момент времени t n , в состояние x n +1 в момент t n +1 > t n и обозначают (5.3) p( x , t / x , t ) = p ( x , t ; x , t ) . n +1
n +1
n
n
167
n +1
n +1
n
n
Рассмотрим многомерную плотность распределения процесса
ξ(t ) . С учетом условия марковости (5.2) ее можно записать в виде p( x1 , t1 ; x 2 , t 2 ;...; x n +1 , t n +1 ) = p ( x n +1 , t n +1 / x n , t n ) p ( x n , t n / x n−1 , t n −1 ) × (5.4) ×... ⋅ p ( x2 , t 2 / x1 , t1 ) ⋅ p( x1 , t1 ) . Отсюда видно, что начальное одномерное распределение p( x1 , t1 ) и вероятности перехода p(t , x; y, s ) , t > s , полностью задают марковский процесс. Вероятности перехода удовлетворяют двум основным соотношениям: а) ∫ p( x, t; y, s )dx = 1 (условие нормировки); б) проинтегрируем (5.4) по некоторому промежуточному значению x i , например, по x 2 :
p( x1 , t1 ; x3 , t 3 ;...; xn+1 , t n+1 ) = p( xn+1 , t n+1 ; x n , t n ) ⋅ ... ⋅ p ( x1 , t1 ) × × ∫ p( x3 , t 3 ; x2 , t 2 ) p( x2 , t 2 ; x1 , t1 )dx2 ; с другой стороны, по формуле (5.4) имеем p( x1 , t1 ; x3 , t 3 ;...; xn+1 , t n+1 ) = p ( xn+1 , t n+1 ; xn , t n ) ⋅ ... ⋅ p ( x 4 , t 4 ; x3 , t 3 ) × × p( x3 , t 3 ; x1 , t1 ) p( x1 , t1 ) ; из сопоставлений этих выражений видно, что (5.5) p( x3 , t 3 ; x1 , t1 ) = ∫ p ( x3 , t 3 ; x 2 , t 2 ) p( x2 , t 2 ; x1 , t1 )dx 2 . В общем случае определение марковского процесса может быть дано следующим образом. Пусть X ⊆ R . Определение. Случайный процесс ξ(t ) , t ∈ T , со значениями в X называется марковским, если ∀t1 < t 2 < ... < t n < t n +1 ∈ T и любых борелевских множеств B1 , B2 ,..., Bn−1 , Bn+1 из R при фиксированном борелевском множестве Bn выполняется следующее соотношение P (ξ(t n +1 ) ∈ Bn +1 / ξ(t1 ) ∈ B1 , ξ(t 2 ) ∈ B2 ,..., ξ(t n ) ∈ Bn ) = = P (ξ(t ) ∈ B / ξ(t ) ∈ B ). n +1
n +1
168
n
n
При этом очевидно (по определению условной вероятности), что
P (ξ(t1 ) ∈ B1 , ξ(t 2 ) ∈ B2 ,..., ξ(t n ) ∈ Bn ) > 0 . Если t n – настоящий момент времени, t n +1 – некоторый момент в будущем, а t1 , t 2 , ..., t n −1 – некоторые моменты в прошлом. Поэтому можно сказать, что марковский случайный процесс – это процесс, из которого «при фиксированном настоящем будущее не зависит от прошлого». Марковские процессы можно разбить на классы в зависимости от структуры множества значений случайного процесса X и интервала наблюдения T . Определение. Если множество X = {i1 , i2 , ..., in , ...} счетно или конечно, то марковский процесс называется цепью Маркова. Множество значений цепи Маркова X называют еще фазовым пространством или пространством состояний цепи Маркова. Определение. Цепь Маркова, у которой множество T дискретно, например, T = {0, 1, 2, ...} , называется цепью с дискретным временем, а цепь Маркова, у которой T – некоторый интервал положительной длины (конечный или бесконечный), называется цепью с непрерывным временем. Для цепи Маркова с дискретным временем можно записать P (ξ n +1 = in +1 / ξ1 = i1 , ξ 2 = i2 ,..., ξ n = in ) = P(ξ n +1 = in +1 / ξ n = in ),
где in = ξ(t n ) – состояние цепи Маркова в некоторый дискретный момент времени t , t < t < ... < t < ... . То есть ξ полностью оп1 2 n n n +1 ределяется значением ξ n и (n + 1) -м элементарным событием ω n +1 из последовательности независимых элементарных событий {ω } . n Рассмотрим примеры цепей Маркова с дискретным временем. Пример 5.1. Производится последовательность независимых испытаний, каждое из которых может быть «успешным» с вероят169
ностью p и «неудачным» с вероятностью q = 1 − p . Обозначим через ν n – число успехов в первых n испытаниях, n = 1,2,... . Введем СВ
1, если (n + 1) − е испытание успешно, η n +1 = η n +1 (ω n +1 ) = 0, в противном случае. Очевидно, что ν n +1 = ν n + η n +1 , поэтому {ν n } – цепь Маркова. Пример 5.2. Имеется водохранилище, которое в любой момент времени t ≥ 0 характеризуется некоторым уровнем наполнения x(t ) . Минимальный уровень равен 0. Приток воды происходит в моменты τ, 2τ, ..., nτ,... , причем порции воды, поступающие (ω ) (ω ) в эти моменты – независимые СВ η1 1 , η 2 2 , ..., η(nωn ) . Сток воды равномерен, т.е. за время dt в интервале между nτ и (n + 1)τ уровень наполнения водохранилища уменьшается на величину αdt , α > 0 , если этот уровень еще не достиг нуля. Пусть ξ n – уровень наполнения водохранилища в момент, непосредственно следующий за моментом поступления n -й порции воды:
ξ n = x(nτ + o) = lim x(nτ + ε) . ε ↓0
Тогда
ξ n − ατ + η n +1 , ξ n − ατ > 0, ξ n +1 = η n +1 , ξ n − ατ ≤ 0, и поэтому {ξ n } является цепью Маркова. Опишем похожую модель из теории запасов. Пример 5.3. Рассмотрим систему, в которой запасается некоторый товар с целью удовлетворения постоянного спроса. Предположим, что восполнение запаса осуществляется в моменты времени t1 , t 2 ,..., t n ,..., а суммарный спрос η n (ω n +1 ) на товар в интервале (t n −1 , t n ) является СВ с распределением 170
P{η n = k} = p k , k = 0,1,2,..., ∞
одинаковым для всех интервалов, p k ≥ 0 , ∑ p k = 1 . Уровень запаk =0
са фиксируется в начале каждого периода. Стратегия запаса такова: если имеющееся количество товара не превышает некоторого критического уровня u , то производится немедленное пополнение запаса до U > u . Если же имеющееся количество товара больше u , то пополнение не производится. Пусть ξ n означает уровень
наличного запаса непосредственно перед моментом t n . Множество состояний процесса {ξ n } складывается из возможных значений уровня запаса
U , U − 1, ..., 1, 0, − 1, − 2, ..., где отрицательные значения интерпретируются как неудовлетворенный спрос (эти заказы подлежат немедленному исполнению при пополнении запаса). Согласно описанной стратегии уровни запаса двух последовательных периодов связаны соотношением ξ n − η n +1 , u < ξ n ≤ U , ξ n +1 = U − η +1 , ξ n ≤ u. Если предположить, что СВ η1 , η 2 ,..., η n ,... независимы, то уровни запаса {ξ n } , n = 0,1, 2, ... , образуют марковскую цепь. Пример 5.4. Предположим, что изменение величины заряда ξ ≥ 0 в электронной лампе описывается следующим законом. В интервалах между попаданием на сетку заряженных частиц заряд убывает по экспоненциальному закону с параметром α ; в момент
попадания n -й частицы заряд увеличивается на СВ η n (ω n ) . Пусть τ n – время между попаданием на сетку (n − 1) -й и n -й частиц, ξ n – величина заряда после попадания на сетку n -й частицы. Тогда
171
ξ n +1 = ξ n e
− ατ n + 1
+ η n +1 .
Если двумерные СВ (τ n , η n ) независимы в совокупности, то последовательность {ξ n } является цепью Маркова. Пример 5.5. Пусть на стоянку такси в единичные моменты времени прибывают (по одной в каждый момент) машины. Если на стоянке нет ожидающих, то машина немедленно уезжает. Обозначим через ηn (ωn ) число пассажиров такси, приходящих в момент n на стоянку, и будем предполагать, что η1 , η 2 ,..., ηn ,... – независимые СВ. Пусть ξ n – длина очереди в момент n , ξ 0 = 0 . Тогда, если ξ n = i , то в следующий момент n + 1 длина очереди ξ n +1 станет равной
Иначе говоря,
η n +1 , i = 0, i − 1 + η n +1 , i ≥ 1. ξ n +1 = (ξ n − 1) + + η n+1 ,
где a + = max(a,0) , и значит, последовательность {ξ n } образует цепь Маркова. Определение. Если множество состояний X непрерывно и система переходит из состояния в состояние в произвольные моменты времени из множества T , то соответствующий процесс называется непрерывным марковским процессом. Например, координата броуновской частицы принимает значения из непрерывного множества X и переходы происходят в произвольные моменты времени. §24. ОДНОРОДНЫЕ ЦЕПИ МАРКОВА
Рассмотрим цепь Маркова с дискретным временем и, для простоты, с конечным числом состояний X = {1,2,..., N } . Вероятности 172
pij( n ) = P (ξ m + n = j | ξ m = i ) , n ≥ 1 , m ≥ 1 , i, j ∈ X (5.6) называются вероятностями перехода цепи Маркова за n шагов, а pij(1) = pij – просто вероятностями перехода (за один шаг). Матрица вида p11 p P = 21 . p N1
p1N p2 N . p NN
p12 ... p22 ... . . p N 2 ...
называется матрицей вероятностей перехода цепи Маркова. Очевидно, что сумма элементов в каждой строке этой матрицы равна 1, т.е. _____
∞ ∑ pij = 1 , i = 1, N , т.к. за один шаг цепь Маркова либо остается в j =1
своем состоянии, либо переходит в какое-то иное состояние. Пусть (0) pi( 0) вероятность состояния i на нулевом шаге; набор { pi , i ∈ X } называется начальным распределением цепи Маркова. Определение. Если вероятности перехода (5.6) не зависят от , то цепь Маркова называется однородной. m Понятно, что свойства однородных марковских цепей полностью определяются начальными распределениями и вероятностя-
ми перехода pij . В конкретных случаях для описания эволюции цепи вместо явного выписывания матрицы P = p используют ij ориентированный граф, вершинами которого являются состояния из множества X , а стрелка
pij j
i
173
означает, что из состояния i возможен переход в состояние j с вероятностью pij ; в том случае, когда pij = 0 , соответствующая стрелка не проводится. Пример 5.6. Одномерное случайное блуждание. При рассмотрении системы случайных блужданий состояние системы для наглядности интерпретируют как движение движущейся частицы. Одномерное случайное блуждание представляет собой марковскую цепь, пространство состояний которой состоит из конечного или бесконечного множества целых чисел. Если частица находится в состоянии i , то за один шаг она может либо перейти в одно из своих соседних состояний (i − 1 или i + 1) соответственно с вероят-
ностями qi и pi , либо остаться в состоянии i с вероятностью ri . Граф переходов для случая, когда пространством состояний служит множество неотрицательных целых чисел, представлен на рис. 19. ri
r0 pi −1
p0 0
q1
1
.
.
.
i −1
qi
pi
i
qi +1
i +1
.
Рис. 19
Матрица вероятностей переходов имеет вид
r0 q1 0 P=
p0 r1 q2 .
0 p1 r2 .
0 0 p2 .
.
qi .
ri .
pi .
0 .
, .
где p0 , r0 ≥ 0 , p0 + r0 = 1 ; pi , qi > 0 , ri ≥ 0 , pi + qi + ri = 1 , i ≥ 1 . 174
.
Пусть ξ n – состояние частицы через n шагов. Тогда
pi i +1 = P(ξ n +1 = i + 1 / ξ n = i ) = pi , pi i −1 = P (ξ n +1 = i − 1 / ξ n = i ) = qi , pii = P (ξ n+1 = i / ξ n = i) = ri , i ≥ 1 , q0 = 0 , pij = 0 для i − j > 1 . В пользу названия «случайное блуждание» для процесса такого типа говорит тот факт, что его реализация описывает путь «абсолютно пьяного» человека, делающего случайным образом шаг назад или шаг вперед. Процессом случайного блуждания описывают также капитал игрока, участвующего в серии партий азартной игры. Предположим, что игрок A , имеющий капитал i , играет с бесконечно богатым партнером; при этом вероятность того, что он выиграет партию и увеличит свой капитал на единицу, равна pi , а вероятность того, что он проиграет и тем самым уменьшит свой капитал на единицу, равна qi = 1 − pi , i ≥ 1 . Зависимость вероятностей выигрыша и проигрыша от i отражает возможную зависимость условий игры от капитала. Так, можно условиться, что, оказавшись в состоянии 0, соответствующем разорению игрока A , процесс остается в этом состоянии, т.е. r0 = 1 . Процесс {ξ n } , где ξ n – размер капитала игрока A после n партий, является процессом случайного блуждания. Этот процесс известен под названием «задачи о разорении игрока». Пусть
теперь
X = {0, ± 1, ± 2,..., ± N } ,
p0( 0 ) = 1 ,
p NN = p( − N )( − N ) = 1 , а для i < N : p, j = i + 1, pij = q, j = i − 1, 0, в остальных случаях. Граф переходов для случая N = 3 изображен на рис. 20.
175
(5.7)
1
p −3
q −2
q −1
p q
p 0
q
p
p 1
q
2
1 3
Рис. 20
Эта цепь отвечает игре двух игроков A и B , когда капитал каждого равен N и на каждом шаге игрок A с вероятностью p выигрывает у игрока B + 1 и проигрывает − 1 с вероятностью q . Если трактовать состояние i как величину выигрыша игрока A у игрока B , то достижение состояний N и − N означает разорение игрока B и игрока A соответственно. В самом деле, если η1 , η 2 ,...η n – независимые бернуллиевские СВ, для которых P (η i = +1) = p , P (ηi = −1) = q , S 0 = 0 , а S n = η1 + η 2 + ... + η n – величина выигрыша игрока A у игрока B , то последовательность {S n } образует цепь Маркова с p0 = 1 и ве-
роятностями перехода (5.7), поскольку S n+1 = S n + η n+1 и
P ( S n+1 = j / S n = in , S n−1 = in−1 ,...) = = P ( S n + η n+1 = j / S n = in , S n−1 = in−1 ,...) = = P ( S n + η n+1 = j / S n = in ) = P (η n+1 = j − in ) . Рассмотрим теперь цепь Маркова с непрерывным временем. Вероятности (5.8) pij (t ) = P(ξ( s + t ) = j / ξ( s) = i ) , s ≤ t , i, j ∈ X . называются вероятностями перехода цепи Маркова за время t . Введем также следующее обозначение для вероятностей состояний pi (t ) = P(ξ(t ) = i ) , t > 0 , i ∈ X .
Набор { pi (0), i ∈ X } называется начальным распределением цепи Маркова с непрерывным временем. 176
Определение. Если вероятности перехода (5.8) не зависят от s , то цепь Маркова с непрерывным временем называется однородной. Вернемся опять к пуассоновскому случайному процессу (см. примеры 2.3, 4.1) и покажем в качестве примера, что он является однородной цепью Маркова с непрерывным временем. При этом само определение процесса мы введем опять несколько по-другому. Пример 5.7. Простейший поток событий. Пуассоновский процесс. Пусть {z k } , k = 1,2, ... – последовательность независимых положительных СВ, имеющих одно и то же экспоненциальное распределение с ф.р.
FzK ( x) = P ( z k ≤ x) = 1 − e − λx , x ≥ 0 . Положим t 0 = 0 , t k = z1 + z 2 + ... + z k , k ≥ 1 ; очевидно, что t k +1 > t k . Множество точек {t k } , k = 0,1,2,... , называется простей-
шим пуассоновским потоком однородных событий. Число тех
k , для которых a ≤ t k < b , называется числом событий потока в интервале [a, b] . Обозначим через ν(t ) , t ≥ 0 , число событий простейшего потока в интервале [0, t ) . Определенный таким образом случайный процесс ν(t ) назовем пуассоновским процессом с параметром λ . Покажем, что выполняется следующее соотношение
P(ν( s + t ) = j | ν( s ) = i ) =
(λt ) j −i e −λt , ( j − i )!
Введем следующие обозначения (см. рис 5.3):
177
j≥i.
(5.9)
z1′ = z i +1 − ( s − t i ),
t 0′ = 0,
z ′2 = z i + 2 ,
t k′ = z1′ + z 2′ + ... + z k′
z 3′ = z i +3 ,
ti′+ k = s + t k′ .
(5.10)
... z 2′
z1′ 0
ti
s
ti +1
z k′ ti + 2
ti + k
s+k
ti + k +1
Рис. 21
Ясно, что P (ν (t ) = k ) = P (t k < t , t k +1 ≥ t ) . Кроме того (см. рис. 21),
(5.11)
P (ν ( s + t ) = i + k | ν( s ) = i) = P (t k′ < t , t k′ +1 ≥ t | ν( s ) = i ) . (5.12) Из свойства экспоненциального распределения (см. §4) сле-
дует, что СВ z1′ = z i +1 − τ , где τ = s − t i , имеет такое же экспоненциальное распределение, как и СВ z i +1 , если τ > 0 и z1′ ≥ 0, то есть, если ti < s и ti +1 ≥ s , что эквивалентно ν( s ) = i . Отсюда вытекает, что при выполнении условия (ν( s) = i) СВ {z ′k } , k = 1,2,... , независимы и одинаково распределены по экспоненциальному закону с параметром λ . Тогда из (5.10) – (5.12) получаем (5.13) P (ν ( s + t ) = i + k | ν( s ) = i ) = P(ν(t ) = k ) . Теперь по индукции докажем, что выполняются соотношения − λt (2.1), (2.6). При k = 0 имеем P (ν (t ) = 0) = P (t1 > t ) = e , то есть (2.6) выполнено. Предположим, что (2.6) выполняется при некото-
ром k и покажем, что оно будет иметь место для k + 1 . Используя определение ν(t ) и формулу полной вероятности, имеем 178
t
P(ν(t ) = k + 1) = ∫ P (ν (t − x) = k )d (1 − e −λx ) = 0
t
=∫ 0
[λ(t − x)]k e −λ (t − x ) λe −λx dx = λk +1e −λt k!
k!
t
k ∫ (t − x) dx = 0
t
(λt ) k +1 −λt , λk +1e −λt (t − x) k +1 = e =− (k + 1)! (k + 1)! 0 т.е. формула (2.6) справедлива и для k + 1 , а значит, справедлива
∀ k ≥ 0. . Из соотношений (5.13) и (2.6) следует (5.9). Рассмотрим основные свойства пуассоновского процесса и соответственно простейшего потока событий. 1. Стационарность означает, что для любых интервалов времени [τ 0 , τ1 ), [τ1 , τ 2 ),..., [τ n −1 , τ n ) , где 0 ≤ τ 0 < τ1 < τ 2 < ... < τ n , любого τ > 0 и любых неотрицательных чисел k1 , k 2 ,..., k n вероятность того, что на интервале [τ 0 , τ1 ) произойдет k1 событий потока, …, на интервале [τ1 , τ 2 ) произойдет k 2 событий потока, …, на интервале [τ n−1 , τ n ) произойдет k n событий потока равна вероятности того, что на интервале [τ 0 + τ, τ1 + τ) произойдет k1 событий потока, на интервале [τ1 + τ, τ 2 + τ) произойдет k 2 событий потока, на интервале [τ n −1 + τ, τ n + τ) – k n событий потока. Это свойство можно также сформулировать по-другому: для любых фиксированных 0 ≤ τ 0 < τ1 < τ 2 < ... < τ n , любого τ > 0 многомерные СВ и
(ν (τ1 ) − ν(τ 0 ), ν(τ 2 ) − ν (τ1 ),..., ν(τ n ) − ν (τ n −1 ) (ν (τ1 + τ) − ν(τ 0 + τ), ν(τ 2 + τ) − ν(τ1 + τ),..., ν (τ n + τ) − ν(τ n −1 + τ)) имеют одинаковое распределение.
179
2. Ординарность означает, что вероятность того, что на интервале [t , t + ∆t ) произойдет два или более событий, равна o( ∆t ) при ∆t → 0 , т.е.
P (ν (t + ∆t ) − ν(t ) ≥ 2 ) = o(∆t ) , ∆t → 0 . 3. Отсутствие последействия означает, что при 0 ≤ τ 0 < τ1 < τ 2 < ... < τ n , СВ (ν (τ1 ) − ν(τ 0 ), ν(τ 2 ) − ν (τ1 ),..., ν(τ n ) − ν (τ n −1 ) независимы. Можно показать, что выполняется следующее соотношение
P (ν (τ1 ) − ν(τ 0 ) = k1 , ν(τ 2 ) − ν( τ1 ) = k 2 , ..., ν (τ n ) − ν (τ n−1 ) = k n ) = ki n [λ ( τ − τ i i −1 )] (5.14) = ∏ e −λ ( τi −τi −1 ) , k ! i =1 i откуда и следует свойство отсутствия последействия простейшего потока событий. Свойство стационарности вытекает из того, что в последнюю
формулу входят лишь разности τ i − τ i −1. Таким образом, если ко всем τi добавить некоторое τ , то вид вероятности (5.14) не изменится. Величина ν(t + ∆t ) − ν (t ) , согласно (5.9), имеет распределение Пуассона с параметром λ∆t . Отсюда следует свойство ординарности, поскольку P(ν (t + ∆t ) − ν(t ) ≥ 2 ) = 1 − P(ν(t + ∆t ) − ν (t ) = 0 ) −
− P (ν(t + ∆t ) − ν (t ) = 1) = 1 − e − λ∆t − λ∆te − λ∆t = (λ∆t ) 2 + O(∆t 3 ) . 2 Простейший поток событий и пуассоновский процесс (как уже упоминалось выше) имеют огромное число приложений. Этими = e −λ∆t (e −λ∆t − 1 − λ∆t ) =
180
математическими схемами можно описать самые различные модели многих явлений. Об их применении речь будет идти в последующих главах. Покажем, что пуассоновский процесс является цепью Маркова. В силу отсутствия последствия
P (ν (τ1 ) = k1 , ν (τ 2 ) = k 2 , ..., ν(τ n ) = k n )=
P (ν (τ1 ) = k1 , ν (τ 2 ) − ν(τ1 ) = k 2 − k1 , ..., ν(τ n ) − ν(τ n−1 ) = k n − k n−1 ) = n
= P (ν(τ1 ) = k1 )∏ P (ν(τ l ) − ν (τ l −1 ) = k l − k l −1 ) , l =2
P (ν(τ1 ) = k1 , ν(τ 2 ) = k 2 , ..., ν(τ n +1 ) = k n+1 ) = . n +1
= P(ν (τ1 ) = k1 )∏ P(ν (τ l ) − ν (τ l −1 ) = k l − k l −1 ) . l =2
Поэтому, используя определение условной вероятности и формулу (5.14), имеем
P (ν(τ n +1 ) = k n +1 | ν(τ1 ) = k1 , ν(τ 2 ) = k 2 , ..., ν (τ n ) = k n ) = = P(ν (τ n +1 ) − ν (τ n ) = k n+1 − k n ) =
[λ(τ n +1 − τ n )]k
n +1 − k n
e − λ ( τ n +1 − τn ) . (k n +1 − k n )! Кроме того, используя (5.13) и (2.6), получаем =
P (ν (τ n+1 ) = k n+1 / ν (τ n ) = k n ) = P (ν(τ n+1 − τ n ) = k n+1 − k n ) = =
[λ(τ n+1 − τ n )]k
Таким образом,
n +1 − k n
(k n +1 − k n )!
e −λ ( τn +1 −τn ) .
P (ν(τ n +1 ) = k n +1 / ν (τ1 ) = k1 , ν( τ 2 ) = k 2 , ..., ν(τ n ) = k n ) = , P = P (ν(τ ) = k / ν(τ ) = k ), n +1
n +1
n
n
значит, ν(t ) – цепь Маркова. Ее ординарность следует из соотношения (5.9) (выражение справа в нем не зависит от s ). 181
ГЛАВА 6. ЦЕПИ МАРКОВА С ДИСКРЕТНЫМ ВРЕМЕНЕМ §23. УРАВНЕНИЯ ЧЕПМЕНА–КОЛМОГОРОВА
Рассмотрим однородную цепь Маркова с дискретным временем. Ее вероятности перехода (5.6) не зависят от m . Теорема 6.1. Переходные вероятности pij(n ) однородной цепи Маркова удовлетворяют уравнению Чепмена–Колмогорова: pij( n +l ) = ∑ pik( n ) p kj(l ) .
(6.1)
k
Доказательство. Используя определение условной вероятности, легко проверить, что для любых случайных событий A , B , C справедливо равенство P( A " B / C ) = P( A / C ) P( B / A " C ) ,
(6.2) если P(C ) ≠ 0 , P ( A " C ) ≠ 0 . Случайные события (ξ = k ) , k = 1, 2, ... , n образуют полную группу, поэтому ! (ξ n = k) = Ω . Для вероятносk
тей переходов за n + l шагов можно записать
pij( n+l ) = P (ξ n+l = j / ξ0 = i ) = P ((ξ n+l = j ) " Ω / ξ0 = i ) = = P (ξ n+l = j ) " ! (ξ n = k ) / ξ0 = i = ∑ P ((ξ n+l = j ) " (ξ n = k ) / ξ0 = i ). k k
Пусть A = (ξ n = k ) , B = (ξ n +l = j ) , C = (ξ 0 = i ) . Тогда, используя марковское свойство и равенство (6.2), получаем
pij( n+l ) = ∑ P (ξ n = k / ξ0 = i )P (ξ n+l = j /(ξ n = k ) " (ξ 0 = i ) ) = k
= ∑ pik( n ) P (ξ n+l = j / ξ n = k ) = ∑ pik( n ) p kj(l ) , k
k
что и требовалось доказать.
182
Из соотношения (6.1) следует, что переход цепи Маркова из состояния i в состояние j за n + l шагов может осуществиться путем перехода ее в некоторое промежуточное состояние k за первые n шагов и далее перехода из состояния k в состояние j за оставшиеся l шагов. Особо важны следующие два частных случая уравнения (6.1): обратное уравнение (когда n = 1 ) (6.3)
p ij(l +1) = ∑ p ik p kj(l ) k
и прямое уравнение (когда l = 1 ) (6.4)
pij( n +1) = ∑ pik( n ) p kj , k
см. рис. 22, 23.
j
j i
i
0
1
0
l +1
Рис. 22. К обраттному уравнению
n
n +1
Рис. 23. К прямому уравнени.
Из обратного уравнения (6.3) следует
P (l ) = PP (l −1) = PPP (l −2) = ... = P l , где P – матрица вероятностей переходов за один шаг, P (l ) = pij(l ) – матрица вероятностей переходов за l шагов, т.е. для того чтобы получить матрицу вероятностей переходов за l шагов, нужно матрицу вероятностей переходов за один шаг возвести в степень l .
183
Пример 6.1. Некоторая совокупность семей поделена на три группы: i1 – семьи, не имеющие квартиры и не намеревающиеся ее купить; i2 – семьи, не имеющие квартиры, но собирающиеся ее купить; i3 – семьи, имеющие квартиру. Статистические обследования дали возможность оценить вероятность перехода семей из одной группы в другую на протяжении года. При этом матрица вероятностей переходов оказалась следующей
0.8 0.1 0.1 P = 0 0.7 0.3 . 0 0 1 Например, p33 = 1 = P {семьи, которые в предыдущем году имели квартиру, и в следующем году будут ее иметь}, p 23 = 0.3 = P {семья, не имевшая в предыдущем году квартиры, будет ее иметь следующем году}, p 21 = 0 = P {семья, которая хотела купить квартиру в предыдущем году, в следующем году от этого намерения отказалась}. Нужно найти следующие вероятности: P1 = P {семья, не имевшая в предыдущем году квартиры и не собирающаяся ее купить, будет находиться в такой же ситуации через два года}, P2 = P {семья, не имевшая квартиры и не намеревающаяся ее приобрести, будет иметь квартиру через два года}. В данном случае имеем цепь Маркова с тремя состояниями i1 , i2 , i3 . Найдем матрицу вероятностей переходов за два шага (матрицу вероятностей перехода семей из одного состояния в другое через два года):
184
2
0,8 0,1 0,1 0,64 0,15 0,21 ( 2) 2 0,49 0,51 . P = P = 0 0,7 0,3 = 0 0 0 0 1 0 1 Поэтому искомые вероятности равны (2) ( 2) P1 = p11 = 0,64 ; P2 = p 23 = 0,51 . Пример 6.2. Рассмотрим однородную марковскую цепь с двумя состояниями, 0 и 1 , и матрицей вероятностей переходов
p 01 . p P = 00 p10 p11 Нетрудно найти матрицу переходных вероятностей за два шага: p 2 + p01 p10 p01 ( p00 + p11 ) . P ( 2 ) = 00 2 + + ( ) p p p p p p 11 11 01 10 10 00 Можно также по индукции показать, что P (n) = P n =
1 − p11 1 − p 00 + 2 − p 00 − p11 1 − p11 1 − p 00 1
− (1 − p00 ) , 1 − p00 − (1 − p ) 1 − p 11 11
n ( p00 + p11 − 1) +
2 − p00 − p11 в предположении, что
(6.5) p 00 + p11 − 1 < 1 . Отсюда видно, что если выполняется неравенство (6.5), то
P ( n ) n → →∞ и значит, lim pi(0n ) =
n →∞
1 − p11 1 − p00 , 2 − p00 − p11 1 − p11 1 − p00 1
1 − p11 , lim p ( n ) = 1 − p00 . i1 n → ∞ 2 − p00 − p11 2 − p00 − p11
185
Таким образом, при выполнении условия (6.5) поведение рассматриваемой марковской цепи подчиняется следующей закономерности: влияние начального состояния на вероятность нахождения цепи в том или ином состоянии исчезает с ростом времени (числа шагов); pij(n ) сходятся к предельным значениям π j , не зависящим от i и образующим распределение вероятностей: π 0 , π1 ≥ 0 , π 0 + π1 = 1 . Если к тому же все элементы pij > 0 , то предельные значения π 0 , π1 > 0 ; к этому свойству мы вернемся в §29. §26. НАХОЖДЕНИЕ ВЕРОЯТНОСТЕЙ ПЕРЕХОДОВ С ПОМОЩЬЮ ПРОИЗВОДЯЩИХ ФУНКЦИЙ
Рассмотрим однородную цепь Маркова с дискретным временем и конечным числом состояний, X = {1, 2, ..., N } . Прямое уравнение Чепмена–Колмогорова (6.4) для нее можно переписать в виде N
pij( n ) = ∑ pik( n −1) pkj , i, j = 1, N , n ≥ 2 .
(6.6)
k =1
Данное соотношение обычно используют для вычисления pij(n ) при небольших n . При больших n используют следующий метод. Обозначим
1, i = j , pij( 0) = δ ij = 0, i ≠ j.
(6.7)
Тогда уравнение (6.6.) выполняется при n = 1 , что можно проверить непосредственной подстановкой. Введем в рассмотрение производящие функции ∞
ψ ij ( z ) = ∑ pij( n ) z n . n =0
186
(6.8)
Ряд в правой части сходится по крайней мере при z < 1 , так как 0 ≤ pij( n ) ≤ 1 . Умножив обе части уравнения (6.6) на z n и просуммировав по n от 1 до ∞ , получим ∞
∞ N
n =1
n =1 k =1
∑ pij( n ) z n = ∑ ∑ pik( n−1) z n pkj
или ∞
∞ N
n =0
n =0 k =1
∑ pij( n ) z n − pij(0) = z ∑ ∑ pik( n ) z n pkj .
Отсюда следует, что
N
ψ ij ( z ) − pij( 0) = z ∑ ψ ik ( z ) p kj . k =1
Подставив в это равенство (6.7), находим N
ψ ij ( z ) − z ∑ ψ ik ( z ) p kj = δ ij , i, j = 1, N .
(6.9)
k =1
Получим систему N 2 уравнений с N 2 неизвестными. Однако как в левую, так и в правую часть равенства (6.9) входит одно и то же i , поэтому можно отдельно решить N уравнений при фиксированном i . Обозначим через ∆(z ) определитель этой системы (один и тот же для всех i ). Имеем
∆( z ) =
1 − zp11
− zp21
...
− zp N 1
− zp12
1 − zp22
...
.
.
.
− zp N 2 . .
− zp1N
− zp2 N
...
1 − zp NN
При малом z диагональные элементы близки к 1, а недиагональные – к 0, т.е. определитель ∆(z ) близок к 1. Значит, ∆( z ) ≠ 0 187
в некоторой окрестности точки z = 0 и система уравнений (6.9) имеет единственное решение. Так как коэффициенты этих уравнений – линейные функции z , то
ψ ij ( z ) =
Rij ( z ) ,
(6.10)
S ( z)
где Rij (z ) , S (z ) – некоторые полиномы. Выражение (6.10) после выделения целой части можно разложить на простейшие дроби вида
βr
(1 − α r z )
r +1
, где α r , β r – некоторые комплексные постоянные,
r = 0, 1, 2, ... . Далее будем исходить из тождества ∞
1 . 1 − αz n =0 Продифференцировав его r раз, получим
∑ αn z n =
∞
∑ n(n − 1) ⋅ ... ⋅ (n − r + 1)α n z n−r =
n=r
или, что то же самое,
α r r!
(1 − αz )r +1
1 ∞ 1 . ∑ (n + r )(n + r − 1) ⋅ ... ⋅ (n + 1)α n z n = r! n=r (1 − αz )r +1
Таким образом, каждой элементарной дроби вида
r = 1, 2, ... ,
соответствует
составляющая
β
(1 − αz )r +1
pij(n )
,
вида
β β соответствует состав(n + r )(n + r − 1) ⋅ ... ⋅ (n + 1)α n ; дроби 1 − αz r! ляющая pij(n ) вида βα n . Следовательно, pij(n ) равно конечной сумме всех указанных составляющих. 188
Описанным способом можно найти пределы lim p ( n ) , если ij n →∞
они существуют. Пример 6.3. Рассмотрим конечную однородную цепь Маркова с двумя состояниями, матрица вероятностей переходов которой имеет вид
a . 1 − a P = b 1− b Для определенности положим i = 1 . Тогда уравнения (6.9) принимают вид ψ11 ( z ) − zψ11 ( z ) p11 − zψ12 ( z ) p 21 = 1 , ψ12 ( z ) − zψ 11 ( z ) p12 − zψ12 ( z ) p 22 = 0 . Определитель этой системы равен
∆( z ) =
(1 − zp11 ) − zp12
− zp 21 = (1 − zp11 )(1 − zp 22 ) − z 2 p12 p 21 = (1 − zp22 )
= z 2 (1 − a − b) − z (2 − a − b) + 1 . Один из корней уравнения ∆( z ) = 0 равен 1 , другой равен
1 . 1− a − b
Поэтому вероятности p ( n ) должны иметь следующий вид: 1j
p1( nj ) = c j 1n + β j (1 − a − b) n = c j + β j (1 − a − b) n , j = 1, 2 . Далее, по правилу Крамера, находим ψ11 ( z ) = где
∆1 ( z ) , ψ ( z ) = ∆ 2 ( z ) , 12 ∆( z ) ∆( z )
∆1 ( z ) =
− zp21 , 0 1 − zp22
1
189
∆ 2 ( z) =
1 − zp22 − zp12
1 = zp12 = az . 0
Откуда следует, что
ψ11 ( z ) = =
a 1 b , ⋅ + a + b 1 − z (1 − a − b) (a + b)(1 − z )
ψ12 ( z ) =
=− таким образом,
1 − (1 − b) 2 z = z 2 (1 − a − b) − z ( 2 − a − b) + 1
az = z (1 − a − b) − z (2 − a − b) + 1 2
a 1 a 1 , ⋅ + ⋅ a + b 1 − z (1 − a − b) a + b 1 − z
( n) = p11
b a (1 − a − b) n , n ≥ 1 , + a+b a+b
a a (1 − a − b) n , n ≥ 1 . − a+b a+b Легко убедиться, что p ( n ) + p ( n ) = 1 при любом n ≥ 1 . Кроме 11 12 того, ( n) = p12
b , a , (n) = lim p12 → ∞ n a+b a+b если только исключить тривиальные случаи, когда a = b = 0 либо a = b −1 . (n) = lim p11
n →∞
§27. КЛАССИФИКАЦИЯ СОСТОЯНИЙ ЦЕПИ МАРКОВА ПО АРИФМЕТИЧЕСКИМ СВОЙСТВАМ ВЕРОЯТНОСТЕЙ ПЕРЕХОДА
Будем рассматривать цепь Маркова с дискретным временем и счетным числом состояний, X = {1, 2, ...} . 190
Определение. Состояние i ∈ X называется несущественным, если из него с положительной вероятностью можно за конечное число шагов выйти, но нельзя в него вернуться, т.е. ∃ m, j , что
pij( m ) > 0 , но ∀ n, j p (jin ) = 0 . Если из множества X выделить все несущественные состояния, то оставшееся множество существенных состояний обладает тем свойством, что, попав в него, цепь Маркова никогда из него не выйдет (рис. 24). Как станет ясно из дальнейшего, основной интерес представляют именно существенные состояния. 1 1/ 2 1/ 2 1 1/ 2 1/ 2 1/ 2 1/ 2 1
Существенные состояния
Несущественные состояния Рис. 24
Рассмотрим множество существенных состояний. Определение. Состояние j называется достижимым из состояния i (обозначается i → j ), если ∃ n ≥ 0 , что pij( n ) > 0 ( 0) ( pij = δ ij ). Состояния i и j называются сообщающимися (обозначается i ↔ j ), если j достижимо из i и i достижимо из j . По определению отношение « ↔ » является симметричным ( i ↔ j ⇒ j ↔ i ), рефлексивным ( i ↔ i ) и нетрудно убедиться, что оно транзитивно ( i ↔ j , j ↔ k ⇒ i ↔ k ). Поэтому множество существенных состояний разбивается на конечное или счетное число непересекающихся множеств X 1 , X 2 , ... , состоящих из сооб-
191
щающихся состояний и характеризующихся тем, что переходы между различными множествами невозможны. Определение. Множества X 1 , X 2 , ... называются классами, или неразложимыми классами, существенных сообщающихся состояний. Цепь Маркова, состояния которой образуют один неразложимый класс, называется неразложимой. Пример 6.4. Рассмотрим цепь Маркова с множеством состояний X = {1, 2, 3, 4, 5} и матрицей вероятностей переходов 1 3 1 4 P= 0 0 0
2 3
3
4 0
0 0
0
0
0
0
0 1 2 0
1 0 1
0 0 P 0 = 1 0 1 2 0
0 . P2
Граф переходов для этой цепи имеет вид (рис. 25). 2/3 1/3
1
1/4
1 2
3
1/2
1/2 4
1
5
Рис. 25
Ясно, что у рассматриваемой цепи есть два неразложимых класса X 1 = {1, 2} и X 2 = {3, 4, 5} , и исследование ее свойств сводится к исследованию свойств каждой из двух цепей, множествами состояний которых являются X 1 и X 2 , а матрицы вероятностей переходов равны соответственно P1 и P2 . Проведенная классификация позволяет провести матрицу вероятностей переходов к каноническому виду. Для этого выделим неразложимые классы и перенумеруем их, а также отдельно выделим несущественные состояния. Тогда матрица P примет вид 192
несущ. k сост.
II I I P1 0 II 0 P 2 P= . k 0 0 несущ. сост. B1 B2
0 0 0 0 , . Pk 0 Bk R
... . ...
где Ps – матрица вероятностей переходов s -го неразложимого класса, Bs – матрица вероятностей переходов из несущественных состояний в s -й класс, s = 1, k ; R – матрица вероятностей переходов по несущественным состояниям. Рассмотрим теперь какой-либо неразложимый класс, изображенный на рис. 26. 1 1/2
1/2
1/2
1/2
4
3
1/2
1/2
1/2
1/2
2 Рис. 26
Заметим, что здесь возвращение в каждое состояние возможно лишь за четное число шагов, переход в соседнее состояние – за нечетное число шагов, а матрица вероятностей переходов имеет блочную структуру:
193
0 0 P= 1 2 1 2
0
1
0 1 2 1 2
1
2
2 0
0
1 2 1 2 . 0 0
Отсюда видно, что класс X = {1, 2, 3, 4} разбивается на два s подкласса C = {1, 2} и C = {3, 4} , обладающих следующим свой0
1
ством цикличности: за один шаг цепь Маркова из C непременно 0 переходит в C1 , а из C1 – в C0 . Этот пример показывает возможность разбиения неразложимых классов на циклические подклассы. Определение. Будем говорить, что состояние j имеет период
d ( j ) , если выполнены следующие два условия: ( n) 1) p jj > 0 только для тех n , которые имеют вид n = d ( j ) m ;
2) d ( j ) есть наибольшее из чисел, обладающих свойством 1). Иначе говоря, d ( j ) есть наибольший общий делитель чисел ( n) n таких, что p (jjn ) > 0 (если p jj = 0 для всех n ≥ 1 , то полагаем
d ( j ) = 0 ). Теорема 6.2 (свойство периода состояния). Если состояния j i и сообщающиеся ( i ↔ j ), то их периоды равны ( d (i) = d ( j ) ). Иными словами, все состояния одного неразложимого класса X имеют один и тот же период d = d ( X ) . Доказательство. Пусть i, j ∈ X , т.е. i ↔ j . Тогда ∃ n, l , что pij( n ) > 0 , p (jil ) > 0 . Отсюда, используя уравнение Чепмена–Колмогорова, получаем pii( n +l ) = ∑ pik( n ) p ki(l ) ≥ pij( n ) p (jil ) > 0 , k
194
откуда следует, что n + l делится на d (i) , т.е. n + l = r1d (i ) . Аналогично p (jjn +l ) = ∑ p (jkn ) p kj(l ) ≥ p (jin ) pij(l ) > 0 , k
поэтому n + l делится на d ( j ) , т.е.
n + l = r2 d ( j ) . Таким образом, n + l делится и на d ( j ) , и на d (i) . Далее ∀ r > 0 имеем ( rd ( j )) ( l ) pii( n + rd ( j )+l ) = ∑ pik( n ) p km p mi ≥ pij( n ) p (jjrd ( j )) p (jil ) > 0 , k ,m
и, так как n + l делится на d (i) , то rd ( j ) также должно делиться на d (i) . Аналогично, в силу симметрии, можно показать, что ∀ r ′ > 0 r ′d (i ) делится на d ( j ) . Поскольку r , r ′ – произвольные положительные целые числа, а d (i) и d ( j ) – наибольшие общие делители соответствующих чисел, то d (i) = d ( j ) . Определение. Если d ( j ) = 1 ( d ( X ) = 1 ), то состояние j (класс
X ) называется апериодическим (эргодическим). Пусть d = d ( X ) – период неразложимого класса X . Несмотря на сложность переходов внутри класса, можно обнаружить некоторую цикличность в переходах из одной группы состояний в другую. Чтобы показать это, выберем некоторое начальное состояние i0 и введем для d ≥ 1 следующие подклассы:
{ = {j ∈ X : p
} > 0 ⇒ n ≡ 1(mod d )},
C0 = j ∈ X : pi(0nj) > 0 ⇒ n ≡ 0 (mod d ) , C1
(n) i0 j
…
{
}
C d −1 = j ∈ X : pi(0nj) > 0 ⇒ n ≡ d − 1(mod d ) . 195
Ясно, что X = C0 + C1 + ... + C d −1 . Покажем, что за один шаг движение из подкласса в подклассе осуществляется так, как показано на рис. 27. C0 C d −1
C1
C3
C2 Рис. 27
В самом деле, пусть состояние i ∈ C и p > 0 . Покажем, что p ij тогда j ∈ C . Пусть n таково, что p ( n ) > 0 . Тогда n = ad + p , p +1 (mod d ) i0i т.е. n ≡ p (mod d ) . Значит, n + 1 ≡ p + 1(mod d ) , откуда следует, что
pi(0nj+1) > 0 и j ∈ C p +1(mod d ) . Из-за переходов между подклассами, изображенными на рис. 27, подклассы C , p = 1, d − 1 , называют p циклическими подклассами. Заметим, что из приведенных рассуждений следует, что матрица вероятностей переходов неразложимого класса имеет блочную структуру
C0 C1 . . Cd −1
C0
C1 . . Cd −1
196
Рассмотрим некоторый подкласс C . Если в начальный моp мент времени система находилась в C , то в дискретные моменты 0 времени k = p + rd , r = 0, 1, ... , она будет находиться в подклассе
C p . Поэтому с каждым подклассом C p можно связать новую цепь Маркова с матрицей вероятностей переходов p (d ) , i, j ∈ C , коij p торая будет неразложимой и апериодической. Следовательно, в дальнейшем при рассмотрении предельных свойств вероятностей переходов p (n ) можно ограничиться рассмотрением только эргоij дических классов. С учетом проведенной в данном параграфе классификации все состояния цепи Маркова можно расположить по следующей схеме (рис.28). Множество всех состояний X Несущественные состояния
Существенные состояния
X1
X2
X3
Неразложимые классы C0
C1
Cd −1
Циклические подклассы Рис.28
197
§28. КЛАССИФИКАЦИЯ СОСТОЯНИЙ ПО АСИМПТОТИЧЕСКИМ СВОЙСТВАМ ПЕРЕХОДНЫХ ВЕРОЯТНОСТЕЙ
Пусть {ξ n } , n = 0, 1, 2, ... , – цепь Маркова с дискретным временем. Введем в рассмотрение следующие вероятности: f ii( k ) = P{ξk = i; ξl ≠ i, 1 ≤ l ≤ k − 1 / ξ0 = i} – вероятность первого возвращения цепи Маркова в состояние i в дискретный момент времени k (на k -м шаге), когда ξ0 = i ;
f ij( k ) = P{ξ k = j; ξl ≠ j , 1 ≤ l ≤ k − 1 / ξ0 = i} – вероятность первого попадания в состояние j в момент времени k , когда ξ0 = i . Используя марковское свойство, аналогично как при выводе уравнения Чепмена–Колмогорова, можно показать, что n
pij( n ) = ∑ f ij(l ) p (jjn − l ) . l =1
(6.11)
Введем также для каждого состояния i ∈ X , X = {1, 2, ...} , величину ∞
f ii = ∑ f ii( n ) , n =1
которая является вероятностью того, что цепь Маркова, выходящая из состояния i , рано или поздно вернется в это состояние. Определение. Состояние i ∈ X называется возвратным, если f ii = 1 , и невозвратным, если f ii < 1 . Каждое возвратное состояние можно в свою очередь отнести к одному из двух типов в зависимости от величины среднего времени возвращения (от его конечности или бесконечности). Величина ∞
µ i = ∑ nfii( n ) n =1
по определению математического ожидания равна среднему числу шагов, за которые цепь Маркова возвращается в состояние i , т.е. для цепи с дискретным временем характеризует среднее время воз198
вращения в состояние i . Величина µi−1 , очевидно, характеризует интенсивность возвращения в состояние i . Определение. Возвратное состояние i называется положительным, если µ i−1 > 0 , и нулевым, если µ i−1 = 0 . Итак, в зависимости от свойств вероятностей pii(n ) получаем классификацию состояний цепи, изображенную на рис. 6.8. Множество всех состояний X Возвратные состояния
Невозвратные состояния
Положительные состояния
Нулевые состояния
Рис. 29
Поскольку отыскание функций f ii(n ) довольно сложно, то для определения возвратности состояний полезен следующий критерий. Теорема 6.3 (критерий возвратности состояний). Состояние i ∈ X возвратно тогда и только тогда, когда ∞
∑ pii( n) = ∞ .
(6.12)
n =1
Если состояние i ∈ X возвратно и i ↔ j , то состояние i ∈ X также возвратно. Доказательство. Из соотношения (6.11) следует n
pii( n ) = ∑ f ii(l ) pii( n − l ) , l =1
и значит, ∞
∞ n
n =1
n =1l =1
∑ pii( n) = ∑ ∑ f ii(l ) pii( n − l ) . 199
Поменять местами индексы суммирования нам поможет рис. 30, на котором линиями указано направление движения по целым точкам. n
n
. . .
. . .
3
3 ∞ n
2
n =1l =1
1 0
1
2
3
∞ ∞
2
∑∑
∑∑
l =1 n =l
1
. . .
0
l
1
2
3
. . .
l
Рис. 30
Поменяв местами индексы суммирования, далее будем иметь ∞
∞
∞
∞
n =1
l =1
n=l
n=0
∑ pii( n ) = ∑ f ii(l ) ∑ pii( n − l ) = f ii ∑ pii( n ) =
∞ ∞ = f ii pii( 0) + ∑ pii( n ) = f ii 1 + ∑ pii( n ) . n =1 n =1 ∞
Отсюда следует, что если ∑ pii( n ) = A < ∞ , то f ii = n =1
поэтому состояние i невозвратно. Пусть выполняется соотношение (6.12). Тогда N
N
n
∑ pii( n ) = ∑ ∑ f ii(l ) pii( n −l ) =
n =1
n =1l =1
n
N
N
N
l =1
n =1
l =1
m =0
= ∑ f ii(l ) ∑ pii( n − l ) ≤ ∑ f ii(l ) ∑ pii( m ) для N ≥ n . Поэтому
N
n
∑ f ii(l ) ≥
l =1
∑ pii( n )
n =1 N
∑
m =0
200
pii( m )
,
A < 1, и 1+ A
откуда получаем N
∞
N
l =1
l =1
f ii = ∑ f ii(l ) ≥ ∑ f ii(l ) ≥
∑ piin
( )
n =1 N
∑
m =0
pii( m )
N→ →1 . ∞
Итак, если соотношение (6.12) выполнено, то f ii = 1 , т.е. состояние i возвратно. (r ) (l ) Докажем вторую часть теоремы. Пусть pij > 0 , p ji > 0 . Тогда ( r ) (l ) pii( n + r + l ) = ∑ pik( n ) pkm pmi ≥ pij( r ) p (jjn ) p (jil ) , k, m
∞
и если ∑ p (jjn ) = ∞ , то и соотношение (6.12) выполняется, т.е. соn =1
стояние i возвратно. Теорема доказана. Пример 6.5. Рассмотрим одномерное случайное блуждание частицы по целочисленным точкам действительной прямой (см. пример 5.6). За каждый переход частица перемещается на единицу вправо с вероятностью p и на единицу влево с вероятностью q ,
p + q = 1 . Следовательно, используя формулу Бернулли, получаем ( 2n) ! ( pq) n , n = 0, 1, 2, ... . n! n! Воспользуемся формулой Стирлинга
pii( 2 n +1) = 0 , pii( 2 n ) = C2nn p n q n =
n !~ 2π n n + 2 e − n . 1
Тогда
pii( 2 n ) ~
2 2 n ( pq) n πn
201
=
(4 pq) n πn
.
Легко проверить, что pq = p (1 − p) ≤
1 , причем равенство 4
имеет место только тогда, когда p = q =
pii( 2 n ) ~
1 . В этом случае 2
∞ 1 . Поэтому ряд ∑ pii( 2 n ) расходится тогда и только тогn =0 πn
да, когда p =
1 , и в данном случае все состояния являются воз2 ∞
вратными. При p ≠ q , когда 4 pq < 1 и ∑ pii( 2 n ) < ∞ , все состояния n =0
являются невозвратными. Интуитивно ясно, что в этом случае вероятность того, что частица, отправляясь из состояния i , будет смещаться к + ∞ , если p > q , и к − ∞ , если p < q , ни разу не возвращаясь в исходное состояние. Пример 6.6. Обратимся теперь к двумерному случайному блужданию по двумерной целочисленной решетке. Пусть вероятности смещения частицы на единицу вправо, влево, вверх, вниз
1 . Рассмотрим все траектории, 4 состоящие из j перемещений вправо, j перемещений влево, k являются одинаковыми и равны
перемещений вверх, k перемещений вниз, 2 j + 2k = 2n , от состояния i . Легко убедиться, воспользовавшись полиномиальным распределением, что
pii( 2 n +1) = 0 , n = 0, 1, 2, ... , 2n
pii( 2 n ) = ∑
j,k j+k =n
(2n)! 1 , n = 1, 2, ... . j! j!k!k! 4
202
(6.13)
Умножая числитель и знаменатель в правой части выражения (6.13) на (n!) 2 , получаем
p ii( 2 n )
1 = 4
2n
n
C 2nn ∑ C nj C nn − j , j =0
но n
∑ Cnj Cnn − j = C2nn .
j =0
Следовательно,
1 = 4
p ii( 2 n )
2n
(C ) . n 2 2n
Формула Стирлинга дает
pii( 2 n ) ~
1 . πn
Таким образом, соотношение (6.12), и в этом случае все состояния являются возвратными. Теорема 6.4. Если состояние j ∈ X невозвратно, то для любого i ∈ X ∞
∑ pij( n) < ∞ ,
n =1
pij( n )
=0. и, значит, nlim →∞ Доказательство. Из (6.11) и теоремы 6.3 следует ∞
∞ n
∞
∞
n =1
n =1l =1
l =1
n =0
∑ pij( n ) = ∑ ∑ f ij(l ) p (jjn −l ) = ∑ f ij(l ) ∑ p (jjn ) =
203
∞
∞
n=0
n=0
= f ij ∑ p (jjn ) ≤ ∑ p (jjn ) < ∞ , ∞
поскольку f ij = ∑ f ij(l ) ≤ 1 – вероятность того, что цепь Маркова, выl =1
шедшая из состояния i , рано или поздно попадет в состояние j . ∞
Итак, ряд ∑ pij( n ) сходится и, следовательно, pij( n ) → 0 при n → ∞ . n =1
Покажем, что свойство возвратности состояния является свойством всего класса. Рассмотрим марковскую цепь с конечным числом состояний X = {1, 2, ..., N } . Теорема 6.5. Все состояния апериодической неразложимой цепи Маркова возвратны. Доказательство. Предположим, что все состояния невозвратны. Тогда в силу предыдущей теоремы и конечности множества состояний имеем N
N
1 = lim ∑ pij( n ) = ∑ lim pij( n ) = 0 . n → ∞ j =1
j =1 n → ∞
Из этого противоречия следует, что все состояния не могут быть невозвратными. Пусть состояние i возвратно, а j – произвольное состояние. Так как i и j сообщающиеся, то, по теореме 6.3, состояние j также возвратно, что и завершает доказательство. Таким образом, все состояния конечного эргодического класса возвратны. Невозвратные состояния возможны только при бесконечном числе состояний. §29. ЭРГОДИЧЕСКИЕ ЦЕПИ МАРКОВА
Мы уже рассматривали примеры (пример 6.2), в которых вероятности переходов pij(n ) сходятся к предельным значениям π j , 204
не зависящим от i и образующим распределение вероятностей. Следующая теорема описывает широкий класс марковских цепей, обладающих так называемым свойством эргодичности: пределы
lim pij( n ) = π j не только существуют, не зависят от i , образуют рас-
n →∞
пределение вероятностей, т.е. π j ≥ 0 , j ∈ X , ∑ π j = 1 , но и такоj∈ X
вы, что π j > 0 ∀ j ∈ X . Такие распределения {π j } , j ∈ X , называются эргодическими. Сами вероятности называются финальными вероятностями состояний. Определение. Цепь Маркова с дискретным временем называется эргодической, если lim pij( n ) = π j , j ∈ X , ∑ π j = 1 .
n →∞
j∈ X
Теорема 6.6 (эргодическая теорема для цепей Маркова с дискретным временем и конечным числом состояний). Пусть
X = {1, 2, ..., N } . Тогда: 1) если ∃ n0 такое, что
min pij( n0 ) > 0 ,
(6.14)
i, j
то ∃ числа π1 , π 2 , ..., π N такие, что N
π j > 0 , j = 1, N , ∑ π j = 1
(6.15)
lim pij( n ) = π j ;
(6.16)
j =1
и ∀i ∈ X n→∞
2) числа π1 , π2 , ..., π N удовлетворяют системе уравнений N
π j = ∑ πk pkj = 1 , j = 1, N . k =1
205
(6.17)
Доказательство. Докажем первую часть теоремы. Введем обозначения
m (jn ) = min pij( n ) , M (j n ) = max pij( n ) , i, j = 1, N . i
Поскольку
i
N
pij( n +1) = ∑ pik pkj( n ) , k =1
то
m (jn +1) = min pij( n +1) = min ∑ pik pkj( n ) ≥ i
i
k
≥ min ∑ p ik min p kj( n ) = m (jn ) min ∑ p ik = m (jn ) , i
k
k
i
k
откуда следует, что m (jn ) ≤ m (jn +1) . Аналогично можно показать, что (n ) M (j n ) ≥ M (j n +1) , т.е. наибольшая из вероятностей pij с ростом n не может возрастать, а наименьшая не может убывать. Далее покажем, что
max pij( n ) − pkj( n ) n → 0 , →∞ i,k
тогда (6.17) выполняется. Для этого достаточно показать, что → 0 , j = 1, N . M (j n ) − m (jn ) n →∞
Пусть ε = min pij( n0 ) , ε > 0 согласно (6.14). Тогда i, j
[
]
pij( n0 + n ) = ∑ pik( n0 ) pkj( n ) = ∑ pik( n0 ) − εp (jkn ) pkj( n ) + ε ∑ p (jkn ) pkj( n ) = k
[
k
]
k
= ∑ pik( n0 ) − εp (jkn ) pkj( n ) + εp (jj2 n ) ≥
[
k
]
≥ m (jn ) ∑ pik( n0 ) − εp (jkn ) + εp (jj2 n ) = m(jn ) (1 − ε) + εp (jj2 n ) . k
Отсюда следует, что
m (jn0 + n ) ≥ m (jn ) (1 − ε) + εp (jj2 n ) . 206
(6.18)
Аналогичным образом можно показать, что M (j n0 + n ) ≤ M (j n ) (1 − ε) + εp (jj2 n ) . Объединяя эти неравенства, получаем
(
)
M (j n0 + n ) − m (jn0 + n ) ≤ M (j n ) − m (jn ) (1 − ε) и, следовательно,
(
)
→ 0 . M (jl n0 + n ) − m (jl n0 + n ) ≤ M (j n ) − m (jn ) (1 − ε)l l →∞
Итак, для некоторой подпоследовательности {n } , l = 1, 2, ... , l
→0 , M (j nl ) − m (jnl ) ≤ n→ ∞ l и поскольку разность M ( n ) − m( n ) монотонна по n , то соотношеj j ние (6.18) выполняется, а следовательно, имеет место и соотношение (6.16). Ясно также, что при n ≥ n0 m (jn ) ≥ m(jn0 ) ≥ ε > 0 , откуда вытекает, что π j > 0 , j = 1, N . Докажем вторую часть теоремы. Запишем прямое уравнение Чепмена–Колмогорова N
pij( n +1) = ∑ pik( n ) pkj , i, j = 1, N . k =1
Тогда
N
lim pij( n +1) = ∑ lim pik( n ) pkj
n →∞
k =1 n → ∞
и, используя (6.16), получаем систему уравнений (6.17). Теорема доказана. Следствие. Для апериодического неразложимого класса с конечным числом состояний справедливо соотношение (6.16). Если обозначить π = (π1 , π 2 , ..., π N ) , то (6.17) можно переписать в матричной форме (6.19) π = πP , 207
где P – матрица вероятностей переходов цепи Маркова. Рассмотрим еще одно важное следствие, вытекающее из эргодической теоремы. Пусть A – некоторая группа состояний цепи Маркова {ξ n } , A ⊆ X , и I A (x) – индикатор множества A :
1, x ∈ A, I A ( x) = 0, x ∉ A. Рассмотрим величину I A (ξ0 ) + I A (ξ1 ) + ... + I A (ξ n ) , n +1 характеризующую долю времени, проводимого цепью Маркова во v A ( n) =
множестве A . Поскольку
M [I A (ξ k ) / ξ0 = i ] = P (ξ k ∈ A / ξ0 = i) = ∑ pij( k ) = pi( k ) (A) , j∈ A
то M [v A (n) / ξ 0 = i ] =
и, в частности,
[
1 n (k ) ∑ pi (A) , n + 1 k =0
]
1 n (k ) . ∑ pij n + 1 k =0 Из математического анализа известно, что если последовательM v{ j }(n) / ξ0 = i =
ность x → x , то x0 + x1 + ... + xn → x . Поэтому, если n n →∞ n→∞ n +1
→ π j , то pij( k ) k →∞ → π A , где π A = ∑ π j . → π j , M v A (n) n M v{ j }(n) n →∞ →∞ j∈ A
Для эргодических цепей можно доказать большее – для величин I A (ξ 0 ), I A (ξ1 ), ..., I A (ξ n ), ... справедлив закон больших чисел.
208
Следствие (закон больших чисел). Для цепи Маркова с конечным числом состояний ∀ ε > 0 и произвольного начального распределения → 0 . P{v A ( n) − π A > ε}n →∞
Пример 6.7. Две автомашины A и B сдаются в аренду по одной и той же цене. Каждая из них может находиться в одном из двух состояний: i1 – машина работает хорошо, i2 – машина требует ремонта, которые образуют цепь Маркова. Матрицы вероятностей переходов между состояниями за сутки для этих машин равны соответственно
0,8 0,2 , 0,7 0,3 . PB = PA = 0,7 0,3 0,6 0,4 Определить финальные вероятности состояний для обеих автомашин. Какую автомашину стоит арендовать? Решение. Существование финальных вероятностей состояний след ует из условия (6.14). Найдем их для первой
(
)
(
)
π(1) = π1(1) , π(21) и для второй π( 2 ) = π( 2 ) , π( 2) автомашины, исполь1 2 зуя соотношение (6.19): π(1) = π(1) PA , π( 2 ) = π( 2 ) PB . Из первой системы уравнений имеем 0,8π1(1) + 0,7 π (21) = π1(1) , (1) (1) (1) 0,2π1 + 0,3π 2 = π 2 , (1) (1) π1 + π 2 = 1, откуда получаем (любое из первых двух уравнений системы можно исключить) π1(1) =
7 2 , π (21) = . Аналогично для второй автома9 9
209
2 1 , π (22) = . Отсюда следует, что первая автомашина 3 3 будет более часто находиться в исправном состоянии, чем вторая, т.е. лучше арендовать первую автомашину.
шины π1( 2 ) =
§30. О СРЕДНИХ ВРЕМЕНАХ ПЕРЕХОДОВ МЕЖДУ СОСТОЯНИЯМИ
Обозначим через Ek множество состояний k -го эргодического класса, Q – множество несущественных состояний, mi – среднее время перехода из i -го несущественного состояния, i ∈ Q , в k -й эргодический класс (среднее число шагов, за которые может осуществиться такой переход). Найдем это время. Цепь Маркова за один шаг может перейти из i -го несущественного состояния в некоторое состояние j ∈ Ek с вероятностью ∑ pij , тогда время перехода равно 1 . Если же цепь за первый шаг j ∈E k перейдет в другое состояние l ∈ Q с вероятностью pil , то среднее время перехода в эргодический класс будет равно 1 + ml , и окончательно имеем mi = 1 ⋅ ∑ pij + ∑ pil (1 + ml ) = j∈ E k
l ∈Q
= ∑ pij + ∑ pil + ∑ ml pil = j ∈E k
l ∈Q
l ∈Q
∑ pij + ∑ ml pil .
j ∈Q ! E k
(6.20)
l ∈Q
Решая эту систему уравнений относительно mi , i ∈ Q , получим нужные нам средние времена. Если нас интересуют средние времена перехода в каждый эргодический класс, то систему уравнений (6.20) удобно записать в матричном виде. Обозначим
m1 1 m2 , 1 m = e = , R = pij , i, j ∈ Q . & & 1 m k 210
Учитывая, что в этом случае
∑ pij = 1 , имеем
j ∈Q ! E k
m = e + Rm , т.е. m = ( I − R ) −1 e ,
где I – единичная матрица. Последнее соотношение и определяет вектор среднего времени перехода из несущественного состояния в эргодические классы. Рассмотрим теперь среднее время перехода из состояния в состояние внутри класса. Пусть E – множество состояний одного класса, i, j ∈ E . Через mij обозначим среднее число шагов, необходимых для переходов из i -го состояния в j -е состояние. За один шаг цепь может из i -го состояния с вероятностью pij перейти в j -е состояние, тогда время перехода будет равно 1 , и оно будет
равно 1 + mkj , если за этот шаг цепь перейдет из i -го состояния в некоторое промежуточное k -е состояние. Тогда по формуле для условного математического ожидания имеем mij = 1 ⋅ pij + ∑ pik (mkj + 1) k≠ j
или
mij = 1 + ∑ pik mkj − pij m jj .
(6.21)
k
Введем матричные обозначения
1 1 , , M = mij i, j ∈ E S = . 1
1 ... 1 m11 0 0 ... 0 1 ... 1 , 0 m22 0 ... 0 , D= . . . . . . . . 0 0 0 . mrr 1 ... 1 где r – число состояний данного класса. Тогда систему уравнений (6.21) можно переписать в матричном виде M = S + PM − PD , 211
откуда получаем
M = ( I − P) −1 ( SPD) . Эта формула определяет искомые средние значения времени перехода из одного состояния в другое. Выясним теперь, что собой представляют диагональные элементы матрицы D . Для этого умножим систему уравнений (6.21) на финальную вероятность i -го состояния πi и просуммируем по i :
∑ πi mij = 1 + ∑ mkj ∑ πi pik − m jj ∑ πi pij . i
k
i
Тогда с учетом формулы (6.17) имеем
i
∑ π i mij = 1 + ∑ π k mkj − π j m jj , i
откуда находим
k
1 . πj Таким образом, среднее время возвращения в исходное состояние обратно пропорционально финальной вероятности этого состояния. Это в свою очередь означает, что среднее время возвращения в положительное возвратное состояние конечно, в то время как для нулевых возвратных состояний оно бесконечно. m jj =
§31. СТАЦИОНАРНЫЕ ЦЕПИ МАРКОВА
Система уравнений (6.17) играет большую роль в теории марковских цепей. Всякое ее неотрицательное решение, удовлетворяющее условию нормировки, принято называть стационарным или инвариантным распределением вероятностей марковской цепи с матрицей переходных вероятностей P = pij , i, j = 1, N . Определение. Набор чисел { p j , j ∈ X } называется стационарным распределением цепи Маркова с дискретным временем, если 1) { p j , j ∈ X } является распределением вероятностей, т.е.
p j ≥ 0 , j ∈ X , ∑ p j =1; ∈X j
212
2)
∀ j ∈ X , ∀ n ≥ 0 имеет место равенство p j = ∑ pi pij( n ) . i∈X
Рассмотрим смысл этого определения. Предположим, что на ( n) n -м шаге стационарное распределение достиглось, т.е. p j = p j , (n ) ∀j ∈ X , где p j – вероятность того, что цепь Маркова находится в состоянии j на n -м шаге. Тогда, используя формулу полной вероятности, марковское свойство и приведенное выше определение, ∀m > n будем иметь p (jm ) = P(ξ m = j ) = ∑ P (ξ n = i) P (ξ m = j / ξ n = i) = i∈X
= ∑ pi( n ) pij( m − n ) = ∑ pi pij( m − n ) = p j , ∀j ∈ X , i∈ X
i∈ X
т.е. стационарное распределение будет сохраняться на любом шаге ( 0) m > n . В частности, если начальное распределение { p j , j ∈ X } совпадает со стационарным, то на любом шаге цепь Маркова будет иметь стационарное распределение, поэтому такая цепь Маркова называется стационарной. То же самое произойдет, если в качестве начального взять эргодическое распределение (π1 , π 2 , ..., π N ) , p (j0) = π j j = 1, N . Тогда N
p (j1) = ∑ π i pij = π j j = 1, N , i =1 и вообще p (jn ) = π j , j = 1, N . Условие (6.14) эргодической теоремы 6.6 гарантирует как существование пределов π j = lim pij( n ) , не заn →∞ висящих от i , так и существование эргодического распределения, т.е. распределения с π j > 0 , j = 1, N . Распределение (π1 , π 2 , ..., π N ) оказывается также и стационарным распределением. Покажем, что набор (π1 , π 2 , ..., π N ) является единственным стационарным распределением. Пусть (~ π1 , ~ π2 , ..., ~ π N ) – еще одно стационарное распределение. Тогда N
~ πj = ∑~ πk pkj( n ) и так как pkj( n ) n → π j , то →∞ k =1
213
N
(
)
~ πj = ∑ ~ πk π j = π j , j = 1, N . k =1
Отметим, что стационарное распределение вероятностей (и к тому же единственное) может существовать и для неэргодических цепей. Действительно, если
0 1 , P = 1 0
то
0 1 , 2n +1 1 0 , P = P 2n = 1 0 0 1 и поэтому пределы lim pij( n ) не существуют. В то же время система n→∞
2
π j = ∑ πk pkj , j = 1, 2 , k =1
превращается в систему уравнений
π1 = π 2 , π2 = π1 , единственное решение которой (π1 , π 2 ) , удовлетворяющее условию 1 1 нормировки π1 + π2 = 1 , есть , . 2 2 Приведем без доказательства ряд теорем, касающихся эргодических и стационарных цепей Маркова с дискретным временем и часто используемых при решении различных задач. Для марковской цепи с конечным числом состояний справедливо следующее утверждение. Теорема 6.7 (эргодическая теорема Маркова–Бернштейна). Если существуют такие j ∈ X и n ≥ 1 , что ∀ i ∈ X выполняется неравенство
pij( n ) ≥ λ > 0 , 214
то цепь Маркова является эргодической; существует единственное стационарное распределение этой цепи, совпадающее с эргодическим. Определение. Цепь Маркова с дискретным временем называется неприводимой, если ∀i, j ∈ X ∃n > 0 такое, что pij( n ) > 0 . Для неприводимых марковских цепей с конечным или счетным числом состояний справедливы следующие три утверждения. Теорема 6.8 (эргодическая теорема Феллера). Неприводимая апериодическая цепь Маркова относится к одному из следующих двух классов: а) все состояния цепи невозвратны (либо нулевые), в этом случае ∀ i, j ∈ X pij( n ) → 0 , и не существует стационарного n→∞ распределения цепи; б) все состояния цепи положительны, в этом случае
→ p j > 0 , при этом { p j , j ∈ X } является стационарным pij( n ) n→∞ распределением цепи и не существует других ее стационарных распределений. Из теоремы Феллера следуют два нижеприведенные утверждения. Теорема 6.9 (эргодическая теорема Фостера). Для того чтобы неприводимая апериодическая цепь Маркова была эргодична, необходимо и достаточно, чтобы система уравнений x j = ∑ xi pij , j ∈ X , j∈X
имела нетривиальное решение ( xi , i ∈ X ) , такое, что ∑ xi < ∞ . При j∈X
этом существует единственное стационарное распределение, которое совпадает с эргодическим. Теорема 6.10 (эргодическая теорема Маркова). Для тог, чтобы неприводимая апериодическая цепь Маркова была эргодична, достаточно существования ε > 0 , натурального числа i0 и набора неотрицательных чисел x0 , x1 , x2 , ... таких, что
∑ pij x j ≤ xi − ε для i > i0 ,
j∈X
215
∑ pij x j < ∞ для i ≤ i0 .
j∈X
При этом существует единственное стационарное распределение, совпадающее с эргодическим. Пример 6.8. На письменном столе лежит стопка из m книг. Если обозначить каждую книгу соответствующим номером, то порядок их расположения сверху вниз можно описать перестановкой из m чисел (i1 , i2 , ..., im ) , где i1 – номер книги, лежащей сверху, i2 – номер следующей книги, …, im – номер последней книги, лежащей в самом низу. Предположим, что книга с номером k берется с вероятностью α k , k = 1, m , причем при возвращении она кладется сверху. Рассмотрим произвольное состояние (i1 , i2 , ..., im ) . На следующем шаге оно либо останется неизменным, что происходит с вероятностью α i1 при выборе лежащей сверху книги с номером i1 , либо меняется на одно из m − 1 состояний вида (ik , i1 , ...) , что происходит с вероятностью α ik при выборе книги с номером ik = i1 . В данном примере мы имеем цепь Маркова с состояниями, каждое из которых описывается соответствующей перестановкой (i1 , i2 , ..., im ) и указанными переходными вероятностями. Если некоторая книга i никогда не выбирается (α i = 0) , то все состояния (i1 , i2 , ..., im ) , где i1 = i (книга с номером i лежит сверху), являются невозвратными, поскольку после первого же шага выбирается некоторая j -я книга, j ≠ i , и в дальнейшем i -я книга, никогда не вынимаемая из стопки, опускается ниже. Если каждая книга выбирается с положительной вероятностью α i > 0 , то каждое состояние достижимо из любого другого состояния (всего различных состояний, т.е. различных перестановок (i1 , i 2 , ..., i m ) имеется m! ), и все эти сообщающиеся состояния являются положительными, образуя один неразложимый класс. Из каждого состояния (i1 , i 2 , ..., i m ) можно перейти за m шагов в любое состояние ( j1 , j 2 , ..., j m ) с положительной вероятностью, превосходящей произведение α1 ⋅ α 2 ⋅ ... ⋅ α m (это произведение равно вероятности перехода из (i1 , i2 , ..., im ) в ( j1 , j 2 , ..., j m ) , когда на первом шаге выбирается книга с номером j m , на втором шаге – книга с номером j m −1 и т.д., на последнем m -м шаге выбирается книга с номером j1 ). 216
Следовательно, выполняется условие (6.14) эргодической теоремы 6.6 и с течением времени устанавливается стационарное распределение вероятностей. Рассмотрим вначале случай m = 2 . Тогда имеется лишь два состояния (1, 2) и (2,1) . Вероятности переходов имеют вид
p11 = p 21 = α1 , p12 = p 22 = α 2 , а матрица вероятностей переходов α α2 . P = 1 α1 α 2 Найдем вероятности перехода за два шага, используя соотношение P ( 2 ) = P 2 : ( 2) ( 2) p11 = p 21 = α12 + α1α 2 = α1 (α1 + α 2 ) = α1 , ( 2) ( 2) p12 = p 22 = α1α 2 + α 22 = α 2 (α1 + α 2 ) = α 2 .
Ясно, что P ( n ) = P n . При любом начальном распределении
{
}
вероятностей p1( 0 ) , p 2( 0 ) имеем (n) ( n) p1( n ) = p1( 0 ) p11 + p 2( 0 ) p 21 = α1 ( p1( 0 ) + p1( 0 ) ) = α1 , (n) p 2( n ) = p1(0 ) p 2( n ) + p 2(0 ) p 22 = α 2 ( p1( 0 ) + p1( 0 ) ) = α 2 , т.е. стационарное распределение устанавливается уже на втором шаге. Рассмотрим теперь случай произвольного m . Обозначим через
p(i1 , i2 , ..., im )( j1 , j2 , ..., jm ) вероятность перехода из состояния (i1 , i2 , ..., im ) в состояние ( j1 , j 2 , ..., j m ) . Как было показано,
p(i1 , i2 , ..., im )( j1 , j2 , ..., jm )
pik при (j1, j2 ,..., j m ) = (ik ,...), = 0 при остальных (j1, j 2 ,..., j m ),
217
где перестановка (ik ,...) получается из (i1 , i2 , ..., im ) выбором некоторого ik и перестановкой его на первое место. Стационарные вероятности p(i1 , i2 , ..., im ) , согласно (6.17), являются решением следующей системы линейных уравнений m
p( j1 , j2 , ..., jm ) = α j1 ∑ p( j2 , ..., jk −1 , j1 , jk ,...) . k =1
Интересно выяснить, с какой вероятностью каждая из имеющихся книг оказывается лежащей сверху, когда через достаточно большое число шагов практически устанавливается стационарное распределение вероятностей (т.е. когда стопка книг будет с неизменными вероятностями p (i1 , i2 , ..., im ) занимать соответствующие положения (i1 , i2 , ..., im ) ). Вероятность того, что сверху лежит книга с номером i , очевидно, равна
pi = ∑ p(i , i2 , ..., im ) , i2 , ..., im
где сумма берётся по всем состояниям, в которых на первом месте стоит i . Из уравнения для стационарных вероятностей состояний получаем, что
pi = ∑ α i ∑ p(i2 , ..., ik −1 , i , ik , im ) = i2 , ..., im
k
= α i ∑ p(i1 , i 2 , ..., i m ) = α i , i = 1, m , i 2 , ..., i m
т.е. вероятность pi того, что сверху находится книга с номером i , равна вероятности α i , с которой эта книга выбирается. Таким образом, чем чаще берётся та или иная книга, тем с большей вероятностью она будет находиться сверху.
218
§32. ОПТИМАЛЬНЫЕ СТРАТЕГИИ В МАРКОВСКИХ ЦЕПЯХ
Рассмотрим цепь Маркова с конечным множеством состояний X = {i1 , i2 , ..., i N } и матрицей вероятностей переходов . Пусть при переходе из состояния i j в состояние ik P = pij N ×N мы получаем некоторое вознаграждение r jk . Например, пусть i j , j = 1, N – различные места в городе; переход из i j в ik означает перевозку пассажиров такси по данному маршруту; тогда r jk – это прибыль, входящая в плату за проезд из ( i j ) в ( i k ). Найдем общее вознаграждение, которое следует ожидать после переходов цепи Маркова за n шагов. Предположим, что цепь Маркова находится в состоянии i j и пусть ν j (n) – суммарное среднее вознаграждение за n шагов, если вначале цепь находилась в состоянии i j . Тогда N
q j = ∑ r jk p jk – k =1
средний выигрыш после первого шага. Если после первого шага цепь Маркова находится в состоянии il , то средний выигрыш на оставшихся n − 1 шагах составит ν l (n − 1) . Поэтому полный средний выигрыш за n шагов равен N
ν j (n) = q j + ∑ p jl ν l (n − 1) . l =1
Введем матричные обозначения
ν1 (n) q 1 ν 2 ( n) q2 , . V ( n) = Q = . . . . . . ν ( n) q N N 219
Тогда в матричной форме последнее соотношение может быть переписано как
V (n) = Q + PV (n − 1) . В стационарном режиме среднее вознаграждение за один шаг может быть найдено в виде N
g = ∑ g jπ j , j =1
(6.22)
где π j , j = 1, N , – финальные вероятности состояний. Пример 6.9. Автомашина может находиться в двух состояниях: i1 – работает хорошо, i2 – требует ремонта. На следующий день работы она меняет свое состояние в соответствии с матрицей вероятностей переходов
0,7 0,3 . P = 0,6 0,4 Пусть, если машина работает нормально, мы имеем прибыль $40 ; когда она начинает работу в нормальном состоянии, а затем требует ремонта (либо наоборот), прибыль равна $20 ; если маши-
на требует ремонта, то потери составляют $20 . В данном случае
R = r jk
2×2
40 20 , = 20 − 20
q1 = 40 ⋅ 0,7 + 20 ⋅ 0,3 = 34 , q 2 = 20 ⋅ 0,6 − 20 ⋅ 0,4 = 4 . Найдем ожидаемую прибыль за два перехода между состоя-
34 ниями (за два шага). Так как V (1) = , то 4 34 0,7 0,3 59 V (1) = . V (2) = + 4 0,6 0,4 26 220
Таким образом, ожидаемая прибыль за два перехода составит $59 , если процесс начал развиваться из состояния i1 , и $26 , если
процесс начал развиваться из состояния i2 . Найдем финальные вероятности состояний π = (π1 , π 2 ) из со2 1 , π2 = . 3 3 Далее, используя (6.22), находим стационарное ожидаемое вознаграждение:
отношений π = πP , π1 + π 2 = 1 , откуда получаем π1 =
2 1 + 4 ⋅ = 24 . 3 3 Следовательно, если автомашина работает в течение многих переходов между состояниями, и неизвестно ее текущее состояq = 34 ⋅
ние, то ожидаемая прибыль за один шаг процесса равна $24 .
221
ГЛАВА 7. ЦЕПИ МАРКОВА С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ §31. НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ И СВОЙСТВА
Рассмотрим марковский процесс ξ(t ) с конечным или счетным множеством состояний X , который изменяет свои состояния в произвольные моменты времени непрерывного интервала T . Напомним, что такой процесс называется цепью Маркова с непрерывным временем. Очевидно, что для такой цепи Маркова P(ξ(t ) = j / ξ( s ) = k , ξ(t ) = i ) = P(ξ(t ) = j / ξ(t ) = i ) = p (t , t ) , (7.1) 2
1
2
1
ij
1
2
где i, j ∈ X , s, t1 , t 2 ∈ T , s < t1 < t 2 . Определение. Вероятность pij (t1 , t 2 ) называется вероятностью перехода из состояния i в состояние j за промежуток времени [t1 , t 2 ) ,
∑ pij (t1 , t 2 ) = 1 .
j∈X
В дальнейшем в основном будем рассматривать случай, когда T = [0, + ∞) . Теорема 7.1 (уравнение Чепмена–Колмогорова). Переходные вероятности p ij (t1 , t 2 ) удовлетворяют уравнению pij (t1 , t 3 ) = ∑ pik (t1 , t 2 ) p kj (t 2 , t3 ) , t1 < t 2 < t 3 .
(7.2)
k
Доказательство. Используя определение условной вероятности и то, что события (ξ(t 2 ) = k ), k = 1, 2, ... , образуют полную группу, а значит, ! (ξ(t 2 ) = k ) = Ω , будем иметь k
pij (t1 , t 3 ) = P(ξ(t 3 ) = j / ξ(t1 ) = i ) = P((ξ(t 3 ) = j ) " Ω / ξ(t1 ) = i ) =
222
= P (ξ(t 3 ) = j )" ! (ξ(t 2 ) = k ) / ξ(t1 ) = i = k = ∑ P(ξ(t 3 ) = j, ξ(t 2 ) = k / ξ(t1 ) = i ) = k
=∑ k
=∑ k
P(ξ(t3 ) = j , ξ(t 2 ) = k , ξ(t1 ) = i ) = P( ξ(t1 ) = i )
P(ξ(t 3 ) = j / ξ(t 2 ) = k , ξ(t1 ) = i ) P (ξ(t 2 ) = k , ξ(t1 ) = i ) = P( ξ(t1 ) = i )
= ∑ P(ξ(t 3 ) = j / ξ(t 2 ) = k , ξ(t1 ) = i )P(ξ(t 2 ) = k / ξ(t1 ) = i ) . k
Далее, используя марковское свойство (7.1), получаем
pij (t1 , t 3 ) = ∑ P(ξ(t3 ) = j / ξ(t 2 ) = k )P (ξ(t 2 ) = k / ξ(t1 ) = i ) = k
= ∑ pik (t1 , t 2 ) p kj (t 2 , t 3 ) , k
что и требовалось доказать. Напомним, что если вероятности переходов p ij (t1 , t 2 ) зависят только от разности моментов времени, т.е.
pij (t1 , t 2 ) = pij (t 2 − t1 ) , то цепь Маркова называется однородной. Для однородной цепи Маркова выражение (7.2) может быть переписано в виде pij (t 3 − t1 ) = ∑ pik (t 2 − t1 ) p kj (t 3 − t 2 ) , k
или
pij (t + τ) = ∑ pik (t ) p kj (τ) . k
(7.3)
Таким образом, в этом случае переходные вероятности обладают следующими свойствами: 1) pij (t ) ≥ 0 ; 223
2) ∑ pij (t ) = 1 ; j∈X
3) вероятности pij (t ) равномерно непрерывны по t (примем без доказательства, вернемся к нему в §34); 4) выполняется условие стохастической непрерывности процесса
1, i = j , lim pij (t ) = δ ij = t →0 0, i ≠ j. Это условие означает, что с вероятностью 1 цепь Маркова не изменит своего состояния за бесконечно малый промежуток времени t → 0 . Следует отметить, что стохастическая непрерывность не означает непрерывность реализаций марковской цепи. Это особенно очевидно в данном случае, так как множество ее значений дискретно, т.е. реализации разрывны, тем не менее условие стохастической непрерывности выполнено. Это происходит потому, что разрывы каждой реализации цепи происходят в случайные моменты времени, и вероятность того, что разрыв произойдет именно в данный момент времени t , равна нулю. Определение. Цепь с непрерывным временем называется неприводимой, если ∀ i, j ∈ X ∃ 0 < t ij < ∞ , такое, что pij (t ij ) > 0 . Сформулируем еще несколько утверждений относительно вероятностей pij (t ) . Теорема 7.2. Для любого состояния i ∈ X вероятность возвращения в исходное состояние строго больше нуля при всех t > 0 , т.е. p ii (t ) > 0 ∀ i ∈ X и ∀ t > 0 . Доказательство. В силу стохастической непрерывности найдем такое р > 0 , что ∀ t ≤ h pii (t ) > 0.
224
Пусть t – произвольный момент времени. Всегда ∃ n , такое, что
t < h . Тогда, используя уравнение Чепмена–Колмогорова, получаем n n
p ii (t ) =
t t t t ∑ pik1 p k1k 2 ⋅ ... ⋅ p k ni ≥ pii > 0 . n n n {ki ,i =1,n} n
Теорема 7.3. Если ∃ t 0 , что p ij (t 0 ) > 0 , то pij (t ) > 0 ∀ t > 0. Доказательство также вытекает из уравнения Чепмена–Колмогорова и предыдущей теоремы:
pij (t ) = ∑ pik (t − t 0 ) pkj (t 0 ) ≥ pii (t − t 0 ) pij (t 0 ) > 0 . k
§34. СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ КОЛМОГОРОВА ДЛЯ ОДНОРОДНОЙ ЦЕПИ МАРКОВА С КОНЕЧНЫМ ЧИСЛОМ СОСТОЯНИЙ
В общем случае вероятности перехода pij (t ) однородной марковской цепи для произвольного t ≥ 0 удовлетворяют системам дифференциальных уравнений, вывод которых мы опишем в данном параграфе. Определение. Пусть
1 − pii ( ∆t ) , ∆t → 0 ∆t
λ i = lim
λ ij = lim
∆t →0
pij ( ∆t ) ∆t
, i≠ j,
(7.4)
причем 0 ≤ λ i ≤ +∞, 0 ≤ λ ij < +∞ . λ ij называется интенсивностью перехода цепи Маркова из состояния i в состояние j , λ i называется интенсивностью выхода из состояния i , i, j ∈ X . Определение. Если λ i = ∞ , то состояние i называется мгновенным; если λ i < ∞ , то состояние i называется немгновенным, или задерживающим. Если λ i = 0 , то состояние i называется поглощающим. 225
Можно показать, что всегда λ i ≥ ∑ λ ij , i ∈ X . j ≠i
Определение. Немгновенное состояние i называется регулярным, если λ i = ∑ λ ij и нерегулярным, если λ i > ∑ λ ij . Если j ≠i
j ≠i
все состояния цепи Маркова регулярные, то она называется регулярной. Из соотношения (7.4) следует, что
p ii ( ∆t ) = 1 − λ i ∆t + o(∆t ) , p ij ( ∆t ) = λ ij ∆t + o(∆t ), i ≠ j . Теорема 7.4. Для однородной цепи Маркова с конечным числом состояний переходные вероятности pij (t ) удовлетворяют системам дифференциальных уравнений
p ′ij (t ) = −λ j p ij (t ) + ∑ λ kj p ik (t ), i, j ∈ X ,
(7.6)
p ′ ij (t ) = −λ i p ij (t ) + ∑ λ ik p kj (t ), i, j ∈ X
(7.7)
k≠ j
k ≠i
с начальными условиями
(7.8) p ij (0) = δ ij , i, j ∈ X . Система (7.6) называется системой прямых дифференциальных уравнений, а система (7.7) – системой обратных дифференциальных уравнений Колмогорова. Доказательство. Из уравнения Чепмена–Колмогорова (7.3) следует, что pij (t + ∆t ) = ∑ pik (t ) p kj (∆t ) . k
Выделим в сумме с правой стороны слагаемое при k = j . Тогда, используя асимптотические выражения (7.5), получим
pij (t + ∆t ) = pij (t )[1 − λ i ∆t + o(∆t )] +
226
[
]
+ ∑ pik (t ) λ kj ∆t + o(∆t ) . k≠ j
Следовательно pij (t + ∆t ) − pij (t ) ∆t
o ( ∆t ) + = pij (t ) − λ i + ∆t
o(∆t ) . + ∑ pik (t ) λ kj + ∆t k≠ j Устремив ∆t к нулю, будем иметь систему уравнений (7.6). Аналогично можно поступить при выводе системы уравнений (7.7):
pij (t + ∆t ) = ∑ pik (∆t ) pkj (t ) = k
= [1 − λ i ∆t + o(∆t )] pij (t ) + ∑ [λ ik ∆t + o(∆t )] p kj (t ) , k ≠i
pij (t + ∆t ) − pij (t ) ∆t
o(∆t ) = − λ i + pij (t ) + ∆t
o(∆t ) + ∑ λ ik + pkj (t ) . ∆ t k ≠i
Устремляя ∆t к нулю, получаем систему уравнений (7.7). Отметим, что решения систем прямых и обратных уравнений при одних и тех же начальных условиях (7.8) совпадают. Отметим также, что система прямых дифференциальных уравнений имеет место и для безусловных вероятностей состояний p j (t ) : p ′j (t ) = −λ j p j (t ) + ∑ λ kj p k (t ), j ∈ X k≠ j
{
}
(7.9)
при любом начальном распределении p j (0), j ∈ X . Это следует из формулы полной вероятности и соотношений (7.5): p j (t + ∆t ) = ∑ pk (t ) pkj (∆t ) = k
227
[
]
[
]
= p j (t ) 1 − λ j ∆t + o(∆t ) + ∑ p k (t ) λ kj ∆t + o(∆t ) . k≠ j
Следует также заметить, что в случае, когда множество состояний цепи Маркова X счетно, проведенные рассуждения не всегда правильны, поскольку сумма счетного числа величин порядка
o(∆t ) не обязательно дает o( ∆t ) . В этом случае для справедливости систем уравнений Колмогорова приходится накладывать дополнительные условия. Например, использованный выше прием для вывода системы прямых уравнений (7.6) остается в силе, если в асимптотических выражениях (7.5) остаточные члены o( ∆t ) таковы, что
o( ∆t ) → 0 равномерно по всем i , причем для фиксиро∆t ∆t →0
ванного j интенсивности λ ij равномерно ограничены:
λ ij ≤ Λ j < ∞, i ∈ X . Предположим, что существует стационарное распределение
{
}
цепи Маркова p j , j ∈ X , где p j = lim p j (t ) . Поскольку стациоt →∞
нарные вероятности не зависят от времени и являются константами, то при t → ∞ производные p ′j (t ) становятся равными нулю, и тогда из системы уравнений (7.9) имеем
λ j p j = ∑ λ kj pk , j ∈ X . k≠ j
Полученные уравнения называются уравнениями равновесия. Им можно дать следующее толкование. Назовем произведение λ j p j интенсивности выхода из состояния j и вероятности этого состояния потоком вероятности из состояния j . Произведение λ kj p k назовем потоком вероятности из состояния k в состояние j . Тогда из уравнений равновесия следует, что в стационарном режиме поток вероятности из любого состояния равен 228
сумме потоков вероятностей из всех других состояний в данное состояние. Интенсивности переходов между состояниями можно использовать для следующего определения. Определение. Состояние j стохастически непрерывной однородной цепи Маркова с непрерывным временем называется достижимым из состояния i , если либо i = j , либо λ ij > 0 , либо
λ ik1 λ k1k2 ⋅ ...⋅ λ kn −1kn λ kn j > 0 . Пример 7.1. Найдем решения уравнений (7.9), удовлетворяющие начальным условиям 1, j = 0, p j (0) = 0, j > 0, если
λ j = λ, j = 0, 1, 2, ... , λ, j = k + 1, λ kj = k = 0, 1, 2, ..., j = 1, 2, ... . 0 , j ≠ k + 1 , Система уравнений в данном случае принимает вид
p0′ (t ) = −λ p0 (t ), ′ p j (t ) = −λ p j (t ) + λ p j −1 (t ), j = 1, 2, .... Она совпадает с системой уравнений для вероятностей состояний пуассоновского процесса (пример 2.3), поэтому получаем p j (t ) =
(λ t ) j − λ t e , j = 0,1, 2, ... . j!
Пример 7.2. Пусть ξ(t ) является однородной цепью Маркова с двумя состояниями, X = {0,1} . Например, ξ(t ) = 0 может означать, что некоторое устройство находится в рабочем состоянии,
ξ(t ) = 1 – что оно находится в нерабочем состоянии в момент времени t . Пусть λ 01 = λ, λ10 = µ, т.е. λ 0 = λ, λ1 = µ , и пусть ξ(0) = 0 , 229
т.е. p 0 (0) = 1, p1 (0) = 0 . Система уравнений (7.9) в этом случае имеет вид
p0′ (t ) = −λ p0 (t ) + µ p1 (t ), p1′ (t ) = −µ p1 (t ) + λ p0 (t ) .
(7.10)
Поскольку p1 (t ) = 1 − p0 (t ) , то первое уравнение (7.10) можно переписать в виде Общее
p0′ (t ) + (λ + µ) p0 (t ) = µ . решение однородного
(7.11) уравнения
− ( λ +µ ) t ; частное решение неодноp0′ (t ) + (λ + µ) p 0 (t ) = 0 равно c e родного уравнения (7.11) можно найти в виде константы, посколь-
µ . Следоваλ+µ тельно, общее решение уравнения (7.11) примет вид ку это уравнение первого порядка, и записать как
p 0 (t ) = c e − ( λ + µ ) t +
µ . λ+µ
Учитывая начальное условие, получаем c =
p 0 (t ) =
λ , и, таким образом, λ+µ
λ −( λ + µ ) t µ , + e λ+µ λ+µ
λ −( λ +µ ) t λ . + e λ+µ λ+µ Используя эти вероятности, можно записать выражение для среднего значения цепи Маркова p1 (t ) = −
mξ (t ) = 0 ⋅ p 0 (t ) + 1 ⋅ p1 (t ) = p1 (t ) =
230
(
)
λ 1 − e −( λ +µ ) t . λ+µ
Найдем теперь распределение времени пребывания нашей цепи в состоянии 0, которое обозначим через η 0 . Пусть G (t ) = P (η 0 > t ) . Из определения λ 0 следует, что p00 (t , t + ∆t ) = p00 (∆t ) = 1 − λ 0 ∆t + o(∆t ) = 1 − λ ∆t + o(∆t ) . Поскольку
то
G ( t + ∆t ) = G (t ) p00 (t , t + ∆t ) = G (t )[1 − λ ∆t + o(∆t )] ,
G (t ) = −λ G (t ), G (0) = 1 . Поэтому Таким образом
G (t ) = e − λt . P (η0 ≤ t ) = 1 − G (t ) = 1 − e − λt ,
т.е. СВ η 0 имеет экспоненциальное распределение с параметром λ . Очевидно, что Mη 0 =
1 . Аналогично можно показать, что время λ
пребывания η1 цепи в состоянии 1 имеет также экспоненциальное распределение, но с параметром µ . Из полученных соотношений также следует, что 1 1 . λ1 = , M η0 M η1 Данные результаты можно обобщить: можно показать, что в случае однородной цепи Маркова с конечным числом состояний, λ0 =
имеющей конечные интенсивности λ i , i ∈ X , время пребывания в фиксированном состоянии имеет экспоненциальное распределение. Иногда удобно записывать решения систем уравнений Колмогорова в матричной форме. Пусть имеем однородную цепь Маркова с непрерывным временем и конечным числом состояний,
X = {1, 2, ' , N } . Введем матрицу вероятностей переходов 231
. P (t ) = pij (t ) N ×N Тогда уравнение Чепмена–Колмогорова (7.3) можно записать более компактно в виде (7.12) P (t + τ) = P(t ) P (τ), t , τ ≥ 0 . Условие 5) (§31) говорит о непрерывности P (t ) при t = 0 , поскольку из него следует, что P (0) = I , где I – единичная матрица. Из (7.12) вытекает, что P (t ) непрерывна при всех t > 0 . Действительно, если τ = ∆t > 0 в (7.12), то
lim P(t + ∆t ) = P (t ) lim P (∆t ) = P (t ) I = P (t ) .
∆t →0
(7.13)
∆t → 0
С другой стороны, при t > 0 , 0 < ∆t < t можно записать (7.12) в виде P (t ) = P(t − ∆t ) P (t ) .
Но P (∆t ) при достаточно малых ∆t близка к единичной матрице. Поэтому обратная матрица P −1 ( ∆t ) к матрице P (∆t ) существует и также близка к I . Следовательно
P (t ) = P(t ) lim P −1 (∆t ) = lim P (t − ∆t ) . ∆t →0
(7.14)
∆t → 0
Из (7.13), (7.14) вытекает непрерывность матрицы P (t ) . Обозначим через A матрицу − λ1 λ 21 A= ⋅ λ N1
λ12
λ1 N − λ 2 λ 23 λ2N , ⋅ ⋅ ⋅ ⋅ λ N 2 ... λ N N −1 − λ N которая называется инфинитезимальной. Предельные соотношения (7.4) запишем в матричном виде
lim
∆t → 0
λ13
... ...
P (∆t ) − I = A. ∆t 232
С помощью этого соотношения и равенства (7.12) находим
P (t + ∆t ) − P (t ) P (t ) [P( ∆t ) − I ] P(∆t ) − I = = P (t ) , ∆t ∆t ∆t Откуда при ∆t → 0 получаются матричные дифференциальные уравнения P ′(t ) = P(t ) A = A P (t ) ,
где P ′(t ) = pij′ (t )
N ×N
(7.15)
. Эти уравнения при начальных условиях
P (0) = I можно решить стандартным методом теории обыкновенных дифференциальных уравнений *. Тогда получим Ant n . n =1 n! Практически мы должны найти собственные значения ∞
P (t ) = e At = I + ∑
q1, q2, ... , q N матрицы A и полную систему соответствующих им правых собственных векторов u (1) , u ( 2 ) , ... , u ( N ) , если это возможно [4]. Затем мы должны воспользоваться представлением
P (t ) = U Q(t )U −1 , где U – матрица, столбцами которой являются соответственно вектора u (1) , u ( 2 ) , ... , u ( N ) , а Q(t ) – диагональная матрица e q1t 0 0 ... 0 q2t 0 e 0 ... 0 . Q(t ) = ⋅ ⋅ ⋅ ⋅ ⋅ q t 0 0 ... 0 e N Систему прямых дифференциальных уравнений Колмогорова можно применить для получения соотношений для финальных вероятностей состояний эргодических марковских цепей с непрерывным временем. *
Гантмахер Ф.Р. Теория матриц. – М.: Наука, 1988. – 548 с.
233
Определение. Цепь Маркова с непрерывным временем называется эргодической, если lim pij (t ) = π j , j ∈ X , ∑ π j = 1 .
t →∞
j∈X
Можно показать, что для цепи с конечным числом состояний
X = {1, 2, ... , N } финальные вероятности состояний π j , j = 1, N , всегда существуют. Другими словами, при бесконечно длительной эволюции в цепи устанавливается стационарное распределение вероятностей, не зависящее от времени. Уравнения для вычисления финальных вероятностей можно получить, переходя к пределу при t → ∞ в системе уравнений (7.6). Тогда с учетом того, что
pij′ (t ) = 0 , имеем N π k λ kj , j = 1, N , λ j π j = k∑ =1 N ∑ π k = 1. k =1
(7.16)
Система уравнений (7.15) однозначно определяет финальные вероятности состояний. Покажем теперь, как интенсивности переходов (7.4) используются для нахождения средних времен переходов между состояниями. Рассмотрим цепь Маркова с непрерывным временем и счетным числом состояний. Обозначим через τ ij среднее время перехода из i -го состояния в j -е, i, j ∈ X . За время ∆t цепь Маркова может перейти из состояния i в состояние j с вероятностью
pij (∆t ) и в состояние, отличное от j -го, с вероятностью pik (∆t ), k ≠ j . Тогда, используя формулу для условного математического ожидания, имеем τ ij = ∆t pij (∆t ) + ∑ (∆t + τ kj ) pik (∆t ) . k≠ j
234
(7.17)
Подставляя вероятности (7.5) в (7.16), получим
τ ij = λ ij (∆t ) 2 + ( τij + ∆t ) (1 − λ i ∆t ) + ∑ (τ kj + ∆t ) λ ik ∆t + o(∆t ) k≠ j
или − λ i τ ij ∆t + ∑ λ ik τ kj ∆t + o(∆t ) = − ∆t . k ≠i, j
Поделив данное выражение на ∆t и переходя к пределу при ∆t → 0 , будем иметь − λ i τ ij + ∑ λ ik τ kj = −1, i, j ∈ X .
(7.18)
k≠ j
Из этой системы уравнений можно найти среднее время перехода из состояния i в состояние j , i ≠ j . §35. ПРОЦЕСС ГИБЕЛИ И РАЗМНОЖЕНИЯ
Так называется однородная марковская цепь с непрерывным временем и счетным множеством состояний X = {0, 1, 2, ...} , в которой из состояния n возможен лишь непосредственный переход в состояния n − 1 и n + 1 , а из состояния 0 – в состояние 1 . Такие процессы хорошо описывают задачи в области биологии, физики, социологии, массового обслуживания. Состояние процесса можно интерпретировать, например, как число особей некоторой популяции, переход из состояния n в n + 1 – как рождение новой особи, а переход из состояния n в n − 1 – как гибель некоторой особи. Будем предполагать, что все состояния процесса регулярны. Для сокращения записей обозначим λ n n +1 = λ n , λ n n −1 = µ n . Тогда из (7.5) получаем
pnn +1 (∆t ) = λ n ∆t + o(∆t ) , p (∆t ) = µ ∆t + o(∆t ) , nn −1
n
pnn (∆t ) = 1 − (λ n + µ n )∆t + o(∆t ) . 235
Применяя вышеприведенную интерпретацию, можно сказать, что λ n ∆t с точностью до o(∆t ) есть вероятность рождения новой особи в популяции из n особей за время ∆t , а µ n ∆t с точностью до
o(∆t ) – вероятность гибели особи в этой популяции за время ∆t . Системы прямых и обратных дифференциальных уравнений Колмогорова для вероятностей переходов процесса имеют вид:
(
)
pij′ (t ) = λ j −1 pij −1 (t ) − λ j + µ j pij (t ) + µ j +1 pij +1 (t ) , i, j ∈ X ,
(7.18)
pij′ (t ) = µ i pi −1 j (t ) − (λ i + µ i ) pij (t ) + λ i pi +1 j (t ) , i, j ∈ X ,
(7.19)
где µ 0 = λ −1 = 0 , а система уравнений для безусловных вероятностей состояний:
p0′ (t ) = −λ 0 p0 (t ) + µ1 p1 (t ), (7.20) ′ p ( t ) p ( t ) ( ) p ( t ) p ( t ), j 1 , 2 , ... . = − λ − λ + µ + µ = j −1 j −1 j j j j +1 j +1 j Ее можно записать в матричной форме (7.15), при этом инфинитезимальная матрица процесса равна A=
− λ0
λ0
0
0
...
µ1
− (λ1 + µ1 )
λ1
0
...
0
µ2
− (λ 2 + µ 2 )
λ2
...
0
0
µ3
− (λ 3 + µ 3 )
...
...
...
...
...
.
.
Оказывается, если выполняется условие
λ i −1 (7.21) <∞, j =1 i =1 µ i то процесс гибели и размножения эргодичен, существуют вероят∞
j
∑∏
ности p j = lim p j (t ) , j ∈ X , совокупность которых образует единt →∞ ственное стационарное распределение, совпадающее с эргодическим, т.е. стационарные вероятности состояний равны финальным вероятностям состояний. Для выполнения неравенства (7.21) дос236
таточно, чтобы существовало такое N , для которого
λ i −1 < 1 при µi
всех i > N . Найдем стационарные вероятности состояний. Система уравнений равновесия для них, как следует из (7.20), имеет вид
0 = −λ 0 p0 + µ1 p1 , 0 = −λ j −1 p j −1 − (λ j + µ j ) p j + µ j +1 p j +1 , j = 1, 2, ... .
(7.22)
Обозначим z j = −λ j p j + µ j +1 p j +1 , j = 0,1, 2, ... . Тогда из (7.22) получаем
z0 = 0, z j − z j −1 = 0, j = 1, 2, ..., откуда следует, что z j = 0 для всех j = 0, 1, 2, ... . Следовательно,
pj = =
λ j −1 µj
p j −1 =
λ j −1 λ j − 2 ⋅ p j − 2 = ... = µ j µ j −1
j λ j −1 λ j − 2 λ λ ⋅ ⋅ ... ⋅ 0 p0 = ∏ i −1 p0 . µ j µ j −1 µ1 i =1 µ i
(7.23)
Вероятность p0 найдем, используя условие нормировки ∞
∑ p j = 1 . Подставляя (7.23) в это условие, находим j =0
−1
∞ j λ p0 = 1 + ∑ ∏ i −1 . j =1 i −1 µ i Ясно, что для существования p0 нужно, чтобы выполнялось неравенство (7.21). Если λ i −1 = ∞, j =1 i =1 µ i ∞
j
∑∏
237
то p0 = 0 и стационарного (финального) распределения не существует. Это означает, что эволюция процесса протекает в одну сторону, при этом номер состояния все возрастает. Рассмотрим еще одну особенность, которая возникает в процессе чистого размножения, связанную с временами переходов процесса между состояниями. Пусть µi = 0 , i ∈ X . Найдем τin – среднее время перехода из состояния i в состояние n . Система (7.17) в данном случае имеет вид откуда
− λ i τin + λ i τi +1 n = −1 , i ∈ X ,
1 . (7.24) λi Так как рассматриваемый процесс чистого размножения протекает в одном направлении, то, как показано выше, стационарные (финальные) вероятности не существуют. При этом время возвращения в τin = τi +1n +
исходное состояние, естественно, равно нулю, τ nn = 0 . Тогда τ n−1n =
1 .
λ n−1
Далее, полагая i = n − 2, n − 3, ... , из (7.24) получим n −1
1 . λ j =i j Рассмотрим среднее время перехода в состояние с бесконечно большим номером, т.е. τin = ∑
∞
1 . n→∞ j =i λ j Здесь опять возможны два случая, связанных со сходимостью ряда. lim τin = τi∞ = ∑
238
∞
1 расходится, то в состояние с бесконечно j =i λ j большим номером процесс перейдет за бесконечно большое время, что вполне реально. 1. Если ряд ∑
∞
1 < ∞ , то это соответj =i λ j ствует тому, что процесс за конечное время переходит в состояние с бесконечно большим номером. Физически это означает, что в системе, описываемой процессом чистого размножения, возникает лавинообразное явление, или «взрыв». Для биологических систем, например, это соответствует эпидемии. Пример 7.3 (линейный рост с иммиграцией [4]). Процесс гибели и размножения называется процессом с линейным ростом, если 2. Если же этот ряд сходится, т.е. ∑
λ n = λn + a , µ n = µn , a > 0 . Такие процессы также возникают при изучении биологического воспроизведения и роста популяций. Если состояние n описывает текущий размер популяции, то средняя мгновенная интенсивность роста равна λn + a . Аналогично, вероятность того, что состояние процесса уменьшится на 1 за малый промежуток времени ∆t , равна µn∆t + o(∆t ) . Величина λn соответствует естественному приросту популяции размера n , в то время как второе слагаемое a можно интерпретировать как интенсивность роста популяции за счет внешнего источника, такого, например, как иммиграция. Если подставить значения λ n и µ n в систему прямых уравнений Колмогорова (7.18), то получим pi′0 (t ) = − api 0 (t ) + µpi1 (t )
pij′ (t ) = (λ( j − 1) + a )pij −1 (t ) − ((λ + µ ) j + a )pij (t ) + 239
+ µ( j + 1) pij +1 (t ) , j = 1, 2, ... . Если теперь умножить j -е уравнение на j и просуммировать уравнения, то получим среднее значение нашего процесса ∞
m(t ) = Mξ(t ) = ∑ jpij (t ) . j =1
Можно показать, что оно удовлетворяет линейному неоднородному дифференциальному уравнению первого порядка m′(t ) − (λ − µ)m(t ) = a
с начальным условием m(0) = i , если ξ(0) = i . Решение этого уравнения имеет вид
at + i, λ = µ, m(t ) = a ( λ −µ ) t − 1 − ie ( λ−µ )t , λ ≠ µ. λ − µ e
[
]
→ ∞ . Если же λ < µ , то Ясно, что если λ ≥ µ , то m(t ) t →∞ средний размер популяции при больших t примерно равен m(t ) ≈
a . µ−λ
§36. АНАЛИЗ МАРКОВСКИХ СИСТЕМ МАССОВОГО ОБСЛУЖИВАНИЯ
В этом параграфе мы рассмотрим применение процесса гибели и размножения к анализу систем массового обслуживания (СМО), которые являются адекватными математическими моделями многих объектов в технике, экономике, природе и обществе. Довольно эффективны подходы теории массового обслуживания для описания процессов в электронных вычислительных машинах, их отдельных устройств или, наоборот, в компьютерных системах и сетях, составленных из них. 240
Общая модель обслуживания имеет следующую структуру. На некоторое устройство (СМО) в случайные моменты времени поступают заявки и требуют какого-либо рода обслуживания. Под термином «заявки» можно понимать, например, запросы, поступающие на сервер компьютерной сети; корабли, входящие в порт, или самолеты, прилетающие в аэропорт; клиентов, требующих обслуживания в банках, страховых компаниях, магазинах; неисправные машины, ожидающие ремонта и т. д. Употребление того или иного термина часто определяется характером решаемых прикладных задач. Вместо термина «заявка» поэтому используют также термин «запрос», «вызов», «требование», «клиент», а вместо термина «обслуживающее устройство» – «линия», «канал», «прибор». СМО классифицируются по следующим признакам. 1. Входящий поток заявок, для задания которого необходимо знать распределение интервалов времени между моментами поступления заявок. Мы будем рассматривать СМО с простейшим (пуассоновским) потоком заявок, т. е. когда моменты поступления заявок образуют простейший поток событий (пример 5.7), в котором интервалы между моментами поступления заявок распределены по экспоненциальному закону с параметром λ . 2. Распределение времен обслуживания заявок. Будем предполагать, что длительности обслуживания заявок распределены экспоненциально с параметром µ . 3. Количество линий обслуживания. Будем рассматривать однолинейные и многолинейные СМО. 4. Дисциплина обслуживания заявок. Дисциплиной обслуживания называется правило, в соответствии с которым на обслуживание выбирается заявка из числа ожидающих обслуживания. В большинстве моделей принята дисциплина «первый пришел – первый обслуживается» – прямой порядок обслуживания, когда заявки обслуживаются в той последовательности, в которой они поступают на вход системы. Все СМО, которые будут рассмотрены в этой главе, такого типа. Для обозначения достаточно простых СМО, анализируемых в этом параграфе, обычно используют символику, введенную англий241
ским математиком Кендаллом: A / B / n / N . Буква A обозначает тип входящего потока заявок, например, если A = M , то входящий поток заявок является простейшим. Буква B обозначает тип распределения времен обслуживания заявок в линиях, которые мы будем считать идентичными. Например, B = M означает одинаковое экспоненциальное распределение времен обслуживания для всех линий СМО. Число n обозначает количество линий обслуживания, а N – число мест ожидания в очереди. В случае N = 0 заявки, поступающие в систему в моменты времени, когда все линии заняты обслуживанием других заявок, уходят из системы без ожидания (теряются). Поэтому такие СМО называются системами с потеря-
ми. Если же N = ∞ , все заявки терпеливо ожидают начала обслуживания, соответствующее СМО называются системами с ожиданием. При этом последний символ в обозначениях Кенделла обычно опускается. Если 0 < N < ∞ , СМО называется системой с ограниченным числом мест ожидания. Пусть ξ(t ) – число заявок в системе (в очереди и на обслуживании) в момент времени t . Вероятностное распределение ξ(t ) после момента t определяется: а) числом заявок в системе в момент времени t , б) моментами поступления заявок после момента t , в) моментами окончаний обслуживания заявок после момента t . Рассмотрим СМО с простейшим входящим потоком заявок и экспоненциальным обслуживанием. В силу «отсутствия памяти» у экспоненциального распределения (см. §4), моменты поступления заявок после момента t не зависят от предыстории системы до момента t . Аналогично, моменты окончания обслуживания заявок после момента t не зависят от предыстории системы до момента t . Поэтому вероятностное поведение ξ(t ) после момента t зависит только от ξ(t ) и не зависит от поведения ξ(t ) до момента t . 242
Следовательно ξ(t ) – цепь Маркова с конечным или счетным числом состояний. Такие СМО называются марковскими. Для нахождения вероятностей p j (t ) = P (ξ(t ) = j ), j ∈ X , нужно решить систему дифференциальных уравнений Колмогорова для безусловных вероятностей состояний. В большинстве рассматриваемых СМО ξ(t ) является процессом гибели и размножения со следующим графом переходом (рис. 31): λ1
λ0 0
1
µ1
λ n −1 2
n-1
. . .
µ2
λn n
µn
n+1
. . .
µ n +1
Рис.31
Вершины данного графа обозначают состояния СМО, а дуги возможные переходы из состояния в состояние. При этом каждой дуге приписывается некоторый вес, равный интенсивности соответствующего перехода. В случае, если существует стационарный режим, то стационарные вероятности состояний p j , j ∈ X , находятся из системы уравнений равновесия (7.22), которую можно переписать в виде λ 0 p 0 = µ 1 p1 ,
(7.25)
(λ j + µ j ) p j = λ j −1 p j −1 + µ j +1 p j +1 , j = 1, 2, … . (7.26) Вычитая из уравнения (7.26) при j = 1 уравнение (7.25), получаем
λ1 p1 = µ 2 p 2 . Далее, вычитая из уравнения (7.26) при j = 2 последнее, получим λ 2 p 2 = µ 3 p3 . Продолжая этот процесс, будем иметь λ n −1 p n −1 = µ n p n , n = 1, 2, … .
243
(7.27)
Для составления уравнений (7.27) можно использовать следующую геометрическую интерпретацию и понятие потока вероятности (см. §32). Проведем в графе вертикальное сечение между двумя состояниями n − 1 и n (рис. 31). Тогда поток вероятности через это сечение слева λ n −1 p n −1 в стационарном режиме равен потоку вероятности через это сечение справа µ n p n . Пусть в систему поступает простейший поток заявок с параметром λ . Как следует из примера 2.3, λ является средним числом заявок, поступающих в единицу времени, поэтому λ характеризует интенсивность простейшего потока заявок. Аналогично, если µ – параметр экспоненциального распределения времен обслуживания заявок, то µ −1 является средним временем обслуживания заявок, а µ характеризует интенсивность обслуживания заявок, если линия работает без перерыва. Введем следующие обозначения: пусть a k ( ∆t ) – вероятность поступления k заявок за время ∆t , a ≥ 2 (∆t ) – вероятность поступления двух или более заявок за
время ∆t. Из формулы (2.6) следует, что
(λ∆t ) k − λ∆t e , k = 0, 1, 2, ... . k! Поэтому на основании этой формулы и свойства ординарности простейшего потока: a k (∆t ) =
a 0 (∆t ) = e − λ∆t = 1 − λ∆t + o( ∆t ),
(7.28)
a1 (∆t ) = λ∆te − λ∆t = λ∆t + o(∆t ),
(7.29)
(7.30) a ≥ 2 (∆t ) = o(∆t ). Рассмотрим однолинейную СМО с экспоненциальным обслуживания заявок с интенсивностью µ . Пусть bk (∆t ) – условная вероятность того, что, начиная с определенного момента, за время 244
∆t будет обслужено k заявок при условии, что в указанный мо-
мент линией обслуживалась некоторая заявка; b≥k (t ) – аналогичная вероятность обслуживания k и более заявок. Тогда
b≥1 (∆t ) = 1 − e −µ∆t = 1 − (1 − µ∆t + o(∆t )) = = µ∆t + o(∆t ), (7.31) b0 (∆t ) = 1 − b≥1 (∆t ) = 1 − µ∆t + o(∆t ). Если бы линия работала непрерывно, то моменты окончаний обслуживания заявок образовывали бы простейший поток с параметром µ и вероятность b≥2 (∆t ), которую при данном предполо~ жении обозначим через b≥ 2 (∆t ), была бы в силу ординарности равна o(∆t ) . Следовательно
~ b≥ 2 (∆t ) ≤ b≥ 2 ( ∆t ) = o(∆t ),
(7.32)
(7.33) b1 (∆t ) = b≥1 (∆t ) − b≥ 2 (∆t ) = µ∆t + o(∆t ). Рассмотрим теперь n -линейную СМО, у которой n идентичных линий работают независимо друг от друга. Обозначим через
bk
(n)
(∆t ) вероятность того, что в такой системе за время ∆t будет
обслужено k заявок. Поскольку линии работают независимо, то
b0
(n)
(∆t ) = b0 (∆t )b0 (∆t ) ⋅ ... ⋅ b0 (∆t ) =
= (1 − µ∆t + o(∆t )) n = 1 − nµ∆t + o(∆t ).
(7.34)
Событие {в n -линейную СМО за время ∆t обслужилась ровно одна заявка} равносильно событию {за это время заявка обслужилась в некоторой одной линии данной СМО, а в остальных линиях завершения обслуживания заявок не произошло}. Поэтому, используя формулу полной вероятности, будем иметь
b1
(n)
(∆t ) = b1 (∆t )b0 (∆t ) ⋅ ... ⋅ b0 (∆t ) + b0 (∆t )b1 (∆t ) ⋅ ... ⋅ b0 (∆t ) + ... +
+ b0 ( ∆t ) ⋅ ... ⋅ b0 (∆t )b1 ( ∆t ) = n ⋅ b1 (∆t )[b0 ( ∆t )]
n −1
245
= nµ∆t + o( ∆t ),
(7.35)
и (n) (n) (n) (7.36) b≥ 2 (∆t ) = 1 − b0 (∆t ) − b1 (∆t ) = o(∆t ), где b≥ 2 (∆t ) – вероятность того, что в n -линейную СМО за время ∆t будет обслужено более одной заявки. Рассмотрим некоторые простейшие СМО. Система М / М / 1. Определим вероятности переходов для (n)
процесса ξ(t ) . Переход процесса ξ(t ) из состояния i в состояние i − 1 за время ∆t означает, что в системе за это время должно обслужиться на одну заявку больше, чем поступило. Следовательно, из формулы полной вероятности имеем ∞
p ii −1 (∆t ) = a 0 ( ∆t )b1 (∆t ) + ∑ a k (∆t )bk +1 (∆t ). k =1
∞
Но, так как ∑ a k (∆t )bk +1 (∆t ) ≤ b≥ 2 (∆t ) , поскольку a k (∆t ) ≤ 1, k = 1,2,... , k =1
то из (7.28), (7.32), (7.33) следует, что p ii −1 (∆t ) = µ∆t + o(∆t ), i ≥ 1.
(7.37)
Аналогично, переход процесса из состояния i в состояние i + 1 за время ∆t означает, что в систему должно за это время поступить на одну заявку больше, чем обслужиться. Поэтому ∞
p ii +1 ( ∆t ) = a1 ( ∆t )b0 (∆t ) + ∑ a k (∆t )bk −1 (∆t ) ≤ a1 (∆t )b0 ( ∆t ) + a ≥ 2 (∆t ), k =2
а из (7.29) – (7.31) вытекает, что Кроме того,
pii +1 (∆t ) = λ∆t + o( ∆t ), i ≥ 0.
(7.38)
∞
p ii (∆t ) = a 0 (∆t )b0 (∆t ) + ∑ a k (∆t )bk (∆t ) ≤ k =1
≤ a 0 (∆t )b0 (∆t ) + a ≥1 (∆t )b≥1 (∆t ) + a 0 (∆t )b0 ( ∆t ) + o(∆t ), и учитывая (7.28), (7.31), получаем pii (∆t ) = 1 − (λ + µ)∆t + o(∆t ), i ≥ 1.
246
(7.39)
Аналогично можно найти (7.40)
p 00 (∆t ) = 1 − λ∆t + o(∆t ), p ik (∆t ) = o(∆t ), i − k ≥ 2.
Таким образом, из (7.37) – (7.40) следует, что ξ(t ) является процессом гибели и размножения со следующим графом переходов (рис. 32). λ 0
λ 1
µ
λ 2
.
.
n-1
.
µ
λ n
µ
n+1
. . .
µ
Рис. 32
Из условия эргодичности для процесса гибели и размножения следует, что если
λ <1 , µ то существует единственное стационарное распределение, совпаρ=
дающее с эргодическим, ρ называется коэффициентом загрузки системы. Уравнение равновесия (7.27) имеют вид откуда находим
λp n −1 = µp n , n = 1, 2,..., p n = ρp n −1 = ρ 2 p n − 2 = ... = ρ n p 0 .
Вероятность p 0 можно найти, используя условие нормиров∞
ки ∑ p n = 1 , откуда следует, что p 0 = 1 − ρ , и поэтому n =0
p n = ρ n (1 − ρ), n = 0, 1, 2,..., т.е. число заявок в такой СМО в стационарном имеет геометрическое распределение. Легко найти производящую функцию такого распределения: 247
1− ρ , z < 1. 1 − ρz n =0 Отсюда получаем выражение для среднего числа заявок в системе (в очереди и на обслуживании) в стационарном режиме: ∞
ψ( z ) = ∑ p n z n =
∞
Mξ = ∑ np n = ψ ′( z ) n =0
z =1
=
ρ . 1− ρ
Ясно, что Mξ ρ → ∞ , т.е. при стремлении ρ к 1 очередь в →1 СМО неограниченно растет. При рассмотрении последующих СМО выражения для переходных вероятностей находятся подобным образом, как в предыдущем случае, с использованием соотношений (7.28) – (7.36). Поэтому в дальнейшем мы сразу будем изображать граф переходов для соответствующего процесса гибели и размножения. Нужно только учесть, что если обслуживанием заявок в многолинейной СМО заняты k линий, то интенсивность обслуживания равна kµ . Система М / М / n / 0. Это система с потерями без ожидания. Если заявка поступает в систему в момент, тогда обслуживанием заняты все n линий, то она теряется. Такая система была введена датским инженером Эрлангом в начале прошлого столетия и применена в качестве модели обработки вызовов, поступающих на телефонную станцию. Граф переходов для такой СМО имеет вид (рис. 33) λ 0
λ 1
µ
λ 2
.
.
.
k-1
2µ
λ k
kµ
. . .
n-1
n
nµ
Рис. 33
Поскольку число состояний системы конечно, то единственное стационарное распределение, совпадающее с эргодическим, существует всегда при любых параметрах λ, µ (см. §32). Запишем уравнения равновесия для стационарных вероятностей состояний: λp = kµp , k = 1, n . k −1
k
248
Отсюда получаем
ρ ρ2 ρk (7.41) p k −1 = p k − 2 = ... = p 0 , k = 1, n . k k (k − 1) k! Вероятность p 0 , как всегда, можем найти из условия нормиpk =
n
ровки, которое в данном случае имеет вид ∑ p k = 1, откуда k =0
−1
Таким образом,
n ρk . p 0 = ∑ k = 0 k! −1
ρ k n ρi . ∑ pk = k! i =0 i! В частности, вероятность потери заявки равна (формула потерь Эрланга) −1
ρ n n ρi . ∑ pn = n! i =0 i! Система М / М / n. Это многолинейная система с ожиданием. Если обслуживанием заявок заняты все n линий, то интенсивность обслуживания равна nµ . Гsраф переходов для этой СМО имеет вид (рис. 34) λ 0
λ 1
µ
λ 2
2µ
. . .
λ
n-2
n-1
(n − 1)µ
λ n
nµ
λ n+1
nµ
n+2
nµ
Рис. 34
Стационарное распределение существует, если
249
. . .
ρ < 1. n Уравнение равновесия имеет вид ρn =
λp k −1 = kµp k , k = 1, n , λp k −1 = nµp k , k ≥ n + 1, откуда, аналогично предыдущему случаю (7.41), получаем
pk =
ρk p0 , k ≤ n , k!
2
ρ ρ ρ p k = p k −1 = p k − 2 = ... = n n n =
ρk n k − n n!
k −n
ρ pn = n
k −n
ρn p0 = n!
p0 , k ≥ n + 1 .
Условие нормировки в этом случае принимает вид ∞
k ρk nn ∞ ρ + ∑ =1, k =0 k! n! k = n +1 n n
∑ p k = p0 ∑
k =0
откуда следует, что
−1
n +1 n ρk . n nρn p0 = ∑ + k =0 k! n!(1 − ρ n ) Среднее число заявок в системе в стационарном режиме равно n +1 ∞ n ρ i n n ρ n [1 − n(1 − ρ n )] . + Mξ = ∑ kp k = p 0 ∑ n!(1 − ρ n ) 2 k =0 i =1 (i − 1)! Система М / М / n / N. Это многолинейная система с ограниченным числом мест для ожидания. Она отличается от предыду-
щей СМО тем, что в ней имеется только N мест для ожидания. Поэтому граф переходов в этом случае имеет вид (рис. 35) 250
λ 0
λ 1
µ
λ 2
. . .
2µ
n-2
λ n-1
(n − 1)µ
λ
λ n
nµ
n+1
. . .
N+n-1
nµ
N+n
nµ
Рис. 35
Стационарное распределение существует при любых λ , µ , поскольку число состояний системы конечно. Уравнения равновесия принимают вид
Отсюда
λp k −1 = kµp k , k = 1, n , λp k −1 = nµp k , k = n + 1, N + n . следует, что стационарные
вероятности
p k , k ∈ X , имеют такой же вид, как и для предыдущей СМО, с той
лишь разницей, что они определены для k = 0 , N + n . разом,
Таким об-
ρk p0 , k = 0 , n , k! pk = n k n ρn p , k = n + 1, N + n . 0 n! n+ N
Вероятность p 0 определяется из условия нормировки ∑ p k = 1 : k =0
откуда получаем
n ρ k N +n n n ρ n k + ∑ p0 ∑ k =0 k! k = n +1 n!
= 1, −1
n ρ k ρ n ρ n (1 − ρ n N ) p0 = ∑ + . (1 − ρ n ) k = 0 k! 251
Среднее число заявок в системе определяется соотношением n ρ i 1 − ρn N ρ nρ n N Mξ = ∑ kp k = p 0 ∑ + n − ( n + N )ρ n + 1 − ρn k =0 i =1 (i − 1)! n!(1 − ρ n ) а вероятность потери заявки n+ N
pn+ N = p0
,
ρ n+ N . n! n N
§35. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ
Предположим, что имеется некоторая совокупность частиц, которые с течением времени превращаются в частицы такого же типа, причем этот процесс «размножения» обладает следующим свойством: каждая из исходных частиц через время t независимо от других частиц и от обстоятельств, предшествующих исходному моменту, с вероятностью pk (t ) порождает группу из k частиц. Обозначим через ξ(t ) число частиц, имеющихся к моменту времени t . Очевидно, эволюция величины ξ(t ) представляет собой цепь Маркова с непрерывным временем. Процесс ξ(t ) такого вида называется ветвящимся процессом. Такие процессы служат математическими моделями многих реальных процессов (химические реакции, ядерные процессы, выживание фамилий, генетические и экологические процессы и др.) [4, 11]. Пусть в некоторый исходный момент времени t0 имеется ровно i частиц и пусть ξ j (t ) – число частиц, порожденных j -й частицей через время t , j = 1, 2, ..., i . Предположим, что СВ ξ1 (t ), ξ 2 (t ), ..., ξi (t ) независимы между собой и имеют одно и то же распределение вероятностей pk (t ) = P ξ j (t ) = k , k = 0,1, 2,... , j = 1, 2, ..., i . Общее число частиц через время t будет (7.42) ξ(t ) = ξ1 (t ) + ξ 2 (t ) + ... + ξi (t ) . Будем рассматривать однородные ветвящиеся процессы. Предположим, что отдельная частица за малый промежуток времени ∆t с вероятностью
(
)
252
pk (∆t ) = λ k ∆t + o(∆t ) , k ≠ 1 , превращается в k новых частиц, и с вероятностью p1 (∆t ) = 1 − λ∆t + o( ∆t )
остается неизменной. Пусть также λ1 = −λ , ∑ λ i = 0 и переходi
ные вероятности pk (t ) = p1k (t ) удовлетворяют обратным дифференциальным уравнениям Колмогорова (7.7):
p′k (t ) = ∑ λ i pik (t ) , k = 0,1, 2,... ,
(7.43)
i
где pik (t ) – переходные вероятности ветвящегося процесса, pik (t ) есть вероятность того, что i частиц за время t порождают k частиц. Введем производящие функции ∞
ψ (t , z ) = ∑ pk (t ) z k ,
(7.44)
k =0 ∞
ψ i (t , z ) = ∑ pik (t ) z k . k =0
При каждом z , для которого z < 1 , из (7.43) имеем ∞ ∞ d ∞ d ∑ pk (t ) z k = ∑ z n pk (t ) = ∑ λ i ∑ pik (t ) z k , dt k =0 dt k =0 i k =0 что дает следующее дифференциальное уравнение для производя-
щей функции ψ (t , z ) :
d (7.45) ψ (t , z ) = ∑ λ i ψ i (t , z ) . dt i Но, по определению математического ожидания для дискретной СВ, ψ (t , z ) = Mz
ξ j (t )
, j = 1, 2, ..., i ,
253
ψ i (t , z ) = Mz ξ (t ) , i
где ξ(t ) = ∑ ξ j (t ) . Поскольку все величины ξ j (t ) , j = 1, i , незавиj =1
симы, то
Mz ξ (t ) = Mz ξ1 (t ) ⋅ Mz ξ2 (t ) ⋅ ... ⋅ Mz ξi (t ) . Следовательно, ψ i (t , z ) = [ψ (t , z )]i , i = 1, 2, ... , и дифференциальное уравнение для производящей функции ψ (t , z ) можно записать в виде
d ψ (t , z ) = ∑ λ i ψ k (t , z ) . dt i
(7.46)
Будем считать, что для ветвящегося процесса ξ(t ) параметры λ i , i = 0,1, 2, ... , заданы. Введем функцию. ∞
f ( x) = ∑ λ i x i .
(7.47)
i =0
Согласно (7.46), производящая функция ψ(t , z ) является решением дифференциального уравнения вида dx = f (x) . dt
(7.48)
Поскольку ψ (0, z ) = z , производящая функция ψ(t , z ) при каждом z , 0 ≤ z ≤ 1 , совпадает с решением x = x(t ) этого уравнения, удовлетворяющим начальному условию x(0) = z . Вместо уравнения (7.48) удобно рассмотреть эквивалентное ему дифференциальное уравнение для обратной к x = x(t ) функции t = t (x) :
dt 1 . = dx f ( x) 254
Решение этого уравнения, функция t = t (x) , имеет вид x
t=∫
Пример 7.4. Пусть
z
du , 0 ≤ x ≤ 1. f (u )
(7.49)
λ 0 = λ , λ1 = −λ , λ i = 0 , i = 2, 3, ... В этом случае f ( x) = λ − λx = λ(1 − x) и x
t=∫ z
du 1 = − [ln (1 − x ) − ln (1 − z )] . λ f (u )
Из этого соотношения легко находится функция ψ = ψ (t , z ) , а именно, ln(1 − ψ ) = −λt + ln(1 − z ) , т.е.
ψ (t , z ) = 1 − e − λt (1 − z ) . Вероятности pk (t ) , определяемые из разложения (7.44), имеют вид
p0 (t ) = 1 − e − λt , p1 (t ) = e − λt , pk (t ) = 0 , k = 2, 3, ... Пример 7.5. Предположим, что некоторые частицы размножаются делением пополам. В соответствующем этому явлению ветвящемся процессе нужно взять λ 0 = 0 , λ1 = −λ , λ 2 = λ , λ k = 0 , i = 3, 4, ...
В данном случае f ( x) = −λx + λx 2 = λx( x − 1) и x
t=∫ z
=
1 x 1 1 du = ∫ − du = f (u ) λ z u − 1 u
1 1 1 ln1 − − ln1 − . λ x z
255
Таким образом, функция ψ = ψ (t , z ) может быть определена из соотношения
t= откуда следует, что
1 1 1 , ln1 − − ln1 − λ ψ z
∞ z = e −λt z ∑ (1 − e −λt ) k z k . −λ t 1 − z (1 − e ) k =0 В итоге получаем, что
ψ (t , z ) = e −λt
p0 (t ) = 0 , pk (t ) = e − λt (1 − e − λt ) k −1 , k = 1, 2, ... . В заключение данного параграфа проанализируем эффекты вырождения и взрыва для ветвящихся процессов. Определим вероятность того, что через некоторое время t не останется ни одной частицы. Естественно, этого не может произойти, если λ 0 = 0 , т.е. если частицы не могут исчезать, а могут лишь размножаться. Если в исходный момент t = 0 имеется одна частица, то эта вероятность равна p0 (t ) = ψ (t ,0) . Если же вначале имеется i частиц, то эта вероятность имеет вид
pi 0 (t ) = ψ i (t ,0) = p0i (t ) . Как функция от t вероятность p0 (t ) , как следует из вышесказанного и (7.43), является решением дифференциального уравнения (7.48), отвечающим параметру z = 0 : p0′ (t ) = f [ p0 (t )] , p0 (0) = 0 . Проведя анализ дифференциального уравнения (7.48), где f (x) имеет вид (7.47), можно показать [11], что это решение при t → ∞ асимптотически приближается к некоторому значению p0 = α , являющемуся наименьшим корнем уравнения f ( x) = 0 , т.е. lim p (t ) = α . t →∞
0
256
Таким образом, p0 = α есть вероятность вырождения ветвящегося процесса ξ(t ) – вероятность того, что к некоторому моменту времени не останется ни одной частицы. Если функция f (x) является положительной на интервале 0 ≤ x < 1 , то вероятность вырождения ветвящегося процесса ξ(t ) равна 1. Рассмотрим теперь так называемое явление взрыва, когда образуется бесконечно много частиц. Вероятность того, что взрыв произойдет до момента t , если вначале была одна частица, равна p∞ (t ) = P (ξ(t ) ≥ ∞ ) = 1 − P (ξ(t ) < ∞ ) = ∞
∞
= 1 − ∑ P (ξ(t ) = k ) = 1 − ∑ pk (t ) = 1 − lim ψ (t , z ) . k =0
k =0
(7.50)
z →1
В случае, когда x(t ) = 1 является единственной интегральной кривой дифференциального уравнения (7.48), проходящей через точку (0,1) , или при выполнении условия 1
dx
= −∞ ∫ x f ( x)
(7.51)
0
с помощью (7.44) получаем
lim ψ (t , z ) = 1 , z →1
и тогда, согласно (7.50), p∞ (t ) = 0 ∀ t > 0 , так что возможность взрыва исключена. В [11] показано, что при условии 1
dx
> −∞ ∫ x f ( x)
(7.52)
0
интегральные кривые x(t , z ) при z → 1 монотонно сходятся к функции x0 (t ) , так что вероятность взрыва есть p∞ (t ) = 1 − x0 (t ) > 0 . Ясно, что если вначале было i частиц, то вероятность взрыва через время t при условии (7.50) также равна нулю, а при условии (7.52) она равняется
pi∞ (t ) = 1 − x0i (t ) . 257
ГЛАВА 8. НЕПРЕРЫВНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ §38. ОБОБЩЕННОЕ УРАВНЕНИЕ МАРКОВА
Рассмотрим теперь класс марковских процессов, который характеризуется тем, что множество его состояний X является непрерывным и время перехода из одного состояния в другое также изменяется непрерывно. Такие процессы образуют класс непрерывных марковских процессов, широко используемых в качестве моделей различных реальных процессов. Докажем вспомогательную формулу. Лемма 8.1. Пусть η , ζ – некоторые СВ, B – случайное событие. Тогда +∞
P ( B / η = x) = ∫ P ( B / η = x, ζ = y )dFζ ( y / η = x) ,
(8.1)
−∞
где Fζ ( y / η = x) – условная ф.р. СВ ζ при условии, что η = x . Доказательство. Введем случайные события Ai = ( y i < ζ ≤ y i +1 ) , i = 1,2 ...,
где y i , i = 1, 2 ... – точки разбиения переменной Тогда
y, y1 < y 2 < ... < y i < y i +1 < ... .
Ai " A j = ∅ , i ≠ j , ! Ai = Ω , i, j = 1,2,... . i
Далее, используя определение условной вероятности и условной ф.р., будем иметь P ( B / η = x) = P ( B " Ω / η = x) = P ( B " (! Ai ) / η = x) = i
= ∑ P ( B " Ai / η = x) = i
= ∑ P ( B / η = x, Ai ) P ( Ai / η = x ) = i
258
→ ∑ P( B / η = x , y i < ζ ≤ y i +1 )[Fζ ( y i +1 / η = x) − Fζ ( y i / η = x)]∆ y →0 i
i
+∞
∆ → ∫ P ( B / η = x , ζ = y ) dFξ ( y / η = x ) . y →0 i
Лемма доказана.
−∞
Говорят, что случайный процесс ξ(t ) непрерывен, если за малые промежутки времени лишь с малой вероятностью он может получить заметные по величине приращения [3]. Пусть ξ(t ) – марковский процесс. Полная вероятностная характеристика этого процесса определяется функцией F (t , x ; τ, y ) = P(ξ(τ) ≤ y / ξ(t ) = x) , τ > t , которая называется переходной функцией марковского процесса (марковской переходной функцией). Определение [10]. Случайный процесс ξ(t ) называется непрерывным марковским, если для любых моментов времени s, t , τ ∈ T , таких, что 0 ≤ s < t < τ , и любых действительных y выполняется равенство
(8.2) Теорема 8.1. Переходная функция непрерывного марковского процесса удовлетворяет обобщенному уравнению Маркова (уравнению Чепмена–Колмогорова) P(ξ(τ) ≤ y / ξ(t ) = x, ξ( s ) = z ) = P (ξ( τ) ≤ y / ξ(t ) = x ) = F (t , x ; τ, y ) .
+∞
F (t , x ; τ, y ) = ∫ F ( s, z ; τ, y ) d z F (t , x ; s, z) ∀ 0 ≤ t < s < τ . −∞
Доказательство. В соотношении (8.1) положим B = {ξ(τ) ≤ y}, η = ξ(t ) , ζ = ξ( s ) , а y заменим на z. Тогда, используя (8.2), имеем
P(ξ(τ) ≤ y / ξ(t ) = x) = +∞
= ∫ P (ξ(τ) ≤ y / ξ(t ) = x, ξ( s ) = z )dP(ξ( s ) ≤ z / ξ(t ) = x) = −∞
+
259
(8.3)
+∞
= ∫ P(ξ(τ) ≤ y / ξ( s ) = z )dP(ξ( s ) ≤ z / ξ(t ) = x) , −∞ откуда и следует (8.3). Отметим некоторые свойства, которым должна удовлетворять функция F (t , x; τ, y ) . Прежде всего для нее, как для ф.р., должны быть выполнены соотношения: 1) 0 ≤ F (t , x; τ, y ) ≤ 1 , 2) lim F (t , x; τ, y ) = 0 , y → −∞
3) lim F (t , x; τ, y ) = 1 . y → +∞
Кроме того, функция F (t , x; τ, y ) непрерывна справа относительно аргумента y и
1, y ≥ x ,
lim F (t , x; τ, y ) = 0, y < x .
τ →t + 0
Если существует плотность
∂ F (t , x; τ, y ) , ∂y то для нее выполняются следующие очевидные равенства f (t , x; τ, y ) =
y
∫ f (t , x; τ, z )dz = F (t , x; τ, y ) ,
−∞
+∞
∫ f (t , x; τ, z )dz = 1 ,
−∞
а обобщенное уравнение Маркова имеет вид +∞
f (t , x; τ, y ) = ∫ f ( s, z; τ, y ) f (t , x; s, z )dz ,
оно вытекает из (8.3).
−∞
260
(8.4)
§39. ДИФФУЗИОННЫЕ ПРОЦЕССЫ
Среди непрерывных марковских процессов особую роль играют диффузионные процессы, которые являются математической моделью движения частицы в процессе диффузии, а также предельной моделью для дискретных процессов, описывающих различные биологические явления. В настоящее время они имеют широкое применение в экономико-математическом и финансовоматематическом моделировании. Определение. Марковский процесс ξ(t ) называется диффузионным, если его переходная функция F (t , x; τ, y ) удовлетворяет следующим условиям.
1 (8.5) 1. lim ∆t ∫ dF (t − ∆t , x; t , y ) = 0 ∀ δ > 0 . ∆t → 0 y − x >δ Это более точное условие непрерывности случайного процесса. Оно требует, чтобы вероятность того, что ξ(t ) − ξ(t − ∆t ) > ε , была величиной более высокого порядка малости, чем ∆t . 2. Существует функция a (t , x) такая, что
1 ∫ ( y − x)d y F (t − ∆t , x; t , y) = a(t , x) ∀ δ > 0 . (8.6) ∆t → 0 t y − x > δ 3. Существует предел
lim ∆
1 t
lim ∆
∆t → 0
2 ∫ ( y − x) d y F (t − ∆t , x; t , y) = b(t , x) ∀ δ > 0 . (8.7)
y − x >δ
Заметим, что левые части равенств (8.6), (8.7) зависят от δ , но, в силу определения непрерывности процесса, т.е. в силу (8.5), эта зависимость является лишь кажущейся. Для того чтобы выяснить физический смысл функций a (t , x) и b(t , x) , мы несколько усилим требование непрерывности про261
цесса. А именно, предположим, что вместо (8.5) при любом δ > 0 имеет место соотношение
1
lim ∆t
∆t → 0
2 ∫ ( y − x) d y F (t − ∆t , x; t , y ) = 0 .
(8.8)
y − x >δ
Легко видеть, что из (8.8) следует (8.5). Условия (8.6), (8.7) могут быть записаны теперь в виде 1 +∞ ∫ ( y − x) d y F (t − ∆t , x; t , y ) = a(t , x) , ∆t → 0 ∆ t − ∞
(8.9)
1 +∞ 2 ∫ ( y − x) d y F (t − ∆t , x; t , y ) = b(t , x) . ∆t → 0 ∆t − ∞
(8.10)
lim lim
Но +∞
∫ ( y − x)d y F (t − ∆t , x; t , y ) = M [ξ(t ) − ξ(t − ∆t )]
−∞
является математическим ожиданием изменения процесса ξ(t ) за время ∆t , а +∞
2 2 ∫ ( y − x) d y F (t − ∆t , x; t , y ) = M [ξ(t ) − ξ(t − ∆t )]
−∞
есть математическое ожидание квадрата изменения процесса ξ(t ) и, следовательно, пропорционально кинетической энергии в предположении, что ξ(t ) является координатой движущейся под влиянием случайных воздействий точки. Поэтому из (8.9), (8.10) ясно, что функция a (t , x) есть средняя скорость изменения процесса ξ(t ) (и называется коэффициентом сноса, или переноса), а функция
b(t , x) пропорциональна средней кинетической энергии изучаемой нами системы (называется коэффициентом диффузии). 262
Отметим, что при некоторых ограничениях на F (t , x; τ, y ) задание коэффициентов a (t , x) , b(t , x) полностью определяет марковский процесс. §40. ОБРАТНОЕ УРАВНЕНИЕ КОЛМОГОРОВА
Далее мы введем дифференциальные уравнения в частных производных, которым при выполнении некоторых условий удовлетворяет переходная функция марковского процесса F (t , x; τ, y ) и ее производных. Эти уравнения впервые строго были доказаны А.Н.Колмогоровым, хотя второе из них встречалось в работах физиков М.Планка и А.Фоккера в связи с развитием теории диффузии, и носят название уравнений Колмогорова. Теорема 8.2. Пусть существуют непрерывные частные производные первого и второго порядков ∂F (t , x; τ, y ) и ∂ 2 F (t , x; τ, y ) ∂x ∂x 2
при любых значениях t , x и ô > t . И пусть выполнены условия (8.5)(8.7). Тогда функция F (t , x; τ, y ) удовлетворяет уравнению ∂F (t , x; τ, y ) ∂F (t , x; τ, y ) 1 ∂ 2 F (t , x; τ, y ) (8.11) , = − a(t , x) − b(t , x) 2 ∂t ∂x ∂x 2 которое называется обратным уравнением Колмогорова. Доказательство. Заменив в обобщенном уравнении Маркова
(8.3) t на t − ∆t , s на t и используя условие нормировки для ф.р., получим +∞
F (t − ∆t , x; τ, y ) = ∫ F (t, z; τ, z )d z F (t − ∆t , x; t , z ) , −∞
+∞
∫ d z F (t − ∆t , x; t , z ) = 1 .
−∞
263
Тогда
∂F (t , x; τ, y ) 1 = − lim [F (t − ∆t , x; ô, y ) − F (t , x; ô, y )] = ∂t ∆t → 0 ∆t +∞ 1 +∞ F (t , z; ô, y )d z F (t − ∆t , x; t , z ) − ∫ F (t , x; ô, y )d z F (t − ∆t , x; t , z ) = ∫ ∆t → 0 ∆t − ∞ −∞
= − lim
1 +∞ ∫ [F (t , z; ô, y ) − F (t , x; ô, y )]d z F (t − ∆t , x; t , z ) = ∆t →0 ∆t − ∞
= − lim
1 ∆t → 0 ∆t
= − lim − lim
∆ t →0
1 ∆t
∫ [F (t , z; ô, y ) − F (t , x; ô, y )]d z F (t − ∆t , x; t , z ) +
z − x >δ
∫ [F (t , z; τ, y) − F (t , x; τ, y )]d z F (t − ∆ t , x; t , z ) . (8.12)
z − x ≤δ
При сделанных нами предположениях по формуле Тейлора имеет место равенство
F (t , z; τ, y ) = F (t , x; τ, y ) + ( z − x)
∂F (t , x; τ, y ) + ∂x
(
)
∂ 2 F (t , x; τ, y ) 1 + o ( z − x) 2 . ( z − x) 2 2 ∂x 2 Тогда, подставляя это выражение в (8.12) и используя (8.5) – (8.7), далее будем иметь +
1 o(∆t ) + ∆t →0 ∆t
− lim
∫ ( z − x ) − ≤δ
z x
(
1 ∂ 2 F (t , x; τ, y ) + ( z − x) 2 + o ( z − x) 2 2 ∂x 2 =−
1 ∂F (t , x; τ, y ) lim 0 ∆ → t ∂x ∆t
∂F (t , x; τ, y ) + ∂x
) d F (t − ∆t, x; t, z) =
z
∫ ( z − x) d z F (t − ∆t , x; t , z ) −
z − x ≤δ
264
−
1 ∂ 2 F (t , x; τ, y ) 1 lim 2 0 ∆ → t 2 ∆t ∂x 1 ∆t →0 ∆t
− lim
2 ∫ ( z − x) d z F (t − ∆t , x; t , z ) −
z − x ≤δ
2 ∫ o(( z − x) )d z F (t − ∆t , x; t , z ) .
(8.13)
z − x ≤δ
Последнее слагаемое стремится к нулю при δ → 0 . Но так как левая часть равенства (8.12) от δ не зависит и пределы (8.6) и (8.7) также от δ не зависят, выражение (8.13) существует и равно ∂F (t , x; τ, y ) 1 ∂ 2 F (t , x; τ, y ) , − b(t , x) ∂x 2 ∂x 2 что и приводит нас к уравнению (8.11). Если предположить, что существует плотность распределения − a (t , x)
∂ (8.14) F (t , x; τ, y ) , ∂y то простое дифференцирование (8.11) показывает, что она удовлетворяет уравнению f (t , x; τ, y ) =
∂f (t , x; τ, y ) ∂f (t , x; τ, y ) 1 ∂ 2 f (t , x; τ, y ) =0. + a(t , x) + b(t , x) 2 ∂t ∂x ∂x 2 §41. УРАВНЕНИЕ КОЛМОГОРОВА–ФОККЕРА–ПЛАНКА
Перейдем теперь к выводу прямого уравнения Колмогорова, которое является сопряженным к обратному. Теорема 8.3. Пусть имеется диффузионный процесс, т.е. выполняются соотношения (8.5) – (8.7), существует плотность распределения (8.14) и существуют производные 2 ∂f (t , x; τ, y ) ∂ [a(τ, y) f (t , x; τ, y)], ∂ 2 [b(τ, y ) f (t , x; τ, y )]. , ∂τ ∂y ∂y
Тогда плотность f (t , x; τ, y ) удовлетворяет уравнению 265
∂f (t , x; τ, y ) ∂ 1 ∂2 [b(τ, y ) f (t , x; τ, y )], = − [a (τ, y ) f (t , x; τ, y )]+ ∂τ ∂y 2 ∂y 2
(8.15)
которое называется прямым уравнением Колмогорова (уравнением Колмогорова–Фоккера–Планка). Доказательство. Пусть R ( y ) – неотрицательная непрерывная функция такая, что
R ( y ) = 0, если y < a и y > b R (a) = R(b) = R ′(a) = R ′(b) = R ′′(a ) = R ′′(b) = 0 ,
(8.16)
R( y)
b
a
y
Рис. 36
Рассмотрим интеграл ∞ ∂f (t , x; τ, y ) f (t , x; τ + ∆τ, y ) − f (t , x; τ, y ) R( y ) dy = lim ∫ R( y ) dy. ∆ τ → 0 ∂τ ∂τ −∞ a Согласно обобщенному уравнению Маркова (8.4) b
I =∫
∞
f (t , x; τ + ∆τ, y ) = ∫ f ( s, z; τ + ∆τ, y ) f (t , x; s, z )dz −∞
и, если заменить s на τ , то ∞
f (t , x; τ + ∆τ, y ) = ∫ f (τ, z; τ + ∆τ, y ) f (t , x; τ, z )dz .
Поэтому
−∞
1 ∞ ∞ ∫ ∫ f (t , z; τ + ∆τ, y ) f (t , x; τ, z )dz − f (t , x; τ, y )R ( y )dy = ∆τ→ 0 ∆τ −∞ −∞
I = lim
266
∞ 1 ∞ ∞ f ( t , x ; , z ) f ( t , z ; , y ) R ( y ) dz dy f (t , x; τ, y ) R ( y )dy . τ τ + ∆ τ − ∫ ∫ ∫ ∆τ→0 ∆τ −∞ −∞ − ∞
= lim
После замены в двойном интеграле y на z, а z на y, получим
∞ 1 ∞ τ ( , ; , ) f t x y f (τ, y; τ + ∆τ, z ) R ( z )dz − R ( y )dy . (8.17) ∫ ∫ ∆τ→0 ∆τ −∞ −∞
I = lim
Разложим функцию R (z ) в ряд Тейлора в окрестности точки z = y : 1 (8.18) R ( z ) = R ( y ) + ( z − y ) R ′( y ) + ( z − y ) 2 R ′′( y ) + o ( z − y ) 2 . 2 Так как в силу ограниченности функции R (z ) и условия (8.5)
(
)
∫ f (τ, y; τ + ∆τ, z ) R( z )dz = o(∆τ)
y − z >δ
и
∫ f (τ, y; τ + ∆τ, z )dz = 1 + o(∆τ) ,
y − z ≤δ
то выражение в квадратной скобке в (8.17) с учетом разложения (8.18) принимает вид ∞
∫ f (τ, y; τ + ∆τ, z ) R( z )dz − R ( y ) =
−∞
= R ′( y ) ∫ ( z − y ) f (τ, y; τ + ∆τ, z )dz + y −z ≤δ
[
)]
(
1 R′′( y ) ∫ ( z − y ) 2 + o ( z − y ) 2 f (τ, y; τ + ∆τ, z )dz + o(∆τ) . 2 y − z ≤δ Таким образом,
+
1 ∞ f (t , x; τ, y ) R ′( y ) ∫ ( z − y ) f (τ, y; τ + ∆τ, z )dz + ∫ ∆τ→ 0 ∆τ −∞ y − z ≤δ
I = lim
+
1 R ′′( y ) ∫ ( z − y ) 2 + o ( z − y ) 2 f (τ, y; τ + ∆τ, z )dz + o(∆τ)dy 2 y − z ≤δ
[
(
)]
267
Далее, с учетом (8.6), (8.7), (8.16), имеем ∞ 1 I = ∫ f (t , x; τ, y ) a (τ, y ) R ′( y ) + b(τ, y ) R ′′( y ) dy = 2 −∞ b 1 = ∫ f (t , x; τ, y ) a(τ, y ) R ′( y ) + b(τ, y ) R′′( y ) dy . (8.19) 2 a Воспользовавшись формулой интегрирования по частям и равенствами (8.16), находим, что b
b
a
a
∂
∫ f (t , x; τ, y ) a(τ, y ) R ′( y )dy = − ∫ R( y ) ∂y [a(τ, y ) f (t , x; τ, y )]dy , ∂2 [b(τ, y) f (t , x; τ, y )]dy . 2 ∂ y a a В результате подстановки полученных выражений в (8.19) получаем b
b
∫ f (t , x; τ, y ) b(τ, y) R′′( y )dy = ∫ R( y )
b ∂ ∂f (t , x; τ, y ) = ( ) R y dy − [a (τ, y ) f (t , x; τ, y )]+ ∫ ∫ ∂τ a a ∂y b
+ или
1 ∂2 [b(τ, y) f (t , x; τ, y )]R( y )dy 2 2 ∂y
∂f (t , x; τ, y ) ∂ + [a (τ, y ) f (t , x; τ, y )]− ∂τ ∂y a b
∫ −
1 ∂2 [b(τ, y) f (t , x; τ, y)]R( y )dy = 0 . 2 2 ∂y
Так как на промежутке [a, b] функция R ( y ) не меняет знак, последнее соотношение может быть справедливо только тогда, когда
∂f (t , x; τ, y ) ∂ 1 ∂2 + [a(τ, y ) f (t , x; τ, y )] − [b(τ, y) f (t , x; τ, y)] = 0 . ∂τ ∂y 2 ∂y 2 268
Таким образом, получили уравнение Колмогорова–Фоккера– Планка, которое вместе с начальным условием
f (t , x; t , y ) = δ( y − x) однозначно определяет функцию f (t , x; τ, y ) ∀ τ > t . В заключение рассмотрим частный случай уравнений Колмогорова, когда функция f (t , x; τ, y ) зависит от t , τ и y − x , но не зависит от самих x и y . Физически это означает, что процесс ξ(t ) протекает однородно в пространстве: вероятность получить приращение ∆ = y − x не зависит от того, в каком положении x находится процесс в момент времени t . Очевидно, что в этом случае функции a (t , x) и b(t , x) не зависят от x , а являются функциями только от одного аргумента t : a (t , x) = a(t ), b(t , x) = b(t ) . Обратное и прямое уравнения Колмогорова в этом случае имеют вид ∂f ∂f 1 ∂2 f ( ) ( ) , = − − a t b t ∂t ∂x 2 ∂x 2 ∂f 2 = −a (τ) ∂f + 1 b(τ) ∂ f . ∂y 2 ∂y 2 ∂τ
(8.20)
Пусть a (t ) = 0, b(t ) = 1 , уравнения (8.20) при этом превращаются в уравнение теплопроводности
∂f 1 ∂ 2 f = ∂τ 2 ∂y 2
(8.21)
и ему сопряженное ∂f 1 ∂2 f . (8.22) =− ∂t 2 ∂x 2 Из общей теории теплопроводности известно, что единственное решение этих уравнений, удовлетворяющее условию
lim ∫ f (t , x; τ, y )dy = 0 , τ→t y − x >δ
которое следует из (8.5), имеет вид 269
( y− x)2
− 1 f (t , x; τ, y ) = e 2 ( τ −t ) . 2π(τ − t ) Если сделать замену переменных τ
t
x′ = x − ∫ a ( z ) dz ,
y ′ = y − ∫ b( z ) dz ,
a t
t ′ = ∫ b( z ) dz , a
a
τ
τ′ = ∫ b( z ) dz , a
то уравнения (8.20) сводятся к уравнениям (8.21), (8.22). Отсюда следует, что решения уравнений (8.20) можно записать в виде
f (t , x; τ, y ) = где τ
α = ∫ a( z ) dz , t
1 2 πσ
e
−
( y − x −α ) 2 2σ2
,
τ
σ 2 = ∫ b( z ) dz , t
т.е. плотность f (t , x; τ, y ) является нормальной. §42. ДОПРЕДЕЛЬНЫЕ МОДЕЛИ ДИФФУЗИОННЫХ ПРОЦЕССОВ
Рассмотрим еще одно применение диффузионных марковских процессов. Представим частицу, совершающую скачкообразные движения по оси Ox . За время ∆t частица совершает скачок на 1 величину ± δ с вероятностью , причем скачки совершаются не2 зависимо друг от друга. Пусть x(T ) – координата частицы в момент времени T , а ∆x k – скачок в k -й момент времени. Очевидно, что n T . (8.23) x(T ) = ∑ ∆xk , где n = ∆ t k =1 Найдем среднее значение и дисперсию положения частицы в
момент T : 270
n n M {x(T )} = M ∑ ∆x k = ∑ M {∆x k } = 0 , k =1 k =1
{
}
n n n D{x(T )} = D ∑ ∆xk = ∑ D{∆xk } = ∑ M (∆xk ) 2 = δ 2 n , k =1 k =1 k =1 или, согласно (8.23),
D{x(T )} = δ 2
δ2 . T =T ∆t ∆t
δ2 = ∞ ∨ 0 для практики малоинтересны. ∆t →0 ∆t Рассмотрим случай, когда Случаи, когда lim
δ2 = const , ∆t →0 ∆t lim
и пусть δ 2 = b∆t , тогда D{x(T )} = bT – конечная величина. Для разностей
x(t 2 ) − x(t 1) = имеем
∑ ∆xk , t 2 > t1 ,
t1 ≤ k∆t ≤t 2
M {x(t 2 ) − x(t 1)} = 0 ,
D{x(t 2 ) − x(t1 )} = b t 2 −t 1 . Тогда в силу центральной предельной теоремы p(x2 , t 2 / x1 , t1 ) =
1 2πb t 2 − t1
e
−
[x2 − x1 ]2 2 b t 2 −t1
,
и все разности по предположению независимы. Поэтому в пределе получим, что x(T ) – винеровский процесс. Остановимся на особенностях траекторий этого процесса. Как определено выше, приращение процесса за время ∆t равно δ = b∆t и δ → 0 при ∆t → 0 , т.е. траектории винеровского процесса непрерывны. С другой стороны, 271
∆x ±δ ± b∆t = lim = lim = ±∞ , ∆ → ∆ → t t 0 0 ∆t ∆t ∆t поэтому производная не существует. Можно сказать, что траектории винеровского процесса ни в одной точке не имеют производной. Это утверждение верно для всех диффузионных процессов. В данном случае случайное блуждание частицы описывается диффузионным процессом с коэффициентом сноса a (t , x) = 0 и коэффициентом диффузии b(t , x) = b . В заключение этого параграфа докажем лемму, которая понадобится нам в следующей главе. Лемма 8.2. Пусть ξ(t ) – винеровский процесс с нулевым коэффициентом сноса и единичным коэффициентом диффузии. Тогда для 0 ≤ t1 < t 2 < ... < t n = T lim
∆t →0
n −1
→ T . S n = ∑ [ξ(ti +1 ) − ξ(t i )]2 ср.кв. max ti +1 −ti →0
i =1
i
Доказательство. По определению сходимости в среднем квадратичном нужно доказать, что
{
}
→ 0 . M (S n − T ) n →∞ 2
2 Обозначим ηi = [ξ(ti +1 ) − ξ(ti )] , тогда S n = ∑ ηi . Так как ξ(t ) – n −1 i =1
винеровский процесс, то [ξ(t i +1 ) − ξ(t i )] – нормально распределенные СВ и Тогда
M [ξ(t i +1 ) − ξ(ti )] = 0 , D[ξ(ti +1 ) − ξ(ti )] = t i +1 − ti . M {ηi } = D[ξ(t i +1 ) − ξ(t i )] = t i +1 − t i ,
{ }
2 D{ηi } = M ηi − M 2 {ηi }.
{ }
Величины M ηi 2 можно найти, используя выражение для четных моментов нормальных СВ:
{ }
M ξ 2 k = (2k − 1)!!σ 2 k = 1 ⋅ 3 ⋅ 5 ⋅...⋅ (2k − 1)σ 2 k , 272
значит,
{ } {
}
M ηi = M [ξ(t i +1 ) − ξ(ti )] = 3(ti +1 − t i ) 2 , 2
и
4
D{ηi } = 2(t i +1 − t i ) 2 .
Поэтому
M {S n } = T n −1
D{S n } = 2 ∑ (ti +1 − t i ) 2 . i =1
Рассмотрим теперь выражение
{
} { }
M (S n − T )2 = M S n 2 − 2 M {S n }T + T 2 = = D{S n }+ T 2 − 2TM {S n }+ T 2 = D{S n } = n −1
= 2 ∑ (t i +1 − t i ) 2 ≤ 2T max t i +1 − t i . i
i =1
{
}
Так как T конечно, то при max ti +1 − t i → 0 M (S n − T )2 → 0 , что i
и доказывает сходимость (S n − T ) в среднем квадратичном.
273
ГЛАВА 9. СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ В данной главе мы будем рассматривать интегралы вида b
∫ ϕ(ξ(t ), t )dξ(t ) ,
(9.1)
a
где ϕ(⋅) – неслучайная функция, ξ(t ) – случайный процесс. Реализации процесса ξ(t ) в общем случае являются функциями неограниченной вариации, следовательно, этот интеграл нельзя понимать как интеграл Стилтьеса или Лебега–Стилтьеса. Определение. Интеграл вида (9.1) называют стохастическим интегралом, если ξ(t ) – диффузионный процесс. Как следует из §42, не совсем понятно, что понимать в этом случае под дифференциалом dξ(t ) . Выясним это, рассмотрев два более подробных определения стохастического интеграла. §43. СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ В ФОРМЕ ИТО
Разобьем интервал [a, b] точками a = t1 < t2 < ... < tn−1 = b , и рассмотрим интегральную сумму n −1
S n = ∑ ϕ(ξ(ti ), ti )[ξ(ti +1 ) − ξ(ti )] . i =1
Если существует предел в среднем квадратичном n −1
b
n →∞ i =1 max ( t i +1 − ti ) → 0
a
l. i. m.
∑ ϕ(ξ(t i ), t i )[ξ(t i +1 ) − ξ(t i )] = ∫ ϕ(ξ(t ), t )dξ(t ) ,
i
то он называется стохастическим интегралом в форме Ито. Так как диффузионный процесс ξ(t ) недифференцируем ни в одной точке, то интеграл Ито обладает рядом свойств, отличных от интеграла Римана. Покажем это отличие на частном примере.
274
Пример 9.1. Пусть надо вычислить интеграл t
I = ∫ [ξ(τ) − ξ(t0 )]dξ( τ) , t0
где ξ(τ) – винеровский процесс с нулевым математическим ожиданием и единичной дисперсией, Mξ(τ) = 0 , Dξ(τ) = 1 . Если этот интеграл понимать как интеграл Римана, то t
I = ∫ [ξ(τ) − ξ(t 0 )]d [ξ(τ) − ξ(t 0 )] = t0
[ξ(τ) − ξ(t 0 )]2 [ξ(τ) − ξ(t 0 )]2 . = ∫ d = 2 2 t0 t
(9.2)
Но так как ξ(t ) недифференцируем, то интеграл I вычислим как предел интегральной суммы. Для этого разобьем область интегрирования на n − 1 частей точками t0 = t1 < t2 < ... < tn −1 = t . Пусть δi +1 = ξ(ti +1 ) − ξ(ti ) . Тогда i −1
ξ(ti ) − ξ(t0 ) = ∑ δ k , k =1
и по определению интеграла Ито имеем n −1
I = l. i. m. ∑ [ξ(ti ) − ξ(t0 )][ξ(ti +1 ) − ξ(ti )] = n → ∞ i =1
n −1 i −1 = l. i. m. ∑ ∑ δ k δi . n → ∞ i =1 k =1 Чтобы вычислить двойную сумму в I , воспользуемся соотношением 2
2
n −1 n −1 n −1 i −1 ∑ δ k = ∑ δ k + 2 ∑ δi ∑ δ k . i =1 k =1 k =1 k =1
275
Отсюда следует 2 n −1 i −1 1 n −1 2 δ δ = δ ∑ k − ∑ δ k . ∑ i∑ k i =1 k =1 k =1 2 k =1
n −1
Тогда
1 n −1 n −1 ∑ δ k − ∑ δ k 2 k =1 k =1 2
I = l. i. m. n →∞
=
2
=
n −1 1 [ξ(t ) − ξ(t 0 )]2 − l. i. m. 1 ∑ [ξ(t i +1 ) − ξ(t i )]2 . 2 n → ∞ 2 i =1
По лемме 8.2 второе слагаемое равно t − t0 , поэтому
I=
[ξ(t ) − ξ(t0 )]2 − t − t0 .
2 2 Сравнивая это выражение с интегралом Римана (9.2), видим, что они отличаются на величину
t − t0 за счет недифференцируе2
мости траекторий винеровского процесса ξ(t ) . §44. СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ В ФОРМЕ СТРАТАНОВИЧА
При решении прикладных задач обычно имеют дело с допредельными моделями броуновского движения, траектории которых непрерывны. Поэтому желательно ввести такое определение стохастического интеграла, в котором его значение было бы устойчивым по отношению к предельному переходу от процессов с дифференцируемыми траекториями к винеровскому процессу. Таким определением является определение в форме Стратановича. Определение. Пусть имеем разбиение интервала интегрирования [a, b] точками a = t1 < t 2 < ... < tn−1 = b . Рассмотрим интегральную сумму 276
n −1 ξ(t ) + ξ(ti ) , ti [ξ(ti +1 ) − ξ(ti )]. S n = ∑ ϕ i +1 2 i =1
(9.3)
Если при max (ti +1 − ti ) → 0 существует прием в среднем квадi
ратичном, то он называется стохастическим интегралом в форме Стратановича, или симметризованным стохастическим интегралом, и обозначается
ξ(t i +1 ) − ξ(t i ) , t i [ξ(t i +1 ) − ξ(t i )] . 2 1 → ∞ = n i a Отличие в аргументе подынтегральной функции обеспечивает необходимую устойчивость стохастического интеграла к предельному переходу. Рассмотрим связь интеграла в форме Ито и в форме Стратаноb
n −1
∫ ϕ(ξ(t ), t )dξ(t ) = l. i. m. ∑ ϕ
вича. Предположим, что функция ϕ( x, y ) дифференцируема по первому аргументу. Используя разложение в ряд Тэйлора в окрестности точки ξ(ti ) , имеем ξ(t ) − ξ(ti ) ξ(t ) + ξ(ti ) , ti = ϕ ξ(ti ) + i +1 , ti = ϕ i +1 2 2 2 1 [ξ(ti +1 ) − ξ(ti )] ∂ϕ + 1 [ξ(ti +1 ) − ξ(ti )]2 ∂ ϕ2 + ... . 2 ∂ξ 4 ∂ξ Подставляя это разложение в сумму (9.3) и переходя к пределу при n → ∞ , получаем
= (ξ(ti ), ti ) +
b
b
a
a
∫ ϕ(ξ(t ), t )dξ(t ) = ∫ ϕ(ξ(t ), t )dξ(t ) + +
b n −1 ∂ϕ(ξ(t ), t ) 1 i i [ξ(t i +1 ) − ξ(t i )] + ... = ∫ ϕ(ξ(t ), t )dξ(t ) + l. i. m. ∑ ∂ξ 2 n →∞ i =1 a
+ 1 ∂ϕ(ξ(t ), t ) dξ(t ) . ∫ ∂ξ 2a b
277
(9.4)
Так как интеграл Стратановича больше отвечает прикладным задачам, а интеграл в форме Ито более удобен в теоретических преобразованиях, то решение конкретной задачи можно начинать с использования представления Ито, а затем по формуле (9.4) перейти к интегралу в форме Стратановича. Если ϕ(ξ(t), t ) не зависит от ξ(t ) , то данные интегралы совпадают. Пример 9.2. Найдем среднее значение и корреляционную функцию случайного процесса, заданного выражением 1
η(t ) = ∫ eiτt d τξ(τ) , 0
где ξ(τ) – винеровский процесс, τ ∈ T = [0,+∞ ) . Мы знаем (п. 4.4), что для винеровского процесса
Mξ( τ) = 0 , Dξ(τ) = σ 2 τ ,
[
]
D(ξ(τ2 ) − ξ(τ1 ) ) = M (ξ( τ2 ) − ξ(τ1 ) ) = Mξ 2 (τ2 ) − 2M [ξ(τ2 )ξ(τ1 )]+ 2
+ Mξ 2 (τ1 ) = σ 2 (τ 2 − 2τ1 + τ1 ) = σ 2 (τ2 − τ1 ) . Заметим, что последнее выражение можно представить в виде τ2
D(ξ(τ2 ) − ξ(τ1 ) ) = ∫ s (t )dt , τ1
где s(t ) = σ 2 . Найдем среднее значение процесса η(t ) : n −1 1 Mη(t ) = M ∫ eiτt d τξ(τ) = M l. i. m. ∑ eiτ k t [ξ(τ k +1 ) − ξ(τk )] = n → ∞ k =1 0 n −1
= l. i. m. ∑ e iτk t M [ξ(τ k +1 ) − ξ(τ k )] = 0 . n → ∞ k =1
Найдем корреляционную функцию комплекснозначного процесса η(t ) при t1 ≠ t2 :
278
1 1 Rη (t1 , t 2 ) = M η(t1 )η(t 2 ) = M ∫ e it1τ d τ ξ(t ) ∫ e it2 τ d τ ξ(t ) = 0 0
[
]
n −1
n −1
n → ∞ k =1
k =1
= M l. i. m. ∑ e it1τ k [ξ(τ k +1 ) − ξ(τ k )] ∑ e it 2 τk [ξ(τ k +1 ) − ξ(τ k )] = n −1
= l. i. m. ∑ e it1τ k e it 2 τk D[ξ(τ k +1 ) − ξ(τ k )] = n → ∞ k =1 n −1
τ k +1
1
τk
0
= l. i. m. ∑ e it1τk e it2 τ k ∫ s(t )dt = ∫ e it1τ e −it 2 τ s (τ)dτ = n → ∞ k =1 1
= σ 2 ∫ e i (t1 −t 2 ) τ dτ = 0
[
]
σ2 e i (t1 −t 2 ) − 1 . i (t1 − t 2 )
Для t1 = t 2 имеем
[
]
1
Rη (t , t ) = M η(t )η(t ) = σ 2 ∫ dt = σ 2 .
Таким образом,
[
0
]
σ2 e i (t1 −t 2 ) − 1 , t1 ≠ t 2 , Rη (t1 , t 2 ) = i (t1 − t 2 ) 2 σ , t1 = t 2 . §45. СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Многие реальные объекты описываются дифференциальными уравнениями вида dX (t ) dξ(t ) = a(X (t ), t ) + σ(X (t ), t ) dt dt или в форме дифференциалов
(9.5)
dX (t ) = a(X (t ), t ) + σ(X (t ), t )dξ(t ) .
(9.6)
279
Если ξ(t ) – винеровский случайный процесс, то дифференциальное уравнение называется стохастическим. Стохастические дифференциальные уравнения принято обычно писать в форме дифференциалов, поскольку винеровский процесс является недифференцируемым. Решение уравнений (9.5), (9.6) определяется интегральным равенством t
t
t0
t0
X (t ) = X (t0 ) + ∫ a( X (τ), τ)dτ + ∫ σ( X (τ), τ)dξ( τ) ,
(9.7)
где первый интеграл является стохастическим в среднеквадратичном смысле (см. §16), второй интеграл является стохастическим в форме Ито или в форме Стратановича, X (t0 ) – значение процесса
X (t ) в начальный момент времени. (9.7) называется стохастическим уравнением Ито. Справедливо следующее утверждение, которое мы примем без доказательства. Теорема 9.1. Пусть a ( x, t ) , σ( x, t ) – непрерывные по t функции и существует константа L , такая, что
a ( x, t ) − a ( y , t ) + σ ( x, t ) ≤ L x − y , a 2 ( x, t ) + σ 2 ( x, t ) ≤ L2 (1 + x 2 ) . Тогда существует «единственное» решение уравнения (9.7) в том смысле, что P sup X 1 (t ) − X 2 (t ) = 0 = 1 , t 0 ≤ t ≤T
где X 1 (t ) , X 2 (t ) – некоторые решения уравнения (9.7). Пусть a ( x, t ) = β(t ) x + α(t ) , σ( x, t ) = b(t ) . Тогда решение уравнения (9.7), как легко проверить, имеет вид
280
t0 X (t ) = e X (t 0 ) + ∫ α(τ)e dτ + ∫ b( τ)e dξ(τ) .(9.8) t0 t0 Отсюда следует, что среднее значение данного решения можно записать в виде ∫ β ( τ ) dτ
τ
t
τ
− ∫ β ( u ) du
t
t0
t0
∫ β( τ ) dτ
t
− ∫ β ( u ) du
t
− ∫ β ( u ) du
τ
t
m X (t ) = MX (t ) = e
t0
MX (t ) + α (τ)e ∫ 0 t0
t0
dτ .
Покажем, что процесс X (t ) , определяемый уравнением (9.7), является марковским. Действительно, распределение вероятностей
X (t ) при t > t0 при заданном значении X (t0 ) зависит лишь от X (t0 ) и не зависит от прошлых значений X (s) , s < t0 , как видно из (9.7). А это является основным свойством марковского процес-
са. Поэтому процесс X (t ) полностью описывается коэффициентами сноса и диффузии. Пусть ξ(t ) – винеровский процесс с нулевым средним и единичным коэффициентом диффузии, второй интеграл в (9.7) будем понимать в форме Ито. Тогда X (t + ∆t ) − X (t ) = a(X (t ), t )∆t + σ(X (t ), t )[ξ(t + ∆t ) − ξ(t )]+ o(∆t ) , откуда после усреднения имеем M [X (t + ∆t ) − X (t ) / X (t )] = a(X (t ), t )∆t ,
т.е. a ( x, t ) является коэффициентом сноса процесса X (t ) . Найдем коэффициент диффузии. Далее, используя (9.8), получаем
[X (t + ∆t ) − X (t )]2 = a 2 (X (t ), t )(∆t ) 2 + σ 2 (X (t ), t )[ξ(t + ∆t ) − ξ(t )]2 + + 2a(X (t ), t )σ(X (t ), t )∆t [ξ(t + ∆t ) − ξ(t )]+ o(∆t ) . Отсюда, после усреднения будем иметь
{
}
M [X (t + ∆t ) − X (t )] / X (t ) = σ 2 (X (t ), t )∆t , 2
281
таким образом, коэффициент диффузии процесса X (t ) равен σ 2 ( x, t ) . Знание коэффициентов сноса и диффузии позволяет записать уравнение Колмогорова–Фоккера–Планка для переходной плотности вероятностей, которая однозначно определяет поведение процесса X (t ) .
282
ГЛАВА 10. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ §46. СТАЦИОНАРНЫЕ В УЗКОМ И ШИРОКОМ СМЫСЛЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
Определение. Случайный процесс ξ(t ) называется стационарным в узком смысле, если для конечномерных ф.р. выполняется равенство F ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ) = F ( x1 , t1 + τ; x 2 , t 2 + τ; ... ; x n , t n + τ) (10.1) ∀ τ и ∀ n = 1, 2, ... , т.е. его конечномерное распределение инвари-
антно относительно сдвига всех моментов времени t i , i = 1, n , на одну и ту же величину τ . При n = 1 условие стационарности (10.1) дает F ( x , t ) = F ( x , t + τ) . 1
1
1
1
Полагая τ = −t1 , имеем F ( x1 , t1 ) = F ( x1 , 0) , т.е. одномерное распределение стационарного процесса не зависит от времени и совпадает с распределением в момент времени t = 0 . А одномерное распределение, согласно (2.12), (2.13), определяет среднее значение и дисперсию случайного процесса, следовательно, для стационарного в узком смысле случайного процесса среднее значение и дисперсия не зависят от времени:
mξ (t ) = m , Dξ (t ) = σ 2 . При n = 2 из условия стационарности следует F ( x1 , t1 ; x 2 , t 2 ) = F ( x1 , t1 + τ; x 2 , t 2 + τ) .
Полагая τ = −t1 , имеем F ( x1 , t1 ; x 2 , t 2 ) = F ( x1 , x 2 , t 2 − t1 ) ,
283
т.е. двумерное распределение зависит лишь от разности моментов времени t 2 и t1 . Поэтому корреляционная функция стационарного в узком смысле случайного процесса, согласно (2.14), зависит только от одного аргумента t = t 2 − t1 : +∞ +∞
Rξ (t1 , t 2 ) = ∫ ∫ x1 x 2 dF ( x1 , t1 ; x 2 , t 2 ) = − ∞ −∞
+∞ +∞
(10.2)
∫ ∫ x1 x 2 dF ( x1 , t1 , t 2 − t1 ) = Rξ ( t 2 − t1 ) = Rξ (t ) .
−∞ −∞
С практической точки зрения стационарность в узком смысле означает, что все статистические характеристики процесса не подвергаются изменению при переносе оси времени, в частности, одномерное распределение не зависит от времени вообще. Например, стационарность в узком смысле некоторого производственного процесса означает, что не подвергаются систематическим изменениям ни условия производства, ни поставляемое сырье, ни другие факторы; существует возможность появления только некоторых случайных изменений и то только таких, распределения вероятностей которых не подвергаются изменениям при переносе времени. Стационарным в узком смысле случайным процессом не может быть измеряемая температура воздуха в течение года, поскольку известно, что распределения температуры в разных местах и в разные поры года являются различными. Аналогично, стационарным процессом не является курс доллара, выраженный в рублях. Определение. Случайный процесс ξ(t ) называется стационарным в широком смысле, если его среднее значение не зависит от времени (10.3) mξ (t ) = m , а корреляционная функция зависит лишь от разности аргументов,
Rξ (t1 , t 2 ) = Rξ ( t 2 − t1 ) ,
284
(10.4)
Очевидно, что из стационарности в узком смысле следует стационарность в широком смысле. Наоборот верно не всегда. Но для гауссовских случайных процессов верно и обратное утверждение. Теорема 10.1. Гауссовский процесс стационарный в широком смысле является стационарным и в узком смысле. Доказательство. Согласно §19 n -мерная ф.р. процесса равна F ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ) = =
1 n (2π) 2
где
K
∫ ∫ ' ∫ exp− 2 K ∑ [( y i − ai ) K ij ( y j − a j )]dy1 dy 2 ' dy n , i , j =1 −∞ −∞ −∞ x1
x2
xn
a i = Mξ(t i ) ,
1
n
[
(
K = K (t i , t j ) = M (ξ(t i ) − a i ) ξ(t j ) − a j
(10.5)
)]
n×n
,
i, j = 1, n , K ij – алгебраическое дополнение элемента K (ti , t j ) матрицы ковариаций K . Для стационарного в широком смысле процесса, как следует из (2.14), (10.3), (10.4), K (t i , t j ) = K (t i + τ, t j + τ) = K (t j − t i ), поэтому многомерная ф.р. (10.5) зависит только от n и K (t j − ti ) :
(
)
F ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ) = f xi , n, K (t j − t i ) , i, j = 1, n . Отсюда видно, что при переходе к моментам времени t i + τ , i = 1, n , ф.р. не изменится, т.е. соотношение (10.1) выполнено. Как указано выше, функцию корреляции стационарного в широком смысле случайного процесса можно рассматривать как функцию одного аргумента Rξ (t ) . Как следует из свойств этой функции для произвольного случайного процесса (см. §12), Rξ (t ) обладает следующими свойствами: а) R (0) ≥ 0 , ξ
(10.6)
б) R (t ) ≤ R (0) , ξ ξ
(10.7)
285
в) Rξ (t ) является положительно определенной функцией, т.е.
∀ n и любых комплексных чисел z1 , z 2 , ..., z n n
∑ Rξ (t i − t j ) z i z j ≥ 0 .
(10.8)
i , j =1
Отметим, что частными случаями теорем 3.2, 3.4 являются следующие утверждения. Теорема 10.2. Для того чтобы стационарный в широком смысле случайный процесс ξ(t ) был непрерывен в среднем квадратичном, необходимо и достаточно, чтобы его корреляционная функция была непрерывной в точке t = 0 . Теорема 10.3. Для того чтобы стационарный в широком смысле процесс был дифференцируем в среднем квадратичном, необходимо и достаточно, чтобы − Rξ′′ (0) < +∞ . Пример 10.1. Рассмотрим случайный процесс ξ(t ) = ξ cos t + η sin t , где ξ , η – независимые СВ, причем Mξ = Mη = 0 , Dξ = Dη = 1 . Очевидно, что mξ (t ) = 0 . Поскольку Mξ 2 = Dξ = 1 , Mη 2 = Dη = 1 ,
M (ξη) = MξMη = 0 , то корреляционная функция процесса равна Rξ (t1 , t 2 ) = M [ξ(t1 )ξ(t 2 )] = M [(ξ cos t1 + η sin t1 )(ξ cos t 2 + η sin t 2 )] = = M (ξ 2 cos t1 cos t 2 + ξη sin t1 cos t 2 + ξη cos t1 sin t 2 + η 2 sin t1 sin t 2 ) = = cos t cos t + sin t sin t = cos(t − t ) = cos(t − t ) , 1
2
1
2
1
2
2
1
поэтому случайный процесс ξ(t ) является стационарным в широком смысле. Пусть теперь у нас имеются два случайных процесса ξ(t ) и η(t ) . Определение. Процессы ξ(t ) и η(t ) называются стационарно связными в узком смысле, если их совместная конечномерная 286
ф.р. любого порядка (2.11) не зависит от положения начала отсчета времени, т.е. F ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ; y1 , τ1 ; y 2 , τ 2 ; ... ; y m , τ m ) = = F ( x1 , t1 + τ; x 2 , t 2 + τ; ... ; x n , t n + τ; y1 , τ1 + τ; y 2 , τ 2 + τ; ... ; y m , τ m + τ) ∀ τ и ∀ n, m = 1, 2, ... . Определение. Комплексный случайный процесс
ζ(t ) = ξ(t ) + iη(t ) называется стационарным в узком смысле, если ξ(t ) и η(t ) являются стационарно связными в узком смысле, т.е. его конечномерное распределение любого порядка n удовлетворяет соотношению
Fζ ( x1 , t1 ; x 2 , t 2 ; ... ; x n , t n ; y1 , t1 ; y 2 , t 2 ; ... ; y n , t n ) = = Fζ ( x1 , t1 + τ; x 2 , t 2 + τ; ... ; x n , t n + τ; y1 , t1 + τ; y 2 , t 2 + τ; ... ; y n , t n + τ).
Определение. Пусть ζ (t ) – комплексный случайный процесс, такой, что Mζ 2 (t ) < ∞ . Он называется стационарным в широком смысле, если (10.9) Mζ (t ) = const (не зависит от t ) ,
[
]
Rζ (t1 , t 2 ) = M ζ (t1 )ζ (t 2 ) = Rζ (t 2 − t1 ) . Пример 10.2. Рассмотрим случайный процесс
(10.10)
n
ζ (t ) = ∑ α k (ω)e iλ k t , k =− n
где λ −n , λ − n +1 , ..., λ n – действительные постоянные, α − n (ω), α − n +1 (ω), ..., α n (ω) – СВ, такие, что 2
2
Mα k (ω) = 0 , M α k (ω) = σ k < ∞ , k = − n, − n + 1, ..., n . Ясно, что Mζ (t ) = 0 .
Найдем корреляционную функцию процесса ζ (t ) :
287
[
]
n n Rζ (t1 , t 2 ) = M ζ (t1 )ζ (t 2 ) = M ∑ α k (ω)e iλ k t1 ∑ α k (ω)e −iλ k t 2 = k =−n k =−n n
[
]
n
2 = ∑ M α k (ω) e iλ k (t1 −t 2 ) = ∑ σ 2k e −iλ k (t 2 −t1 ) . k =−n
k =− n
Таким образом, выполнены условия (10.9), (10.10), поэтому процесс ζ (t ) является стационарным в широком смысле. §47. СПЕКТРАЛЬНАЯ ПЛОТНОСТЬ СЛУЧАЙНОГО ПРОЦЕССА
Докажем сначала в общем виде одно утверждение. Теорема 10.4 (Бохнера). Для функции R (t ) , обладающей свойствами (10.6) – (10.8), существует функция F (λ) – неубывающая, ограниченной вариации, такая, что +∞
R (t ) = ∫ e iλt dF (λ) .
(10.11)
−∞
Доказательство. Пусть z i = e −iλti , i = 1, 2, ... . Тогда из определения положительно определенной функции (10.6) следует, что − iλ ( t −t ) ≥0, ∑ R(t i − t j )e i
j
i, j
поэтому
1
AA
dtdu ≥ 0 ∀ A > 0 . (10.12) 2π A 0 0 Сделаем в интеграле (10.12) замену переменных g (λ, A) =
∫ ∫ R(t − u )e
− iλ ( t − u )
t −u = x, u = y, тогда x = t − y . При этом область интегрирования B перейдет в область интегрирования C , как показано на рис. 37.
288
y
u
A
A
B O
C A
−A
t
O
A
x
Рис. 37
Далее будем иметь
g (λ, A) = =
= где
A A− x 0 A − iλ x − iλx + dyR x e dx ( ) ∫ ∫ dyR( x)e dx = ∫ ∫ 2π A − A − x 0 0
1
A 0 − iλx − iλx + + A x R x e dx ( ) ( ) ∫ ( A − x) R( x)e dx = (10.13) ∫ 2π A − A 0
1
A x 1 ∞ x − iλx − iλ x ∫ 1 − A R( x)e dx = ∫ µ A R( x)e dx , 2π − A 2π − ∞
1
1 − t , t ≤ 1 , µ(t ) = 0 , t > 1 . Покажем, что функция g (λ, A) интегрируема на всей прямой. Рассмотрим интеграл ∞
λ
∞
∞
λ
−iλx ∫ µ 2M g (λ, A)dλ = ∫ µ A R( x) ∫ µ 2M e dλdx . 2π − ∞ −∞ −∞ 1
x
289
Поскольку 2M λ − i λx λ −iλx µ λ = e d ∫ 2M ∫ 1 − 2M e dλ = −∞ −2M ∞
2M 2M λ λ d sin(λx) = = 2 ∫ 1 − cos(λx)dλ = 2 ∫ 1 − x 2M 2M 0 0 2M
λ sin(λx) = 21 − 2M x
+ 0
1 2M ∫ sin(λx)dλ = Mx 0
2M
cos(λx) 1 − cos(2 Mx) 2 sin 2 ( Mx) , = = Mx 2 0 Mx 2 Mx 2 то с учетом (10.7) получаем =−
∞
λ
∞
sin 2 ( Mx)
dx ≤ ∫ µ 2M g (λ, A)dλ = M π ∫ µ A R ( x) ( Mx) 2 −∞ −∞ 2
≤ R (0)
x
2 ∞ sin 2 ( Mx) d ( Mx) = R (0) . ∫ π −∞ ( Mx) 2
Таким образом, g (λ, A) интегрируема на всей прямой и, как следует из (10.13), является обратным преобразованием Фурье для x функции µ R (x) . Тогда из свойств преобразований Фурье полу A чаем, что в этом случае существует прямое преобразование Фурье +∞ x µ R( x) = ∫ g (λ, A)e iλx dλ . A −∞
При x = 0 имеем +∞
R (0) = ∫ g (λ, A)dλ , −∞
290
(10.14)
откуда, учитывая условие нормировки, вытекает, что функция g (λ, A) является плотностью распределения вероятностей некоR ( 0)
x R( x) торой СВ. В свою очередь тогда из (10.14) следует, что µ A R (0) является характеристической функцией ∀ A . При A → ∞
R ( x) x R( x) , µ → R (0) A R (0) R ( x) также является характеристической функцией. ТогR ( 0) да из теоремы об обращении характеристической функции выте-
поэтому
кает, что существует неубывающая функция F1 (λ ) ограниченной вариации, такая, что
R ( x) +∞ iλx = ∫ e dF1 (λ) , R(0) −∞ откуда следует выражение (10.11). Теорема доказана. Следствие. Если R (t ) – корреляционная функция стационарного случайного процесса ξ(t ) , то справедливо выражение (10.11). При этом F (λ) называется спектральной функцией процесса
ξ(t ) . Если функция F (λ) дифференцируема, то f (λ ) = F ′(λ ) называется спектральной плотностью процесса ξ(t ) , +∞
f (λ ) = ∫ e −iλt R (t )dt , −∞
291
λ
F (λ ) = ∫ f (u )du . −∞
Если R (t ) – вещественная функция, то +∞
R(t ) = ∫ cos(λt ) f (λ )dλ , −∞
+∞
f (λ ) = ∫ cos(λt ) R (t )dt . −∞
Пример 10.3. Найдем спектральную плотность с корреляционной функцией
1 2 −α t , α > 0. σ e 2π Используя формулу (10.15), получаем R (t ) =
f (λ ) =
=
1 +∞ −iλt 2 −α t ∫ e σ e dt = 2π − ∞
σ 2 0 −iλt + αt σ 2 +∞ −iλt − αt e dt dt = + ∫ ∫e 2π − ∞ 2π 0
α 1 σ2 σ2 1 ⋅ . + = 2π α − iλ α + iλ π α 2 + λ2 Сформулируем без доказательства нужное нам в дальнейшем утверждение. Теорема 10.5. Для любого стационарного в широком смысле =
и непрерывного в среднем квадратичном случайного процесса ξ(t ) существует процесс η(t ) с независимыми приращениями, такой, что справедливо спектральное представление +∞
ξ(t ) = ∫ e iλt d λ η(λ ) . −∞
292
(10.16)
Рассмотрим случайный процесс вида dξ(t ) d k ξ(t ) (10.17) + ' + ak , dt dt k где a 0 , a1 , ..., a k – постоянные коэффициенты, ξ(t ) – стационарный в широком смысле, имеющий спектральную плотность f ξ (λ) процесс, имеющий также производную k -го порядка в среднем квадратичном. Согласно теореме 10.5 процесс ξ(t ) имеет спектральное представление (10.16). Кроме того, можно показать, что ζ (t ) = a 0 ξ(t ) + a1
+∞ d r ξ(t ) d r +∞ iλt r iλt = e d η ( λ ) = ∫ ∫ (iλ) e d λ η(λ) , λ dt r dt r − ∞ −∞ т.е. можно дифференцировать под знаком интеграла. Учитывая это, процесс (10.17) можно переписать в виде
[
]
+∞
ζ (t ) = ∫ a 0 + a1 (iλ ) + ' + a k (iλ ) k e iλt d λ η(λ ) . −∞
Можно также показать, что корреляционная функция этого процесса равна
[
]
Rζ (t1 , t 2 ) = M ζ (t1 )ζ (t 2 ) =
[
]
+∞ = M ∫ a 0 + a1 (iλ) + ' + a k (iλ) k e iλt1 d λ η(λ) × −∞ +∞ × ∫ a 0 + a1 (iλ) + ' + a k (iλ) k e iλt 2 d λ η(λ) = −∞
[
]
+∞
2
= ∫ a 0 + a1 (iλ ) + ' + a k (iλ ) k e iλ (t1 −t 2 ) f ξ (λ )dλ . −∞
Тогда спектральная плотность имеет вид 2
(10.18) f ζ (λ) = a 0 + a1 (iλ) + ' + a k (iλ) k f ξ (λ) . Рассмотрим теперь выражение (10.17) как стохастическое дифференциальное уравнение. Если предположить, что его решение 293
ξ(t ) является стационарным в широком смысле случайным процессом, то спектральная плотность этого решения равна f ξ (λ ) =
f ζ (λ ) a 0 + a1 (iλ) + ' + a k (iλ) k
2
.
Пример 10.4. Найдем среднее значение mξ (t ) и функцию корреляции Rξ (t ) стационарного в широком смысле решения стохастического дифференциального уравнения. (10.19) ξ ′(t ) + αξ(t ) = ζ (t ) , где ζ (t ) является стационарным в широком смысле случайным процессом с нулевым средним значением, Mζ (t ) = 0 , и спектральной плотностью 1
2
− λ f ζ (λ) = e 2 , α – действительная постоянная. Предположим, что решение уравнения (10.19) является стационарным процессом, поэтому mξ (t ) = const . Кроме того, беря математическое ожидание от обеих сторон в (10.19), получаем
′ mξ (t ) + αmξ (t ) = 0 , откуда следует, что mξ (t ) = 0 . Из (10.18) находим выражение, которому удовлетворяет спектральная плотность процесса ξ(t ) , 2
2
2
α + iλ f ξ ( λ ) = (α + λ ) f ξ ( λ ) = f ζ (λ ) =
1 − λ2 e 2
,
откуда 1
− λ2 1 2 . e 2 2 α +λ Поэтому из (10.11) получаем
f ξ (λ ) =
+∞
Rξ (t ) = ∫ e −∞
iλt
+∞
f ξ ( λ ) dλ = ∫ e −∞
294
1
iλt
− λ2 1 2 dλ . e α 2 + λ2
(10.20)
Далее заметим, что функция f 1 (λ ) =
1 − λ2 e 2
является характе-
ристической функцией СВ ξ1 , имеющей плотность распределения
p ξ1 ( x) = а функция f 2 (λ ) =
1 2π
e
−
x2 2
,
α2 является характеристической функциα 2 + λ2
ей СВ ξ 2 , имеющей плотность распределения
p ξ 2 ( x) = Поэтому функцию
α −α x . e 2 1
− λ2 α2 (10.21) 2 e α 2 + λ2 можно трактовать как характеристическую функцию суммы двух
f ξ1 + ξ 2 (λ) = f 1 (λ) f 2 (λ) =
независимых СВ ξ1 + ξ 2 . Плотность распределение этой суммы имеет вид +∞
p ξ1 + ξ 2 ( x) = ∫ p ξ1 (u ) p ξ 2 ( x − u )du = −∞
=
α
+∞
∫ e 2 2π −∞ Используя (10.21), получаем
−
1
u2 −α x −u 2
du .
(10.22)
− λ2 1 +∞ −iλt α 2 1 +∞ −iλt 2 e e d λ = ∫ ∫ e 2πf ξ1 +ξ 2 (λ)dλ . (10.23) 2πα 2 −∞ α 2 −∞ α 2 + λ2 Как известно (§7), для характеристической функции справедливы соотношения
295
+∞
f ξ1 + ξ 2 (λ ) = ∫ e iλt p ξ1 + ξ 2 (t )dt , −∞
1 +∞ −iλt ∫ e f ξ1 +ξ 2 (λ)dλ . 2π −∞ Тогда из (10.20), (10.22) – (10.24) вытекает, что p ξ1 + ξ 2 (t ) =
2π 2π + ∞ − Rξ (t ) = 2 p ξ1 + ξ 2 (t ) = ∫ e 2α −∞ α
u2 − α t −u 2
(10.24)
du .
§48. ЭРГОДИЧЕСКОЕ СВОЙСТВО СЛУЧАЙНЫХ ПРОЦЕССОВ
Пусть ξ(t ), t ≥ 0 – случайный процесс с непрерывным временем. Определение. Временным средним некоторой функции
(
)
g ξ(t , ω) реализации случайного процесса ξ(t , ω) называется величина
(
)
(
)
( 1t (10.25) Mg ξ(t , ω) = lim ∫ g ξ(τ, ω) dτ . t →∞ t 0 Например, временное среднее случайного процесса равно ( 1t ( m = Mξ(t , ω) = lim ∫ ξ(τ, ω)dτ , t →∞ t 0 а временная дисперсия
[
]
[
]
( ( 1t (2 (2 D = M ξ(t , ω) − m = lim ∫ ξ(τ, ω) − m dτ . t →∞ t 0
Определение. Говорят, что случайный процесс ξ(t , ω) обладает эргодическим свойством, если Mg (ξ(t , ω) ) = ∫ g (ξ(t , ω) )P (dω) = Ω
296
(
)
(
)
( 1t (10.26) = Mg ξ(t , ω) = lim ∫ g ξ(τ, ω) dτ . t →∞ t 0 Свойство эргодичности обычно рассматривается применитель-
но к стационарным процессам, для которых Mg (ξ(t , ω) ) не зависит от t . В этом случае при выполнении (10.26) вместо среднего по вероятностной мере на множестве Ω
∫ g (ξ(t , ω) )P(dω)
Ω
можно взять одну реализацию процесса ξ(t , ω) и вычислить среднее по времени (10.25). Сформулируем сейчас утверждения, являющиеся теоретической основой для оценки среднего значения процесса с помощью его одной реализации. Теорема 10.6. Пусть ξ(t ) – случайный процесс с непрерывной корреляционной функцией R(t1 , t 2 ) . Тогда необходимым и достаточным условием для того, чтобы 1t l.i. m . ∫ ξ(τ)dτ = 0 t →∞ t 0
является
(10.27)
1 tt (10.28) ∫ ∫ R (t1 , t 2 )dt1 dt 2 = 0 . t →∞ t 2 00 Доказательство. Справедливо следующее соотношение lim
2
t 1 t 1 t M ∫ ξ(τ)dτ = 2 M ∫ ξ(τ)dτ ∫ ξ( τ)dτ = t 0 t 0 0
1 tt 1 tt (10.29) ξ ξ = [ ] M t t dt dt ( ) ( ) ∫ ∫ ∫ ∫ R (t1 , t 2 )dt1 dt 2 . 1 2 1 2 t2 0 0 t2 00 Из определения сходимости в среднем квадратичном следует, что (10.27) эквивалентно соотношению =
297
2
1 t lim M ∫ ξ(τ)dτ = 0 . t →∞ t 0 Поэтому из (10.29) следует, что выражения (10.27) и (10.28) эквивалентны. Теорема 10.7. Пусть ξ(t ) – действительный стационарный в широком смысле случайный процесс, имеющий непрерывную корреляционную функцию R (t ) . Необходимым и достаточным условием выполнения равенства (10.27) служит 1t τ (10.30) lim ∫ 1 − R (τ)dτ = 0 . t →∞ t t 0 Доказательство. Нужно показать, что для стационарного в широком смысле случайного процесса условие (10.28) принимает вид (10.30). Заметим, что 1 tt 1 tt = R t t dt dt ( , ) ∫ ∫ ∫ ∫ R ( t 2 − t1 )dt1 dt 2 = 1 2 1 2 t2 0 0 t2 00 =
t t −τ 1 0 1 t R (τ)dτ ∫ dt1 + 2 ∫ R( τ)dτ ∫ dt1 = 2 ∫ t −t t 0 −τ 0
=
1 0 1 t + τ τ τ + t R d ( ) ( ) ∫ ∫ ( t − τ) R ( τ) d τ = t 2 −t t2 0
=
1 t 1 t − τ − τ τ + t R d ( ) ( ) ∫ ∫ ( t − τ) R ( τ) d τ = t2 0 t2 0
2 t 2 t τ − τ τ τ = t R d ( ) ( ) ∫ ∫ 1 − R( τ)dτ , t 0 t t2 0 откуда следует эквивалентность выражений (10.28) и (10.30). Заметим также, что достаточным условием для того, чтобы имело место равенство (10.30), является =
lim R (t ) = 0 . t →∞
298
Это следует из того, что τ 1t 1t (1 − ) R( τ)dτ ≤ ∫ R( τ)dτ = ∫ t0 t t0
1 t0 1t = ∫ R ( τ) dτ + ∫ R( τ)dτ → 0 при t → ∞ t0 t t0 для достаточно больших t 0 . Пример 10.5. Покажем, что для винеровского процесса равенство (10.28) не имеет места. Из соотношения (4.13) с учетом того, что Mξ(t ) = 0 , получаем
1 tt 2σ 2 t t = R t t dt dt ( , ) ∫ ∫ ∫ dt1 ∫ t1 dt 2 = 1 2 1 2 t2 0 0 t2 0 0 2σ 2 t 2σ 2 t 2 t 3 σt t − = ( ) → ∞ , − = t t t dt ∫1 1 1 t2 0 t 2 2 3 3 t →∞ поэтому в данном случае (10.28) не выполняется. Пример 10.6. Проверим, выполняется ли условие (10.27) для процесса (2.17). Данный процесс, как следует из примера 2.6, является стационарным в широком смысле. Из (2.19) вытекает, что имеет место равенство (10.30), поскольку =
σ2 t τ σ2 [1 − cos( λτ)]t − λτ τ = → 0 , 1 cos( ) d ∫ →∞ t 0 t λ2 t 2 поэтому, на основании теоремы 10.7, условие (10.27) выполняется. §49. МАРТИНГАЛЫ
Мартингалы являются классом случайных процессов с очень полезными свойствами, которые в последнее время все шире находят применение, например, в финансовой математике и финансовой экономике [9].
299
Исследование зависимости между сечениями случайного процесса можно осуществлять различными способами. При исследовании стационарных случайных процессов, например, основным показателем этой зависимости была корреляционная функция, и все выводы делались на основании свойств непрерывности, дифференцируемости и интегрируемости этой функции. В теории непрерывных марковских процессов основной характеристикой зависимости служит переходная функция, которая полностью определяет эволюцию этих процессов; в однородных цепях Маркова такой характеристикой зависимости является матрица вероятностей переходов. В данном параграфе остановимся на достаточно обширном классе случайных процессов, для которых изучение зависимости проводится методами, основанными на исследовании свойств условных математических ожиданий. Пусть имеем два сечения случайного процесса ξ(t1 ) и ξ(t 2 ) ,
t 2 > t1 , и пусть существует одномерная pξ ( x, t ) > 0 и двумерная pξ ( x, t1 ; y, t 2 ) плотности распределения этого процесса. Тогда условное математическое ожидание можно ввести следующим образом M {ξ(t 2 ) / ξ(t1 ) = x} =
∞ 1 ∫ ypξ ( x, t1 ; y, t 2 )dy , pξ ( x, t1 ) −∞
если этот интеграл существует. Очевидно, что M {ξ(t 2 ) / ξ(t1 ) = x} есть функция от x , то есть от значения процесса в момент t1 < t 2 . Рассмотрим теперь процесс ξ(t ) , заданный многомерной плотностью распределения p( x1 , t1 ; x 2 , t 2 ; ...; x n , t n ) , и предположим, что существуют условные математические ожидания
M {ξ(t n ) / ξ(t1 ) = x1 , ξ(t 2 ) = x2 , ... , ξ(t n−1 ) = xn−1 }. Определение. Случайный процесс ξ(t ) называется мартингалом, если существует условное математическое ожидание
M {ξ(t i ) / ξ(t1 ) = x1 , ξ(t 2 ) = x 2 , ... , ξ(t i −1 ) = xi −1 }= x i −1 ∀ i , 300
которое не зависит от предшествующих значений процесса ξ(t k ) ,
t k < t i −1 , k = 1, i − 2 . Мартингалы можно рассматривать как модели безобидных игр. Если ξ(ti −1 ) описывает состояние капитала игрока в момент времени t i −1 , тогда по определению мартингала средняя величина его капитала в момент ti при условии, что в момент t i −1 он располагал капиталом xi −1 , равна xi −1 независимо от того, каков был его капитал до момента ti −1 . Рассмотрим примеры мартингалов. Пример 10.7. Винеровский процесс с нулевым коэффициентом сноса и единичным коэффициентом диффузии является мартингалом. Действительно, учитывая независимость приращений винеровского процесса, найдем условное математическое ожидание значения процесса в момент ti , если в предыдущий момент времени t i −1 < t i значение процесса фиксировано ξ(ti −1 ) = xi −1 :
M {ξ(t i ) / xi −1} = M {[(ξ(ti ) − xi−1 ) + xi −1 ]/ xi −1 } = = M {(ξ(t ) − x )/ x }+ x = x . i −1
i
i −1
i −1
i −1
Пример 10.8. Рассмотрим пуассоновский процесс ξ(t ) с началом в нуле, то есть ξ(0) = 0 . Тогда центрированный процесс η(t ) = ξ(t ) − Mξ(t ) = ξ(t ) − λt , как нетрудно показать, также является мартингалом. Пример 10.9. Рассмотрим пуассоновский процесс ξ(t ) с началом в нуле, ξ(0) = 0 , с нулевым средним значением, Mξ(t ) = 0 , и независимыми приращениями. Пусть также
M [ξ(t ) − ξ( τ)] = F (t ) − F ( τ), 0 ≤ τ < t . 2
301
Тогда процесс ξ 2 (t ) − F (t ) является мартингалом. Для того чтобы это показать, найдем условное математическое ожидание
{[
]
}
{
}
M ξ 2 (t ) − F (t ) / ξ(τ) = x = M [ξ(t ) − ξ(τ) + ξ(τ)] − F (t ) / ξ(τ) = x = 2
{
}
= ξ 2 (τ) + 2ξ(τ) M {[ξ(t ) − ξ(τ)]/ ξ( τ) = x}+ M [ξ(t ) − ξ(τ)] / ξ(τ) = x − F (t ) = 2
= ξ 2 (τ) + M {[ξ(t ) − ξ(τ)]/ ξ(τ) = x}− F (t ) = ξ 2 (τ) − F (τ) , то есть определение мартингала выполняется. Определение. Случайный процесс ξ(t ) называется субмартингалом, если
M {ξ(t i ) / ξ(ti −1 ) = xi −1 } ≥ xi −1 , и супермартингалом, если M {ξ(t i ) / ξ(t i −1 ) = xi −1 }≤ xi −1
∀i
Очевидно, что если ξ(t ) – субмартингал, то (– ξ(t ) ) – супермартингал. Теорема 10.8. Пусть g (x) – выпуклая вниз функция, ξ(t ) – мартингал. Тогда, если существует математическое ожидание Mg (ξ(t ) ), то η(t ) = g (ξ(t ) ) – субмартингал. Доказательство. Данное утверждение вытекает из неравенства Иенсена для математического ожидания СВ M {g (ξ )} ≥ g (Mξ ) ,
если g (x) – выпуклая вниз функция. В нашем случае M {g (ξ(t i ) )/ ξ(t i −1 ) = xi −1 } ≥ g (M {ξ(t i ) / ξ(t i −1 ) = xi −1 }). По определению мартингала,
поэтому то есть или
M {ξ(t i ) / ξ(ti −1 ) = xi −1 } = xi −1 , M {g (ξ(ti ) )/ ξ(ti −1 ) = xi −1 }≥ g (xi −1 ) , M {η(ti ) / η(ti −1 ) = g (xi −1 )}≥ g (xi −1 )
302
M {η(ti ) / η(ti −1 ) = yi −1}≥ yi −1 , что и требовалось доказать. Основные соотношения и свойства мартингалов исследуются для случайных моментов времени, связанных с моментами достижения ими некоторых заранее заданных значений. Их называют моментами остановки. Основные утверждения, касающиеся моментов остановки, приведены, например, в [13].
303
ГЛАВА 11. О ПРИМЕНЕНИИ СЛУЧАЙНЫХ ПРОЦЕССОВ В данной главе речь пойдет о применении цепи Маркова с непрерывным временем и конечным числом состояний при исследовании сети массового обслуживания, являющейся вероятностной моделью локальной вычислительной сети, а также о применении винеровских процессов в финансовой математике. §50. ИССЛЕДОВАНИЕ МАРКОВСКОЙ СЕТИ МАССОВОГО ОБСЛУЖИВАНИЯ В СТАЦИОНАРНОМ И ПЕРЕХОДНОМ РЕЖИМЕ
В §34 был проведен анализ марковских систем массового обслуживания (СМО). Под сетью массового обслуживания (МО) принято понимать совокупность СМО, между которыми циркулируют заявки, переходящие из одной системы в другую. Сети МО часто применяются в качестве математических моделей различных информационно-компьютерных систем и сетей и других объектов [14, 15]. Рассмотрим замкнутую сеть МО, состоящую из однолинейных систем обслуживания S1 , S 2 , ... , S n (рис. 38). Система Si обслуживает в общем случае K i заявок типа i , i = 1, n − 1 . После обслуживания в системе Si заявка типа i поступает в систему S n , обслуживается там и вновь поступает в систему Si , i = 1, n − 1 . Таким образом, в сети постоянно обслуживаются K1 + K 2 + ... + K n−1 = K заявок. Систему обслуживания S n будем называть центральной, а S1 , S 2 , ... , S n−1 – периферийными СМО.
Sn S1
S2
...
Sn −1
Рис. 38
Времена обслуживания заявок в системе Si имеют экспоненциальное распределение с параметром µ i , i = 1, n − 1 . Пусть B (l , t ) 304
– ф.р. длительностей обслуживания заявок в центральной СМО и пусть K i = 1 , i = 1, n − 1 . Состояние сети в момент времени t характеризуется вектором k (t ) = (k , t ) = (k1 , k 2 , ..., k n−1 , n − 1 − k1 − k 2 − ... − k n−1 , t ) ,
где ki = 0 ∨ 1 – число заявок в системе Si , i = 1, n − 1 . Такая сеть служит моделью локальной сети со случайным множественным доступом, если под заявками понимать передаваемые в локальной сети пакеты; при этом каждая из (n − 1) первых СМО будет моделью сетевой станции, а центральная СМО – моделью канала связи. Рассмотрим множество натуральных чисел Ω = {1, 2, ..., n − 1} и для каждого набора
k = (k1 , k 2 , ..., k n−1 )
– множе ства
Ω 0 (k ) = {i k i = 0, 1 ≤ i ≤ n − 1}, Ω1 (k ) = {i k i = 1, 1 ≤ i ≤ n − 1}, очевидно, что для любого k Ω 0 (k ) ! Ω1 (k ) = Ω . Случайный процесс
{k (t )} является марковским с дискретным множеством состояний и непрерывным временем. Сети МО, состояния которых образуют марковский процесс, называются марковскими. Обозначим через pi – вероятность перехода заявок в i -ю периферийную СМО посn −1
ле обслуживания в центральной СМО, i = 1, n − 1 , ∑ pi = 1 . Возi =1
можны следующие переходы в состояние (k , t ) за время ∆t для этого процесса: из состояния (k + I i − I n , t ) , i ∈ Ω 0 (k ) , с вероятностью µ i ∆t + o(∆t ) ; из состояния (k − I i + I n , t ) , i ∈ Ω1 (k ) , с вероятностью pi µ n (n − Ω1 (k ) )∆t + o(∆t ) ; из состояния (k , t ) с вероятностью 1 − ∑ µ i ∆t − ∑ p i µ n ( Ω 0 (k ) )∆t + o(∆t ) ; из остальных состоi∈Ω1 ( k )
i∈Ω 0 ( k )
яний – с вероятностью o(∆t ) , где Ω 0 (k ) – мощность множества 305
Ω0 (k ) , I i – вектор размерности n с нулевыми компонентами, за исключением i -й, которая равна 1. Тогда используя формулу полной вероятности и переходя к пределу при ∆t → 0 , получим систему уравнений Колмогорова для вероятностей состояний: dP( k , t ) = ∑ µ i + ∑ p i µ n ( Ω 0 (k ) ) P ( k , t ) + ∑ µ i P ( k + I i − I n , t ) + dt i∈Ω 0 ( k ) i∈Ω1 ( k ) i∈Ω 0 ( k )
+ ∑ p i µ n ( Ω 0 ( k ) )P (k + I i − I n , t ) .
(11.1)
i∈Ω1 ( k )
Будем считать, что в центральной СМО S n заявки на обслуживание выбираются с одинаковыми вероятностями, т.е. если в очереди на обслуживание находится l заявок, то интенсивность
1 обслуживания заявок равна µ n (l ) . Кроме того, предположим, что l функция µ n (l ) зависит от числа заявок линейно, т.е. µ n (l ) = µ n l и пусть µ i = µ , i = 1, n − 1 . В этом случае система (11.1) имеет вид: dP (k , t ) = −(µΩ1 (k ) + µ n Ω 0 (k ) )P (k , t ) + dt
+ µ ∑ P(k + I i − I n , t ) + µ n ∑ P(k − I i + I n , t ) . i∈Ω 0 ( k )
(11.2)
i∈Ω1 ( k )
Исследуем более подробно эту систему. Терема 11.1. Стационарное решение системы (11.2) записывается в виде
k i P (k ) = G∏ . i =1 µ Доказательство. Стационарные вероятности состояний, согласно (11.2), удовлетворяют системе уравнений n −1 µ
n
(µ Ω1 (k ) + µ n Ω 0 (k ) )P(k ) = 306
= µ ∑ P(k + I i − I n , t ) + µ n ∑ P(k − I i + I n , t ) . (11.4) i∈Ω 0 ( k )
i∈Ω1 ( k )
Используя (11.3), получаем
P (k + I i − I n ,t ) = таким образом,
µn µ P (k ) , P (k − I i + I n ,t ) = P (k ) , k ≠ 0, i µ µn
µ ∑ P ( k + I i − I n , t ) = µ n Ω 0 ( k ) P( k ) , i∈Ω 0 ( k )
µ n ∑ P ( k − I i + I n , t ) = µ Ω1 ( k ) P ( k ) . i∈Ω1 ( k )
То есть (11.4) выполняется. В системе уравнений (11.2) Cnj−1 одинаковых уравнений для состояний с j нулями, j = 0,n − 1 , т.к. P (k ,t ) = P (k ,t ) , если число нулей в состояниях k и k совпадают, поскольку в этом случае
Ω 0 (k ) = Ω 0 (k ) , Ω1 (k ) = Ω1 (k ) и
∑ P ( k + I i − I n , t ) = ∑ P( k + I i − I n , t ) ,
i∈Ω 0 ( k )
i∈Ω0 ( k )
∑ P(k − I i + I n , t ) = ∑ P(k − I i + I n , t ) .
i∈Ω1 ( k )
i∈Ω1 ( k )
n −1
(
)
Поэтому ее можно свести к системе 2 n−1 − ∑ C nj−1 − 1 = n разj =0
личных линейных дифференциальных уравнений с постоянными коэффициентами, которую можно записать в матричной форме
dP(u ,t ) = AP(u ,t ), u = 1, n, dt
307
(11.5)
где
0 ... 0 − ( n − 1)µ ( n − 1)µ n µ − (n − 2)µ + µ (n − 2)µ ... 0 n n 0 2µ − (n − 3)µ + 2µ (n − 3)µ 0 . . . 0 n n A= ... 0 . . . 0 (n − 2)µ − µ + (n − 2)µ n 2µ n 0 ... 0 0 (n − 1) µ − (n − 1)µ n
[
]
[
]
[
]
Решение этой системы с матрицей Якоби может быть записано в виде [14]:
M i (λ ) M u (λ ) e λ t
n
P (u , t ) = ∑ ∑ P (i,0) i =1 λ
(µµ n )i i!(n − 1)(n − 2)...(n − i ) Ln (λ)
, u = 1,n,
причем суммирование производится по всем корням λ (действительным и различным) многочлена M n (λ ) , где M 1 (λ ) = 1 , M 2 (λ ) = λ + (n − 1)µ ,
M u +1 = [λ + nµ − µ n + (µ n − µ)u ]M u (λ) − (µµ u )u u!(n − 1)(n − 2)... ...(n − u ) M u −1 (λ), u = 2, n − 1 , M 2j
n
Ln (λ) = ∑
j =1 (µµ
n)
j
j!(n − 1)(n − 2) ⋅ ... ⋅ (n − j )
.
Пример 11.1. Рассмотрим случай, когда n = 4 . Состояниями сети будут: (1,1,1,0) , (1,1,0,1) , (1,0,1,1) , (0,1,1,1) , (1,0,0,2) , (0,1,0,2) ,
(0,0,1,2) , (0,0,0,3) . Пусть P (1,0) = 1, P (i,0) = 0 , i = 2,8 . Для упрощения записей переобозначим их соответственно 1, 2, 3, …, 8. Можно показать [14], что в этом случае P (2, t ) = P(3, t ) = P(4, t ), 308
P (5, t ) = P (6, t ) = P (7, t ), и система уравнений для вероятностей состояний сводится к системе четырех дифференциальных уравнений для P (1, t ), P (2, t ), P (5, t ) , P (8, t ) (11.5) с матрицей
− 3µ 3µ 4 0 0 − (2µ + µ 4 ) µ 2µ 4 0 , A= − (µ + 2µ 4 ) µ4 2µ 4 0 0 − 3µ 4 0 3µ которая в свою очередь, учитывая условие нормировки, сводится к линейному уравнению третьего порядка d 3 P(1, t ) d 2 P (1, t ) dP (1, t ) + γ + 11γ 2 + 6 γ 3 P(1, t ) = 3µ 4 , (11.6) 6 3 2 dt dt dt
где γ = µ + µ 4 . Частным решением его является
µ4
2γ 3
. Характеристи-
ческое уравнение однородного уравнения y 3 + 6γy 2 + 11γ 2 y + 6γ 3 = 0 имеет корни y1 = − γ , y 2 = −2γ , y 3 = −3γ . Таким образом, общее решение уравнения (11.6) имеет вид: P (1, t ) = c1e
− γt
+ c2 e −2 γt + c3e −3 γt +
µ4 . 2γ 3
Используя его, можно получить: P (2, t ) =
c1 c − γt − 2 γt − 3γt µ 4 , (2µ − µ 4 )e + 2 (µ − 2µ 4 )e + c3e + 3µ 4 3µ 4 2γ
2 c µ 2 − γt c µ − 2 γt − 3γt 3γµ + µ 4 + 2 e + c3e − +1, P (8, t ) = 1 2 e µ4 3µ 4 2γ 2 µ 4
1 P (5, t ) = [1 − P (1, t ) − P (8, t ) − 3P (2, t )] . 3 309
Константы c1 , c2 , c3 находятся, используя начальные условия:
γ 2 + 3µ 2 , c1 = µ 24 γ −2 1 − γ −2 − 2µ γ 3 4 1 µ 4 γ −2 − c1 − c2 . 2 Знание этих вероятностей состояний позволяет найти такие характеристики локальной сети, как, например, среднее число станций, ожидающих передачи пакетов в момент времени t ,
c2 = 3µ 4 − 2 γ −2 − 2c1 , c3 = 1 −
3P( 2,t ) + 6 P (5,t ) + 3P(8,t ) − 1 , коэффициент загрузки канала связи 1 − P (1,t ) и другие. Отметим, что применение марковских сетей МО в качестве моделей обработки исков в страховых компаниях, а также использование уравнения Колмогорова–Фоккера–Планка при исследовании таких сетей рассмотрены в [15]. §51. ПРИМЕНЕНИЕ ВИНЕРОВСКОГО ПРОЦЕССА И СТОХАСТИЧЕСКИХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ В ФИНАНСОВОЙ МАТЕМАТИКЕ
В §22 было дано определение стандартного винеровского процесса W (t ) . Он обладает следующими свойствами [9, 16]: 1) W (t ) имеет непрерывные траектории, т.е. является непрерывным в среднеквадратичном смысле; 2) W (0) = 0 ; 3) W (t ) имеет независимые приращения, т.е. для всяких
s < t ≤ u < v приращения W (t ) − W ( s ) и W (v) − W (u ) являются независимыми случайными величинами; 4) для всяких s < t приращение W (t ) − W ( s ) является случайной величиной, имеющей нормальное распределение вероятностей с нулевым математическим ожиданием и дисперсией t − s ; 310
5) с вероятностью единица траектории процесса W (t ) являются непрерывными функциями времени, которые не дифференцируемы в любой точке t ; 6) условное распределение W (t ) при заданном W (τ) для τ ≤ t является нормальным со средним значением W (τ) и дисперсией t − τ ; Заметим, что два последних свойства следуют из предыдущих. Стандартный винеровский процесс иногда называют процессом случайного блуждания, или стандартным броуновским движением. В финансовой литературе чаще всего используется последний термин. Характер изменения процесса во времени представлен на рис. 39. W (t ) 5 4 3 2 1 0
t
-1 -2 -3 -4 -5
20
40
60
80
100
120
140
160
180
200
Рис. 39. Типичная реализация процесса броуновского движения
Рассмотрим более подробно некоторые свойства стандартного винеровского процесса. Зафиксируем два момента времени τ и t , τ < t , и используем более удобные обозначения:
∆t = t − τ , ∆W (t ) = W (t ) − W (τ) . Из перечисленных выше свойств стандартного винеровского процесса легко получить следующие результаты: 311
[ ] Var[∆W(t)] = ∆t , Var[(Ä W (t ) ) ] = 2(∆t ) E [∆W (t )] = 0 , E (∆W (t ) ) = ∆t , 2
2
2
.
Отсюда видно, что квадрат винеровских приращений (∆W (t ) ) имеет математическое ожидание, которое равно приращению вре2
мени ∆t . Однако существенным фактом является то, что при малых приращениях времени ∆t дисперсия (∆W (t ) )2 пренебрежимо мала по сравнению со своим математическим ожиданием. Другими словами, когда ∆t стремится к нулю, (∆W (t ) )2 , конечно, тоже стремится к нулю, но дисперсия будет приближаться к 0 гораздо быстрее, чем математическое ожидание. Таким образом, при уменьшении ∆t квадрат (∆W (t ) )2 будет выглядеть все более и более «детерменированным», и мы должны принять, что в пределе становится справедливым формальное равенство
(∆W (t ))2 = dt .
(11.7) Обычным (не стандартным) процессом броуновского движения X (t ) является процесс, приращения которого связаны с приращениями стандартного процесса W (t ) соотношением
(∆X (t ) − µ∆t ) = ∆W (t ) , или σ
∆X (t ) = µ∆t + σ∆W (t ) , где параметры µ и σ определяют соответственно математическое ожидание и дисперсию процесса X (t ) . Этот процесс является наиболее простым представителем процессов с независимыми приращениями. В общем случае приращения процесса X (t ) можно определить соотношением
∆X (t ) = µ(X (t ), t )∆t + σ(X (t ), t )∆W (t ) , 312
откуда, переходя к пределу ∆t → dt , получаем стохастическое дифференциальное уравнение для процесса с независимыми приращениями: dX (t ) = µ(X (t ), t )dt + σ(X (t ), t )dW (t ) , X (0) = X 0 . (11.8) Рассмотрим применение уравнений такого типа в финансовой математике. Пример 11.2 (арифметическое броуновское движение).
Пусть µ(X (t ), t ) = µ и σ(X (t ), t ) = σ – две константы, в этом случае имеем уравнение dX (t ) = µdt + σdW (t ) . Тогда говорят, что процесс X (t ) следует арифметическому броуновскому движению с дрейфом µ и волатильностью σ . Процесс описывает реальные экономические показатели, которые растут с линейной скоростью и проявляют увеличивающуюся неопределенность. Отметим следующие свойства такого процесса X (t ) : 1) X (t ) может быть положительным или отрицательным; 2) если u > t , то X (u ) является будущим значением процесса по отношению к моменту t ; распределение X (u ) при заданном
X (t ) является нормальным со средним X (t ) + α(u − t ) и стандартным отклонением σ (u − t ) ; 3) дисперсия предсказания (прогноза) процесса X (u ) стремится к бесконечности с ростом u (при заданных t , X (t ) ). Рис. 40 демонстрирует выборочную траекторию арифметического броуновского движения с положительным дрейфом (µ > 1) .
313
X (t ) 6 5 4 3 2 1 0 -1
50
100
150
200
t
-2 Рис. 40. Арифметическое броуновское движение. Дрейф равен 0,02, волатильность равна 0,5.
Эти три свойства показывают, что арифметическое броуновское движение описывает показатели, которые могут становиться положительными или отрицательными, имеют нормальное распределение ошибки предсказания и имеют дисперсию предсказания, которая увеличивается линейно во времени. Например, этот процесс может служить математической моделью потока платежей. Пример 11.3 (геометрическое броуновское движение). Пусть µ(X (t ), t ) = µX (t ) и σ(X (t ), t ) = σX (t ) . Тогда из (11.8) имеем dX (t ) = αX (t )dt + σX (t )dW (t ) . В этом случае говорят, что процесс X (t ) следует геометрическому броуновскому движению с дрейфом µ и волатильностью σ . Процесс соответствует экономическим показателям, которые растут экспоненциально со средней скоростью µ и имеют волатильность, пропорциональную значению самого процесса. Процесс также проявляет увеличивающуюся неопределенность предсказания. 314
Приведем следующие свойства процесса X (t ) , отметив при этом, что если X (t ) стартует с положительного значения, он будет оставаться положительным: 1) X (t ) имеет поглощающий барьер в 0; таким образом, если X (t ) достигает 0 (событие нулевой вероятности), то X (t ) будет оставаться нулевым; 2) условное распределение X (u ) при заданном X (t ) является логарифмически нормальным (логнормальным); условное среднее ln (X (t ) ) для u > t равно ln(X (t ) ) + α(u − t ) − 0.5 σ 2 (u − t ) и условное стандартное отклонение ln (X (t ) ) равно σ (u − t ) ; ln (X (t ) ) является нормально распределенным; условное ожидаемое значение X (u ) равно X (t ) exp[α(u − t )] ; 3) дисперсия предсказания X (u ) неограниченно увеличивается с ростом u . X (t ) 120 100 80 60 40 20 0 0
20
40
60
80
100
120
140
160
180
Рис. 41. Геометрическое броуновское движение. Коэффициенты дрейфа и волатильность такие же, как у процесса, представленного на рис. 40.
315
200
t
Геометрическое броуновское движение часто используется для моделирования стоимости активов, так как пропорциональные изменения цены активов являются независимыми и одинаково нормально распределенными. Оно может быть также использовано для моделирования процессов, которые являются положительными и увеличиваются (в среднем) с постоянной экспоненциальной скоростью. Например, можно применить геометрическое броуновское движение для моделирования номинальной цены товаров потребления или доходов от конкретной деятельности. В некоторых случаях также желательна отрицательная скорость изменения положительной переменной. Геометрическое броуновское движение также может быть использовано. Для моделирования процессов, изображенных на рис. 40 и рис. 41, использован один и тот же процесс W (t ) , чтобы продемонстрировать, как могут выглядеть соответствующие ему арифметическое и геометрическое броуновские движения. Пример 11.4 (процесс, возвращающийся к среднему). Процесс, возвращающийся к среднему, называется процессом Орнштейна–Уленбека, когда γ = 0 . Пусть µ(X (t ), t ) = k (µ − X (t ) ) и σ(X (t ), t ) = σX (t ) , где k ≥ 0 и γ произвольные. В этом случае получаем уравнение dX (t ) = k (µ − X (t ) )dt + σX (t )dW (t ) ,
и говорят, что процесс X (t ) следует процессу возвращения к среднему с параметром регулирования скорости k , средним установления µ и волатильностью σ . Выбор γ дает возможность изменять характер волатильности процесса. Этот процесс является подходящим для описания экономических показателей, которые имеют тенденцию устанавливаться к среднему значению, но могут быть подвержены краткосрочным возмущениям. Мы предположим, что
k , µ и γ являются положительными. Процесс имеет следующие свойства:
316
1) X (t ) является положительным для положительных стартовых значений; 2) когда X (t ) достигает 0, дрейф становится положительным и волатильность исчезает; 3) когда u становится неограниченным, дисперсия предсказания X (u ) является конечной; 4) если γ = 0 , распределение X (u ) при заданном X (t ) для
u > t является нормальным; при этом условное среднее распределение равно
(X (t − µ) ) exp[− k (u − t )]+ µ ,
а условная дисперсия имеет вид
[σ
2
]
/( 2k ) (1 − exp[− 2k (u − t )]) ;
5) если γ = 0,5 , распределение X (u ) при заданном X (t ) для 2 u > t является нецентральным χ ; среднее распределения равно (X (t ) − µ )exp[− k (u − t )]+ µ , а дисперсия распределения равна
(
)
(
)
2 σ 2 − k (u −t ) σ2 − e − 2 k (u −t ) + µ e 1 − e − k ( u −t ) . k 2k Процесс, возвращающийся к среднему, является подходящим для описания процентных ставок или индексов инфляции, которые могут иметь устойчивые установившиеся значения, и не подходит для торгуемых активов. Можно также моделировать саму волатильность (если волатильность изменяется непредсказуемо) как процесс, возвращающийся к среднему. Процесс, возвращаю-
X (t )
щийся к среднему при γ = 0,5 , может выглядеть подобно представленному на рис. 42, где использован тот же процесс W (t ) , что и на рис. 40 и 41.
317
X (t ) 3.0 2.5 2.0 1.5 1.0 0.5 0.5 0.0 0
20
40
60
80
100
120
140
160
Рис. 42. Процесс, возвращающийся к среднему, γ = 0,5 ; k = 0,7 ; µ = 2 ; σ = 0,1
318
180
200
t
ПРИЛОЖЕНИЕ 1 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ ϕ(x ) = 0
1
2
3
4
5
6
7
8
9
0,0 0,1
0,3989 3989 3970 3965
3989 3988 3986 3984 3961 3956 3951 3945
3982 3980 3977 3973 3939 3932 3925 3918
0,2
3910 3902
3894 3885 3876 3867
3857 3847 3836 3825
0,3
3814 3802
3790 3778 3765 3752
3739 3726 3712 3697
0,4
3683 3668 3652 3637 3621 3605
3589 3572 3555 3538
0,5
3521 3503
3485 3467 3448 3429
3410 3391 3372 3352
0,6
3332 3312
3292 3271 3251 3230
3209 3187 3166 3144
0,7
3123 3101
3079 3056 3034 3011
2989 2966 2943 2920
0,8
2897 2874
2850 2827 2803 2780
2756 2732 2709 2685
0,9
2661 2637
2613 2589 2565 2541
2516 2492 2468 2444
1,0 1,1
0,2420 2396 2179 2155
2371 2347 2323 2299 2131 2107 2083 2059
2275 2251 2227 2203 2036 2012 1989 1965
1,2
1942 1919
1895 1872 1849 1826
1804 1781 1758 1736
1,3
1714 1691
1669 1647 1626 1604
1582 1561 1539 1518
1,4
1497 1476
1456 1435 1415 1394
1374 1354 1334 1315
1,5
1295 1276
1257 1238 1219 1200
1182 1163 1145 1127
1,6
1109 1092
1074 1057 1040 1023
1006 0989 0973 0957
1,7
0940 0925
0909 0893 0878 0863
0848 0833 0818 0804
1,8
0790 0775
0761 0748 0734 0721
0707 0694 0681 0669
1,9
0656 0644
0632 0620 0608 0596
0584 0573 0562 0551
2,0 2,1
0,0540 0529 0440 0431
0519 0508 0498 0488 0422 0413 0404 0396
0478 0468 0459 0449 0387 0379 0371 0363
2,2
0355 0347
0339 0332 0325 0317
0310 0303 0297 0290
2,3
0283 0277
0270 0264 0258 0252
0246 0241 0235 0229
2,4
0224 0219
0213 0208 0203 0198
0194 0189 0184 0180
2,5
0175 0171
0167 0163 0158 0154
0151 0147 0143 0139
2,6
0136 0132
0129 0126 0122 0119
0116 0113 0110 0107
2,7
0104 0101
0099 0096 0093 0091
0088 0086 0084 0081
2,8
0079 0077
0075 0073 0071 0069
0067 0065 0063 0061
2,9
0060 0058
0056 0055 0053 0051
0050 0048 0047 0046
3,0 3,1
0,0044 0043 0033 0032
0042 0040 0039 0038 0031 0030 0029 0028
0037 0036 0035 0034 0027 0026 0025 0025
3,2
0024 0023
0022 0022 0021 0020
0020 0019 0018 0018
3,3
0017 0017
0016 0016 0015 0015
0014 0014 0013 0013
3,4
0012 0012
0012 0011 0011 0010
0010 0010 0009 0009
3,5
0009 0008
0008 0008 0008 0007
0007 0007 0007 0006
3,6
0006 0006
0006 0005 0005 0005
0005 0005 0005 0004
3,7
0004 0004
0004 0004 0004 0004
0003 0003 0003 0003
3,8
0003 0003
0003 0003 0003 0002
0002 0002 0002 0002
3,9
0002 0002
0002 0002 0002 0002
0002 0002 0001 0001
319
1 2π
e
−
x2 2
ПРИЛОЖЕНИЕ 2 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Φ (x ) =
2π
х
Ф(x)
x
Ф(x)
x
Ф(x)
0,00 0,01
0,0000 0,0040
0,32 0,33
0,1255 0,1293
0,64 0,65
0,2389 0,96 0,3315 0,2422 0,97 0,3340
0,02
0,0080
0,34
0,1331
0,66
0,2454 0,98 0,3365
0,03
0,0120
0,35
0,1368
0,67
0,2486 0,99 0,3389
0,04
0,0160
0,36
0,1406
0,68
0,2517 1,00 0,3413
0,05
0,0199
0,37
0,1443
0,69
0,2549 1,01 0,3438
0,06
0,0239
0,38
0,1480
0,70
0,2580 1,02 0,3461
0,07
0,0279
0,39
0,1517
0,71
0,2611 1,03 0,3485
0,08
0,0319
0,40
0,1554
0,72
0,2642 1,04 0,3508
0,09
0,0359
0,41
0,1591
0,73
0,2673 1,05 0,3531
0,10
0,0398
0,42
0,1628
0,74
0,2703 1,06 0,3554
0,11
0,0438
0,43
0,1664
0,75
0,2734 1,07 0,3577
0,12
0,0478
0,44
0,1700
0,76
0,2764 1,08 0,3599
0,13
0,0517
0,45
0,1736
0,77
0,2794 1,09 0,3621
0,14
0,0557
0,46
0,1772
0,78
0,2823 1,10 0,3643
0,15
0,0596
0,79
0,2852 1,11 0,3665
0,16
0,0636
0,47 ,0,1808 0,48 0,1844
0,80
0,2881 1,12 0,3686
0,17
0,0675
0,49
0,1879
0,81
0,2910 1,13 0,3708
0,18
0,0714
0,50
0,1915
0,82
0,2939 1,14 0,3729
0,19
0,0753
0,51
0,1950
0,83
0,2967 1,15 0,3749
0,20
0,0793
0,52
0,1985
0,84
0,2995 1,16 0,3770
0,21
0,0832
0,53
0,2019
0,85
0,3023 1,17 0,3790
0,22
0,0871
0,54
0,2054
0,86
0,3051 1,18 0,3810
0,23
0,0910
0,55
0,2088
0,87
0,3078 1,19 0,3830
0,24
0,0948
0,56
0,2123
0,88
0,3106 1,20 0,3849
0,25
0,0987
0,57
0,2157
0,89
0,3133 1,21 0,3869
0,26
0,1026
0,58
0,2190
0,90
0,3159 1,22 0,3883
0,27
0,1064
0,59
0,2224
0,91
0,3186 1,23 0,3907
0,28
0,1103
0,60
0,2257
0,92
0,3212 1,24 0,3925
0,29
0,1141
0,61
0,2291
0,93
0,3238 1,25 0,3944
0,30
0,1179
0,62
0,2324
0,94
0,3264
0,31
0,1217
0,63
0,2357
0,95
0,3289
320
x
1
Ф(x)
x
∫e 0
−
z2 2
dz
x
Ф(x)
x
Ф(x)
1,26 0,396 1,27 0,398
х
Ф(x)
1,59 0,4441 1,60 0,4452
x
Ф(x)
1,92 1,93
0,4726 0,4732
2,50 2,52
0,4938 0,4941
1,28 0,399
1,61 0,4463
1,94
0,4738
2,54
0,4945
1,29 0,401
1,62 0,4474
1,95
0,4744
2,56
0,4948
1,30 0,403
1,63 0,4484
1,96
0,4750
2,58
0,4951
1,31 0,404
1,64 0,4495
1,97
0,4756
2,60
0,4953
1,32 0,406
1,65 0,4505
1,98
0,4761
2,62
0,4956
1,33 0,408
1,66 0,4515
1,99
0,4767
2,64
0,4959
1,34 0,409
1,67 0,4525
2,00
0,4772
2,66
0,4961
1,35 0,411
1,68 0,4535
2,02
0,4783
2,68
0,4963
1,36 0,413
1,69 0,4545
2,04
0,4793
2,70
0,4965
1,37 0,414
1,70 0,4554
2,06
0,4803
2,72
0,4967
1,38 0,416
1,71 0,4564
2,08
0,4812
2,74
0,4969
1,39 0,417
1,72 0,4573
2,10
0,4821
2,76
0,4971
1,40 0,419
1,73 0,4582
2,12
0,4830
2,78
0,4973
1,41 0,420
1,74 0,4591
2,14
0,4838
2,80
0,4974
1,42 0,422
1,75 0,4599
2,16
0,4846
2,82
0,4976
1,43 0,423
1,76 0,4608
2,18
0,4854
2,84
0,4977
1,44 0,425
1,77 0,4616
2,20
0,4861
2,86
0,4979
1,45 0,426
1,78 0,4625
2,22
0,4868
2,88
0,4980
1,46 0,427
1,79 0,4633
2,24
0,4875
2,90
0,4981
1,47 0,429
1,80 0,4641
2,26
0,4881
2,92
0,4982
1,48 0,430
1,81 0,4649
2,28
0,4887
2,94
0,4984
1,49 0,431
1,82 0,4656
2,30
0,4893
2,96
0,4985
1,50 0,433
1,83 0,4664
2,32
0,4898
2,98
0,4986
1,51 0,434
1,84 0,4671
2,34
0,4904
3,00 0,49865
1,52 0,435
1,85 0,4678 2,36,
0,4909
3,20 0,49931
1,53 0,437
1,86 0,4686
2,38
0,4913 ,3,40 0,49966
1,54 0,438
1,87 0,4693
2,40
0,4918
3,60 0,49984
1,55 0,439
1,88 0,4699
2,42
0,4922
3,80 0,49992
1,56 0,440
1,89 0,4706
2,44
0,4927
4,00 0,49996
1,57 0,441
1,90 0,4713
2,46
0,4931
4,50 0,49999
1,58 0,442
1,91 0,4719
2,48
0,4934
5,00 0,49999
321
ПРИЛОЖЕНИЕ 3 РАСПРЕДЕЛЕНИЕ ПУАССОНА P (ξ = k ) =
λk −λ e k!
k
0
1
2
3
4
0,1
0,9048
0,0905
0,0045
0,0002
0,0000
0,2
0,8187
0,1637
0,0164
0,0011
0,0001
0,0000
0,3
0,7408
0,2222
0,0333
0,0033
0,0003
0,0000
0,4
0,6703
0,2681
0,0536
0,0072
0,0007
0,0001
0,0000
0,5
0,6065
0,3033
0,0758
0,0126
0,0016
0,0002
0,0000
0,6
0,5488
0,3293
0,0988
0,0198
0,0030
0,0004
0,0000
0,7
0,4966
0,3476
0,1217
0,0284
0,0050
0,0007
0,0001
0,0000
0,8
0,4493
0,3595
0,1438
0,0383
0,0077
0,0012
0,0002
0,0000
0,9
0,4066
0,3659
0,1647
0,0494
0,0111
0,0020
0,0003
0,0000
1,0
0,3679
0,3679
0,1839
0,0613
0,0153
0,0031
0,0005
0,0001
0,0000
1,5
0,2231
0,3347
0,2510
0,1255
0,0471
0,0141
0,0035
0,0008
0,0001
0,0000
2,0
0,1353
0,2707
0,2707
0,1804
0,0902
0,0361
0,0120
0,0034
0,0009
0,0002
0,0000
2,5
0,0821
0,2052
0,2565
0,2138
0,1336
0,0668
0,0278
0,0099
0,0031
0,0009
0,0002
0,0000
3,0
0,0498
0,1494
0,2240
0,2240
0,1680
0,1008
0,0504
0,0216
0,0081
0,0027
0,0008
0,0002
3,5
0,0302
0,1057
0,1850
0,2158
0,1888
0,1322
0,0771
0,0385
0,0169
0,0066
0,0023
0,0007
4,0
0,0183
0,0733
0,1465
0,1954
0,1954
0,1563
0,1042
0,0595
0,0298
0,0132
0,0053
0,0019
4,5
0,0111
0,0500
0,1125
0,1687
0,1898
0,1708
0,1281
0,0824
0,0463
0,0232
0,0104
0,0043
5,0
0,0067
0,0337
0,0842
0,1404
0,1755
0,1755
0,1462
0,1044
0,0653
0,0363
0,0181
0,0082
6,0
0,0025
0,0149
0,0446
0,0892
0,1339
0,1606
0,1606
0,1377
0,1033
0,0688
0,0413
0,0225
7,0
0,0009
0,0064
0,0223
0,0521
0,0912
0,1277
0,1490
0,1490
0,1304
0,1014
0,0710
0,0452
8,0
0,0003
0,0027
0,0107
0,0286
0,0573
0,0916
0,1221
0,1396
0,1396
0,1241
0,0993
0,0722
9,0
0,0001
0,0011
0,0050
0,0150
0,0337
0,0607
0,0911
0,1171
0,1318
0,1318
0,1186
0,0970
10,0
0,0000
0,0005
0,0023
0,0076
0,0189
0,0378
0,0631
0,0901
0,1126
0,1251
0,1251
0,1137
k
12
13
21
22
23
24
3,0
0,0001
0,0000
3,5
0,0002
0,0001
0,0000
4,0
0,0006
0,0002
0,0001
0,0000
4,5
0,0016
0,0006
0,0002
0,0001
0,0000
5,0
0,0034
0,0013
0,0005
0,0002
0,0000
6,0
0,0113
0,0052
0,0022
0,0009
7,0
0,0263
0,0142
0,0071
0,0033
8,0
0,0481
0,0296
0,0169
9,0
0,0728
0,0504
10,0
0,0948
0,0729
14
15
16
5
6
17
18
0,0003
0,0001
0,0000
0,0014
0,0006
0,0090
0,0045
0,0021
0,0324
0,0194
0,0109
0,0521
0,0347
0,0217
7
8
9
10
19
20
0,0002
0,0001
0,0000
0,0009
0,0004
0,0002
0,0001
0,0000
0,0058
0,0029
0,0014
0,0006
0,0003
0,0001
0,0000
0,0128
0,0071
0,0037
0,0019
0,0009
0,0004
0,0002
322
11
0,0001
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА 1. Вентцель А.Д. Курс теории случайных процессов. – М.: Наука, 1975. – 319 с. 2. Гихман И.И., Скороход А.В. Введение в теорию случайных процессов. – М.: Наука, 1977. – 567 с. 3. Гнеденко Б.В. Курс теории вероятностей. – М.: Наука, 1988. – 447 с. 4. Карлин С. Основы теории случайных процессов. – М.: Наука, 1971. – 536 с. 5. Кемени Д., Снелл Дж., Кнепп А. Счетные цепи Маркова. – М.: Наука, 1987. – 414 с. 6. Коваленко И.Н. Филлипова А.А. Теория вероятностей и математическая статистика. – М.: Высшая школа, 1982. – 256 с. 7. Лапо П.М., Маталыцкi М.А. Задачы па тэорыi iмавернасцей. – Мiнск: Унiверсiтэцкае, 1995. – 87 с. 8. Маталыцкий М.А., Романюк Т.В. Теория вероятностей в примерах и задачах. Учебное пособие для студентов математических специальностей вузов. – Гродно: ГрГУ, 2002. – 247 с. 9. Медведев Г.А. Математические основы финансовой экономики. Часть 1. Мартингальный подход. – Минск: БГУ, 2003. – 287 с. 10. Радюк Л.Е., Терпугов А.Ф. Теория вероятностей и случайных процессов. – Томск: ТГУ, 1988. – 175 с. 11. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика. – М.: Наука, 1985. – 320 с. 12. Феллер В. Введение в теорию вероятностей и ее приложения. Т.1. – М.: Мира, 1984. – 526 с. 13. Ширяев А.Н. Вероятность. – М.: Наука, 1980. – 573 с.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 14. Маталыцкий М.А., Сети массового обслуживания в стационарном и переходном режимах: Монография. – Гродно: ГрГУ, 2001. – 211 с. 15. Маталыцкий М.А., Романюк Т.В. Приближенные методы анализа сетей с центральной системой обслуживания и их применения: Монография. – Гродно: ГрГУ, 2003. – 200 с. 16. Медведев Г.А. Математические модели финансовых рисков. Часть 1. – Минск: БГУ, 1999. – 239 с.
323
Содержание ПРЕДИСЛОВИЕ ............................................................................................ 3 ВВЕДЕНИЕ .................................................................................................... 4 ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ ........... 8 §1. случайные события. классическое определение вероятности .................................................................. 8 §2. Условная вероятность и независимость событий ......................... 18 §3. Схема независимых испытаний Бернулли ..................................... 22 4. Cлучайные величины и их распределения ...................................... 29 §5• . Пространства с мерой, интеграл Лебега ..................................... 62 §6. Числовые характеристики случайных величин ............................. 70 §7. Функциональные характеристики случайных величин ................ 92 §8. Сходимость случайных последовательностей ............................ 100 § 9. Закон больших чисел .................................................................... 108 § 10. Центральная предельная теорема .............................................. 115 ГЛАВА 2. ОСНОВНЫЕ ПОНЯТИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ .... 122 §11. Определение случайного процесса и примеры ......................... 122 §12. Статистические средние характеристики случайных процессов . 133 ГЛАВА 3 ПРОЦЕССЫ С КОНЕЧНЫМИ МОМЕНТАМИ ВТОРОГО ПОРЯДКА. КОРРЕЛЯЦИОННАЯ ТЕОРИЯ ..................................... 139 §13. Сходимость в среднем квадратичном для случайных процессов ... 139 §12. Непрерывность случайных процессов ....................................... 142 §15. Дифференцируемость случайных процессов ............................ 145 §16. Интегрирование случайных процессов ..................................... 148 §17. Стохастические обыкновенные дифференциальные уравнения .... 151 §18. Разложение случайных процессов по ортогональным функциям .. 153 ГЛАВА 4 ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ. ГАУССОВСКИЙ И ВИНЕРОВСКИЙ СЛУЧАЙНЫЕ ПРОЦЕССЫ156 §19. Процессы с независимыми приращениями ........................... 156 §20. Обобщенный пуассоновский процесс ........................................ 159 §21. Гауссовский случайный процесс ................................................ 162 §22. Винеровский случайный процесс ............................................... 164 ГЛАВА 5. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ....................... 167 §23. Определения и примеры .............................................................. 167 §24. Однородные цепи маркова .......................................................... 172 ГЛАВА 6. ЦЕПИ МАРКОВА С ДИСКРЕТНЫМ ВРЕМЕНЕМ ............ 182 §23. Уравнения Чепмена–Колмогорова ............................................. 182 §26. Нахождение вероятностей переходов с помощью производящих функций ........................................................................................... 186 §27. Классификация состояний цепи маркова по арифметическим свойствам вероятностей перехода ................................................ 190 §28. Классификация состояний по асимптотическим свойствам переходных вероятностей .............................................................. 198
324
§29. Эргодические цепи Маркова ....................................................... 204 §30. О средних временах переходов между состояниями ................ 210 §31. Стационарные цепи Маркова ...................................................... 212 §32. Оптимальные стратегии в марковских цепях ............................ 219 ГЛАВА 7. ЦЕПИ МАРКОВА С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ ......... 222 §31. Некоторые определения и свойства ........................................... 222 §34. Системы дифференциальных уравнений колмогорова для однородной цепи маркова с конечным числом состояний ...................................................... 225 §35. Процесс гибели и размножения .................................................. 235 §36. Анализ марковских систем массового обслуживания .............. 240 §35. Ветвящиеся процессы с непрерывным временем .................... 252 ГЛАВА 8. НЕПРЕРЫВНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ .................. 258 §38. Обобщенное уравнение маркова ................................................ 258 §39. Диффузионные процессы ............................................................ 261 §40. Обратное уравнение колмогорова .............................................. 263 §41. Уравнение Колмогорова–Фоккера–Планка ............................... 265 §42. Допредельные модели диффузионных процессов .................... 270 ГЛАВА 9. СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ .......................................... 274 §43. Стохастический интеграл в форме Ито ...................................... 274 §44. Стохастический интеграл в форме Стратановича ..................... 276 §45. Стохастические дифференциальные уравнения ....................... 279 ГЛАВА 10. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ............... 283 §46. Стационарные в узком и широком смысле случайные процессы ...................................................................... 283 §47. Спектральная плотность случайного процесса ......................... 288 §48. Эргодическое свойство случайных процессов .......................... 296 §49. Мартингалы .................................................................................. 299 ГЛАВА 11. О ПРИМЕНЕНИИ СЛУЧАЙНЫХ ПРОЦЕССОВ .............. 304 §50. Исследование марковской сети массового обслуживания в стационарном и переходном режиме ............................................ 304 §51. Применение винеровского процесса и стохастических дифференциальных уравнений в финансовой математике ......... 310 Приложение 1. Таблица значений функции ö(x ) .................................. 319 Приложение 2. Таблица значений функции Ö (x ) ................................. 320 Приложение 3. Распределение Пуассона ................................................ 322 Рекомендуемая литература ..................................................................... 323
325
Учебное издание Маталыцкий Михаил Алексеевич ЭЛЕМЕНТЫ ТЕОРИИ СЛУЧАЙНЫХ ПРОЦЕССОВ Учебное пособие Редактор Н.Н. Красницкая Компьютерная верстка: Р.Н. Баранчик Дизайн обложки: О.В. Канчуга Сдано в набор 09.04.2004. Подписано в печать 05.07.2004. Формат 60×84/16. Бумага офсетная. Печать RISO. Гарнитура Таймс. Усл.печ. л. 18,91. Уч.-изд. л. 17,93. Тираж 200 экз. Заказ . Учреждение образования «Гродненский государственный университет имени Янки Купалы». ЛИ №02330/0133257 от 30.04.2004. Ул. Пушкина, 39, 230012, Гродно. Отпечатано на технике издательского центра Учреждения образования «Гродненский государственный университет имени Янки Купалы». ЛП №02330/0056882 от 30.04.2004. Ул. Пушкина, 39, 230012, Гродно.