МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образ...
6 downloads
247 Views
543KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Часть 2
Ульяновск 2003
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования
УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ТИПОВОМУ РАСЧЁТУ ДЛЯ СТУДЕНТОВ ВСЕХ СПЕЦИАЛЬНОСТЕЙ ч. 2
Составители: В. Р. Крашенинников, Л. А. Крашенинникова, В. В. Селиванов
Ульяновск 2003
-2УДК 517.3 (076) ББК 22.171 я7 Т20
Рецензент канд. физ.-мат. наук, доцент УГУ Д. Р. Воденин Одобрено секцией методических указаний научно-методического совета университета
Теория вероятностей и математическая статистика: Методические указания к типовому расчёту. Ч. 2 /Сост.: В. Р. Крашенинников, Л. А. Крашенинникова, В. В. Селиванов. – Ульяновск: УлГТУ, 2003. - 36 с. Методические указания составлены в соответствии с программами курса высшей математики для инженерно-технических специальностей высших учебных заведений и предназначены для студентов дневного отделения всех специальностей Ульяновского государственного технического университета. Изложена методика выполнения второй части типового расчёта по теме «Теория вероятности и математическая статистика» и даны образцы решения задач с предварительным теоретическим обоснованием. Работа подготовлена на кафедре «Высшая математика».
УДК 517.3 (076) ББК 22.171 я7
© Оформление УлГТУ, 2003 © В. Р. Крашенинников, Л. А. Крашенинникова, В. В. Селиванов, 2003
-3ОБЩИЕ УКАЗАНИЯ Одной из форм обучения студентов является самостоятельное выполнение ими типовых расчётов по курсу высшей математики. Предлагаемые методические указания являются руководством для выполнения второй части типового расчёта по теме «Теория вероятностей и математическая статистика» из специального сборника заданий В. Ф. Чудесенко «Сборник заданий по специальным курсам высшей математики (типовые расчёты)» . - М.: Высшая школа, 1983, который удовлетворяет требованиям курса к типовым расчётам. К выполнению расчёта следует приступать лишь после изучения по учебнику или конспекту лекций теоретического материала, соответствующего этой теме, и решения достаточного количества типовых задач. При решении задач нужно обосновывать каждый этап решения, исходя из теоретических положений курса математики. Решение задач следует излагать подробно, вычисления располагать в строгом порядке. Решения должны доводиться до ответов, требуемых условиями задач. Ниже в помощь студенту даны методические указания к задачам указанного типового расчёта и образцы решения характерных задач. Если при выполнении расчёта студент все же обнаружит непонимание того или иного вопроса, то следует обратиться к учебникам [1-7] или конспекту лекций. 7. ХАРАКТЕРИСТИЧЕСКАЯ ФУНКЦИЯ 7.1 Определение и свойства характеристической функции Характеристической функцией ϕ (t ) случайной величины ξ называется математическое ожидание случайной величины e itξ : itξ
ϕ (t ) = Μ e ,
(7.1)
где t - действительная переменная; i - мнимая единица. Для дискретной случайной величины ξ характеристическая функция ξ (t ) вычисляется по формуле
ξ (t ) = ∑ e
itx k
k
pk ,
(7.2)
где xk - всевозможные значения величины ξ и pk = P(ξ = xk ) - их вероятности. Для непрерывной величины:
ϕ (t ) =
+∞
∫
−∞
itx
e p( x )dx ,
где p(x) - плотность распределения вероятностей величины ξ .
(7.3)
-4Плотность распределения p(x) случайной величины ξ выражается через характеристическую функцию ϕ (t ) с помощью обратного преобразования Фурье
1 p(x ) = 2π
+∞
− itx ∫ e ϕ (t )dt .
−∞
Свойства характеристических функций. 1. Характеристическая функция ϕ (t ) случайной величины ξ определена для любого t ∈ (− ∞,+∞ ), причём ϕ (t ) ≤ 1 , ϕ (0 ) = 1 . 2. При изменении знака аргумента значение характеристической функции изменяется на комплексно-сопряжённое; ϕ (− t ) = ϕ (t ) , − ∞ < t < +∞ . 3. Если случайные величины связаны соотношением ξ 2 = kξ1 + b , то itb
ϕξ 2 (t ) = e ϕξ1 (kt ) . 4. Если ξ и η – независимые случайные величины, то ϕξ +η (t ) = ϕξ (t )ϕη (t ) . 5. Если существует Mξ , то ′ Мξ = ϕ (0 ) .
(7.4) (7.5)
i
Если существует Dξ , то Dξ = −ϕ ′′(0 ) + [ϕ ′(0 )]2 . (7.6) 6. Соответствие между множеством функций распределения и множеством хаitξ
рактеристических функций, устанавливаемое формулой ϕ (t ) = Мe , является взаимно однозначным (теорема единственности) и непрерывным (предельная теорема Леви).
7.2 Указания к задачам 23 и 24 При решении задачи 23 воспользоваться формулами (7.2), (7.5) и (7.6), а в задаче 24 – формулами (7.3), (7.5) и (7.6). Пример 7.1. Дискретная случайная величина ξ может принимать значения 0, 1, 2, …, 9 с вероятностями γ , 2 γ , 22 γ , …, 29 γ , соответственно, где γ =1/(2101)=1/1023. Найти характеристическую функцию ϕ (t ) , математическое ожидание М ξ и дисперсию Dξ случайной величины.
Решение. По формуле (7.2) k it it it 2 it 9 ϕ (t ) = ∑ e γ 2 = γ ∑ 2e = γ 1 + 2e + 2e + ... + 2e . k =0 k =0 9
itk
k
9
-5Выражение в квадратных скобках есть геометрическая прогрессия со знаменатеit
лем 2e , суммируя которую, получаем искомую характеристическую функцию: 10
it 1 − 2e ϕ (t ) = γ
10 10it
=γ
it
1− 2 e
it
10it
=γ
1 − 1024e
it
.
1 − 2e 1 − 2e 1 − 2e Для нахождения математического ожидания и дисперсии найдём первую и вторую производные от ϕ (t ) при t=0 и воспользуемся формулами (7.5) и (7.6). 10it
ϕ ′(t ) = γ
− 10240ie
10it it it 11it 10it it 1 − 2e + 2ie 1 − 1024e = 2γi 9236e − 5120e + e . 2 2 1 − 2e it 1 − 2e it
8194 i ≈ 8,01i , М ξ = 8,01 . 1023 9236 × 11ie11it − 51200ie10it + ie it + 4ie it 9236e11it − 5120e10it + e it . ϕ ′′(t ) = 2γi 3 1 − 2e it 2 × 33929 ϕ ′′(0 ) = − ≈ −66,3323 . 1023 Dξ = −ϕ ′′(o ) + (ϕ ′(0 ))2 = 66,3323 − (8,01)2 = 66,3323 − 64,1601 = 2,1722 .
ϕ ′(0 ) =
Пример 7.2. Непрерывная случайная величина ξ имеет плотность распределения вероятностей
xe − x , x ≥ 0, p(x ) = 0, x < 0. Найти её характеристическую функцию ϕ (t ) , математическое ожидание М ξ и дисперсию Dξ .
Решение. По формуле (7.3) ∞
itx
−x
∞
ϕ (t ) = ∫ e xe dx = ∫ xe 0
(it −1)x
dx .
0
Вычислим этот интеграл по частям, взяв u=x и dv = e (it −1)x dx . Тогда du=dx, (it −1)x
e , ν= (it − 1)
-6(it −1)x
∞ (it −1)x ∞ xe 1 ∞ (it −1)x 1 1 . − e dx = − e = ϕ (t ) = ∫ 2 0 (it − 1)2 it − 1 0 it − 1 0 (it − 1) Математическое ожидание и дисперсию найдём так же, как и в примере 7.1. 2i ϕ ′(t ) = − , ϕ ′(0 ) = 2i , М ξ = 2 . (it − 1)3 2
ϕ ′′(t ) = −6(it − 1)−4 , ϕ ′′(0 ) = −6 , Dξ = −(− 6 ) − 2 = 2 . 8. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ФУНКЦИЙ СЛУЧАЙНЫХ ВЕЛИЧИН
Рассмотрим непрерывную случайную величину ξ с плотностью распределения pξ ( x ) и другую случайную величину η , связанную с ней функциональной
зависимостью η = ϕ (ξ ) . Функция распределения Fη ( y ) случайной величины η выражается через плотность распределения pξ ( x ) случайного аргумента ξ : Fη ( y ) = ∑
∫ pξ (x )dx ,
k ∆k (y)
(8.1)
где ∆ k ( y ) - интервалы, в которых выполняется неравенство ϕ ( x ) < y . Суммирование в формуле (8.1) распространяется на все указанные интервалы. Границы интервалов ∆ k ( y ) зависят от y и при заданном конкретном виде функции y = ϕ ( x ) могут быть выражены как явные функции y. Плотность распределения pη ( y ) случайной величины η (если она существует) получается путём дифференцирования функции распределения: pη ( y ) = Fy′ ( y ).
(8.2)
В простейшем случае монотонной функции η = ϕ (ξ ) использование формул (8.1) и (8.2) приводит к выражению: pη ( y ) = pξ [ψ ( y )] × ψ ′( y ) , (8.3)
где ψ ( y ) - функция, обратная функции y = ϕ ( x ) . Рассмотрим отдельно случай, когда функция распределения Fη ( y ) имеет
точки разрыва y1, y2, …, yn со скачками p1, p2, …, pn. Это означает существование значений случайной величины η (совпадающих с точками разрыва y1, y2, …, yn), которым соответствуют ненулевые вероятности p1, p2, …, pn. В данном случае плотность распределения вероятностей в точках y1, y2, …, yn обращается в бесконечность.
-7Математическая идеализация указанного явления опирается на использование дельта-функции δ ( y ) , которая не является функцией в обычном понимании, а представляет собой так называемую обобщённую функцию. Будем рассматривать δ ( y ) как производную функции единичного скачка: 1, y > 0, η( y ) = 0, y ≤ 0. В классическом анализе функция η ( y ) не дифференцируема в точке y = 0, однако в теории обобщённых функций это ограничение снимается; таким образом, (8.4) δ ( y ) = η ′( y ) . Представим функцию Fη ( y ) в виде ~ Fη ( y ) = Fη ( y ) +
n
∑ p kη ( y − y k ) ,
(8.5)
k =1
~ где Fη ( y ) - непрерывная (“сомкнутая”) функция. Согласно формулам (8.2) и (8.4) получаем
pη ( y ) = ~ pη ( y ) +
~ pη ( y ) = Fη′ ( y ) . где ~
n
∑ pk δ ( y − y k ) ,
(8.6)
k =1
Пусть теперь (ξ1 ,ξ 2 ) , (η1 ,η 2 ) - двухмерные случайные величины, причём η1 = f1 (ξ1 ,ξ 2 ) , η 2 = f 2 (ξ1 ,ξ 2 ) , (8.7) где функции f1 и f2 предполагаются непрерывно дифференцируемыми и отображение (8.7) – взаимно-однозначным, т. е. существуют функции ϕ1 и ϕ 2 такие, что ξ1 = ϕ1 (η1 ,η 2 ) , ξ 2 = ϕ 2 (η1 ,η 2 ). Тогда плотность распределения pη ( y1 , y 2 ) двухмерной случайной величины (η1 ,η 2 ) выразится через плотность распределения pξ ( x1 , x2 ) случайной величины (ξ1 ,ξ 2 ) :
pη ( y1 , y 2 ) = pξ [ϕ1 ( y1 , y 2 ),ϕ 2 ( y1 , y 2 )] × I ,
∂ϕ1 ∂ϕ1 ∂y ∂y 2 . (8.8) I= 1 ∂ϕ 2 ∂ϕ 2 ∂y1 ∂y 2 Пусть случайная величина η = ϕ (ξ ) есть функция случайной величины ξ . Если требуется определить лишь числовые характеристики случайной величины η , нет необходимости находить её закон распределения. Числовые характеристики выражаются через закон распределения случайного аргумента ξ . Так если ξ
-8имеет плотность распределения pξ ( x ) , то математическое ожидание Мη и дисперсия Dη равны соответственно: +∞
Мη = ∫ ϕ ( x ) pξ ( x )dx , Dη =
−∞ +∞
2 ∫ [ϕ (x ) − Мη ] × pξ (x )dx =
−∞
+∞
2 ∫ ϕ ( x ) pξ ( x )dx − [Mη ] . 2
(8.9)
−∞
8.1. Указания к задачам 25 и 26 Пример 8.1. Случайная величина ξ имеет плотность распределения 2 x, x ∈ [0,1] , pξ ( x ) = 0, x ∉ [0,1] . Найти плотность распределения pη ( y ), математическое ожидание Μη и дисперсию случайной величины η , равной объёму шар радиуса ξ . 4 3 Решение. Объём шара есть η = πξ , т. е. функциональная зависимость ме3 4 3 жду ξ и η есть η = ϕ (ξ ) = πξ . Функция ϕ (ξ ) в нашем случае монотонна и имеет 3 . Поэтому можно воспользоваться формулой обратную функцию ξ = ψ (η ) = 3 3η 4π (8.3) для нахождения плотности распределения величины η : ′ 1 3 3y 3 y 3 . × = pη ( y ) = pξ (ψ ( y )) × ψ ′( y ) = 2 × 4π 4π 2 3 6π y Учитывая, что η принимает значения от 0 до 4/3 π , окончательно получаем: 1 , y ∈ [0, 4π ] , 2 3 3 6πy pη ( y ) = 0, y ∉ [0, 4π ] . 3 Математическое ожидание и дисперсию найдём по формулам (8.9): 1 1 3 4 4 8 8π x 5 1 = 8π . π π Μη = ∫ x 2 xdx = x dx = 3 3∫ 15 0 15 0 1
3 2
(
0
)
2
2 Dη = ∫ 4π x 2 xdx − 8π = 36π . 3 15 225 0
-98.2. Указания к задаче 27 Пример 8.2. Случайная величина ξ
имеет плотность распределения
2
−2x pξ ( x ) = 2 e , заданную на всей числовой прямой. Найти плотность распреде-
π
ления вероятностей pη ( y ) величины η = e
−ξ
2
. −ξ
2
Решение. В данном случае функциональная зависимость η = ϕ (ξ ) = e немонотонная функция: она возрастает на (− ∞,0] и убывает на [0,+∞ ). Поэтому воспользуемся формулами (8.1) и (8.2), учитывая, что η принимает значения на (0,1] . Найдём сначала функцию распределения величины η по формуле (8.1): Fη ( y ) = ∑
∫ pξ (x )dx ,
k ∆k (y)
где ∆ k ( y ) - интервалы, где выполняется неравенство ϕ ( x ) < y , т. е. e рифмируя обе части последнего неравенства, получаем: 2
(
2
2
< y . Лога-
)
x > − ln y , т. е. два интервала ∆1 ( y ) = − ∞,− − ln y и
− x < ln y , x > − ln y ,
(
−x
)
∆ 2 ( y ) = − ln y ,+∞ . В силу симметричности этих интервалов относительно начала координат x=0 и чётности pξ ( x ) , два интеграла, составляющие Fη ( y ) , равны между собой, поэтому достаточно вычислить один из них, например, второй:
∫
∆2 (y)
+∞
pξ ( x )dx =
2
2 e − 2 x dx .
∫
π
− ln y
Для нахождения этого интеграла приведём подынтегральную функцию к виду плотности нормального распределения: +∞
∫
− ln y
−
1 2π × 1
e
( x − 0 )2
( 2)
2× 1
2 t
−x
2
x − 0+ ∞ dx = Φ = 1 − Φ 2 − ln y , 2 1 − ln y 2
(
2
1 2 e dx - функция Лапласа. Таким образом, ∫ 2π 0 0, y ≤ 0 , Fη ( y ) = 1 − 2Φ 2 − ln y , y ∈ (0,1] , 1, y > 1 .
где Φ (t ) =
(
)
)
- 10 2
Учитывая, что Φ ′(t ) = пределения величины η :
(
(
1 e 2π
pη ( y ) = Fy′ ( y ) = 1 − 2Φ 2 − ln y
t − 2
, находим по формуле (8.2) плотность рас-
))′ y = −2
1 e 2π
−
(2
− ln y 2
)2 ×2
1 − 1 = y 2 − ln y
2 ln y 1 2 e × , y ∈ (0,1) , или = π y − ln y 0, y ∉ (0,1) , y 2 , y ∈ (0,1) , π× − ln y pη ( y ) = 0, y ∉ (0,1) .
8.3. Указания к задаче 28 Пример 8.3. Случайная величина ξ1 имеет плотность распределения x2 p1 ( x ) = 18 , x ∈ [− 3,3] , 0, x ∉ [− 3,3] . Найти функцию распределения F2 ( y ) случайной величины ξ 2 = ϕ (ξ1 ) , где функция ϕ задана графиком
Построить график функции распределения F2 ( y ) , записать её выражение через функцию единичного скачка η ( y ) и записать выражение плотности распределения p2 ( y ) через дельта-функцию δ ( y ) . Решение. Из условий примера следует, что
- 11 0, ξ ∈ [− 3,1] , ξ2 = 1 ξ1 − 1, ξ1 ∈ [1,3] . Поэтому 1
1
2
3
x x 1 28 P(ξ 2 = 0 ) = P(− 3 ≤ ξ1 ≤ 1) = ∫ p1 ( x )dx = ∫ dx = = , 54 − 3 54 −3 − 3 18 т. е. имеется положительная вероятность принятия величиной ξ 2 значения 0, поэтому в точке y=0 функция распределения F2 ( y ) имеет разрыв. Величина ξ 2 , очевидно, принимает значения только из отрезка [0,2] . Для y ∈ (0,2] имеем 28 F2 ( y ) = P(ξ 2 < y ) = P(ξ 2 = 0 ) + P(0 < ξ 2 < y ) = + P(0 < ξ1 − 1 < y ) = 54 y +1 2
3
x 28 28 28 x y + 1 ( y + 1)3 − 1 28 dx = = + P(1 < ξ1 < y + 1) = + ∫ + = + . 54 54 1 18 54 54 1 54 54 Таким образом, 0, y ≤ 0 , 3 ( y + 1) − 1 28 F2 ( y ) = + ,0< y ≤2, 54 54 1, y > 2 . График этой функции приведён на следующем рисунке
Запишем F2 ( y ) в виде (8.5): 28 ~ F2 ( y ) = F2 ( y ) + η ( y − 1) , 54 где 0, y ≤ 0 , 3 ~ ( y + 1) − 1 F2 ( y ) = , 0 < y ≤ 2 , - непрерывная часть, а 54 28 54 , y > 2 ,
- 12 -
0, y ≤ 1 , 28 - разрывная часть функции распределения F2 ( y ) . η ( y − 1) = 28 54 , > 1 , y 54 Отсюда по формуле (8.6) находим плотность распределения: 28 p2 ( y ) = ~ p2 ( y ) + δ ( y − 1) , 54 где ( y + 1)2 , y ∈ [0,2] , ~ p2 ( y ) = F2′ ( y ) = 18 0, y ∉ [0,2] , и δ (• ) - дельта-функция.
8.4. Указания к задаче 29 Пример 8.4. Двумерная случайная величина (ξ1 ,ξ 2 ) имеет плотность рас1 − 2 x1 − 3 x 2 . Найти плотность распределения pη ( y1 , y 2 ) пределения pξ ( x1 , x2 ) = e 24 двумерной случайной величины (η1 ,η 2 ) , связанной с (ξ1 ,ξ 2 ) взаимно однозначными соотношениями: ζ 1 = ϕ1 (η1 ,η 2 ) = η 2 − 6η12 , ξ 2 = ϕ 2 (η1 ,η 2 ) = 3η 2 + 4η1 . Решение. Определим искомую плотность по формуле (8.8). Для этого сначала найдём Якобиан преобразования случайных величин: ∂ϕ1 ( y1 , y 2 ) ∂ϕ1 ( y1 , y 2 ) ∂ ∂ y 2 − 6 y12 y 2 − 6 y12 ∂y1 ∂y 2 ∂y1 ∂y 2 = = I= ∂ϕ 2 ( y1 , y 2 ) ∂ϕ 2 ( y1 , y 2 ) ∂ ∂ (3 y2 + 4 y1 ) (3 y2 + 4 y1 ) ∂y1 ∂y1 ∂y1 ∂y 2 − 12 y1 1 = = −30 y1 − 4 , I = − 36 y1 − 4 = 4 9 y1 + 1 . 4 3 Отсюда 1 − 2 y − 6 y −3 3 y + 4 y pη ( y1 , y 2 ) = pξ (ϕ1 ( y1 , y 2 ),ϕ 2 ( y1 , y 2 )) × I = e × 4 9 y1 + 1 = 24 9 y1 + 1 − 2 y 2 − 6 y1 − 3 3 y 2 + 4 y1 e . = 6
(
)
2
(
1
2
)
1
- 13 -
9. ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Распределение двух случайных величин ξ и η , или двумерной случайной величины (ξ ,η ) , не исчерпывается распределением каждой из них, так как при этом не учитывается зависимость, которая может существовать между ними. Функция распределения F ( x, y ) двумерной случайной величины (ξ ,η ) определяется как вероятность совместного выполнения неравенств ξ < x и η < y : F ( x, y ) = P{ξ < x,η < y} . (9.1) Если F ( x, y ) представима в виде F ( x, y ) =
x
y
∫ ∫ p(x, y )dxdy , где p(x, y ) - неко-
−∞ −∞
торая неотрицательная функция, то двумерную случайную величину (ξ ,η ) называют непрерывной, функцию p( x, y ) - плотностью распределения двумерной случайной величины (ξ ,η ) . Плотность распределения pξ ( x ) случайной величины ξ выражается через
совместную плотность p( x, y ) следующим образом: pξ ( x ) =
+∞
∫ p(x, y )dy .
(9.2)
−∞
Аналогично для плотности распределения случайной величины η имеем pη ( y ) =
+∞
∫ p(x, y )dx .
(9.3)
−∞
В отличие от совместной плотности распределения p( x, y ) одномерные плотности pξ ( x ) и pη ( y ) называют маргинальными. Случайные величины ξ и η называются независимыми, если их совместная функция распределения F ( x, y ) при любых значениях аргументов x, y равна произведению маргинальных функций распределения Fξ ( x ) случайной величины ξ и Fη ( y ) случайной величины η : F ( x, y ) = Fξ ( x ) × Fη ( y ) .
(9.4)
p( x, y ) = pξ ( x ) × pη ( y ) .
(9.5)
Пусть (ξ ,η ) - непрерывная двумерная случайная величина с плотностью распределения p( x, y ) . Тогда для независимости ξ и η необходимо и достаточно, чтобы совместная плотность p( x, y ) распадалась в произведение маргинальных плотностей pξ ( x ) и pη ( y ):
- 14 -
(
)(
)
Величина М [ ξ − М ξ η − Мη ] называется ковариацией случайных величин
ξ и η , cov(ξ ,η ) . Если (ξ ,η ) - непрерывная двумерная случайная величина с плот-
ностью распределения p( x, y ) , то
cov(ξ ,η ) =
+∞ +∞
∫ ∫ (ξ − Мξ )(η − Мη )p(x, y )dxdy =
−∞ −∞
=
+∞ +∞
∫ ∫ xyp(x, y )dxdy − Мξ Мη .
(9.6)
−∞ −∞
Величина r = cov(ξ ,η )
Dξ Dη
(9.7)
называется коэффициентом корреляции случайных величин ξ и η . Свойства коэффициента корреляции: 1*. Модуль коэффициента корреляции не превосходит единицы, r ≤ 1. 2*. Если ξ и η независимые случайные величины, то r = 0 . Обратное неверно: из условия r = 0 (некоррелированность случайных величин ξ и η ) не следует независимость ξ и η . 3*. Если ξ и η связаны линейной зависимостью, то r = 1 . 9.1. Указания к задаче 30 Пример 9.1. Двумерная случайная величина (ξ ,η ) имеет равномерное распределение вероятностей в четырёхугольнике с вершинами A(0,0), B(0,2), C(2,3), D(3,0), т. е. её плотность распределения 1 , (x , y ) ∈ ABCD , p (x , y ) = 6 0, (x , y ) ∉ ABCD ,
где 6 – площадь четырёхугольника.
Найти маргинальные плотности распределения pξ ( x ) и pη ( y ) случайных величин ξ и η , их математические ожидания М ξ и Мη , дисперсии Dξ и Dη , коэффици-
ент корреляции r. Являются ли ξ и η независимыми?
- 15 Решение. Найдём сначала маргинальные плотности по формулам (9.2) и (9.3):
2 ∫ 1 6 dy = 13 , x ∈ [0,3] , pξ ( x ) = ∫ p( x, y )dy = 0 −∞ 0, x ∉ [0,3] , +∞
3 1 dx = 1 2 , y ∈ [0,2] , pη ( y ) = ∫ p( x, y )dx = 0∫ 6 −∞ 0, y ∉ [0,2] . Итак, 1 , x ∈ [0,3] , 1 , y ∈ [0,2] , pη ( y ) = 2 pξ ( x ) = 3 0, y ∉ [0,2] , 0, x ∉ [0,3] , т. е. ξ и η имеют равномерные распределения на [0,3] и [0,2] соответственно. Поскольку выполнение условий x ∈ [0,3] и y ∈ [0,2] равносильно условию (x, y )∈ ABCD и 16 = 13 × 1 2 , то в нашем примере p(x, y ) = pξ (x ) × pη ( y ) , т. е. имеет место формула (9.5). Следовательно, ξ и η - независимы. Найдём теперь математические ожидания и дисперсии величин ξ и η : +∞
+∞
2
3
1 x 3 9 3 М ξ = ∫ xpξ ( x )dx = ∫ x × dx = = = , 0 3 6 6 2 0 −∞ Dξ =
+∞
∫
−∞
2
( )
x pξ ( x )dx − M ξ
2
3
2 1 9 3 x 3 9 3 = ∫ x × dx − = − =3− = . 3 9 0 4 4 4 2 0 3
2
Аналогично,
1 Мη = 1 , Dη = . 3 Отметим, что эти результаты можно получить проще, используя выражения для математического ожидания Мψ = (a + b) 2 и дисперсии Dψ = (b − a )2 12 случай-
ной величины ψ , равномерно распределённой на отрезке [a, b]. В силу независимости ξ и η коэффициент корреляции r=0. Тем не менее вычислим его по формулам (9.6) и (9.7): +∞ +∞ 3 2 3 1 3 1 3 3 3 cov(ξ ,η ) = ∫ ∫ xydxdy − М ξ Мη = ∫ ∫ xydy dx − × 1 = ∫ xdx − = − = 0 , 2 2 2 2 −∞ −∞ 0 0 6 03
- 16 r = cov(ξ ,η )
Dξ Dη
=
0
3 ×1 4 3
= 0.
Пример 9.2. То же, что и в примере 9.1, но с вершинами A(0,0), B(3,1), C(6,0), D(3,-1).
Решение. Площадь четырёхугольника снова равна 6, поэтому выражение для p( x, y ) то же, что и в примере 9.1. Найдём маргинальное распределение pξ ( x ) величины ξ по формуле (9.2),
учитывая, что внутри четырёхугольника p( x, y ) равна 1 6 , а вне его – нулю. По-
этому pξ ( x ) = 0 при x ∉ [0,6] . Если x ∈ [0,3] , то, как это следует из рисунка, пределы интегрирования в (9.2) по y достаточно взять от − x x
3
до x : 3
x 1 1 1 3 pξ ( x ) = ∫ dy = y = x − −x =x . 3 9 6 6 −x 6 3 −x 3 3 Если же x ∈ [3,6] , то интегрируем по y от x − 2 до 2 − x : 3 3 2− x x 3 1 1 2− 3 1 1 pξ ( x ) = ∫ dy = y = 2− x − x −2 = 2− x . 3 3 3 6 x −2 6 3 x −2 6 3 3 3
(
(
(
Итак,
))
(
)) (
)
- 17 0, x < 0 , x 9, 0 ≤ x ≤ 3, pξ ( x ) = 2 − x 3 3, 3 < x ≤ 6 , 0, x > 6 . Аналогичным образом, используя уравнения границ четырёхугольника x = 3 y , x = −3 y , x = 3(2 + y ) и x = 3(2 − y ) , получаем 0, y < −1 , 1 + y, − 1 ≤ y ≤ 0 , 1 − y , y ∈ [− 1,1] , = pη ( y ) = − < ≤ 1 y , 0 y 1 , 0, y ∉ [− 1,1] . 0, y > 1 . Очевидно, что в нашем случае p( x, y ) ≠ pξ ( x ) pη ( y ) , например, в точке (3,0)
(
)
имеем p(3,0 ) = 1 , pξ (3) = 1 , pη (0 ) = 1 и 1 ≠ 1 × 1 . Следовательно, величины 6 3 6 3 и η зависимы, т. к. (9.5) не выполняется. ξ Найдём теперь математические ожидания и дисперсии величин ξ и η . +∞
6 x 2 x М ξ = ∫ xpξ ( x )dx = ∫ x × dx + ∫ x − dx = 3 , 9 9 0 3 3 −∞
Dξ =
+∞
∫
Dη =
2
∫
−∞ +∞
∫
−∞
( )
x pξ ( x )dx − М ξ
−∞ +∞
Мη =
3
2
3
6 2 2 2 3 x x = ∫ x × dx + ∫ x − dx − 3 = , 9 2 3 9 0 3 2
0
1
ypη ( y )dy = ∫ y (1 + y )dy + ∫ y (1 − y )dy = 0 , −1
2
0
0
1
( ) = ∫ y (1 + y )dy + ∫ y 2 (1 − y )dy = 16 .
y pη ( y )dy − Мη
2
−1
2
0
Найдём ковариацию и коэффициент корреляции: +∞ +∞ 1 cov(ξ ,η ) = ∫ ∫ xyp( x, y )dxdy − М ξ Мη = ∫∫ xydxdy = 0 (в силу симметрии ABCD 6 ABCD −∞ −∞ относительно оси y=0 и нечётности подынтегральной функции по y), r = cov(ξ ,η ) = 0 = 0. Dξ Dη 6×3 В данном примере r=0, хотя величины ξ и η зависимы (см. свойство 2* коэффициента корреляции).
- 18 10. ЗАКОН БОЛЬШИХ ЧИСЕЛ И ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
Под законом больших чисел понимают ряд теорем, объединённых идеей устойчивости средних результатов при большом числе испытаний. Теорема Чебышева. Пусть случайные величины ξ1 , ξ 2 , …, ξ n , … попарно независимы и Dξ i ≤ c , i = 1, 2, …, где c – некоторая постоянная. Тогда при любом
ε > 0 выполняется предельное соотношение
1 n 1 n lim P ∑ ξ i − ∑ М ξi < ε = 1 . (10.1) n →∞ n n i i = 1 = 1 Теорема Маркова. Пусть случайные величины ξ1 , ξ 2 , …, ξ n , … удовлетворяют условию 1 n (10.2) D ξ → 0 при n → ∞ . 2 ∑ i n i =1 Тогда при любом ε > 0 выполняется предельное соотношение (10.1). Теорема Бернулли. Пусть m – число успехов в n независимых испытаниях, p – вероятность успеха в каждом испытании. Тогда при любом ε > 0 m lim P − p < ε = 1 . (10.3) n→∞ n Доказательство этих теорем основано на неравенстве Чебышева D P { ξ − Мξ ≥ ε } ≤ ξ 2 , (10.4)
ε справедливом при любом ε > 0 для любой случайной величины ξ , имеющей конечное математическое ожидание М ξ и конечную дисперсию Dξ . Центральная предельная теорема для одинаково распределённых случайных слагаемых. Пусть ξ1 , ξ 2 , …, ξ n , … - независимые одинаково распределённые случайные величины, имеющие математические ожидания М ξ i = a и дисперсии 2
Dξ i = σ . Тогда при n → ∞ функция распределения нормированной суммы n ηn = ∑ (ξ i − a ) σ n i =1
(10.5)
сходится к функции распределения нормальной случайной величины с параметрами (0,1), т. е. при любом x 2
P{η n < x} →
n →∞
1 2π
x −
∫e
−∞
z 2
dz .
(10.6)
- 19 Отсюда получается приближённая формула P{x1 < η n < x2 } ≈ Φ( x2 ) − Φ( x1 ) , (10.7) справедливая при достаточно больших n. Она выражает вероятность выполнения неравенства x1 < η n < x2 через интеграл вероятности 2
x −
t 2
1 ∫ e dt , 2π 0 значения которого можно посмотреть в таблице 1 (см. приложение). Приближение (10.7) можно записать как n x − na x − na P x1 < ∑ ξ i < x2 ≈ Φ 2 − Φ 1 . nσ nσ i =1 Φ(x ) =
(10.8)
10.1. Указания к задачам 31-33 Пример 10.1. Случайная величина ξ имеет среднеквадратическое отклонение σ = 3 . Используя неравенство Чебышева, оценить вероятность того, что ξ 2 отклонится от своего математического ожидания меньше чем на 2. Решение. В этом примере нужно оценить вероятность выполнения неравенства ξ − М ξ < 2 , т.е. P ξ − М ξ < 2 . В неравенстве Чебышева фигурирует вероят-
(
)
ность противоположного события ξ − М ξ ≥ 2 , следовательно,
(
)
(
)
P ξ − Мξ < 2 = 1 − P ξ − Мξ ≥ 2 . По неравенству Чебышева
(
)
(
)
σ
2
( 3 2 )2 =
9 . 4 16 2 Отсюда и из предыдущего соотношения получаем 9 7 P ξ − Мξ < 2 ≥ 1 − = . 16 16 Итак, искомая вероятность не меньше 7 16 . P ξ − Мξ ≥ 2 ≤
2
=
Пример 10.2. Случайные величины ξ1 , ξ 2 , …, ξ i , … независимы и равномерно распределены на интервалах [− i, i ] , соответственно. Удовлетворяет ли эта последовательность случайных величин закону больших чисел? Решение. Для ответа на поставленный вопрос проверим выполнение условия (10.2) из теоремы Маркова. Величина ξ i равномерно распределена на [− i, i ] , поэтому
- 20 2
( i − (− i ))2 =
4i 1 2 Dξ i = = i . 12 12 3 Величины ξ i независимы, поэтому дисперсия их суммы равна сумме дисперсий: n n 2 2 2 2 2 2 n n D ∑ ξ i = ∑ Dξ i = ∑ 1 i = 1 ∑ i = 1 1 + 2 + 3 + ... + n . 3 3 i =1 3 i =1 i =1 i =1 Выражение в условии (10.2) 2 2 2 2 2 2 n 1 1 + 2 + 3 + ... + n (n − 1)2 + 1 ≥ 1 , 1 1 2 = × = + + + ... D ξ 2 ∑ i 2 2 3 3 n2 n2 n i =1 3 n n поэтому к нулю не стремится. Следовательно, условие (10.2) не выполняется, а данная в примере последовательность закону больших чисел не удовлетворяет. Отметим, что при вычислениях можно получить более точный результат, 2 2 2 2 1 используя формулу 1 + 2 + 3 + ... + n = n(n + 1)(2n + 1) , откуда 6 n n(n + 1)(2n + 1) 1 1 1 D ξ = = 1 + (2n + 1) → ∞ . 2 ∑ i 2 6 n 1 = i n 6n
1
Пример 10.3. То же, что и в примере 10.2, но ξ i равномерно распределены на [− 1 i,1 i ] . Решение. Аналогичным образом получаем 2
1 1 − − i i 1 Dξ i = = 2. 12 3i 1 n 1 1 1 1 = + + + ... D ξ . ∑ i 2 2 2 2 2 n i =1 3n 1 2 n 1 1 1 Из теории рядов известно, что ряд 2 + 2 + 2 + ... сходится, поэтому выражение 1 2 3 1 n в квадратных скобках ограничено. Поэтому 2 D ∑ ξ i → 0 и величины ξ1 , ξ 2 , n i =1 …, ξ i , … закону больших чисел удовлетворяют. Пример 10.4. В самолёт садятся 100 пассажиров. Оценить вероятность того, что их общий вес будет в пределах от 6900 до 7200 кг, если средний вес человека a=70 кг и среднеквадратическое отклонение σ = 10 кг.
- 21 -
Решение. Пусть ξ i - вес i-го пассажира, тогда общий их вес равен
100
∑ξ i . В
i =1
нашем случае количество слагаемых (100) достаточно велико, поэтому можно воспользоваться приближением (10.8), следующим из центральной предельной теоремы: 100 7200 − 100 × 70 6900 − 100 × 70 P 6900 < ∑ ξ i < 7200 ≈ Φ − Φ = 100 × 10 100 × 10 i =1 = Φ (2 ) − Φ (1) = 0,47725 + 0,34134 = 0,81859 .
11. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ Выборкой называется n-мерная случайная величина ( X 1 , X 2 ,..., X n ) с независимыми одинаково распределёнными компонентами Xi, i = 1, 2, …,n. Число n называется объёмом выборки. Любая функция h = h( X 1 , X 2 ,..., X n ) выборочных значений называется статистикой. Пусть α - неизвестный параметр распределения случайной величины ξ . Статистика *
*
α = α ( X 1 , X 2 ,..., X n ), *
используемая в приближённом равенстве α ≈ α , называется оценкой (точечной оценкой) неизвестного параметра по выборке. Методы получения оценок. 1. Метод моментов. Пусть ξ - непрерывная случайная величина с плотностью распределения p( x,α ) , зависящей от одномерного неизвестного параметра α . Тогда математическое ожидание М ξ является функцией α : +∞
M ξ = ∑ xp( x,α )dx = µ1 (α ) . −∞
Выборочное среднее X =
1 n × ∑ X i принимает значение, близкое к M ξ , поn i =1
(11.1) этому µ1 (α ) = X . Метод моментов аналогичным образом применяется к дискретным случайным величинам. 2. Метод максимального правдоподобия. Пусть ξ - дискретная случайная величина с распределением P(ξ = ai ) = pi (α ) , i = 1, 2, …, k,
- 22 где ai – возможные значения случайной величины ξ ; pi (α ) - соответствующие вероятности, зависящие от неизвестного параметра α , причём n
∑ p i (α ) = 1
при любом допустимом значении α . Множество значений ai
i =1
случайной величины ξ может быть не только конечным, но и счётным. Если среди наблюдаемых выборочных значений ( x1 , x2 ,..., xn ) число ai встречается ni раз (i = 1, 2, …, k), то для вероятности L( x1 , x2 ,..., xn ;α ) получения данной выборки имеем выражение n1
nk
n2
L( x1 , x2 ,..., xn ;α ) = p1 (α ) × p2 (α ) × ... × pk (α ) . (11.2) Функция (11.2) параметра α называется функцией правдоподобия, а величи*
на α , при которой функция L( x1 , x2 ,..., xn ;α ) достигает максимума, – оценкой максимального правдоподобия неизвестного параметра α . Для непрерывной случайной величины ξ с плотностью распределения p( x,α ) , зависящей от неизвестного параметра α , метод максимального правдоподобия остаётся в силе. Отличие состоит в том, что теперь функция правдоподобия L( x1 , x2 ,..., xn ;α ) = p( x1 ,α ) × p( x2 ,α ) × ... × p( xn ,α ) выражается не через вероятность получения данной выборки, а через плотность распределения n-мерной случайной величины (Χ1 , Χ 2 ,..., Χ n ) , зависящую от параметра α . При этом α служит аргументом, значения x1, x2, …, xn считаются фиксированными.
11.1. Указания к задачам 34 и 35 Пример 11.1. Дискретная случайная величина ξ имеет распределение m
P(ξ = m ) = a (1 − a ) , m = 0, 1, 2, …, с неизвестным параметром a. Используя метод моментов и метод максимального правдоподобия, получить точечные оценки параметра a по выборке (x1, x2 ,..., x10 ) = (2, 6, 5, 0, 12, 10, 3, 6, 9, 7 ) . Решение. Построим сначала оценку по методу моментов. Для этого нам понадобится математическое ожидание величины ξ :
Мξ =
∞
∞
m
∞
∑ mP(ξ = m ) = ∑ ma (1 − a ) = a(1 − a ) ∑ ma
m=0
m=0
1
m=0
m −1
1
∞ m = a (1 − a ) ∑ a = m=0 a
a 1 1 = . = a (1 − a ) = a(1 − a ) 2 − a 1 1 − a a (1 − a ) Приравнивая точное значение М ξ к его выборочному значению
- 23 1 1 xi = (2 + 6 + 5 + 0 + 12 + 10 + 3 + 6 + 9 + 7 ) = 6 (уравнение 11.1), получаем ∑ n 10 a 6 6 уравнение = 6 , решением которого является a = = . Таким образом, по 1− a 1+ 6 7 x=
*
методу моментов получаем оценку a = 6 7 . Построим теперь оценку методом максимального правдоподобия. Для этого составим функцию правдоподобия (11.2): 2
6
7
L( x1 , x2 ,..., xn ; a ) = L(2,6,5,0,12,10,3,6,9,7; a ) = a (1 − a ) × a (1 − a ) × ... × a (a − a ) = = a (1 − a )10 . Оценкой максимального правдоподобия является точка максимума функции правдоподобия. Для нахождения этой точки возьмём производную функции 60
(1 − a )10 и приравняем её к нулю: 59 59 60a (1 − a )10 − 10a (1 − a )9 = 10a (1 − a )9 (6 − 7 a ) = 0 . a
60
60
Корнями этого уравнения являются a1 = 0, a2 = 1 и a3 = 6/7. При этом, очевидно, точкой максимума является только a3. Таким образом, оценкой по максимуму *
правдоподобия является a = 6 7 . Отметим, что в нашем примере оценки, полученные двумя методами совпали. Такое совпадение не обязательно – иногда эти методы дают разные оценки.
12. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ Кроме точечных оценок используются так называемые доверительные ин*
тервалы: указывается не одна точка α ( X 1 , X 2 ,..., X n ) , а интервал (α ,α ) , к которому с заданной вероятностью принадлежит истинное значение параметра α , P(α < α < α ) = Θ . Число Θ , 0 < Θ < 1 называется доверительной вероятностью и характеризует надёжность полученной оценки: чем ближе Θ к единице, тем надёжнее оценка (обычно выбирают Θ = 0,9; 0,95 или 0,99). Величины α и α называются доверительными границами. Они являются функциями выборочных значений α = α ( X 1 , X 2 ,..., X n ) , α = α ( X 1 , X 2 ,..., X n ) и, следовательно, являются случайными величинами. Интервал (α ,α ) со случайными границами α ,α , которые при любом допустимом значении α удовлетворяют соотношению P(α < α < α ) = Θ , называется доверительным интервалом для неизвестного параметра α .
- 24 Примеры доверительных интервалов. 1. Доверительный интервал для математического ожидания a нормальной слу2
чайной величины при известной дисперсии σ имеет вид
σ
*
a − uΘ ×
*
< a < a + uΘ ×
σ
, (12.1) n n * 1 n здесь a = ∑ X i , величина uΘ определяется по заданной доверительной n i =1 вероятности Θ с помощью таблицы 1 (см. приложение). 2. Доверительный интервал для математического ожидания a нормальной слу2
чайной величины при неизвестной дисперсии σ имеет вид *
a − tΘ ×
σ
*
n
*
< a < a + tΘ ×
σ
*
n
,
(12.2)
*
где оценка σ вычисляется по формуле * 1 ∞ ( X i − X )2 , σ = (12.3) ∑ n − 1 i =1 а величина tΘ определяется по заданной достоверной вероятности Θ и по объёму выборки n с помощью таблицы 2 (см. приложение). 3. Доверительный интервал для дисперсии σ ны имеет вид
(n − 1)σ
∗2
2
<σ <
2 χ (2 )
(n − 1)σ 2 χ (1)
2
нормальной случайной величи-
∗2
,
(12.4)
*
где n – объём выборки; σ - оценка величины σ , определяемая формулой 2
2
(12.3); χ (1) и χ (2 ) - корни уравнений 2
χ (1)
1− Θ ∫ pn −1 (x )dx = 2 , 0
∞
∫ pn −1 (x )dx =
2 χ (2 )
1− Θ , 2
(12.5)
в которых подынтегральная функция pn −1 ( x ) представляет собой плотность распределения хи-квадрат с n-1 степенями свободы. Уравнения (12.5) при заданной достоверной вероятности Θ решаются с помощью таблицы 3 (см. приложение).
- 25 2
При определении χ (1) входами этой таблицы служат ν = n − 1 и α =
1+ Θ , 2
1− Θ . 2 4. Пусть n – число независимых испытаний, m – число наступлений события А, p – вероятность наступления события А в каждом отдельном испытании. Рассмотрим случай, когда n достаточно велико, а значение p не слишком близко к нулю или к единице так, что можно воспользоваться асимптотикой Муавра-Лапласа. При этом доверительный интервал для p имеет вид 2
при определении χ (2 ) - ν = n − 1 и α =
m
2
m + uΘ
, (12.6) < p< 2 2 n + uΘ n + uΘ uΘ определяется по заданной доверительной вероятности Θ с помощью таблицы 1 (см. приложение). Рассмотрим отдельно случай m = 0. При этом нижняя доверительная граница равна нулю, верхняя 1− n 1− Θ . (12.7) Аналогично, при m=n нижняя и верхняя достоверная границы равны соответственно n 1 − Θ и единице. (12.8)
12.1. Указания к задаче 36 Пример 12.1. Случайная величина ξ распределена нормально с неизвест2
ным математическим ожиданием a и известной дисперсией σ = 25 . По выборке 100 * (x1 ,..., x100 ) объёма 100 вычислено выборочное среднее a = 1 ∑ xi = 142,3 . Оп100 i =1 ределить доверительный интервал для a с доверительной вероятностью Θ = 0,95 . Решение. В этом примере дисперсия σ
2
известна, поэтому воспользуемся 2
формулой (12.1), в которую подставим наши данные σ = σ = 25 = 5 и n = 100, а также uΘ = u0,95 = 1,96 , полученные из таблицы 1 приложения:
5 5 , < a < 142,3 + 1,96 100 100 т. е. 141,32 < a < 143,28 . Таким образом, с доверительной вероятностью (надёжностью) 0,95 неизвестное математическое ожидание a находится в интервале (141,32; 143,28). 142,3 − 1,96
- 26 -
12.2. Указания к задачам 37 и 38 2
Пример 12.2. Пусть математическое ожидание a и дисперсия σ нормальной случайной величины ξ неизвестны. По выборке ( x1 , x2 ,..., x20 ) объёма 20 найдены оценки 2
* 2 * 1 20 1 20 a = ∑ xi = 56,85 и σ = ∑ xi − a = 26,1 . 19 i =1 20 i =1 Найти доверительные интервалы для математического ожидания a и дисперсии *
2
σ при доверительной вероятности Решение. Поскольку a и σ
2
Θ = 0,95 . неизвестны, найдём доверительный интервал *
для a по формуле (12.2), в которую подставим наши данные a = 56,85 , n = 20, *
σ = 26,1 = 5,109 и взятые из таблицы II приложения tΘ = t 0,95 = 2,086 : 5,109 5,109 < a < 56,85 + 2,086 , 20 20 т. е. 55,708 < a < 57,992 . 56,85 − 2,086
Доверительный интервал для σ
2
найдём по формуле (12.4), подставив в неё
* 2
2 2 n = 20, σ = 26,1 , а также найденные из таблицы 3 приложения χ (1) и χ (2 ) . 2 1 + Θ 1 + 0,95 Для χ (1) имеем ν = n − 1 = 20 − 1 = 19 , α = = = 0,975 ≈ 0,98 , следова2 2 2
тельно, χ (1) = 8,57 . 2
Для χ (2 ) имеем ν = n − 1 = 20 − 1 = 19 , α =
1 − Θ 1 − 0,95 = = 0,025 ≈ 0,02 , следова2 2
2
тельно, χ (2 ) = 33,7 . Таким образом, имеем 2 20 − 1 20 − 1 26,1 < σ < 26,1 , 33,7 8,57 2
т. е. 14,715 < σ < 57,845 .
12.3. Указания к задачам 39 и 40 Пример 12.3. Из 35 новорожденных оказалось 18 мальчиков. Найти доверительный интервал для вероятности p рождения мальчика при доверительной вероятности Θ = 0,99 .
- 27 Решение. Воспользуемся формулой (12.6), в которой для нашего примера n = 35, m = 18, Θ = 0,99 и (из таблицы 1 приложения) u0,99 = 2,576 . Получаем
18 + 2,576
2
35 + 2,576 35 + 2,576 т. е. 0,432 < p < 0,592 .
2
18 2
< p<
,
Пример 12.4. Сколько нужно получить безотказных срабатываний пожарной сигнализации, чтобы с доверительной вероятностью 0,99 утверждать, что вероятность отказа этой сигнализации не превышает 0,001? Решение. В нашем примере речь идёт о числе опытов n, в которых событие (отказ сигнализации) ни разу не произошло. Верхняя граница p2 доверительного интервала для вероятности отказа p, число опытов n и доверительная вероятность Θ связаны уравнением (12.7): p2 = 1 − n 1 − Θ ,
откуда n 1 − Θ = 1 − p2 , 1 − Θ = (1 − p2 )n . Логарифмируя последнее уравнение, получаем ln (1 − Θ ) = n ln (1 − p2 ) , т. е. ln(1 − Θ ) . n= ln(1 − p2 ) Подставляя в полученную формулу наши данные Θ = 0,99 и p2 = 0,001, получаем ln (1 − 0,99 ) n= = 2994,23 . ln (1 − 0,001) Возьмём ближайшее целое, не меньшее найденного значения, т. е. n = 2995. Таким образом, для обоснования сформулированного в этом примере утверждения о том, что с доверительной вероятностью Θ = 0,99 вероятность p сбоя сигнализации не превосходит 0,001 (т. е. 0 ≤ p ≤ 0,001), необходимо, чтобы в серии из n = 2995 испытаний не было ни одного сбоя у такой сигнализации.
13. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА χ
2
Случайная величина X, которая служит для статистической проверки гипотезы, называется критерием. Иногда термином критерий обозначают не только
- 28 случайную величину X, но и всё правило проверки в целом. При этом X называют статистикой критерия. Проверка гипотезы состоит в том, что если наблюдаемое значение критерия принадлежит некоторому определённому множеству S, т. е. наступает событие {X ∈ S }, то основная гипотеза H 0 отвергается. Множество S, такое, что при наступлении события {X ∈ S } основная гипотеза H 0 отвергается, называется критическим множеством (для гипотезы H 0 ). Событие {X ∈ S }, состоящее в том, что основная гипотеза H 0 отвергается, когда она является истинной, называется ошибкой первого рода. Событие {X ∈ S }, состоящее в том, что основная гипотеза H 0 не отвергается, когда верна одна из альтернативных гипотез H λ , называется ошибкой второго рода. Вероятности PI и PII ошибок первого и второго рода вычисляются в предположениях о справедливости различных гипотез – основной H 0 и альтернативной H λ соответственно: PI = PH 0 ( X ∈ S ) , PII = PH λ ( X ∈ S ). Вероятность ошибки второго рода, а также вероятность PH λ ( X ∈ S ) = 1 − PH λ ( X ∈ S ) противоположного события связаны с конкретной альтернативной гипотезой H λ , т. е. могут зависеть от некоторого параметра λ . Функция PH λ параметра λ , равная вероятности отвергнуть гипотезу H 0 , если верна гипотеза H λ , называется функцией мощности критерия. Правило статистической проверки гипотезы. 1. Задаются малым числом α > 0 , называемым уровнем значимости критерия; обычно α = 0,05; 0,01 или 0,001. Чем более опасными признаются ошибки первого рода, тем меньшее значение α должно быть выбрано. 2. Определяют критическое множество S из условия выполнения неравенства PI = PH 0 ( X ∈ S ) ≤ α .
3. Условием PI ≤ α критическое множество определяется неоднозначно. Выбирают ту из возможностей, которая обеспечивает минимум вероятности ошибки второго рода, или, что то же самое, максимум мощности критерия. 4. Производят опыт и получают наблюдаемое значение критерия. Если при этом наступает событие {X ∈ S }, то основная гипотеза H 0 отвергается. В противном случае считается, что H 0 не противоречит опытным данным. Результат проверки гипотезы выражается словами: гипотеза H 0 отвергается (не отвергается) на уровне значимости α .
- 29 2
13.1. Критерий согласия χ Критерии, которые служат для проверки гипотезы о законе распределения случайной величины, называются критериями согласия. Пусть основная гипотеза H 0 состоит в том, что функция распределения случайной величины ξ есть вполне определённая функция F ( x ) . Разобьём числовую ось на r промежутков (разрядов): (− ∞ = a0 , a1 ), [a1 , a2 ),..., [ar −1 , ar = +∞ ) , где a1 < a2 < ... < ar −1 . При справедливой гипотезе H 0 i-му разряду [ai −1 , ai ) соответствует вероятность pi = F (ai ) − F (ai −1 ) , i = 1, 2, …, r. (13.1) Из n выборочных значений (X1, X2, …, Xn) случайной величины ξ в i-й разряд r [ai −1 , ai ) попадает случайное число mi значений ∑ mi = n . Тогда отношение i =1 mi n представляет собой частоту попадания выборочных значений в i-й разряд. Близость частот mi n к вероятности pi свидетельствует в пользу основной гипотезы H 0 , заметные различия отвергают гипотезу H 0 . Случайная величина r (m − np )2 n m i χ = ∑ i − pi = ∑ i npi i =1 i =1 pi n 2
r
2
(13.2) 2
характеризует согласованность гипотезы H 0 с опытными данными. Критерий χ применяется в соответствии с общим правилом статистической проверки гипотез. При этом наблюдаемое значение критерия вычисляется по формуле (13.2), крити2 ческое множество выбирается в виде полубесконечного интервала χα ,+∞ , где 2
величина χα находится с помощью таблицы 3 (см. приложение). Входами таблицы служат величина ν = r −1 (13.3) и уровень значимости α . 2
2
Если выполняется соотношение χ > χα , то говорят, что гипотеза H 0 отвергается на уровне значимости α . В противном случае она не противоречит опытным данным. Замечание 1. Число выборочных значений mi, i = 1, 2, …, r в каждом разряде должно быть не менее 5-10. Если это условие не выполняется, рекомендуется объединять разряды.
- 30 2
Замечание 2. Критерий согласия χ применим не только в случае, когда гипотетическая функция распределения F ( x ) случайной величины ξ полностью определена. Если она зависит от l неизвестных параметров, т. е. имеет вид F ( x;α1 ,α 2 ,...,α l ) , и параметры α1 , α 2 , …, α l оцениваются по выборке методом максимального правдоподобия, то критерий согласия остаётся в силе, только входом в таблицу 3 служит величина ν = r − l − 1. (13.4)
13.2. Указания к задаче 41 Пример 13.1. Тысяча человек участвовала в соревнованиях по рыбной ловле. Из них mi человек поймали i рыб, что представлено первыми двумя строками следующей таблицы: i
0
1
2
3
4
5
6
7
8
9
10
mi
437
250
138
80
49
16
10
8
6
3
3
0,400
0,240
0,144
0,086
0,052
0,031
0,019
0,011
0,007
0,010
0,450
0,248
0,136
0,075
0,041
0,023
0,012
0,007
0,004
0,004
pi a=0,6 pi a=0,55
С уровнем значимости α = 0,05 проверить гипотезу о показательном законе i
распределения P(ξ = i ) = (1 − a )a (см. пример 11.1), где ξ - случайное количество пойманных рыб. Решить задачу для заданного значения параметра a = 0,6 и для случая, когда a оценивается по выборке, как это сделано в примере 11.1. Решение. Для проверки гипотезы о законе распределения случайной вели2
чины ξ применим критерий χ . Отметим сразу, что частоты m9 = 3 и m10 = 3 малы (рекомендуется не менее 5-6). Поэтому объединим два последних столбца в один, считая его частотой m9 = 3 + 3 = 6. Случай 1. Пусть параметр задан, т. е. a = 0,6. Найдём вероятность pi попадания в интервалы нашей таблицы. Для i = 0, 1, …, 8 эти вероятности вычисляются по формуле i
i
pi = P(ξ = i ) = (1 − a )a = 0,4 × 0,6 , i = 0, 1, …, 8, и они записаны в третьей строке таблицы. Последняя вероятность в этой строке дополняет остальные до единицы: p9 = 1 − ( p0 + p1 + ... + p8 ) = 0,010 . Фактически p9 – вероятность того, что ξ ≥ 9 . Это сделано для того, чтобы сумма всех вероят-
- 31 ностей в строке была равна единице и чтобы были учтены все возможные значения ξ . 2
Далее вычислим значение χ по формуле (13.2): 2
9
(mi − npi )2
i =0
npi
χ =∑ ... +
9
=∑
i =0 2
(6 − 1000 × 0,010) 1000 × 0,010
(mi − 1000 pi )2 (437 − 1000 × 0,400 )2 = 1000 × 0,400
npi
+ ...
= 18,76 .
2
Итак, χ = 18,76. Вычислим число степеней свободы по формуле (13.3): ν = r − 1 = 10 − 1 = 9 , где r = 10 – количество интервалов. Из таблицы 3 приложения при ν = 9 и α = 0,05 находим критическое значение 2
2
2
2
χα = χ 0,05 = 16,92 . Оказалось, что χ > χ 0,05 , поэтому проверяемая гипотеза отвергается. При этом уровень значимости α = 0,05 есть вероятность отвергнуть правильную гипотезу. Поэтому, вообще говоря, мы не можем с полной уверенностью утверждать, что отвергнутая нами гипотеза не верна. Случай 2. Пусть теперь параметр α неизвестен. В этом случае в качестве α *
возьмём его оценку α . В примере 11.1 такая оценка получена двумя методами с одним и тем же результатом: * x a = , 1+ x где x - среднее арифметическое наблюдаемых значений ξ . В нашем примере x =
1 10 1 (437 × 0 + 250 × 1 + ... + 3 × 10 ) = 1,263 и mi × i = ∑ 1000 i = 0 1000
1,263 ≈ 0,55 . 1 + 1,263 Значения pi при a = 0,55 приведены в четвёртой строке таблицы аналогично её третьей строке. ∗
a =
2
Далее вычисляем χ = 6,92. Число степеней свободы в рассматриваемом случае находится по формуле (13.4): ν = r − l − 1 = 10 − 1 − 1 = 8 , где r = 10 – количество интервалов и l = 1 – количество параметров распределения, оценённых по выборке (у нас это один параметр a). По таблице 3 приложения при ν = 8 и α = 0,05 находим критическое значение 2
2
2
2
χα = χ 0,05 = 15,51 . Оказалось, что χ < χ 0,05 , поэтому проверяемая гипотеза принимается.
- 32 Опять-таки, это ещё не означает, что данная гипотеза непременно верна. Мы можем только утверждать, что она достаточно хорошо согласуется с имеющимися наблюдениями, т. е. правдоподобна.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Вентцель Е. С. Теория вероятностей. /Е. С. Вентцель. – М.: Наука, 1964. – 412 с. 2. Чистяков В. П. Курс теории вероятностей. /В. П. Чистяков. – М.: Наука, 1987. – 345 с. 3. Гнеденко Б. В. Курс теории вероятностей. /Б. В. Гнеденко. – М.: Наука, 1971. – 346 с. 4. Гмурман В. Е. Теория вероятностей и математическая статистика. /В. Е. Гмурман. – М.: Высшая школа, 1972. – 368 с. 5. Гмурман В. Е. Руководство к решению задач по теории вероятностей и математической статистике. /В. Е. Гмурман.– М.: Высшая школа, 1975. – 378 с. 6. Розанов Ю. А. Лекции по теории вероятностей: Учебное пособие для втузов. /Ю. А. Розанов.– М.: Наука, 1986. – 120 с. 7. Вентцель Е. С. Теория вероятностей. Задачи и упражнения. /Е. С. Вентцель, Л. А. Овчаров.– М.: Наука, 1973. – 365 с. 8. Чудесенко В. Ф. Сборник заданий по специальным курсам высшей математики (типовые расчёты). /В. Ф. Чудесенко.– М.: Высшая школа, 1983. – 112 с.
- 33 -
ПРИЛОЖЕНИЕ Таблица 1 Значения uΘ , удовлетворяющие равенству 2Φ (u Θ ) = Θ Θ uΘ
0,9 1,645
0,95 1,960
0,98 2,326
0,99 2,576
0,998 3,09
Таблица 2 t
Значения t Θ , удовлетворяющие равенству 2 ∫ S n −1 ( x )dx = Θ , 0
где S n −1 ( x ) - плотность распределения Стьюдента с n − 1 степенями свободы Θ n −1
5 6 7 8 9 10 12 14 16 18 20 22 30
∞
0,9
0,95
0,98
0,99
2,015 1,943 1,895 1,860 1,833 1,812 1,782 1,761 1,746 1,734 1,725 1,717 1,697 1,645
2,571 2,447 2,365 2,306 2,262 2,228 2,179 2,145 2,120 2,101 2,086 2,074 2,042 1,960
3,365 3,143 2,998 2,895 2,821 2,764 2,681 2,624 2,583 2,552 2,528 2,508 2,457 2,326
4,032 3,707 3,499 3,355 3,250 3,169 3,055 2,977 2,921 2,878 2,845 2,819 2,750 2,576
Таблица 3 +∞
2
Значения xα , удовлетворяющие равенству ∫ p v (x )dx = α , x α2
где pv ( x ) - плотность хи-квадрат распределения с v степенями свободы α v 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0,99
0,98
0,95
0,90
0,80
0,70
0,50
0,30
0,20
0,10
0,05
0,02
0,01
0,001
0,000 0,020 0,115 0,297 0,554 0,872 1,239 1,646 2,090 2,560 3,050 3,570 4,110 4,660 5,230 5,810 6,410 7,020 7,630 8,260 8,900 9,540 10,20 10,86 11,52 12,20 12,88 13,56 14,26 14,95
0,001 0,040 0,185 0,429 0,742 1,134 1,564 2,030 2,530 3,60 3,610 4,180 3,760 5,370 5,980 6,610 7,260 7,910 8,57 9,240 9,920 10,60 11,29 11,99 12,70 13,41 14,12 14,85 15,57 16,31
0,004 0,103 0,352 0,711 1,145 1,635 2,170 2,730 3,320 3,940 4,580 5,230 5,890 6,570 7,260 7,960 8,670 9,390 11,11 10,85 11,59 12,34 13,09 13,85 14,61 15,38 16,15 16,93 17,71 18,49
0,016 1,211 0,584 1,064 1,610 2,200 2,830 3,490 4,170 4,860 5,580 6,300 7,040 7,790 8,550 9,310 10,08 18,86 11,65 12,44 13,24 14,04 14,85 15,66 16,47 17,29 18,11 18,94 19,77 20,60
0,064 0,446 1,005 1,649 3,340 3,070 3,820 4,590 5,380 6,180 6,990 7,810 8,630 9,470 10,31 11,15 12,00 12,86 13,72 14,58 15,44 16,31 17,19 18,06 18,94 19,82 20,70 21,60 22,50 23,40
0,148 0,713 1,424 2,200 3,000 3,830 4,670 5,530 6,390 7,270 8,150 9,030 9,930 10,82 11,72 12,62 13,53 14,44 15,35 16,27 17,18 16,10 19,02 19,94 20,90 21,80 22,70 23,60 24,60 25,50
0,455 1,386 2,370 3,360 4,350 5,350 6,350 7,340 8,340 9,340 10,34 11,34 12,34 13,34 14,34 15,34 16,34 17,34 18,34 19,34 20,30 21,30 22,30 23,30 24,30 25,30 26,30 27,30 28,30 29,30
1,074 2,410 3,660 4,880 6,060 7,230 8,380 9,520 10,66 11,78 12,90 14,01 15,12 16,22 17,32 18,42 19,51 20,60 21,70 22,80 23,90 24,90 26,00 27,10 28,20 29,20 30,30 31,40 32,50 33,50
1,642 3,220 4,640 5,990 2,290 8,560 9,800 11,03 12,24 13,44 14,63 15,81 16,98 18,15 19,31 20,50 21,60 22,80 23,90 25,00 26,20 27,30 28,40 29,60 30,70 31,80 32,90 34,00 35,10 36,20
2,710 4,600 6,250 7,780 9,240 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,10 22,30 23,50 24,80 26,00 27,20 28,40 29,60 30,80 32,00 33,20 34,40 35,60 36,70 37,90 39,10 40,30
3,840 5,990 7,820 9,490 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,00 22,40 23,70 25,00 26,30 27,60 28,90 30,10 31,40 32,70 33,90 35,20 36,40 37,70 38,90 40,10 41,30 42,60 43,80
5,410 7,820 9,840 11,67 13,39 15,03 16,62 18,17 19,68 21,20 22,60 24,10 25,50 26,90 28,30 29,60 31,00 32,30 33,70 35,00 36,30 37,70 39,00 40,30 41,70 42,90 44,10 45,40 46,70 48,00
6,640 9,210 11,34 13,28 15,09 16,81 18,48 20,10 21,70 23,20 24,70 26,20 27,70 29,10 30,60 32,00 33,40 34,80 36,20 37,60 38,90 40,30 41,6 43,00 44,30 45,60 47,00 48,30 49,60 50,90
10,83 13,82 16,27 18,46 20,50 22,50 24,30 26,10 27,90 29,60 31,30 32,90 34,60 36,10 37,70 39,30 40,80 42,30 43,80 45,30 46,80 48,30 49,70 51,20 52,60 54,10 55,50 56,90 58,30 59,70
- 35 -
35
ОГЛАВЛЕНИЕ ОБЩИЕ УКАЗАНИЯ ........................................................................................... 3 7. ХАРАКТЕРИСТИЧЕСКАЯ ФУНКЦИЯ ....................................................... 3 7.1 Определение и свойства характеристической функции ............................ 3 7.2 Указания к задачам 23 и 24 ........................................................................... 4 8. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ФУНКЦИЙ СЛУЧАЙНЫХ ВЕЛИЧИН ............................................................. 6 8.1. Указания к задачам 25 и 26 .......................................................................... 8 8.2. Указания к задаче 27 ..................................................................................... 9 8.3. Указания к задаче 28 ..................................................................................... 10 8.4. Указания к задаче 29 ..................................................................................... 12 9. ДВУМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ................................................ 13 9.1. Указания к задаче 30 ..................................................................................... 14 10. ЗАКОН БОЛЬШИХ ЧИСЕЛ И ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА ............................................................................................................. 18 10.1. Указания к задачам 31-33 ........................................................................... 19 11. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ...................................................... 21 11.1. Указания к задачам 34 и 35 ........................................................................ 22 12. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ .................................................................... 23 12.1. Указания к задаче 36 ................................................................................... 25 12.2. Указания к задачам 37 и 38 ........................................................................ 26 12.3. Указания задачам 39 и 40 .......................................................................... 27 13. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. 2
КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА χ ........................................................... 28 2
13.1. Критерий согласия χ ................................................................................. 29 13.2. Указания к задаче 41 ................................................................................... 30 БИБЛИОГРАФИЧЕСКИЙ СПИСОК ................................................................. 32 ПРИЛОЖЕНИЕ .................................................................................................... 33
36
Учебное издание ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ТИПОВОМУ РАСЧЕТУ ДЛЯ СТУДЕНТОВ ВСЕХ СПЕЦИАЛЬНОСТЕЙ ч. 2 Составители: Крашенинников Виктор Ростиславович Крашенинникова Лидия Александровна Селиванов Владимир Владимирович Редактор Н. А. Евдокимова Подписано в печать 30.10.2003. Формат 60x84/16. Бумага тип № 1. Печать трафаретная. Усл. печ. л. 2,09. Уч. – изд. л. 2,00. Тираж 300 экз. Заказ Ульяновский государственный технический университет 432027, г. Ульяновск, ул. Северный Венец, д. 32 Типография УлГТУ, 432, г. Ульяновск, ул. Северный Венец, д. 32