МИНИСТЕРССТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Физический факультет Кафедра радиофизики
Лабораторный практикум по курсу «Вычислительные методы обработки и планирования эксперимента»
для студентов 2 курса дневного отделения по спец. 071500 (радиофизика и электроника), 200.200 (микроэлектроника и п/п)
Составители: Доц. Ю.С. Радченко К.ф.-м.н. Т.М. Овчинникова
Воронеж 2000
2
ЛАБОРАТОРНАЯ РАБОТА № 1 МОДУЛЬНАЯ ОРГАНИЗАЦИЯ ПРОГРАММ НА PASCAL VAX/VMS ОБЩИЕ СВЕДЕНИЯ. Программы, созданные в среде PASCAL для ОС VAX/ VMS, могут быть построены по модульному принципу. При этом взаимодействие файлов с модулями может быть выполнено на следующих этапах работы: 1. Работа с файлами на языке PASCAL. 2. Работа с файлами в объектных кодах. 3. Работа ЕХЕ-файлов с файлами данных. Рассмотрим эти варианты. 1. Директива %INCLUDE Директива %INCLUDE позволяет обращаться к тексту файла, написанного на языке PASCAL, во время компиляции основной программы. Когда компилятор обнаруживает эту директиву, он останавливает чтение исходного файла и начинает чтение включаемого файла до его конца. Затем продолжается компиляция исходного файла со строки, следующей за %INCLUDE. Включаемые модули не являются самостоятельными компиляционными единицами. Директива %INCLUDE может быть в любом месте программы, где разрешен комментарий. Формат директивы %INCLUDE: %INCLUDE 'спецификация файла' Пример 1. Основной файл INCLUDE_TEST.PAS Program Include_test(input, output); %INCLUDE 'CLS.PAS' begin CLS; end. Включаемый файл CLS. PAS Procedure CLS; begin write(CHR(155),'2J'); end. 2. Компиляционная единица MODULE На языке PASCAL имеется две компиляционные единицы: программы - PROGRAM и модули - MODULE. Модуль может быть скомпилирован, но самостоятельно он не может работать. Командой ОС LINK объектные модули могут быть подключены к объектному файлу основной программы. Пример 2. Файл A_CLS Program a_cls(output); Procedure CLS; external; begin CLS; end.
Файл B_CLS Module b_cls(output); [global] Procedure CLS; begin write(chr(155),'2J') end; end.
3
Порядок действия следующий VAX> PAS А,В (* этап компиляции программы и модуля *) VAX> LINK А,В (* этап компоновки программы и модуля *) VAX> RUN А (* исполнение программы * ) В программе используются атрибуты EXTERNAL, а в модуле GLOBAL. В основной программе приводится только заголовок процедуры, а вместо тела ставится директива EXTERNAL. Заметим, что в Примере 2 в программе A_CLS.PAS вместо полного формата директивы [EXTERNAL]: [external] Procedure CLS; external; используется сокращенный:
Procedure CLS; external. В ряде случаев удобно, чтобы некоторые константы, переменные или нестандартные типы использовались совместно и в главной программе, и в модулях. Средства языка позволяют компиляционным единицам совместно использовать объявления и определения двумя способами: - использование глобальных и внешних идентификаторов с атрибутами [GLOBAL] и [EXTERNAL]; - использование файлов среды с атрибутами [ENVIRONMENT] и [INHERIT]. В соответствии с первым методом переменные и подпрограммы, объявленные в одной компиляционной единице, могут использоваться в другой. В первой они должны иметь атрибут [GLOBAL], а во второй [EXTERNAL]. Атрибуты [GLOBAL] и [EXTERNAL] могут быть применены к описаниям любых переменных, процедур и функций, кроме констант и типов, введенных пользователем. Другой механизм совместного использования не только переменных, процедур и функций, но также констант и типов, введенных пользователем, состоит в создании файлов среды. Формат директив следующий: основная программа [ENVIRONMENT('test.pen')] Program A_test(input, output); модуль [INHERIT('test.pen')] module B(input, output); В процессе передачи описаний из A_test создается вспомогательный файл test.реn, который включает в себя наследуемую среду. Файл среды не включает метки. Пример 3. [ENVIRONMENT('test.pen')] Program A_test(input, output); (* Вычисление корня уравнения F (x ) = 0 *) const pi=3.1415926; eps=le-5; d=1.4121; var x, xn, xd: real; Function F: real; external; begin write('XO='); readln(x); repeat
4
xn:=F/d; dx:=abs(x-xn); x:=xn; until dx<eps; writeln( 'Корень уравнения=',x:5:3); end. (* Вычисление функции F (x ) в виде ряда *) [INHERIT( 'test.pen')] module B(input, output); [global] function F : real; Var K : integer; c, z, : real; p begin z:=d*x/pi; p:=l; k:=0; repeat c:=l-(z/(2*k+l))**2; p:=p*c; k:=k+l; until (l-c)<eps; f:=p; end; end. 3. Обработка ввода-вывода данных из файлов Язык PASCAL для ОС VAX/VMS позволяет осуществлять a) последовательный; b) параллельный (прямой) и другие виды доступа к компонентам файла. При последовательном доступе компоненты файла обрабатываются одна за другой. При прямом - компоненты пронумерованы и могут обрабатываться в любом порядке (аналогия с элементами массива). Основные процедуры, связанные с вводом / выводом: 1. Процедуры OPEN и CLOSE. OPEN открывает файл, позволяет задавать файловые параметры и определяет метод доступа, a CLOSE закрывает файл. Простейшая форма процедур: OPEN(f, 'имя файла' ,история); CLOSE(f); Здесь f - описанная в программе файловая переменная; 'имя файла' - спецификация файла, связываемого с файловой переменной f; история - a) NEW, б) OLD, в) UNKNOWN, г) READONLY. NEW - открывает новый файл, OLD - открывает существующий файл, UNKNOWN указывает, что необходимо открыть старый файл. Если же его нет, то создается новый, при этом READONLY указывает, что существующий файл открывается только для чтения. При необходимости организовать прямой доступ к элементам файла (за исключением файла типа text и varying of char) используется следующая форма открытия файла OPEN(f, 'имя файла' , 'история',,direct); или
5
OPEN(f, 'имя файла' , 'история', accsess_method:=direct); 2. Процедуры чтения данных из файлов с последовательным доступом: RESET(f) - готовит файл для считывания; READ(f, список вывода) - считывает одну или несколько файловых компонент; GET(f) - передвигает указатель файла на одну позицию и передает компоненту в буферную переменную f ^. EOF(f) – функция определяющая конец файла f. Функции READ и GET взаимосвязаны. Так, например, оператор READ(f, x) эквивалентен операторам : x:= f ^ ; GET(f). 3. Процедуры записи в файл с последовательным доступом : REWRITE(f) - подготавливает файл для записи; WRITE (f, список вывода) - записывает данные в файл; PUT(f) - прибавляет компоненту в файл. Функции WRITE и PUT также взаимосвязаны. Так, оператор WRITE(f,x) эквивалентен операторам: x:= f ^ ; PUT(f). Пример 4. (* Чтение данных из файла последовательного доступа E1.dat, находящегося в корневом каталоге [000000] рабочего диска *) Program E(input, output); Var x,y: real; f : file of real; begin open(f, ‘[000000]E1.dat’, old); reset(f); while not eof(f) do begin read(f,x,y); writeln(x:5:3,y); end; close(f); end. 4. Процедуры прямого доступа: FIND(f, n) - режим чтения "n" компоненты файла в буферную переменную f ^; LOCATE(f, n) - режим записи "n" компоненты в файл из буферной переменной f ^. Применяется в следующей совокупности операторов: а) FIND(f,n); х:=f ^; б) LOCATE(f,n); f ^:=х; PUT(f). Пример 5. (* Работа с файлом прямого доступа *) Program PARALL(input, output); var i,k : integer; f : file of real; begin open(f, 'par.dat', new,, direct);
6
rewrite(f); for i:=l to 100 do write(f,i); close(f); open(f, 'par.dat', old ,, direct); find(f,10); k:=f ^; write(k); locate(f,25); f ^:=0; put(f); close (f); end. Здесь создается файл 'par.dat' из 100 целых чисел. Затем производится считывание 10ой компоненты файла. Далее в 25 компоненту файла заносится число 0.
Задание I. 1. Используя алгоритм x =
12
∑ (RND − 0.5) ,
написать процедуру формирования случайных
i =1
чисел x. 2. Оформить ее как внешний модуль. 3. В основной программе сформировать выборку объемом n =500, 1000 и найти n
n
i =1
i =1
x = ∑ xi n , s = ∑ (xi − x )2
(n − 1).
Датчик случайных равномерно распределенных чисел RND из библиотеки математических функций должен быть описан в модуле следующим образом: Function RND : real; external; Обращение к этой функции, например, a:=RND; или S:=S+RND-0.5;
Задание II. 1. Обратиться к файлам данных, содержащих выборки случайных величин с заданной статистикой. 2. Вывести данные и приближенно классифицировать их по типам: — дискретные случайные величины; — непрерывные случайные величины (однополярные); — непрерывные случайные величины (двуполярные). 3. Определить минимальное xmin , максимальное xmax значения, размах выборки (xmax − xmin ), выборочное среднее x и выборочную дисперсию s 2 . Задание III. 1. Обратиться к внешним процедурам, формирующим случайные величины с заданной статистикой: a) Procedure GAUSS(var gl,g2: real); external; b) Procedure NORMAL(m, s :real; var x: real); external; c) Procedure RELEY(l: real; var x: real); external; d) Procedure REXP(l: real; var x: real); external; e) Procedure POIS(l: real; var kx: integer); external; f) function RND: real; external; 2. Сформировать массив из 500 случайных чисел и записать его в файл. 3. Считать данные из файла и найти xmin , xmax , (xmax − xmin ) , x , s 2 .
7
ЛАБОРАТОРНАЯ РАБОТА № 2 ПРИМЕНЕНИЕ ИНТЕГРАЛА ВЕРОЯТНОСТИ ДЛЯ АНАЛИЗА ДАННЫХ ОБЩИЕ СООТНОШЕНИЯ. Стандартная гауссовская случайная величина η → N (0,1) имеет плотность вероятности
(
W (x ) = exp − x 2 2
)
2π
(1)
и функцию распределения Φ(x ) =
x
(
)
exp − t 2 / 2 dt ∫ π 2 −∞
(2)
(
)
Для произвольной гауссовской случайной величины x → N m, σ 2 плотность вероятности W(x) и функция распределения F(x) имеют вид : W (x ) =
(
exp − (x − m ) / 2σ 2 2
2πσ 2
),
(
)
exp − (t − m ) / 2σ 2 x−m F (x ) = Φ dt = ∫ σ −∞ 2πσ 2 x
2
(3)
На рис .1. показана эволюция графиков W(x) и F(x) при разных т и σ 2 . W(x)
W(x)
σ2=const m1<m2
m=const σ1<σ2
σ1
σ2
m
F(x)
F(x)
1
1
m1
σ1 σ2
m2 m1
m2
m
Функция Φ(− x) = 1 − Φ(x ), − ∞ < x < ∞ , Φ(0) = 0.5 . Кроме функции Φ(x ) , в вероятностных расчетах используются функции 2 erf (x ) = π Φ 0 (x ) =
x
∫ exp(− t ) 2
0
(
2 dt , erfc(x ) = 1 − erf (x ) = π
)
1 x exp − t 2 / 2 dt . ∫ 2π 0
∞
∫ exp(− t ) dt , 2
(4)
x
(5)
8
Для этих функций имеют место соотношения erf (− x) = −erf ( x); 0 < erf ( x) < 1; erf (0) = 0; erf (∞) = 1; Φ 0 (− x) = −Φ 0 ( x); 0 < Φ 0 ( x) < 0.5; Φ 0 (0) = 0; Φ 0 (∞) = 0.5; С интегралом вероятности эти функции связаны соотношениями
(
(
Φ( x) = 1 + erf x
2
)) 2;
( )
erf ( x) = 2Φ x 2 − 1;
(6)
Φ( x) = 0.5 + Φ 0 ( x); Φ 0 ( x) = Φ ( x) − 0.5;
(7)
Тогда вероятность Ρ(a < η < b ) выражается через введенные функции следующим образом:
( (
Ρ(a < η < b ) = Φ (b) − Φ (a ) = erf b
)
(
2 − erf a
2
)) 2 ;
Ρ(a < η < b ) = Φ (b) − Φ (a ) = Φ 0 (b) − Φ 0 (a ) .
(
Характеристическая функция ϕ (u ) гауссовской случайной величины x → N m, σ 2
)
равна
ϕ (u ) =
∫ exp( jux − (x − m)
+∞
1
2
2πσ 2 − ∞
)
(
/ 2σ 2 dx = exp jum − (uσ )2 / 2
)
(8)
Центральные моменты µ k равны: 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (k − 1)σ k , k − четное µ k =< (x − m ) k >= 0, k − нечетное
(9)
РАСЧЕТНЫЕ СООТНОШЕНИЯ. Так как интеграл вероятности Φ(x ) является специальной функцией, то простого аналитического соотношения для Φ(x ) нет. Для расчета Φ(x ) можно использовать следующие аппроксимации
(
)(
Φ(x ) = 1− exp − x 2 2 a1t + a2t 2 + a3t 3 t = 1 (1 + p x );
)
2π + ε ; x > 0; ε < 10−5 ;
p = 0.33267; a1 = 0.4361836; a2 = −0.1201676; a3 = 0.937298;
(
)(
Φ(x ) = 1 − exp − x 2 2 b1t + b2t 2 + b3t 3 + b4t 4 + b5t 5 t = 1 (1 + p x );
(10)
)
2π + ε ; ε < 7.5 ⋅ 10−8 ;
(11)
p = 0.2316419; a1 = 0.31938153; a 2 = −0.356563782;
b3 = 1.781477937; b4 = −1.821255978; b5 = 1.330274429; Для уточнения значений Ф(x) при малых и больших аргументах х могут применяться a) степенной ряд ( x > 0 )
9
1 1 x3 x5 ( − 1) n x 2 n +1 Φ(x ) = + + + ... + x− . 2 6 40 2π n!2n (2n + 1)
(12)
Рекомендуемый для расчетов диапазон аргументов 0 < х < 3. b) асимптотический ряд ( x > 0 )
(
exp − x 2 2 Φ(x ) = 1 − 2π ⋅ x
)1 − 1 + 3 + ... + (− 1) n1⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1)
x2
x4
x 2n
(13)
Для расчетов целесообразно брать n = 7 и x > 2.5 ...5 . Для решения обратной задачи нахождения квантиля х нормального распределения, определяемого из соотношения
( )
Φ x p = P или x p = Φ −1 (Ρ ) можно использовать следующие соотношения: x=t−
a0 + a1t + ε , где t = − 2 ln( y ), ε < 3 ⋅ 10−3 ; 1 + b1t + b2t
(14)
у = 1 - P , x p = x при 0.5 < P < 1; у = P , x p = − x при 0
(15)
a0 = 2.30753 ; a1 = 0.27061 ; b1` = 0.9922 ; b2 = 0.04481.
(16)
Подпрограмма-функция OGAUSS(y) в модуле OG производит вычисление x = Φ ( y ) по формулам (14),(15),(16). module OG (input, output); [global]function OGAUSS (y: real):real; const a0=2.30753; al=0.27061; bl=0.99229; b2=0.04481; var p, t, x: real; begin (* function *) if y>0.5 then p:=l-y else p:=y; t:=sqrt(-2*LN(p)); x:=t-(a0+al*t)/(l+t*(bl+b2*t); if y>0.5 then ogauss:=x else ogauss:=(-x); end. (* module *) Пример использования функции OGAUSS в программе MOG. program MOG (input,output); var u,p: real; function OGAUSS (y:real):real; external; begin (* mog *) write('p= '); readln(p); u:=OGAUSS(p); writeln('p= ', p:6:4, 'u= ',u:6:4); end. (* mog *) Программные единицы OG.PAS и MOG.PAS могут транслироваться раздельно, a на −1
10
этапе компоновки объединяются командой LINK MOG, OG.
Контрольные задания 1) 2) 3) 4) 5)
Запрограммировать вычисление по формуле (10); Запрограммировать вычисление по формуле (11); Запрограммировать вычисление по формуле (12); Запрограммировать вычисление по формуле (13); Запрограммировать вычисление Φ −1 ( y ) с использованием модуля OG.
Контрольные значения Ф(х) приведены в Таблице 1 Приложения.
Задачи 1. Задана стандартная гауссовская случайная величина η → N (0,1) . Записать выражение,
(
)
описывающее преобразование η в случайную величину x → N m, σ 2 .
( )
2. Заданы случайная величина x → N 0,σ 2 и интервал [a ; b] , не включающий в себя начало координат. При каком значении σ 2
Ρ[a < x < b]будет наибольшей.
3. Для стандартной гауссовской случайной величины x → N (0,1) вероятность какого из неравенств больше P( x < 0.7 ) или P( x > 0.7 ) .
4. Генератор шума вырабатывает гауссовский случайный процесс с параметрами m=0 и
σ = 1.5 вольта. Чему равна вероятность того, что мгновенные значения шума находятся в интервале [-1.5 в; +1.5 в], [-3 в; +3 в], [-4.5 в; +4.5 в]. 5. На пороговое устройство с напряжением срабатывания 0.5 вольт подается гауссовский шум с параметрами т=0 и σ = 0.25 в. Рассчитать вероятность превышения мгновенными отсчетами шума порогового уровня. 6. Рассчитать вероятность пропуска импульса с амплитудой А=0.4 в, 0.6 в, 1 в, 1.5 в, поступающего вместе с шумом с параметрами т=0 и σ = 0.5 в на пороговое устройство с уровнем срабатывания 0.6 в. 7. Найти квантиль гауссовского распределения, соответствующий вероятности Ρ = 0.4, 0.9, 0.95, 0.99 .
(
)
8. Результат измерения является случайной величиной x → N m, σ 2 , где т = 10, σ=5. Найти
симметричный
относительно
т
интервал,
в
который
с
вероятностью
P0 = 0.5,0.8,0.9,0.95 попадает измеренное значение. 9. Вероятность ложной тревоги при обнаружении на интервале, содержащем «m» элементов разрешения, определяется выражением PЛТ = 1 − Φ m (u ) . Рассчитайте вероятность ложной тревоги для u ∈ [0 ; 3] с шагом ∆u=0.5 при значениях m=1, 10, 20. 10. Вероятность ошибки различения неортогональных видеосигналов определяется форму-
(
)
лой ΡОШ = 1 − Φ u (1 − Rs ) 2 Рассчитайте зависимость PОШ (u ) для u ∈ [0 ; 6] при значениях RS =0.2, 0.5, 0.8. 11. Вероятность пропуска сигнала определяется выражением β = Φ (h − u ) , где h- порог обнаружения. Найдите зависимость β (u ) для u ∈ [1... 6] при h = 1.5,2.3 .
11
ЛАБОРАТОРНАЯ РАБОТА № 3 РАСЧЕТ ВЕРОЯТНОСТЕЙ НА ОСНОВЕ ХИ-КВАДРАТ РАСПРЕДЕЛЕНИЯ ОБЩИЕ СООТНОШЕНИЯ. Случайная величина χ n2 характеризуется в общем случае плотностью вероятности W ( x) =
x
n −1 2
(2σ ) Г (n 2) 2
n 2
(
)
exp − x 2σ 2 , 0 < x < ∞ .
(1)
Величина n определяет число степеней свободы. При σ = 1 распределение (1) преобразуется в стандартное хи-квадрат распределение
W ( x) =
n −1 x2 n 22
exp(− x 2) 0 < x < ∞ .
Г (n 2)
(
Характеристическая функция: ϕ (u ) = 1 1 − j 2uσ 2 Коэффициенты
(2)
асимметрии
γ1 = 8 n ,
)n 2
(3)
эксцесса
γ 2 = 12 n , то есть при n → ∞ наблюдается эффект
W(x)
n=1
нормализации. График W(x) при различных п и σ = 1 приведен на рисунке. Случайная величина χ n2 связана с независимыми
(
нормальными случайными величинами x → N 0, σ 2 соотношением χ n2 =
n
∑ xi2 ,
)
2 4 10
i = 1, n .
5
i =1
10
x/σ2
Мода распределения: m0 = (n − 2)σ 2 . Начальный момент k -ого порядка: mk = (2σ )k Г (k + n 2) Г (n 2).
(4)
Кумулянты равны: k k +1 = 2 k k!nσ 2k + 2 .
(5)
( )
Отсюда матожидание т1 и дисперсия D χ n2 : m1 = nσ 2
( )
D χ n2 = 2nσ 4 (6)
РАСЧЕТНЫЕ СООТНОШЕНИЯ. Функция распределения Fχ 2 (x ) в общем случае выражается интегралом Fχ 2 (x ) = (Г (n 2))
−1
x / 2σ 2
∫ 0
n
−1
t 2 exp(− t )dt
(7)
12
Приведем некоторые частные случаи выражений для Fχ 2 (x ) при σ 2 = 1 : n = 1 : Fχ 2 (x ) = 2Φ
( x )− 1;
n = 2 : Fχ 2 (x ) = 1 − exp(− x / 2 ); k −1
n = 2k : Fχ 2 (x ) = 1 − exp(− x / 2 ) ∑ (x / 2 )i i!;
(8)
i =0
n = 2k + 1 : Fχ 2 (x ) = 2Φ
( x )− 1 −
k x(2i −1) / 2 2 exp(− x / 2 )∑ ; π i =11 ⋅ 3 ⋅ ... ⋅ (2i − 1)
На практике нередко используются следующие два разложения Fχ 2 (x ) в ряд, справедливые для любых п ∞ (− 1) k (x / 2 ) n / 2 + k 1 Fχ 2 (x ) = , ∑ Γ(n / 2 ) k = 0 k!(k + n / 2 )
(9)
n
∞ (x / 2) k x 2 exp(− x / 2 ) Fχ 2 (x ) = 1 + ∑ . 2 Γ(1 + n / 2 ) k =1 (1 + n / 2)(2 + n / 2)...(k + n / 2)
(10)
Вычисление рядов (9) и (10) целесообразно производить с двойной точностью. Учитывая нормализацию случайной величины χ n2 при n → ∞ , можно применять следующие аппроксимации функций распределения : Fχ 2 (x ) = Φ(x1 ) x1 = 2 x − 2n − 1, n > 100,
[
]
Fχ 2 (x ) = Φ (x2 ) x2 = (x / n )1 3 − (1 − 2 / 9 n )
(11)
2 9n ,
n > 30 .
(12)
Нахождение квантиля x p распределения вероятности Р из соотношения x p = F −21 (P ) χ
на основании (11), (12) может быть выполнено, как
(
)2
x p = 0.5 Φ −1( p ) + 2n − 1 , n > 100,
(
(14)
)3
x p = n 1 − 2 / 9n + Φ −1( p ) 2 / 9n , n > 30.
(15)
Здесь и выше Φ(x ) - гауссовский интеграл вероятности. Вычисление функции распределения Fχ 2 (x ) согласно выражению (9) осуществляется подпрограммой функцией XIQ(x, n) в модуле XIQ. В этой функции используется обращение к внешней функции GAMMA(L), определяющей значение стрирует применение функции XIQ(x, n):
Г( n 2). Программа F_HI иллю-
13
module XIQ(input, output); (* вычисление хи-квадрат функции распределения *) [global]function XIQ(x: double; n: integer):double; const eps=1d-15; var c,L,s,z: double; k: integer; function GAMMA(L: double):double; external; begin (* function *) L:=n/2.0; z:=x/2; c:=l/L; k:=0; s:=c; while abs(c)>eps do begin k:=k+1; c:=-c*z*(L+k-1)/(k*(L+k)); s:=s+c; end; (* while *) xiq:=s*(z**L)/gamma(L); end; (* xiq *) end. (* module *) program F_HI (input, output); var u,p: double; n: integer; function XIQ(x: double; n: integer):double; external; begin (* F_HI *) write('u='); readln(u); write('n= '); readln(n); p:=xiq(u,n); writeln('u= ',u:6:4, ' F(u)= ',p:6:4); end.(* F_HI *) module GAMMA(input, output); [global]function GAMMA(L:double):double; const d=1.7724538509; var
g:
double;
14
i,k,m,n:
integer;
begin (* function *) n:=trunc(2*L+0.001); m:=n div 2; k:=n mod 2+1; g:=l; case k of 1:
begin for i:=1 to m-1 do g:=g*i; gamma :=g; end;
2: begin for i:=1 to m do g:=g*(2*i-1)/2; gamma :=g*d; end; end; end; (* function *) end. (* module *)
Задания 1. Запрограммировать вычисление Fχ 2 (x ) по формуле (8) при n = 2k = 6, 10, 30, 50 2. Запрограммировать вычисление Fχ 2 (x ) по формуле (8) при n=2k+1=5,15,25.
3. Запрограммировать вычисление Fχ 2 (x ) по формуле (10), используя удвоенную точность вычислений.
4. Используя программу вычисления Fχ 2 (x ) при n= 2k = 6, 10, 30, 50, сравнить результаты с
[
вычислениями по формуле (11) и Φ (x − n )
2n
] (гауссовская асимптотика χ n2 ) при зна-
чениях x = n , n / 2, n . 5. Используя программу вычислений Fχ 2 (x ) при п = 2k = 6, 10, 30, 50, сравнить результаты с вычислениями по формуле (12). 6. Написать программу вычисления квантиля x p по формуле (15).
Задачи 1. Найти вероятность срабатывания обнаружителя с квадратичным накоплением, если на
15
(
)
входе присутствует гауссовский процесс x → N 0, σ 2 . Число накапливаемых импульсов n=4, 8, 14, 20, а порог срабатывания h = nσ 2 2. При обнаружении с квадратичным накоплением гауссовских импульсов x → N (0,1) используется двухпороговое решающее устройство. Найти вероятность события
[
]
Ρ h1 < χ n2 < h 2 для h 1 = 2n , h 2 = 5n при n = 4, 8, 16, 30. 3. Найти порог обнаружения при квадратичном накоплении гауссовских импульсов x → N (0,1) при σ=2 мв и n=10, 20, если вероятность обнаружения P=0.9, 0.99.
( )
4. Сколько импульсов п, имеющих гауссовское распределение x → N 0,σ 2 при σ=5 мв, необходимо просуммировать в квадратичном накопителе, чтобы вероятность обнаружения Р была не менее 0.9, 0.95, 0.99 при h=100 мв2. 5. Время накопления T счетчиком Гейгера "k" импульсов описывается χ n2 (x ) законом распределения при n=2k и x = 2T τ 0 , где τ 0 - средний интервал между импульсами. Найти вероятность того, что время накопления 20 импульсов превысит 5, 10, 15 сек при τ 0 = 1 сек, 0.5 сек. 6. Найти квантиль хи-квадрат распределения, соответствующий P=0.5, 0.8, 0.9, 0.95. 7. Найти порог, вероятность превышения которого случайной величиной с хи-квадрат распределением равна 0.05, 0.1, 0.2 при n=2,8,16. 8. Интегральная интенсивность световой волны описывается χ n2 законом распределения с параметром σ 2 = nE 0 , где E 0 = 0.01 дж - энергия одной моды поля. Построить зависи-
[
]
мость P(E ) = P χ n2 > E при n = 1,2,4,10,15 для значений z = E σ 2 ∈ [0 ; 2n ]. 9. Остаточная ошибка аппроксимации экспериментального графика заданной функцией опи-
[
]
сывается стандартным χ n2 законом распределения. Рассчитать вероятность P χ n2 < h как функцию n при h= 5,8,16 . ЛАБОРАТОРНАЯ РАБОТА № 4 ФУНКЦИОНАЛЬНЫЙ МАСШТАБ. ВЕРОЯТНОСТНАЯ БУМАГА ОБЩИЕ СООТНОШЕНИЯ. Для удобного графического представления функциональной зависимости y = f (x ) могут применяться: a) логарифмический масштаб; b) обратный функциональный масштаб; c) прямой функциональный масштаб.
16
Если A < y < B , причем A B = 10 k , где
ЛОГАРИФМИЧЕСКИЙ МАСШТАБ.
k = 1,2..., то есть различаются на порядки, то удобен логарифмический масштаб. Делаем замену y * = lg ( y ) и строим зависимость y * = lg [ f (x )]. При этом значению y = y 0 на графи-
( )
ке в логарифмическом масштабе соответствует отклонение точки от оси "x" l y = L y lg y 0 , где Ly - линейный размер в миллиметрах одной единицы переменной y * (или одного порядка переменной "y"). Пример: построить в логарифми-
(
)
y*
ческом масштабе x , y * точки (1, 3.6) и (2, 2.5⋅102). Взять Ly =20 мм. Первая точка: l y = 20 lg (3.6 ) = 11 мм. Вторая точка: l y = 20lg(2.5 ⋅ 10) = 48 мм.
8 mm
2
2
10
ly=48 mm
1
10
1
8 6 4 2
8 6 4 2
0
Ly=20 mm
1
2
x
ОБРАТНЫЙ ФУНКЦИОНАЛЬНЫЙ МАСШТАБ. Пусть y = f (x ) = f (kx ) . Преобразуем график в прямую линию y* = kx. Это можно сделать преобразованием y * = f −1 ( y ) Если исходная функция имеет более общую зависимость y = f (x ) = f ((x − c )/ s ), то данное преобразование координаты у дает
(
уравнение в системе координат x , y *
)
y* = (x − c ) / s . Пример: y = 1 − exp (− k (x − c ) ) , x > c . Преобразование y * = − ln (1 − y ) приводит к уравнению прямой линии y * = k (x − c ) . Обратный функциональный масштаб удобно применять к "S" -образным кривым. ПРЯМОЙ ФУНКЦИОНАЛЬНЫЙ МАСШТАБ . Пусть y = f (x ) = k f (x ) + c . Тогда преобразование x * = f1(x ) приводит график к прямой линии y = k x * + c . Такой функциональный масштаб целесообразно использовать для "U" и "J"-образных кривых. Пример: y = 5 tg (x ) − 2.5, − π / 2 < x < π / 2, x* = tg (x ). Тогда y = 5 x * − 2.5 . Обратите внимание, что обратный функциональный масштаб в этом примере менее удобен, так как
17
бесконечную
(− π / 2 < x < π / 2;
кривую
он
преобразует
в
конечный
отрезок
прямой
− π / 2 < x < π / 2;) , а это приведет к сгущению точек на концах отрезка.
ВЕРОЯТНОСТНАЯ БУМАГА. Вероятностной бумагой называется функциональный масштаб, в котором функция распределения F(x) случайной величины х преобразуется в прямую линию. Для этого случая необходимо применить обратное функциональное преобразование y * = F −1 ( y ) . Если на вероятностной бумаге построить полигон накопленных частот Fq (x q ), x q ∈[ a , a + ∆ q ], где 1 ≤ q ≤ r , ∆ = (b − a ) / r , то: 1) нелинейная зависимость Fq* = F −1 (Fq )от xq указывает на несоответствие эмпирической и теоретической функций распределения; 2) линейная зависимость, напротив, говорит о соответствии эмпирической и теоретической функций распределения; 3) по линейной зависимости Fq* = (x − c ) / s легко найти параметры с и s в функции распределения F(x) случайной величины х. ПОРЯДОК ПОСТРОЕНИЯ ВЕРОЯТНОСТНОЙ БУМАГИ I. Cтроим полигон накопленных частот следующим образом: a) берем выборку x1...x n объемом n>100; b) диапазон [a;b] значений xi разбиваем на r (r=8÷20) интервалов группировки. Величина r зависит от объема выборки п. Наиболее часто используют полуэмпирические соотношения: r =(4÷5)lg(n), r =(0.6÷1.2)n0.4. Далее находим ∆= (b-а)/r - размер интервала группировки.
ρ c) Посчитываем количество k q элементов выборки x , попадающих в интервал
[a; a + q∆] ,
1≤ q ≤ r .
d) Вычисляем накопленную частоту Fq = k q / n , являющуюся оценкой функции распределения в точке xq = a + q∆ . II. Выбираем предполагаемый закон распределения y = F (x ) и находим обратную функцию y* = F −1 ( y ) . III. Пересчитываем полигон накопленных частот Fq* = F −1 (Fq ) и строим эмпирическую зависимость Fq* от xq = a + q∆, 1 ≤ q ≤ r . Контрольные задания 1) Построить в логарифмическом масштабе графики функций
18
(
)
f (x ) = exp − x 2 / 2 / x , x ∈ [1;5] ;
(
) f (x ) = 1 − exp(− m exp(− x 2 / 2 )),
f (x ) = Φ (h − x ) , x ∈ [1;4] ; h = 0.5,1,1.5
f (x ) = x exp − ax / 2 , x ∈ [1;5] ; a = 0.5,1,2 ; 2
x ∈ [1;5] ; m = 10,50,80 ;
Ρ(k ) = λk exp(− λ ) / k! , k ∈ [1;6] ; λ = 0.5,1,2 ; n!, n ∈ [1,10]. 2) В таблице приведены эмпирические функции распределения некоторой случайной величины. При помощи вероятностной бумаги доказать, что случайная величина имеет плот-
[
]
ность вероятности W (x ) = c / π c 2 + (x − x0 )2 и определить параметры x0 , c. x
-1
-0.5
0
0.5
F
0.148
0.187
0.25
x
-2
-1.5
-1
F
0.25
0.295
x
-3
1.5
2
2.5
0.352 0.5
0.647
0.75
0.813 0.852
0.879
-0.5
0.5
1
1.5
2.5
0.352 0.422 0.5
0.578
0.647 0.705 0.75
0.785
-2.5
-2
-0.5
0
1
1.5
F
0.205
0.25
0.313 0.397 0.5
0.602
0.687 0.75
0.795
0.828
x
-3.5
-3
-2.5
-1
-0.5
0.5
1
F
0.114
0.147
0.205 0.313 0.5
0.687
0.795 0.852 0.886
0.907
x
-2.5
-2
-1.5
0
0.5
2
F
0.177
0.221
0.285 0.379 0.5
0.621
0.715 0.779 0.822
-1.5
-2
1
0
-1
-1.5
-1
-0.5
0.5
0
1
3
2
1.5
3.5
0.852
3) По вероятностной бумаге проверить на соответствие нормальному закону эмпирической функции распределения из файлов Fl.dat,...,F10.dat; найти m, σ. 4) Определить,
какой
y = 1 − exp(− lx ),
одной
(
из
двух
возможных функциональных зависимостей
)
y = 1 − exp − l 2 x 2 принадлежат данные из файлов El.dat,..., E10.dat.
Найти значение l (данные в файлах записаны попарно (x,y) для каждой точки графика). ЛАБОРАТОРНАЯ РАБОТА № 5 ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ ЧАСТЬ 1. ВЫБОРОЧНЫЕ МОМЕНТЫ. РАСЧЕТ ПОГРЕШНОСТЕЙ ρ ОБЩИЕ СООТНОШЕНИЯ. Набор значений x = (x1 , x 2 ,..., x n ) измеряемой величины ξ , полученный при п -кратном повторении эксперимента, называется реализацией выборки. Можно считать, что все возможные реализации составляют случайную выборку ρ X = ( X 1 , X 2 ,..., X n ) .Элементы выборки X i , i = 1 , n полагаются: a) независимыми;
19
b) одинаково распределенными; c) их распределения совпадают с распределением исследуемого физического явления
ξ (Θ ), FX 1 (z ) = FX 2 (z ) = ... = FX n (z ) = Fξ (z ) . Под параметром Θ будем понимать: a)
наиболее информативные моменты случайной величины ξ : mξ , σ ξ2 , µ 3 , µ 4 ;
b)
вероятности Ρ j ,
j = 1, r в случае дискретного характера случайной величины ξ ;
начальные mk и центральные моменты µ k произвольного k-ого порядка. ρ Оценкой Θ m = Θ m (x ) параметра Θ называется некоторая статистика (функция выρ борки) Θ m (x ) , приближенно соответствующая Θ . И при объеме выборки n → ∞ сходящаяc)
ся (в вероятностном смысле) к истинному значению параметра. Случайная оценка Θ m может быть охарактеризована следующими числовыми значениями: +∞
1) средним значением оценки: mΘ =< Θm >= ∫ uWΘ (u )du; −∞
2) смещением оценки: b(Θ ) = mΘ − Θ; +∞
3) дисперсией оценки: DΘ =< (Θ m − mΘ )2 >= ∫ (u − mΘ )2WΘ (u )du; −∞
4) доверительной
вероятностью
P[ Θm − Θ < ∆ ] = P0 ,
Р0
и
доверительным
интервалом
∆,
Θ+∆
∫ WΘ (u )du = P0 . Здесь WΘ (u ) - плотность вероятности оценки.
Θ−∆
ОСНОВНЫЕ ПАРАМЕТРЫ И ХАРАКТЕРИСТИКИ ОЦЕНОК 1) Параметр Θ ≡ mξ - математическое ожидание: Оценка: Θ m = x =
1 n ∑ xi ; n i =1
(1)
смещение оценки: b(Θ ) = 0; дисперсия оценки: DΘ = σ ξ2 / n; распределение оценки – нормальное, т.е.
(
)
Θ m → N Θ, σ 2 n ;
z p = Φ −1 ((1 + P0 ) 2 ). 2) Параметр Θ ≡ σ ξ2 - дисперсия: a) математическое ожидание известно
доверительный интервал:
∆ =σ zp
n , где
20
(
1 n Оценка: s = ∑ xi − mξ n i =1 2
2
);
(2)
смещение: b(Θ ) = 0; дисперсия: DΘ = 2 σ s4 n ≈ 2s 4 n ; распределение: χ n2 - хи-квадрат (при n>100 – асимптотически нормальное); асимптотически доверительный интервал ∆ = 2 nσ ξ2 z p ≈ 2 n s 2 z p , где z p = Φ −1 ((1 + P0 ) 2 ). . b) математическое ожидание неизвестно 2
1 n Оценка s = ∑ (xi − x ) ; n − 1 i =1 2
(3)
смещение: b(Θ ) = 0; дисперсия: DΘ = 2 σ 4 (n − 1) ≈ 2 s 4 (n − 1); распределение: χ n2−1 (при n>100 – асимптотически нормальное) 3) Параметр Р - вероятность события: Здесь xi - дискретная величина, xi = 1 (событие произошло), либо xi = 0 (событие не произошло). Оценка: ν =
1 n k ∑ xi = , n i =1 n
(k > 10 ÷ 20);
(4)
k- число положительных исходов в п испытаниях; смещение: b(ν ) = 0 ; дисперсия: Dν = Ρ(1 − Ρ ) n ≈ ν (1 − ν ) n ;
асимптотический
доверительный
интервал:
(np>10)
∆ = Ρ(1 − Ρ ) n z p ≈ ν (1 − ν ) n z p , где z p = Φ −1 ((1 + P0 ) 2 ). . 4) Параметр mk - начальный момент k-ого порядка: n ~ = 1 ∑ xk Оценка: m k i n i =1
(5)
(
)
смещение: b(Θ ) = 0; дисперсия: DΘ = m2k − mk2 n . 5) Параметр µ k - выборочный центральный момент k-ого порядка
(
)
1 n 1 n ) Оценка: µ~k = ∑ xi − mξ k , µ k = ∑ (xi − x )k ; n i =1 n i =1 ) смещение: µ~ - несмещенная, µ - асимптотически k
(
k
(6) несмещенная;
дисперсия:
)
~ и µ) при k=2,3,4 DΘ = µ 2 k − µ k2 n . Связь m k k ) ~ − (x )2 ; µ) = m ~ − 3m ~ x + 2(x )3 ; µ) = m ~ − 4m ~ x + 6m ~ (x )2 − 3(x )4 . µ2 = m 2 3 3 2 4 4 3 2 6) Параметр - выборочные коэффициенты асимметрии γ~1 и эксцесса γ~2 ) ) γ~1 = µ 3 s 3 , γ~2 = µ 4 s 4 − 3.
(8)
(7)
21
Задание “А” (Моделирование выборки) 1. Обратиться к датчику-генератору случайных величин из библиотеки стандартных программ a) Procedure REXP(l: real; var x: real);external; b) Procedure RELEY(s: real; var x: real);external; c) Procedure NORMAL(m, s: real; var x: real);external; d) Procedure POIS(l: real; var kx: integer);external; e) Procedure BINOM(m: integer; p: real; var kx: integer);external. 2. Сформировать выборку объемом п = 103 . Параметры процедуры задаются пользователем. ~ , m ~ , m ~ . 3. Вычислить выборочные моменты: x , s 2 , m 2 3 4 4. Вычислить теоретические моменты mξ , σ ξ2 , m2ξ для распределений: a) равномерное ξ ∈ [a;b] ;
(
)
b) гауссовское ξ → N m, σ 2 ; c) экспоненциальное ξ → E (λ ) ;
( )
d) релеевское ξ → rel σ 2 ; e) пуассоновское Ρo(λ ) ; 5. Определить доверительные границы оценок параметров для значений доверительных вероятностей Р0 =0.9; 0.95; 0.99. 6. Сравнить выборочные и теоретические моменты. 7. Определить выборочные коэффициенты асимметрии γ~1 и эксцесса γ~2 . Задание “В” (Выборка из файлов данных) 1. Считать данные из файлов 100da1.dat, 200da2.dat, 10da3.dat, 10da5.dat, 10da6.dat, 500da8.dat ~ , m ~ , m ~ . 2. Вычислить выборочные моменты x , s 2 , m 2 3 4 3. Вычислить теоретические моменты: mξ , σ ξ2 , m22 для распределений: a) равномерное ξ ∈ [a;b] ;
(
)
b) гауссовское ξ → N m, σ 2 ; c) экспоненциальное ξ → E (λ ) ;
( )
d) релеевское ξ → rel σ 2 ;
22
e) пуассоновское Ρo(λ ); ~ . 4. Определить доверительные интервалы для оценок x , s 2 , m 2 5. Сравнить выборочные и теоретические моменты. 6. Определить выборочные коэффициенты асимметрии γ~1 и эксцесса γ~2 . ЛАБОРАТОРНАЯ РАБОТА № 6 ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ ЧАСТЬ 2. ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ ОБЩИЕ СООТНОШЕНИЯ. Теоретическими вероятностными характеристиками для непрерывной случайной величины ξ являются: − плотность вероятности Wξ (x ) ; x
− функция распределения Fξ (x ) = P[ξ < x ] = ∫ Wξ ( y )dy −∞
Для дискретной случайной величины ξ : − распределение вероятностей Ρk = Ρ[ξ = xk ]; − функция распределения Fξ (x ) =
∑ P U (x − x
k : xk < x
k
k
) , где U(x)- единичная функция Хевисайда.
При проведении эксперимента теоретическое распределение может быть: a) либо известно частично, с точностью до некоторых неизвестных параметров; b) либо полностью неизвестным. В первом случае экспериментальное определение Wξ (x ), Fξ (x ), Ρk сводится к оценке ~ , распараметров распределения, которые находятся из выборочных моментов x , s 2 , m 2 смотренных в части I работы. Во втором случае производится непараметрическая оценка распределения на основе гистограммы или полигона накопленных частот. Гистограммой называется оценка плотности вероятности Wξ (x ) по сгруппированным данным. Полигоном накопленных частот называется оценка функции распределения Fξ (x ) по сгруппированным данным. I. Правило построения гистограмм: ρ 1. Берется выборка x = (x1 , x 2 ,..., x n ) объемом n >100, как правило n ≈ (2 ÷ 20 ) ⋅ 10 2 . 2. Определяется число интервалов группировки r:
23
a) r = (0.55 ÷ 1.25)n 0.4 ;
b) r = (4 ÷ 5)lg n .
(1)
Обычно число интервалов группировки 9< r <21 . Если распределение предполагается симметричным, то r желательно брать нечетным; 3. Определяются длина и границы интервалов группировки. Для всех xi : a < xi < b , где d = (b − a ) = 1.02(x max − x min ), ∆x = d / r = 1.02(x max − x min ) / r , a = x min − 0.01∆x, b = x max + 0.01∆x. Границы j-ого интервала ∆ j : ∆ j = (a + ( j − 1)∆ x ; a + j∆ x ),
j = 1, r .
(2)
Для односторонних распределений (экспоненциального, релеевского, хи-квадрат и др.) с точно известной нижней границей а=0.
ρ 4. Подсчитывается количество k j элементов выборки x , попавших в интервал группировки
∆ j = (a + ( j − 1)∆ x ; a + j∆ x ) . Число k j > 5 ÷ 10 . 5. Определяются частоты ν j : ν j = k j n
(3)
либо относительные частоты ω j : ω j = ν j ∆x = k j n∆x и строится диаграмма из столбцов высотой ν j или ω j , j = 1, r . II. Правило построения полигона накопленных частот: Берется выборка и определяется число интервалов группировки так же, как и при построении гистограммы (пункты 1,2,3). 4. Подсчитывается количество
Kq
элементов выборки
ρ x , попавших в интервал
(a; a + q∆x ), q
K q = ∑ k j , q = 1, r
(4)
j =1
5. Определяются выборочные вероятности q
Fq = K q n = ∑ν j
(5)
j =1
и строится ступенчатая диаграмма, высота которой равна
Fq
на интервале
∆q = [a + (q − 1)∆x; a + q∆x ] . Для подсчета количества элементов k j или частот ν j , можно воспользоваться фрагментом программы (* в программе определен вещественный массив р[1..r] из элементов p[j]= ν j *) ( * текст фрагмента программы *)
24
dp:=l/n dx:=(B-A)/r; for i:=1 to n do begin j:=trunc((x[i] -A)/dx)+l; p[j]:=p[j]+dp; end; Для целочисленных дискретных случайных величин (Пуассона, Бернулли и др.) dp:=1/n; for i:=0 to n do begin j:=x[i]; p[j]:=p[j]+dp; end; r = xmax − xmin . Если xmin = 0 , то 0 ≤ j ≤ r
.
(6)
III. Сравнение теоретического и эмпирического распределений Вероятностная бумага. Вероятностная бумага принадлежит к полукачественному критерию, на основе которого можно судить о соответствии эмпирического распределения и предполагаемого теоретического распределения. Этапы проверки: 1. Построение обратной функциональной зависимости для функции распределения y* = Fξ−1 ( y )
y = Fξ (x ) :
(7)
2. Построение полигона накопленных частот Fq , q = 1, r
( )
3. Пересчет полигона накопленных частот Fq * = Fξ−1 Fq , q = 1, r.
(
(8)
)
4. Построение в системе координат (x, y *) графиков по точкам x q , Fq * , где xq = a + q∆x . 5. Если график пересчитанного полигона накопленных частот Fq * - прямая линия, то эмпирическое распределение Fq соответствует y = Fξ (x ) , иначе соответствия нет. Критерий согласия χ 2 (хи-квадрат) Пирсона. Критерий согласия χ 2 Пирсона принадлежит к универсальным количественным критериям. С помощью этого критерия можно проверить соответствие теоретического и эмпирического распределений для любого типа случайных величин: непрерывных, дискретных. Он имеет вид: r
χ =∑ 2
j =1
(k
j
− np j ) np j
2
r
= n∑ j =1
(ν
j
− pj ) pj
2
r ν 2j < 2 (α , l ) . = n ∑ − 1 χ кр j =1 p j >
(9)
25
Здесь п - объем выборки, r- число интервалов группировки, ν i = k j n - частота попадания ρ выборки x в интервал ∆ j = (a + ( j − 1)∆ x ; a + j∆ x ),
j = 1, r ,
p j - теоретическая вероят-
ность попадания случайной величины ξ в интервал ∆j , pj =
a + j∆x
∫ Wξ (x )dx a + ( j −1)∆x
= Fξ (a + j∆ x ) − Fξ (a + ( j − 1)∆ x )
2 χ кр (α , l ) - критическое значение, зависящее от параметров α и l, α - уровень значимости
(вероятность отбросить правильную гипотезу о соответствии распределений), l = r − 1 − v число степеней свободы, где v - количество неизвестных параметров в теоретическом расρ пределении, которые доопределяются по той же выборке x . Например: a) Fξ (x ) = Φ ((x − m ) σ ) , где т и σ известны (или заданы). Тогда v=0. b) Fξ (x ) = Φ ((x − m ) σ ), где т неизвестно, а σ задано. Тогда m ≈ x = (∑ xi ) n и v=1. c) Fξ (x ) = Φ ((x − m ) σ ),
σ 2 ≈ s2 =
(∑ (x
− x)
2
i
где
т
и
σ
неизвестны.
Тогда
) (n − 1) и v=2.
m ≈ x = (∑ xi ) n ,
2 Если χ 2 < χ кр (α , l ) , то принимается гипотеза соответствия теоретического и эмпири2 ческого распределения; при χ 2 > χ кр (α , l ) гипотеза соответствия отвергается. Статистика
(9) подчиняется распределению стандартному χ l2 -распределению. Типичные значения уров2 ня значимости α =0.1, 0.05, 0.01. Чаще всего α =0.1. Критические значения χ кр (α , l ) , явля-
( )
2 ются квантилями вероятностей q = Fχ 2 χ kp = 1 − α для хи-квадрат распределения с l -
степенями свободы - χ l2 . Некоторые значения квантилей порядка q приведены в Таблице 2 Приложения. Задание “A” (Моделирование выборки) 1. Обратиться к датчику-генератору случайных величин из библиотеки стандартных программ a) Procedure REXP(l: real; var х:геа1); external; b) Procedure RELEY(s: real; var х:геа1); external; c) Procedure NORMAL(m, s: real; var х:геа1); external; d) Procedure POIS(l: real; var kx: integer); external; e) Procedure BINOM(m: integer, p: real; var kx: integer); external.
26
2. Сформировать выборку (x1 , x2 ,..., xn ) объемом n = 10 3 ÷ 2 ⋅ 10 3 . Параметры процедур задаются преподавателем. 3. Для непрерывных случайных величин строится гистограмма ν j и полигон накопленных частот Fq . Для дискретных - распределение вероятностей Ρ j и полигон Fq . 4. По критерию согласия хи-квадрат Пирсона проверяется гипотеза о соответствии теоретического и эмпирического распределений. 5. Для непрерывных случайных величин строится вероятностная бумага и наносятся пере-
( )
считанные значения полигона Fq * xq , xq = a + q∆ x, q = 1, r . Задание “В” (Выборка из файла) 1. Считать данные из файлов 100dal.dat, 200da2.dat, 100da3.dat, 100da4.dat, 100da6.dat, 500da8.dat. 2. Определить, являются ли элементы выборки xi дискретными (целочисленными) или непрерывными (вещественный тип данных). 3. Построить гистограмму ν j и полигон накопленных частот Fq . Для дискретных - распределение вероятностей Ρ j и полигон Fq . 4. По критерию хи-квадрат Пирсона проверить гипотезу о принадлежности выборки к законам: -
равномерному;
гауссовскому;
-
экспоненциальному;
релеевскому.
5. По вероятностной бумаге определить принадлежность выборки к законам: -
равномерному;
гауссовскому;
-
экспоненциальному;
релеевскому.
ЛАБОРАТОРНАЯ РАБОТА № 7 ОЦЕНКА МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ ОБЩИЕ СООТНОШЕНИЯ. Если исследуется случайное явление ξ , плотность вероятности которого Wξ (x Θ ) известна с точностью до параметра Θ, то функция правдоподобия выборки ρ X = ( X 1 , X 2 ,..., X n ) имеет вид n ρ W (x Θ ) = ∏Wξ (xi Θ ), i =1
где xi - реализация i -ого элемента выборки X i . ПРИМЕРЫ ФУНКЦИЙ ПРАВДОПОДОБИЯ:
(1)
27
(
1) Гауссовская случайная величина с неизвестным матожиданием ξ → N Θ, σ 2
(2πσ 2 )n 2 .
n ρ W (x Θ ) = exp − ∑ (xi − Θ )2 2σ 2 i =1
)
(2)
2) Гауссовская случайная величина с неизвестной дисперсией ξ → N (m, Θ ) n ρ W (x Θ ) = exp − ∑ (xi − m )2 2Θ i =1
(2πΘ )n 2 .
(3)
3) Экспоненциально распределенная случайная величина ξ → E (Θ ) с неизвестным параметром λ = Θ . n ρ W (x Θ ) = Θn exp − Θ ∑ xi . i =1
(4)
4) Релеевская случайная величина ξ → rel (Θ ) с неизвестным параметром σ 2 = Θ n n ρ W (x Θ ) = ∏ xi Θn exp − ∑ xi2 2Θ i =1 i =1
(5)
5) Распределение Пуассона ξ → Po(Θ, k ) с неизвестным параметром λ = Θ n
∏ xi n ρ W (x Θ ) = Θ i =1 exp(− nΘ ) ∏ (xi !) i =1
(6)
Оценкой максимального правдоподобия (ОМП) Θ m является решение уравнения правдоподобия ρ W (x Θ ) dΘ Θ = Θ
m
ρ ρ ρ = dL(x , Θ ) dΘ Θ = Θ = 0, L(x , Θ ) = ln (W (x Θ )). m
Для приведенных выше типовых распределений (2)-(6) ОМП имеют вид
(
)
n
1) ξ → N Θ,σ 2 , Θ = m, Θm = x = ∑ xi n ; i =1
n 2) ξ → N (m, Θ ), Θ = σ 2 , Θm = s 2 = ∑ (xi − m )2 n ; i =1
n
3) ξ → E (Θ ), Θ = λ , Θm = n ∑ xi ; i =1 n
4) ξ → rel (Θ ), Θ = σ 2 , Θm = ∑ xi2 i =1 n
(2n );
5) ξ → P0 (Θ, k ), Θ = λ , Θm = ∑ xi n ; i =1
(7)
28
ρ Границей Крамера-Рао называется нижняя граница дисперсии DH оценки γ (x ) : DH = [1 + b' (Θ )]2 I n (Θ ). Здесь b(Θ ) - смещение оценки, I n (Θ ) - количество информации по Фишеру 2 ρ ρ I n (Θ ) =< [dL(x , Θ ) dΘ]2 >= − < dL2 (x , Θ ) dΘ > .
Для двух приведенных выше параметров границы Крамера - Рао имеют вид:
(
1) ξ → N Θ, σ 2
)
DH = σ 2 n ;
2) ξ → N (m, Θ ), DH = 2σ 4 n .
Задание 1. Выбрать модель наблюдаемых данных:
(
a) ξ → N Θ, σ 2
)
d) ξ → rel (Θ )
b) ξ → N (m, Θ )
e) ξ → Po(Θ, k )
c) ξ → E (Θ ) 2. Найти вид ОМП. 3. Найти границу Крамера-Рао.
4. Сформировать массив эмпирических ОМП размерностью L=100. 5. Найти выборочное среднее и выборочную дисперсию по сформированному массиву оценок Θ m = γ ( j ) , j=1..L. 6. Определить доверительные границы для соответствующей ОМП Θ m − Θ < z p DH = z p
I n (Θ ) ,
где z p - квантиль гауссовского распределения порядка Р = (1 + Р0)/2 для доверительной вероятности Р0 ==0.9. 7. Сравнить выборочные характеристики оценок со значениями Θ и D H = 1 I n (Θ ). Экспериментальное задание 1. Описать внешнюю (external) процедуру генерации случайной величины с заданным законом распределения. a) Procedure REXP(l: real; var x: real);external; b) Procedure RELEY(s: real; var x: real);external; c) Procedure NORMAL(m, s: real; var x: real);external; d) Procedure POIS(l: real; var kx: integer);external. 2. Фактические значения параметров l, т, s получить у преподавателя. 3. Сгенерировать выборку объемом п =20 с заданной статистикой и сформировать ОМП неизвестного параметра.
29
4. Повторив цикл испытаний L = 100 раз, получить массив реализаций оценок γ(1),… γ(L) 5. Найти выборочное среднее и выборочную дисперсию по массиву оценок
(
)
L L γ = ∑ γ j L , sγ2 = ∑ γ j − γ 2 L . j =1
j =1
6. Сравнив выборочные характеристики с Θ и DH , сделать заключение о смещенности и эффективности ОМП. ЛАБОРАТОРНАЯ РАБОТА № 8 МЕТОД НАИМЕНЬШИХ КВАДРАТОВ ОБЩИЕ СООТНОШЕНИЯ. Метод наименьших квадратов используется для аппроксимации функциональных зависимостей, полученных экспериментальным путем, кривыми ρ y = f t , Θ заданной формы, но содержащими вектор неизвестных параметров ρ ρ Θ = (Θ1,..., Θk ) . Процедура МНК позволяет на основе реализации x = (x1,..., xL )определить
( )
коэффициенты (Θ1 ,..., Θ k ) . Пусть результаты измерений xi , i = 1, L являются выборкой в моменты времени ti процесса
ρ x(t ) = f t , Θ + ε (t )
( )
(1)
( )
Если ε (ti ) → N 0,σ 2 , т.е. имеют нормальный закон распределения, то функция правдоподобия имеет вид ρρ 1 W x Θ = exp− 2 2σ
( )
∑ [x L
i =1
i
ρ 2 − f (t i , Θ /(2πσ 2 ) L / 2 .
]
(2)
ρ В качестве оценки параметра Θ можно взять ОМП. Максимуму функции правдоподобия соответствует минимум выражения L ρ ρ 2 M Θ = ∑ xi − f ti , Θ .
()
(
i =1
( ))
(3)
Решая систему уравнений ρ dM Θ dΘ j = 0, j = 1, k ,
()
(4)
ρ ) ) ) получаем вектор оценок Θ = Θ1,..., Θ k параметра Θ .
(
)
Из (2) и (3) видно, что МНК следует из нормальности закона распределения ошибок
ε (ti ) . Если закон распределения ошибок
ε (ti ) негауссовский, например, Лапласа
W (x ) = a exp(− a x ) 2 , то оценка максимального правдоподобия приводит к методу наименьших модулей (МНМ):
30 L ρ ρ M Θ = ∑ xi − f ti , Θ = min.
()
( )
i =1
Таким образом, МНК для ошибок негауссовского вида либо необоснован, либо неприменим. В МНК целесообразно использовать линейно-параметрические модели функций ρ f t , Θ = Θ0 g 0 (t ) + Θ1g1(t ) + ... + Θ k g k (t ),
( )
где g j (t ), j = 1, k набор некоторых функций. Наиболее употребительна из таких моделей аппроксимация полиномом ρ f t , Θ = Θ0 + Θ1t + Θ2t 2 + ... + Θk t k = A + Bt + Ct 2 + Dt 3 + ...
( )
(5)
Тогда получаем систему k линейных уравнений относительно А, В, С,... , решаемую одним из численных методов для систем алгебраических выражений. Например, для кубического полинома система имеет вид : A ⋅ L + B ∑ t i + C ∑ t i2 + D ∑ t i3 = ∑ xi A∑ t i + B ∑ t i2 + C ∑ t i3 + D ∑ t i4 = ∑ xi t i A∑ t i2 + B ∑ t i3 + C ∑ t i4 + D ∑ t i5 = ∑ xi t i2 A∑ t i3 + B ∑ t i4 + C ∑ t i5 + D ∑ t i6 = ∑ xi t i3 Эта
система
упрощается,
если
перейти
к
центрированному
аргументу
L
•
t = t − t , t = ∑ t i L , то есть перенести ось координат в точку t . Тогда суммы всех нечетных i =1
степеней
•
∑ t i = 0,
•3
∑ t i = 0,
•5
∑ t i = 0, и т.д. В этом случае система уравнений распадается
•2 A ⋅ L + C ∑ t i = ∑ xi на две меньшие 2 4 •2 A t• i + C t• i = x t ∑ ∑ i i ∑
•2 •4 • B ∑ t i + D ∑ t i = ∑ xi t i 4 6 •4 B t• i + D t• i = x t ∑ ∑ i i ∑
k
Аппроксимация полиномами f (t ) = ∑ Θ j t j имеет следующие особенности: j
a) k ≤ L ; т.е. число неизвестных коэффициентов k не должно превышать число точек; b) k ≤ 5 , так как численные методы при k > 5 становятся неустойчивыми и плохо обусловленными. ρ Если функция f t , Θ по условиям задачи нелинейно-параметрическая, то можно сделать об-
( )
ратное функциональное преобразование z = f −1 ( y ) и привести зависимость к линейной. Например,
ρ f t , Θ = Θ0 exp(Θ1t ), z (t ) = ln (Θ0 ) + Θ1t = A + Bt.
( )
(7)
31
Однако такой подход является приближенным, так как при нелинейном преобразовании погрешности ε (t ) дисперсия σ 2 = σ i2 , т.е. изменяется от точки к точке. В этом случае можно усовершенствовать МНК на случай неравноточных измерений, или использовать численные методы решения систем нелинейных уравнений. РАСЧЕТНЫЕ СООТНОШЕНИЯ: 1) Линейная регрессия, линейная функциональная зависимость • • ρ f t , Θ = Θ0 + Θ1t = A + B t , t = t − t ;
( )
(8)
Система уравнений правдоподобия имеет вид L
L
Θ 0 L + Θ1 ∑ t i = ∑ x i 1
L
AL = ∑ xi
⇒
1
L
L
1
1
L
Θ 0 ∑ t i + Θ1 ∑ t = ∑ x i t i 2 i
1
L •2
1
L
•
⇒ B ∑ t i = ∑ xi t i 1
.
(9)
1
Решение системы уравнений (9) имеет вид Θ0
(∑ t )(∑ x ) − (∑ t )(∑ x t ) = 2 i
Θ1 =
i
i
i i
∆L L (∑ xi t i ) − (∑ t i )(∑ xi )
( )
∆L
⇒
A=
1 L ∑ xi = x L 1 L
•
⇒ B = ∑ xi t i 1
где ∆ L = L ∑ ti2 − (∑ ti ) 2 , i = 1, L . ( Очевидно, что B = Θ1
L •2
∑t
,
(10)
i
1
A = Θ0 + Θ1t )
2) Нелинейная регрессия (экспоненциальная модель) ρ f t , Θ = Θ0 exp(Θ1t ),
(11)
Преобразование ρ ln f t , Θ = ln (Θ0 ) + Θ1t = A + Bt.
(12)
( )
[ ( )]
приводит зависимость к линейной. Обозначая z i = ln (xi ) , получаем
( )
) ) ∑ ti2 (∑ zi ) − (∑ ti )(∑ ziti ) A = ln Θ0 = ∆L
(13)
) ) L(∑ ziti ) − (∑ ti )(∑ zi ) , B = Θ1 = ∆L
( )
здесь ∆ L = L ∑ ti2 − (∑ ti )2 , i = 1, L Задания 1) Линейная регрессия: Предполагаемая зависимость сопротивления материала от температуры имеет вид R(T)= А+ВТ. Выбрать данные из файлов MNK_G1.dat, MNK_G2.dat, MNK_G3.dat,
32
MNK_G4.dat, MNK_G5.dat. Используя решения (9), найти оценки А и В. Объем выборки L=20. 2) Нелинейная регрессия (экспоненциальная модель): Изменение активности радиоактивного источника определяется F (t ) = Q exp(− bt ) . Выбрать данные из файлов MNK_E1.dat, MNK_E2.dat, MNK_E3.dat, MNK__E4.dat, MNK_E5.dat. Используя решения (9), найти оценки Q и b. Объем выборки L=20. ОБРАЗЕЦ ОРГАНИЗАЦИИ ВЫБОРКИ ДАННЫХ ИЗ ФАЙЛОВ PROGRAM READ__MNK (input, output); const L=20; type vec=array [1..L] of real; var X,T: vec; i:
integer:
name: varying [30] of char; f: file of real; begin (* read_mnk *) write(' имя файла '); readln(name); (* name для линейной регрессии *) (* MNK_Gl, MNK_G2, MNK_G3, MNK_G4, MNK_G5 *) (* name для нелинейной регрессии *) (* MNK_El, MNK_E2, MNK_E3, MNK_E4, MNK_E5 *) name :='[000000]' +name+ '.dat '; open(f, name, old); reset(f); for i:=l to L do read(f,x[i],t[i]); close(f); end. (* read_mnk *) 3) Вольт-амперная характеристика мощного полевого транзистора аппроксимируется функцией
I c = I 0 + SU З + cU З2 .
В
файлах
MNK_T1.dat,
MNK_T2.dat,
MNK_T3.dat,
MNK_T4.dat, MNK_T5.dat приведены по 20 значений зависимости I c (U 3 ) . Найти оценки I0 , S, c . 4) Передаточная
характеристика
частотного
детектора
описывается
функцией
U вых = kU вх + dU вх3 . В файлах MNK_det1.dat, MNK det2.dat, MNK det3.dat, MNK_det4.dat,
33
MNK_det5.dat приведены по 20 значений зависимости U вых (U вх ) .Найти оценки коэффициентов k, d . ПРИЛОЖЕНИЕ В таблице 1 приведены некоторые значения функции нормального распределения (интеграла вероятности) Φ(x ) для положительного аргумента x = 0.0 ... 4 0. Пример на считывание : для x = 1.2 из таблицы находим значение Φ(1.2 ) = 0.88493 ; для x = −3 получаем Φ(− 3) = 1 − Φ(3) = 1 − 0.99865 = 1.35 ⋅ 10 −3 . Таблица 1 x
… .0
.2
.4
.6
.8
0. …
0.500000
0.579260
0.655422
0.725747
0.788145
1.
0.841345
0.884930
0.919243
0.945201
0.964070
2.
0.977250
0.986097
0.991802
0.995339
0.997445
3.
0.998650
0.999313
0.999663
0.999841
0.999928
4.
0.999968
2 2 В таблице 2 даны квантили χ m , q порядка q распределения χ с m степенями свобо-
ды для q = 1 − α = 0.5, 0.9, 0.95, 0.975, 0.99, 0.995, 0.999 ; m = 1...50 . Пример на считывание : для
m = 15
и
q = 0.95
находим по таблице значение
2 2 χ15 , 0.95 = 25.00 . Более обширные таблицы квантилей χ m, q приведены в [3, 4].
Таблица 2 m
q 0.5
0.9
0.95
0.975
0.99
0.995
0.999
1
0.455
2.71
3.84
5.02
6.63
7.88
10.83
2
1.39
4.61
5.99
7.38
9.21
10.60
13.82
3
2.37
6.25
7.81
9.35
11.34
12.84
16.27
4
3.36
7.78
9.49
11.14
13.28
14.86
18.47
5
4.35
9.24
11.07
12.83
15.08
16.75
20.51
6
5.35
10.64
12.59
14.45
16.81
18.55
22.46
34
m
q 0.5
0.9
0.95
7
6.35
12.02
14.07
8
7.34
13.36
9
8.34
10
0.975
0.99
0.995
0.999
16.01
18.48
20.28
24.32
15.51
17.53
20.09
21.95
26.12
14.68
16.92
19.02
21.67
23.59
27.88
9.34
15.99
18.31
20.48
23.21
25.19
29.59
11
10.34
17.28
19.68
21.92
24.72
26.76
31.26
12
11.34
18.55
21.03
23.34
26.22
28.30
32.91
13
12.34
19.81
22.36
24.74
27.69
29.82
34.53
14
13.34
21.06
23.68
26.12
29.14
31.32
36.12
15
14.34
22.31
25.00
27.49
30.58
32.80
37.70
16
15.34
23.54
26.30
28.85
32.00
34.27
39.25
17
16.34
24.77
27.59
30.19
33.41
35.72
40.79
18
17.34
25.99
28.87
31.53
34.81
37.16
42.31
19
18.34
27.20
30.14
32.85
36.19
38.58
43.82
20
19.34
28.41
31.41
34.17
37.57
40.00
45.31
21
20.34
29.62
32.67
35.48
38.93
41.40
46.80
22
21.34
30.81
33.92
36.78
40.29
42.80
48.27
23
22.34
32.01
35.17
38.08
41.64
44.18
49.73
24
23.34
33.20
36.42
39.36
42.98
45.56
51.18
25
24.34
34.38
37.65
40.65
44.31
46.93
52.62
26
25.34
35.56
38.89
41.92
45.64
48.29
54.05
27
26.34
36.74
40.11
43.19
46.96
49.64
55.48
28
27.34
37.92
41.34
44.46
48.28
50.99
56.89
29
28.34
39.09
42.56
45.72
49.59
52.34
58.30
30
29.34
40.26
43.77
46.98
50.89
53.67
59.76
31
30.34
41.42
44.99
48.23
52.19
55.00
61.10
32
31.34
42.58
46.19
49.48
53.49
56.33
62.49
33
32.34
43.75
47.40
50.73
54.78
57.65
63.87
34
33.34
44.90
48.60
51.97
56.06
58.96
65.25
35
35
34.34
46.06
49.80
53.20
57.34
60.27
66.62
36
35.34
47.21
51.00
54.44
58.62
61.58
67.99
37
36.34
48.36
52.19
55.67
59.89
62.88
69.35
38
37.34
49.51
53.38
56.90
61.16
64.18
70.70
39
38.34
50.66
54.57
58.12
62.43
65.48
72.06
40
39.34
51.81
55.76
59.34
63.69
66.77
73.40
Литература 1. Справочник по специальным функциям./Под ред. М.Абрамовица и И.Стиган. -М.: Наука, 1979.-832 с. 2. Митропольский А.К. Техника статистических вычислений. - М.: Наука, 1971.-576 с. 3. Справочник по прикладной статистике. - М.: Финансы и статистика. - 1989. -T.I; 1990. Т.2. 4. Таблицы по математической статистике/ П.Мюллер, П.Нойман, Р.Шторм; Пер. с нем. – М.: Финансы и статистика, 1982.-278 с. 5.
Статистические методы в экспериментальной физике: Пер. с англ./Под ред. А.А.Тяпкина - М.: Атомиздат, 1976.-336 с.
6. Гришин В.К., Живописцев Ф.А., Иванов В.А. Математическая обработка и интерпретация физического эксперимента. - М.: Изд-во МГУ, 1988. –318 с. 7. Радченко Ю.С., Зюльков А. В. Методические указания по курсу "Статистические методы обработки и планирования эксперимента". - Воронеж: Воронеж. гос. ун-т, 1994.-32 с. 8. Радченко Т.А., Радченко Ю.С. Теория вероятностей и математическая статистика (Конспект лекций). – Воронеж: Изд-во Воронеж. Ун-та, 1998.-240 с.
Составители :
Радченко Юрий Степанович, к.ф.-м.н., доцент Овчинникова Татьяна Михайловна, к.ф.-м.н., асс
Редактор
Кузнецова 3. Е.