ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
ЛАБОРАТОРНЫЙ ПРАКТИКУМ ДЛЯ ВУЗОВ
...
10 downloads
180 Views
330KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
ЛАБОРАТОРНЫЙ ПРАКТИКУМ ДЛЯ ВУЗОВ
Составители: Т.А. Радченко, А.В. Дылевский, Б.Н. Воронков
ВОРОНЕЖ 2007
2
Утвержден учебно-методическим советом факультета прикладной математики, информатики и механики протокол № 4 от 27.12.2006 г.
Лабораторный практикум подготовлен на кафедре технической кибернетики и автоматического регулирования факультета прикладной математики, информатики и механики Воронежского государственного университета. Рекомендуется для студентов 3-го курса дневного отделения и 4-го курса вечернего отделения специальности 010501 (010200) – Прикладная математика и информатика
3
Содержание Введение……………………………………………………………........... Часть I. Mathcad…………………………………………………………... Арифметические вычисления………………………………………… Использование формул в Mathcad……………………………………. Работа с векторами и матрицами……………………………………... Построение графиков в среде Mathcad………………………………. Чтение и запись данных………………………………………………. Часть II. Лабораторные работы………………………………………….. Знакомство с Mathcad…………………………………………………. № 1. Расчет выборочных характеристик…………………………….. № 2. Точечная оценка параметров распределения………………….. № 3. Доверительный интервал……………………………………….. № 4. Критерии согласия………………………………………………. № 5. Корреляционный и регрессионный анализ……………………. Приложение……………………………………………………………….. Некоторые встроенные функции Mathcad…………………………… Предопределенные переменные……………………………………… Библиографический список………………………………………………
3 4 5 6 8 9 11 12 12 13 15 17 19 20 22 22 29 30
Введение Целью данного лабораторного практикума является формирование навыков решения основных задач математической статистики на компьютере. Лабораторные работы выполняются с привлечением математического пакета Mathcad. Для того чтобы выполнять лабораторные работы, необходимо познакомиться с теорией решения соответствующей задачи [1, 7], освоить методику ее решения на практике [2] и иметь навыки работы на ПК в ОС Windows. Минимальные сведения о пакете Mathcad, необходимые для выполнения лабораторных работ, содержатся в первой части настоящего пособия. Вторая часть пособия содержит описания лабораторных работ по математической статистике, которые включают: • цель работы; • задания для предварительной подготовки; • порядок выполнения работы; • содержание итогового документа; • контрольные вопросы и задания.
4
Часть I. Mathcad В последние годы для проведения различного рода расчетов на компьютере все чаще используются не традиционные языки программирования, а специальные математические пакеты Maple, Mathematica, Matlab, Mathcad, Gauss и др. Математические пакеты, в особенности Mathcad – самый популярный пакет из вышеперечисленного списка, позволяют специалистам в конкретной предметной области, не вдаваясь в тонкости программирования, реализовать математические модели. Отметим конкретные преимущества пакета Mathcad: • математические выражения в среде Mathcad записываются в их общепринятом виде. Текстовый процессор пакета позволяет оформить, например, научную статью, не прибегая к специализированным средствам (текстовые процессоры Word, LaTeX и др.). Кроме того, пакет Mathcad – это полноценное Windows-приложение, поэтому ClipBoard (Буфер Обменов) позволяет перенести фрагменты Mathcadдокумента в Word-документ и при необходимости дооформить их; • в среде Mathcad процесс создания программы идет параллельно с отладкой; • в пакет Mathcad интегрирован довольно мощный математический аппарат, позволяющий решать математические задачи без вызова внешних процедур. Вот неполный перечень вычислительных инструментов, доступных в среде Mathcad: 1) решение алгебраических уравнений и систем (линейных и нелинейных); 2) решение систем обыкновенных дифференциальных уравнений (задача Коши и краевая задача); 3) решение дифференциальных уравнений в частных производных; 4) работа с векторами и матрицами (линейная алгебра и др.); 5) поиск максимумов и минимумов функциональных зависимостей; 6) статистическая обработка данных; • пакет Mathcad дополнен справочником по основным математическим и физико-химическим формулам и константам, которые можно автоматически переносить в документ; • в пакет Mathcad интегрированы средства символьной математики, что дает возможность решать математические задачи не только численно, но и аналитически;
5
• система Mathcad оборудована средствами анимации, что позволяет реализовывать созданные модели не только в статике (числа, таблицы), но и в динамике (анимационные клипы). Как видно из приведенной выше характеристики, пакет Mathcad обладает большими возможностями для решения самых разнообразных задач. В настоящем пособии пакет Mathcad будет рассмотрен применительно к классу задач, связанному со статистической обработкой данных. Арифметические вычисления Для вычисления значений арифметических выражений в рабочем поле Mathcad следует с помощью клавиатуры или, нажав на пиктограмму калькулятора в математическом меню Mathcad (см. рис. 1), набрать выражение, завершающееся знаком =. П р и м е р. 1 −
3 + 0.2 ⋅ 4 = 1.2 5
Рис. 1. Окно документа Mathcad 1 – панель инструментов; 2 – кнопки форматирования текста; 3 – математическое меню; 4 – выбранные панели математического меню.
6
Использование формул в Mathcad Для набора формул в Mathcad можно использовать числа, переменные, функции как стандартные (встроенные), так и определяемые пользователем, а также различные математические операторы (сложения, вычитания, умножения,
деления,
возведения
в
степень,
интегрирования,
дифференцирования и т.д.). Набор формул можно осуществлять также с помощью панели математического меню Mathcad (см. рис. 1). Замечание. Имена встроенных функций нечувствительны к шрифту, но чувствительны к регистру (верхнему, нижнему) – их следует печатать в точности, как они приведены в настоящем пособии или документации по Mathcad. Для определения переменной следует после указания ее имени ввести знак присвоения := (нажав клавишу :), после которого вводится алгебраическое (или логическое) выражение, все операнды которого должны быть определены. Заметим, что знак := действует по полю Mathcad правее и ниже указанного выражения. Если вместо знака := вводить ≡ (клавиша ~, а также см. меню на рис. 1), то его действие распространяется по всему полю документа независимо от местоположения рассматриваемого выражения. То есть знак
≡ определяет, в отличие от :=, переменную глобально. Замечание. Если в документе имеется несколько определений, то, по умолчанию, в Mathcad применяются следующие правила: если переменная используется в правой части глобального определения, то она должна быть определена глобально выше него; из нескольких глобальных определений одной переменной (или функции) действует определение, стоящее ближе к концу документа. П р и м е р. x:=1 y:=4 z:=
x+y x + 2⋅ y v := 10 10
z=0.5 v=0.9 Для определения функции одной или нескольких переменных требуется задать имя функции, указав в круглых скобках через запятую имена ее аргументов, и правее знака := (или ≡ ) ввести соответствующее функции
7
арифметическое
(или
логическое)
выражение.
При
этом
операнды
выражения, являющиеся аргументами функции, могут предварительно не определяться. После определения функции ее можно использовать в выражении как стандартную (встроенную) функцию Mathcad. Особо отметим, что к моменту вычисления по формуле все переменные в этой формуле должны быть определены. П р и м е р.
f(x, y):= sin(x) + x 2 − 2 ⋅ y ⋅ cos(x + y) – определение функции f(x,y), g(x):= cos(x 2 + 1) − f(4, x) – использование функции f(x,y) в вычислениях. Работа с векторами и матрицами Для ввода матрицы (или вектора) требуется проделать следующую последовательность операций. Задаем имя матрицы и вводим знак присваивания. Например, для задания матрицы A пишем A:. Получаем A:=. В панели математического меню Mathcad нажимаем на кнопку с изображением матрицы. После этого на экране дисплея возникает окно работы с матрицами. В этом окне два поля и четыре кнопки. В первом поле следует указать число столбцов создаваемой матрицы, а во втором – число строк (по умолчанию в этих полях записаны тройки – считается, что квадратная матрица порядка 3 самая распространенная). Для создания матрицы щелкаем по кнопке OK (Создать). Две остальные кнопки Insert (Вставить) и Delete (Удалить) предназначены для изменения размеров ранее созданных матриц: заданное в полях число столбцов или (и) строк вставляется (удаляется) правее и ниже отмеченного курсором элемента уже созданной матрицы. Кнопка Cansel (Отмена) отменяет вставку матрицы. После щелчка по кнопке OK справа от выражения появляется набор вакантных
мест
для
ввода
информации,
обрамленный
скобками.
Заполнением вакансий завершается формирование матрицы. Формирование вектора осуществляется аналогично. Следует отметить второй вариант формирования матриц и векторов без обращения к окну работы с матрицами, а через переменные с индексами,
8
например, A i, j , B i . Индекс к имени переменной припечатывается нажатием либо на кнопку X n на панели математических инструментов, либо на клавишу [ (открывающаяся квадратная скобка). Замечание. Номер первого элемента векторов и матриц хранит переменная ORIGIN. Эта переменная предопределенная (системная): если пользователь не задает ее значение, то по умолчанию ORIGIN=0. Изменить значение системной переменной ORIGIN можно либо в пункте меню Math (подпункт Built-in Variables (Встроенные переменные)), либо через команду присваивания в поле документа Mathcad. Операции с матрицами и векторами осуществляются по тем же правилам, что и для арифметических выражений (см. Приложение). П р и м е р 1. ORIGIN:=1
определяем номер первого элемента
⎛ 1 1⎞ ⎟⎟ A:= ⎜⎜ 5 3 ⎝ ⎠
формируем матрицу A
⎛ 138 ⎞ ⎟⎟ B:= ⎜⎜ 540 ⎝ ⎠
формируем матрицу B
X:= A −1 ⋅ B
решаем матричное уравнение AX=B
⎛ 63 ⎞ X = ⎜⎜ ⎟⎟ ⎝ 75 ⎠
вывод решения
⎛ 0⎞ A ⋅ X − B = ⎜⎜ ⎟⎟ ⎝ 0⎠
проверка
П р и м е р 2. ORIGIN:=0
определяем номер первого элемента
A 0,0 := 1 A 0,1 := 1
формируем матрицу A
A 1,0 := 5 A 1,1 := 3
B 0 := 138 B1:= 540
формируем матрицу B
X := lsole(A,B)
решаем матричное уравнение AX=B
X 0 = 63 X1 = 75
вывод решения
A 0,0 X 0 + A 0,1 X 1 − B 0 = 0
проверка
9
A 1,0 X 0 + A 1,1 X 1 − B1 = 0 Построение графиков в среде Mathcad В пакете Mathcad содержится большое количество типов графиков, используемых для визуального отображения различных зависимостей. В данном методическом пособии будет рассмотрен лишь двумерный декартов график (X-Y Plot), иллюстрирующий связь между двумя (одна кривая на графике) или несколькими (две или более кривых) векторами. Двумерный декартов график строится в три этапа: 1. Задается вид функций одной переменной. 2. Формируется вектор значений аргумента. 3. Непосредственное построение графика: a) рисование на экране дисплея заготовки графика – прямоугольника с черными квадратиками у левой и правой сторон; заготовка графика появляется в отмеченном курсоре месте после того, как пользователь нажмет на одну из кнопок математического меню «Графики»; b) заполнение пользователем двух черных квадратиков заготовки графика именем функции и именем аргумента. В случае, если функций больше одной, то их имена вводятся через запятую. В заготовке есть и другие черные квадратики, определяющие пределы изменений значений аргумента и функций. Эти квадратики можно не заполнять – среда Mathcad по умолчанию заполнит их сама. График появляется на дисплее после вывода курсора из зоны графика (автоматический режим расчетов) или после нажатия клавиши F9 (ручной режим расчетов). Параметры графика (например, толщина и тип линий, вид осей и графика и т.п.) задаются стандартными по умолчанию; c) если параметры графика, установленные по умолчанию, пользователя не устраивают и он хочет их изменить, то следует двойным щелчком левой клавиши мыши, когда указатель мыши находится в поле графика, вызвать соответствующее меню и произвести необходимые изменения. Для задания диапазона изменения переменной следует руководствоваться следующим правилом:
x := x 1 , x 2 .. x n .
10
Здесь x 1 – первое значение, x 2 – второе значение и x n – последнее значение. Таким образом, шаг изменения от x 1 до x n будет х2–х1. Если же используется запись
x := x 1 .. x n , то шаг изменения переменной x будет по умолчанию равен 1. Для
ввода
..
следует
нажать
клавишу
;
или
воспользоваться
математической панелью меню. П р и м е р 1. i :=0 .. 10
i принимает значения от 0 до 10 с шагом 1
j := –15, –14 .. 12 x :=2,2.5 .. 7
j принимает значения от -15 до 12 с шагом 1 x принимает значения от 2 до 7 с шагом 0,5.
П р и м е р 2. a :=1 b :=2 c :=20
x(α ) :=
− c ⋅ (a + b) ⋅ sin(2 ⋅ α ) − 2⋅a
c ⋅ [a - cos(α ) 2 ⋅ (a + b)] y(α ) := −a c ⋅ cos(α ) z(α ) := (a + b) ⋅ a α := 0.5 ⋅ deg .. 360 ⋅ deg
(deg – по умолчанию один угловой градус).
Чтение и запись данных Mathcad читает и записывает файлы данных – файлы ASCII, содержащие числовые данные. Читая файлы данных, можно брать данные из различных источников и анализировать их в Mathcad. Записывая файлы данных, можно экспортировать результаты Mathcad в текстовые процессоры, электронные таблицы и другие прикладные программы. Mathcad включает набор функций для чтения и записи данных: READPRN, WRITEPRN и APPENDPRN считывают целую матрицу из файла со строками и столбцами данных или записывают в виде такого файла матрицу из Mathcad. Чтение данных производится с помощью команды READPRN. Процедура READPRN(file)
осуществляет
присваивание
матрице
значений
из
11
структурированного файла с именем file (структурированные файлы имеют расширение prn). Структурированные файлы содержат числа, размещенные в виде прямоугольной матрицы (т.е. по строкам и столбцам) и разделенные пробелами или запятыми. При этом размер матрицы устанавливается в соответствии с объемом файла. Копирование данных из файла производится построчно. Каждой строке матрицы соответствует строка файла. П р и м е р. A:= READPRN("c:\Mathcad\qsheet\zscore.prn") Для записи данных в файл следует воспользоваться функцией WRITEPRN. Функция WRITEPRN(file) выводит матрицу в структурированный файл file.prn. П р и м е р 1. ORIGIN :=1 i :=1 .. 10
x i :=i WRITEPRN("d:\ user \ file1.prn") := x П р и м е р 2. ORIGIN :=1 file2 := "d:\ user \ file2.prn" i :=1 .. 10 j :=1 .. 8
Yi, j := sin(i − j) WRITEPRN(file2.prn) := Y Для добавления данных к существующему файлу на диске используется функция APPENDPRN. Функция APPENDPRN(file) добавляет матрицу к существующему на диске структурированному файлу file.prn. Следует особо отметить, что число столбцов в матрице должно быть равно числу столбцов в файле. Пример 3. k:=0.8 Z k :=k+2 APPENDPRN(file2) := Z T
12
Часть II. Лабораторные работы Знакомство с Mathcad Цель работы – изучить возможности работы в среде Mathcad по предложенному
ниже
плану,
подкрепляя
изучение
выполнением
соответствующих заданий. Подготовка к работе. Изучить возможности Mathcad (Часть I). Порядок выполнения работы 1. Использование Mathcad как калькулятора (Часть I, стр. 5). Произвести различные арифметические действия. 2. Расчеты по формулам в среде Mathcad (Часть I, стр. 6–7). Выполнить расчеты по формулам (выбор формул по своему усмотрению). 3. Векторы и матрицы (Часть I, стр. 7–8). Задать несколько векторов произвольной размерности (двумя способами) и произвести с ними различные операции, задать матрицы (двумя способами), преобразовать вектор в матрицу, произвести с матрицами различные операции (выбор операций по своему усмотрению). 4. Построение графиков (Часть I, стр. 9–10). Построить график любой функции, изменить параметры графика, нанести на один график две кривые. 5. Чтение данных из файла и запись в файл (Часть I, стр. 10–11). Познакомиться с содержанием файлов tab1, tab2, tab3. Прочитать файл данных, соответствующих Вашему варианту, преобразовать вектор данных в матрицу, представить данные в виде графика. Записать файл, присвоив ему имя = фамилия автора. Содержание итогового документа. Файл с именем автора. Содержание файла: вектор, матрица и график данных Вашего варианта. Лабораторная работа № 1 Расчет выборочных характеристик Цель работы – знакомство с основными выборочными характеристиками и их расчет. Подготовка к работе. 1. Познакомиться с основными понятиями выборочной теории: выборка, вариационный ряд, выборочные моменты,
13
выборочная медиана, полигон частот, гистограмма, эмпирическая функция распределения [1, С. 119–127]. 2. Изучить методы расчета выборочных характеристик по группированным и негруппированным данным [2]. 3. Выписать соответствующие формулы. Порядок выполнения работы 1. Подготовка данных. 1.1. Считать файл данных, соответствующих Вашему варианту. 1.2. Упорядочить значения в порядке возрастания. 2. Расчет выборочных характеристик. C помощью стандартных функций, содержащихся в Mathcad, получить min и max значения выборки, выборочное среднее, выборочную дисперсию, среднеквадратическое отклонение, выборочную медиану. 3. Расчет гистограммы. Для построения гистограмм в системе Mathcad используется функция hist(int, X) (см. С. 23). Эта функция формирует вектор v i размерностью r, который определяет количество попаданий v i элементов выборки r X = (X1 ,X 2 ,K,X n ) в массив интервалов int размерностью r+1, т.е. v i – r количество значений выборки X , удовлетворяющих условию
int i < X k < int i +1 ,
k = 1, n , i = 0, r − 1.
Массив int определяет набор точек, являющихся границами подынтервалов группировки в гистограмме. Mathcad игнорирует данные меньшие, чем первое значение в int, или большие, чем последнее значение в int. 3.1. Выполнить расчет гистограммы с помощью стандартной процедуры в Mathcad, построить графики гистограммы и полигон частот. 3.2. Выполнить расчет выборочного среднего и выборочной дисперсии по
группированным
данным
(использовать
группированные
данные,
полученные при расчете гистограммы) и сравнить их со значениями выборочных характеристик, полученными в п. 2. 4. Расчет эмпирической функции распределения. Выполнить
расчет
эмпирической
функции
распределения
для
группированных данных (использовать результаты, полученные при расчете
14
гистограммы) и негруппированных данных, построить графики этих функций. 5. На основании вида гистограммы выдвинуть гипотезу о принадлежности данных к генеральной совокупности с одним из законов распределения: нормальным, экспоненциальным, релеевским. Содержание итогового документа. Значения выборочных характеристик, графики
гистограммы,
полигона
частот,
эмпирической
функции
распределения для группированных и негруппированных данных. Контрольные вопросы и задания 1. Что такое математическая статистика? 2. Сформулировать и сравнить между собой задачи теории вероятностей и задачи математической статистики. 3. Из
каких
этапов
Охарактеризовать
состоит
эти
этапы.
статистическое Дайте
исследование?
определение
генеральной
совокупности и выборки. 4. Что такое выборка, выборочные значения? 5. Что называется генеральной совокупностью? 6. Какая выборка называется репрезентативной? 7. Что является оценкой вероятности события? 8. Что такое вариационный ряд? 9. Что такое выборочные моменты? 10. Дайте определение выборочного среднего, выборочной дисперсии. Как они
соотносятся
с
математическим
ожиданием
и
дисперсией
генеральной совокупности? 11. Что такое гистограмма? Является ли она оценкой плотности распределения?
Какие
предварительные
выводы
о
законе
распределения генеральной совокупности можно сделать на основе полученной Вами гистограммы? 12. Что такое полигон частот? 13. Можно ли считать (и почему?) гистограмму асимптотической оценкой плотности распределения вероятностей случайной величины? 14. Что такое эмпирическая функция распределения? Как она соотносится с функцией распределения генеральной совокупности?
15
15. Можно ли считать (и почему?) эмпирическую функцию распределения асимптотической оценкой теоретической функции распределения вероятностей случайной величины? 16. В
чем
различие
эмпирических
функций
распределения
для
группированных и негруппированных данных? 17. Как зависят выборочные характеристики и эмпирическая функция распределения от объема выборки? Лабораторная работа № 2 Точечная оценка параметров распределения Цель работы – для предполагаемого закона распределения получить значения точечных оценок параметров. Подготовка к работе. Изучить свойства и методы нахождения точечных оценок параметров распределения [1, 2]. Произвести оценку параметров распределения: нормального, экспоненциального, релеевского, используя известные Вам методы точечного оценивания ([1, С. 148–153], и записать соответствующие формулы. Записать функцию правдоподобия и функцию распределения для названных законов распределения. Порядок выполнения работы 1. Расчет оценок параметров. Используя выборочные данные, рассчитать значения оценки параметров предполагаемого закона распределения. 2. Оценка параметров по функции правдоподобия. Рассчитать параметра,
зависимость
используя
функции
выборочные
правдоподобия данные.
от
Построить
оцениваемого график
этой
зависимости при различных объемах выборки. Найти значение параметра, обеспечивающее максимум функции правдоподобия. Сопоставить это значение со значением, найденным в п. 1. 3.
Расчет
плотности
распределения
вероятностей
и
функции
распределения. Рассчитать теоретические плотности распределения вероятностей и функции
распределения
предполагаемого
закона
распределения
значениями параметров, равными значениям оценок, полученных в п. 1.
со
16
4. Оценка плотности распределения вероятностей. Получить
оценку
плотности
распределения
вероятностей
путем
соответствующей нормировки гистограммы. 5. Построение графиков. Построить графики: –теоретической (п. 3) и эмпирической (Л.р. № 1) функции распределения; –теоретической (п. 3) плотности распределения вероятностей и ее оценки (п. 4). Замечание. При построении на одном графике теоретических и эмпирических зависимостей следует обеспечить одинаковую размерность аргументов. Содержание параметров правдоподобия
итогового
документа.
предполагаемого для
этого
Значения
распределения. распределения
и
точечных
оценок
Графики
функции
логарифма
функции
правдоподобия при разных объемах выборки. Графики теоретической и эмпирической
функций
распределения,
теоретической
плотности
распределения вероятностей и ее оценки (нормированной гистограммы). Контрольные вопросы и задания 1. Дайте определение точечной оценки параметров распределения. 2. Дайте определение несмещенности точечных оценок параметров. Приведите примеры несмещенных и смещенных оценок. 3. Дайте определение эффективности точечной оценки параметров. Как найти эффективную оценку и ее дисперсию, используя критерий РаоКрамера? Приведите примеры эффективных оценок. 4. Как зависит дисперсия эффективной оценки, найденной по критерию Рао-Крамера от объема выборки? 5. Дайте определение состоятельности оценки. Сформулируйте условия, при
которых
оценка
будет
состоятельной.
Приведите
примеры
состоятельных оценок параметров. 6. В чем состоит выборочный метод оценивания? 7. Какими характеристиками пользуются для количественной оценки расхождения между оцениваемым параметром и статистической оценкой?
17
8.
Какая
(и
почему?)
числовая
характеристика
статистического
распределения называется исправленной выборочной дисперсией, а какая (и почему?) – «исправленным» средним квадратическим отклонением? 9. При каком числе наблюдений требование несмещенности оценки является особенно важным? 10. Верно ли, что свойство состоятельности обязательно для любого правила оценивания? 11. Доказать, что выборочная дисперсия является смещенной оценкой истинной дисперсии. 12. Доказать, что эмпирическая функция распределения выборки является несмещенной состоятельной оценкой функции распределения случайной величины. 13. Доказать, что относительная частота появления события А в n независимых
испытаниях
является
несмещенной,
состоятельной
и
эффективной оценкой неизвестной вероятности р(А) этого события. 14.
Почему
выборочные
моменты
можно
считать
оценками
соответствующих теоретических моментов? 15. Что такое функция правдоподобия? Запишите функцию правдоподобия для
параметров
распределений:
нормального,
экспоненциального,
релеевского, равномерного. 16. В чем заключается метод максимального правдоподобия оценки параметров? Каковы свойства оценок, полученных этим методом? 17. В чем заключается метод моментов оценки параметров? Что можно сказать о свойствах оценок, полученных этим методом? Лабораторная работа № 3 Доверительный интервал Цель работы – определение доверительного интервала для параметров распределения. Подготовка
к
работе.
Получить
расчетные
формулы
границ
доверительного интервала для параметров распределений: a) нормального, b) экспоненциального, c) Релея, d) равномерного (для распределений b) – d) – границы асимптотических доверительных интервалов).
18
Порядок выполнения работы 1. Расчет границ доверительных интервалов. Рассчитать значения границ доверительных интервалов для параметров предполагаемого закона распределения при доверительных вероятностях 0,9 и 0,99. 2. Расчет границ плотностей вероятностей и функций распределения. Рассчитать теоретические плотности вероятностей и распределений со значениями параметров, равными доверительного интервала при γ =0,9 и 0,99. 3. Построение графиков. Построить графики:
функции границам
a) функции распределения (эмпирической (Л. р. № 1) и теоретической со значениями, равными границам доверительного интервала (п. 2)); b) плотности распределения вероятностей (эмпирической (Л. р. № 2) и теоретической со значениями, равными границам доверительного интервала). Замечание. 1. Можно построить на одном графике теоретические кривые с параметрами, соответствующими разным доверительным интервалам. 2. При построении на одном графике теоретических и эмпирических кривых необходимо обеспечить одинаковую размерность аргументов. Содержание итогового документа. Значения границ доверительного интервала и графики плотностей распределения вероятностей (теоретической и эмпирической) и функций распределения (теоретической и эмпирической). Контрольные вопросы и задания 1.
В чем состоит задача интервального оценивания?
2.
Что такое доверительный интервал и доверительная вероятность?
3.
Запишите
границы
доверительных
интервалов
для
параметров
нормальной генеральной совокупности. 4.
Является ли случайной длина доверительного интервала?
5.
Что такое асимптотический доверительный интервал?
6.
Запишите границы асимптотических доверительных интервалов для параметров распределений экспоненциального, релеевского.
7.
Как зависит ширина доверительного интервала от доверительной вероятности и объема выборки? Лабораторная работа № 4
19
Критерии согласия Цель работы – проверка гипотезы о законе распределения. Подготовка к работе. Познакомиться с решением задачи статистической проверки гипотезы о виде функции распределения. Изучить наиболее распространенные критерии согласия ([1, С. 183–187]). Порядок выполнения работы 1. Критерий согласия χ 2 -Пирсона. 1.1. Рассчитать значение статистики для критерия χ 2 - Пирсона (можно воспользоваться данными, полученными при расчете гистограммы). 1.2. Определить при уровнях значимости 0,1, 0,05, 0,01 критические значения (по таблицам или с помощью функции, обратной функции распределения χ 2 - Пирсона). Сравнить эти значения между собой. 1.3. Сравнить значение статистики, полученной в п. 1.1, с критическими значениями из п. 1.2 и сделать вывод о справедливости выдвинутой гипотезы о законе распределения. 2. Критерий Колмогорова. 2.1. Рассчитать значение статистики для критерия Колмогорова (воспользоваться
полученными
ранее
значениями
эмпирической
и
теоретической (Л. р. № 2) функциями распределения). 2.2. Определить при уровнях значимости 0,1, 0,05, 0,01 критические значения (по таблицам распределения Колмогорова). 2.3. Сравнить значение статистики, полученной в п. 2.1, с критическими значениями из п. 2.2 и сделать вывод о справедливости выдвинутой гипотезы о законе распределения. 2.4. Если выводы, сделанные в п. 1.3. и в п. 2.3, не совпадают, то объясните полученный результат. Содержание итогового документа. Для каждого критерия представить значение статистики и критические значения. Заключение о законе распределения генеральной совокупности. Контрольные вопросы и задания 1. Что такое статистическая гипотеза? 2. В чем состоит основной принцип проверки статистических гипотез?
20
3. Сформулируйте задачу проверки гипотезы о виде функции распределения и общую методику ее решения. 4. В чем заключается критерий согласия Колмогорова? В чем его достоинства и недостатки? 5. В чем заключается критерий Пирсона? В чем его достоинства и недостатки? 6. Какой критерий предпочтительнее использовать при решении Вашей задачи? Лабораторная работа № 5 Корреляционный и регрессионный анализ Цель работы – познакомиться с методами оценки коэффициента корреляции и проверки его значимости. Научиться строить простую линейную функцию регрессии и прогнозировать значение временного ряда. Подготовка к работе. Познакомиться с методами оценки коэффициента корреляции между двумя случайными величинами по их выборочным значениям и задачей проверки гипотезы о значимости коэффициента корреляции. Познакомиться с методами построения линейной функции регрессии, оценки ее параметров и построения доверительной области. Порядок выполнения работы 1. Корреляционный анализ. 1.1.Считать матрицу выборочных значений двух случайных величин Х и У (первая строка выборочные значения Х, вторая – выборочные значения У). 1.2. Рассчитать значение оценки коэффициента корреляции Пирсона ρ∗. 1.3. Рассчитать значения статистики T =
ρ* n − 2 * 2
1 − (ρ )
, необходимой для
принятия решения [1, С. 198], и определить при уровнях значимости 0,1, 0,05,
0,01
критические
значения
(с
помощью
обратной
функции
распределения χ 2 - Пирсона). Сравнить Т и эти значения между собой, сделать вывод о наличии корреляционной связи. 2. Линейная функция регрессии. 2.1.
Найти
оценки
параметров
линейной
стандартных функций intersept(x,y) и slope(x,y).
регрессии
с
помощью
21
2.2. Построить график зависимости у(х). На этом же графике представить зависимость выборочных значений уi в зависимости от хi. 2.3. Рассчитать доверительный интервал для параметров линейной регрессии. 2.4. Рассчитать доверительный интервал для дисперсии. 2.5. Построить на одном графике функцию регрессии и доверительную область для этой функции. Содержание итогового документа. Значение коэффициента корреляции и обоснованный вывод о его значимости. График функции регрессии с доверительной областью и выборочными значениями. Контрольные вопросы и задания 1. Как выглядит формула для оценки коэффициента корреляции? 2. Сформулируйте задачу проверки гипотезы о значимости коэффициента корреляции. Какая статистика используется для проверки этой гипотезы. Каково распределение этой статистики при справедливости основной гипотезы. Чему равно критическое значение? 3. Запишите формулы для простой линейной регрессии и оценок ее параметров. 4. Что такое доверительный интервал и доверительная область? ПРИЛОЖЕНИЕ Некоторые встроенные функции Mathcad Обозначения x и y – вещественные числа; m, n, i, j, k – целые числа; z – вещественное либо комплексное число; v и все имена, начинающиеся с v – векторы; A и B – матрицы либо векторы; M – квадратная матрица. Элементарные функции sin(z) – синус cos(z) – косинус tan(z) – тангенс cot(z) – котангенс ln(z) – натуральный логарифм
asin(z) – арксинус acos(z) – арккосинус atan(z) – арктангенс exp(z) – экспонента log(z) – десятичный логарифм
22
Другие функции Re(z) – действительная часть комплексного числа z. Im(z) – мнимая часть комплексного числа z. arg(z) – аргумент комплексного числа z (в радианах).
δ ( x, y) – символ Кронекера (1, если x=y, и 0, если x ≠ y; x и y – целочисленные величины.
Φ ( x ) – функция Хевисайда (1, если x ≥ 0, и 0 в противном случае). ceil(x) – наименьшее целое, не превышающее x. floor(x) – наибольшее целое число, меньшее или равное x. mod(x, modulus) – остаток от деления x по модулю. Аргументы должны быть действительными. Результат имеет такой же знак, как и x. if(cond, x, y) – x, если cond больше 0, иначе –y. until(выраж1, выраж2) – выраж1, пока выраж2 отрицательное. Функции для матриц и векторов augment(A, B) – присоединение матрицы B к матрице A справа; обе матрицы должны иметь одинаковое число строк. cols(A) – число столбцов в матрице A. csort(A, n) – сортировка матрицы A по столбцу n (перестановка строк по возрастанию значений элементов в столбце n). submatrix(A, ir, jr, ic, jc) – выделение из матрицы A субматрицы, состоящей из элементов, содержащихся в строках с ir по jr и в столбцах с ic по jc. Для сохранения порядка строк и столбцов необходимо, чтобы ir ≤ jr, ic ≤ jc. diag(v) – диагональная матрица, элемент главной диагонали которой – вектор v. identity(n) – единичная квадратная матрица размером n. last(v) – индекс последнего элемента вектора v. lenght(v) – число элементов в векторе v. matrix(m, n, f) – матрица, в которой (i, j)-й элемент содержит f(i, j), где i= 0, m и j= 0, n . max(A) – наибольший элемент матрицы A.
23
mean(v) – среднее значение вектора v. median(v) – медиана. min(A) – наименьший элемент матрицы A. norme(M) – евклидова норма матрицы M. rank(A) – ранг матрицы A. reverse(v) – перевернутый вектор v. rows(A) – число строк в матрице A. rsort(A, n) – сортировка матрицы A по строке n (перестановка столбцов по возрастанию значений элементов в строке n). sort(v) – сортировка вектора v по убыванию. stack(A, B) – формирование матрицы путем расположения A над B. Матрицы A и B должны иметь одинаковое число столбцов. stdev(v) – среднеквадратическое отклонение элементов вектора v. tr(M) – след матрицы M (сумма элементов, расположенных на главной диагонали квадратной матрицы M). var(v) – вариация элементов вектора v. hist(intervals, data) – гистограмма. Вектор intervals задает границы интервалов в порядке возрастания; data – массив данных. Возвращает вектор, содержащий число точек из data, попавших в соответствующий интервал. Линейная регрессия и прогноз corr(vx, vy) – коэффициент корреляции двух векторов – vx и vy. cvar(X, Y) – ковариация X и Y. Intercept(vx, vy) – возвращает скаляр: смещение по оси ординат линии регрессии y=ax+b в смысле метода наименьших квадратов для данных из vx и vy. predict(v,
m,
n)
–
прогноз.
Вектор,
содержащий
равноотстоящие
предсказанные значения n переменных, вычисленных по m заданным в массиве v данным. Slope(vx, vy) – возвращает скаляр: наклон линии регрессии y=ax+b в смысле метода наименьших квадратов для данных из vx и vy.
24
Решение уравнений и систем lsolve(M, v) – решение системы линейных алгебраических уравнений вида Mx=v. Minerr( x1 , x 2 ,K, x n )– вектор значений для x1 , x 2 ,K, x n , которые приводят к минимальной ошибке в системе уравнений. root(expr, var) – значение переменной var, при которой выражение expr равно нулю (в пределах точности TOL). polyroots(v) – корни многочлена степени n, коэффициенты которого находятся в векторе v длины n+1. Основные законы распределения [4–6] Функции, имена которых начинаются с d, вычисляют плотность распределения вероятностей (или вероятность для дискретных величин), с p – функции распределения, с q – квантили и с r – генерируют вектор m случайных чисел с соответствующим законом распределения.
As –
коэффициент асимметрии, Es – коэффициент эксцесса. dbeta(x, s1 , s 2 ), pbeta(x, s1 , s 2 ), qbeta(p, s1 , s 2 ), rbeta(m, s1 , s 2 ) – β – распределение
+ s 2 ) s1 −1 x (1 − x) s2 −1 , 0 < x < 1, s1 , s 2 > 0. Γ (s1 )Γ (s 2 ) s1 s1s2 ; Dξ = ; Mξ = 2 s1 + s2 ( s1 + s2 ) ( s1 + s2 + 1) f(x) =
As =
Γ (s1
2( s2 − s1 ) s1 + s2 + 1 ; ( s1 + s2 + 2) s1s2
6[( s1 − s2 ) 2 ( s1 + s2 + 1) − s1s2 ( s1 + s2 + 2)] . Es = s1s2 ( s1 + s2 + 2)( s1 + s2 + 3) dbinom(k, n, p), pbinom(k, n, p), qbinom(p, n, q), rbinom(m, n, p) – биномиальное распределение P(k)
= C kn p k (1 − p) n − k , 0 ≤ k ≤ n, 0 ≤ p ≤ 1.
25
Mξ = np ; Dξ = npq ;
As =
q− p 1 − 6 pq ; Es = ; q = 1− p . npq npq
dcauchy(x, l, s), pcauchy(x, l, s), qcauchy(p, l, s), rcauchy(m, l, s) – распределение Коши
f(x) =
1 , − ∞ < x < ∞ , s > 0. 2 πs(1 + ((x − l) s) )
Математическое ожидание отсутствует. Дисперсия отсутствует. Медиана равна моде и равна единице. 2
dchisq(x, n), pchisq(x, n), qchisq(p, n), rchisq(m, n) – χ n/2 −1
exp(− x/2) , x > 0, n > 0. 2Γ(n/2) 8 12 . ; Es = As = n n
⎛x⎞ f(x) = ⎜ ⎟ ⎝2⎠
Mξ = n ; Dξ = 2n ;
– распределение
dexp(x, r), pexp(x, r), qexp(p, r), rexp(m, r) – экспоненциальное распределение
f(x) = re − rx , x > 0, r > 0.
1 1 Mξ = ; Dξ = 2 ; r r
As = 2 ; E s = 6 .
dF(x, n 1 , n 2 ), pF(x, n 1 , n 2 ), qF(p, n 1 , n 2 ), rF(m, n 1 , n 2 ) – распределение Фишера
f(x) =
Γ
((n1 + n 2 ) 2) n1n1 2 n 2n 2 2 x (n1 −2) 2
Γ (n 1
2) Γ (n 2 2)(n 2 + n1x) (n1 + n 2 )
2
, x > 0, n i > 0.
n2 2n22 (n1 + n2 − 2) Mξ = , n2 > 4 ; ; Dξ = n2 − 2 n1 (n2 − 2) 2 (n2 − 4) As =
2(2n1 + n2 − 2) 2(n2 − 4) ; n2 > 6 ; n2 − 6 n1 (n1 + n2 − 2)
12[( n2 − 2) 2 ( n2 − 4) + n1 (5n2 − 2)( n1 + n2 − 2)] Es = ; n2 > 8 . n1 ( n1 + n2 − 2)( n2 − 6)( n2 − 8)
26
dgamma(x, s), pgamma(x, s), qgamma(p, s), rgamma(m, s) – γ - распределение
Mξ = s ; Dξ = s ;
x s −1 e − x f(x) = , x ≥ 0, s > 0. Γ (s) 2 6 ; Es = . As = s s
dgeom(k, p), pgeom(k, p), qgeom(p, q), rgeom(m, q) – геометрическое распределение
P(k ) = p(1 − p) k , 0 < p < 1. 1− p 1− p Mξ = ; Dξ = 2 ; p p
2− p p2 As = ; Es = +6 . 1− p 1− p
dlnorm(x, μ , σ ), plnorm(x, μ , σ ), qlnorm(p, μ , σ ), rlnorm(m, μ , σ ) – логнормальное (логарифмически нормальное) распределение
f ( x) =
Mξ = exp( μ +
1 exp[−(ln( x) − μ ) 2 /(2σ 2 )] , σx π
σ2 2
x > 0, σ > 0 .
) ; Dξ = [exp(2 μ + σ 2 )](exp(σ 2 ) − 1) ;
As = {[exp(σ 2 )] + 2} [exp(σ 2 )] − 1 ; Es = exp(4σ 2 ) + 2 exp(3σ 2 ) + 3 exp(2σ 2 ) − 6 . dlogis(x, l, s), plogis(x, l, s), qlogis(p, l, s), rlogis(m, l, s) – логистическое распределение
e − (x − l) s , − ∞ < x < ∞, s > 0. f(x) = s(1 + e − (x − l) s ) 2
M ξ = 1;
( sπ ) 2 Dξ = ≈ 3, 2899 s 2 ; 3
As = 0 ;
E s = 1, 2 .
dnbinom(k, n, p), pnbinom(k, n, p), qnbinom(p, n, q), rnbinom(m, n, q) – отрицательное биномиальное распределение
27
P(k ) = Cnk+ k −1 p n (1 − p ) k , 0 < p ≤ 1, n > 0, k ≥ 0 . nq ; Mξ = p
dnorm(x, μ , σ ), pnorm(x, μ , σ ), нормальное распределение
f ( x) = Mξ = μ ; Dξ = σ 2 ;
p2 6 + ; q =1− p . Es = nq n
1+ q ; As = nq
q Dξ = 2 ; p
1 e σ 2π
−
qnorm(p, μ , σ ),
rnorm(m, μ , σ )
–
(x−μ )2 2σ 2
, − ∞ < x < ∞, σ > 0 .
As = 0 ; Es = 0 .
dpois(k, λ ), ppois(k, λ ), qpois(p, λ ), rpois(m, λ ) – распределение Пуассона
P(k ) ≈ Mξ = λ ; Dξ = λ ;
λk e − λ k! As =
, λ > 0, k ≥ 0 . 1
λ
; Es =
1
λ
.
dt(x, n), pt(x, n), qt(p, n), rt(m, n) – распределение Стьюдента
+ 1) 2) ⎛ x 2 ⎞ ⎜1 + ⎟ f(x) = ⎜ n ⎟⎠ Γ ( n 2) πn ⎝ Γ ((n
Mξ = 0 ; Dξ =
n , n > 2; n−2
− (n +1) 2
, − ∞ < x < ∞, n > 0.
As = 0 , n > 3 ; Es =
6 , n > 4. n−4
dunif(x, a, b), punif(x, a, b), qunif(p, a, b), runif(m, a, b) – равномерное распределение
f(x) = a+b Mξ = ; 2
1 , a ≤ x ≤ b, a < b. b−a
(b − a ) 2 Dξ = ; 12
As = 0 ;
E s = − 1, 2 .
dweibull(x, s), pweibull(x, s), qweibull(p, s), rweibull(m, s) – распределение Вейбулла s
f(x) = sx s −1e − x , x > 0, s > 0.
28
1 M ξ = Г ( + 1) ; s
2 1 D ξ = [ Г ( + 1) + Г 2 ( + 1)] ; s s
3 2 1 1 Г ( + 1) − 3 Г ( + 1) Г ( + 1) + 2 Г 3 ( + 1) s s s s ; As = 3 2 2 1 [ Г ( + 1) − Г ( + 1)] 2 s s
4 3 1 2 1 1 Г ( + 1) − 4 Г ( + 1) Г ( + 1) + 6 Г ( + 1) Г 2 ( + 1) − 3 Г 4 ( + 1) s s s s s s − 3. Es = 2 1 [ Г ( + 1) − Г 2 ( + 1)] 2 s s
Другие функции cnorm(x) – интеграл вероятности
1 Φ (x) = 2π
x
−t ∫e
2
2
dt .
−∞
erf(x) – функция ошибок
1 erf(x) = 2π Γ (z)
x
2
−t ∫ e dt .
−∞
– гамма-функция. rnd(x) – псевдослучайное равномерно распределенное число в диапазоне от нуля до x.
ПРЕДОПРЕДЕЛЕННЫЕ ПЕРЕМЕННЫЕ Ниже приведены предопределенные переменные Mathcad с их значениями по умолчанию.
π =3.14159… e=2.71828…
∞ %=0.01
Число π . В численных расчетах Mathcad использует значение π с учетом 15 значащих цифр. Чтобы напечатать π , нажмите [Ctrl][Shift]P Основание натуральных логарифмов. В численных расчетах Mathcad использует значение с учетом 15 значащих цифр Бесконечность. В численных расчетах это заданное большое число (10 307 ). Чтобы напечатать ∞ , нажмите [Ctrl][Shift]Z Процент. Используйте его в выражениях, подобных 10 ⋅ %
29
TOL=10 −3 ORIGIN=0 PRNCOLWIDTH=8 PRNPRECISION=4
Допускаемая погрешность для различных алгоритмов аппроксимации (интегрирования, решения уравнений и т.д.) Начало массива. Определяет индекс первого элемента массива Ширина столбца, используемая при записи файлов функцией WRITEPRN Число значащих цифр, используемых при записи файлов функцией WRITEPRN
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Радченко Т. А. Теория вероятностей и математическая статистика / Т. А. Радченко, Ю. С. Радченко. – Воронеж : Изд-во Воронеж. ун-та, 1998. – 240 с. 2. Методические указания к практическим занятиям по курсу «Теория вероятностей и математическая статистика» / cост. Б. Н. Воронков [и др.]. – Воронеж : ЛОП ВГУ, 1997. – 32 с. 3. Плис А. И. Mathcad: математический практикум для экономистов и инженеров / А. И. Плис, Н. А. Сливина. – М. : Финансы и статистика, 1999. – 600 с. 4. Mathcad 6.0 Plus. Финансовые, инженерные и научные расчеты в среде Windows 95. – М. : Информ.-издат. дом «Филинъ», 1996. – 712 с. 5. Дьяконов В. П. Справочник по Mathcad PLUS 6.0 PRO / В. П. Дьяконов. – М. : СК Пресс, 1997. – 336 с. 6. Вадзинский Р. Н. Справочник по вероятностным распределениям / Р. Н. Вадзинский. – СПб.: Наука, 2001. – 295 с. 7. Математическая статистика : учеб. для вузов / В. Б. Горяинов [и др.]. – М.: Изд - во МГТУ, 2001. – 424 с.
30
Учебное издание
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Лабораторный практикум для вузов
Составители:
Радченко Татьяна Антониновна, Дылевский Александр Вячеславович, Воронков Борис Николаевич
Редактор Е. С. Котлярова
31
Для заметок