Невинномысский химический колледж
Теория вероятностей и математическая статистика Опорный конспект + сборник задач Посо...
149 downloads
314 Views
978KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Невинномысский химический колледж
Теория вероятностей и математическая статистика Опорный конспект + сборник задач Пособие для студентов специальности 2202
Невинномысск 2005
Составители Васько О.Н., Капустин Е.И.
АННОТАЦИЯ В сборнике представлены материалы, необходимые для изучения курса «Теория вероятностей и математическая статистика» студентами 22-ой группы специальностей средних профессиональных учебных заведений. Сборник не содержит подробного теоретического материала, т.е. не дублирует известных учебников по дисциплине. В сборник включены опорный конспект: все необходимые определения и формулы и к каждой главе – разнообразные задачи, как для решения на уроках, так и для самостоятельной работы студентов. Сборник адресован студентам третьего курса и их преподавателям.
Печатается по рекомендации научно-методического отдела Невинномысского химического колледжа
2
СОДЕРЖАНИЕ 1. О сборнике /Вместо предисловия/ ..........................................….......3 2. Элементы комбинаторики……….. ...............................…...........…...4 3. Элементы теории вероятностей......................................……..….…..7 4. Теоремы сложения и умножения вероятностей.....................……...9 5.Формула полной вероятности……………………..…...................…11 6.Формула Бернулли………………………..………...........…………..13 7. Локальная теорема Лапласа…..……………………………………..13 8. Интегральная теорема Лапласа……………………………………...14 9.Теорема Пуасона………………………………………………………14 10.Дискретные случайные величины...........................................…..…16 11.Непрерывные случайные величины......….…………………………18 12.Равномерное распределение......................................……………….20 13. Нормальное распределение…………………………………………21 14. Показательное распределение………………………………………23 15.Вариационные ряды. Генеральная совокупность и выборка....…...25 16. Числовые характеристики вариационного ряда……………………27 17.Выборочный метод и статистическое оценивание............................31 18. Ошибки выборки……………………………………………………..32 19. Интервальное оценивание……………………………………………33 20. Проверка статистических гипотез......................................………….36 21.Корреляционная зависимость. …………………………………….....39 22.Способ наименьших квадратов……………………………………….40 23. Приложения..............................................................................…..… .46 23.1.Треугольник Паскаля..........................……………………………….46 23.2.Значения функции ϕ (x) ……………………… ……………………47 23.3.Значения функции Ф(х)……………………… …………………. ..48 23.4.Критические точки распределения Стьюдента………… … ……..49 О сборнике /Вместо предисловия/
Уважаемые студенты специальности 2202! Вы приступаете к изучению очередного математического курса. Эта дисциплина изучается только студентами Вашей специальности и Вам очень необходимо владение понятиями теории вероятностей и статистики. Для успешного освоения настоящей дисциплины и подготовлен этот сборник. Это не учебник. Только по нему невозможно освоить предмет. Предполагаем такой замкнутый «круг» изучения дисциплины: студент – учебные занятия – литература – самостоятельная работа – настоящий сборник – студент. Что же содержит настоящий сборник, как он устроен и как им пользоваться? Прежде всего сборник содержит весьма полный опорный конспект: определения, толкование понятий, теоремы, схемы и графики и, конечно же, все необходимые формулы. Но здесь нет выводов этих формул, доказательства теорем и т.д. Все это есть в учебной литературе и будет воспроизведено на наших уроках. Но основная часть пособия – это задачи для решения на уроках и для домашних заданий. В сборнике нет ни одной решенной задачи. А как же тогда научиться их решать? Быть внимательным и активно работать на уроках, самостоятельно изучать литературу по предмету. Учебной литературы по дисциплине издано немало (см. соответствующий раздел). Помимо учебников и пособий существует немало изданий научно – популярной литературы, хотелось бы, чтобы эти издания заинтересовали Вас. Это первое издание в колледже по дисциплине. Потому в нем не исключены неточности, опечатки, повторы (составители обыкновенные люди и не могут привлечь 3
многоопытных редакторов). Будем благодарны студентам за рекомендации по улучшению качества издания, может быть, за расширение круга задач. Выражаем благодарность студентам Шкуркину Дмитрию и Назарову Николаю за помощь в создании и редактировании графических объектов. Ваши преподаватели
Элементы комбинаторики Пусть задано множество, содержащее конечное число элементов. (Студенты в группе, яблоки в корзине, набор костей домино и т.д.) Такие множества будем называть конечными и обозначать {a,b,c,d}. Если каждому элементу конечного множества поставлены в соответствие натуральные числа, то такое упорядоченное множество называется перестановкой и обозначается (a,b,c,d). Сколько перестановок можно составить из nэлементного множества? Из трехэлементного 6: (a,b,c), (a,c,b), (b,a,c), (b,c,a), (c,a,b), (c,b,a). Число перестановок из n-элементного множества вычисляется по формуле: Рn = n!, где n! - произведение n(n - 1)(n - 2)(n - 3)…3*2*1. Полезна рекуррентная формула Pn = nPn-1. Прост и комбинаторный смысл числа перестановок: сколькими способами можно упорядочить конечное n-элементоное множество. Размещением из n по k называется упорядоченное k-элементное подмножество nэлементного множества. По смыслу определения ясно, что k ≤ n. Число размещений из n по k обозначается Ank . Очевидно, что Ann = Рn = n!, An1 = n, An2 =n*(n – 1), An3 =n*(n –1)*(n–2 ) An4 =n*(n – 1)*(n – 2)*(n – 3) и т.д. Ank - это произведение k старших сомножителя
натурального числа n, т. е. Ank = n*(n – 1)*(n – 2)*…*(n – k + 1) (*). Помножая и деля это выражение на (n – k)! можно получить еще формулу: n(n − 1)(n − 2)...(n − k + 1)(n − k )! n! = = n(n –1)(n – 2)(n –3)…3*2*1, т.е. k Ank = (n − k )! (n − k )! старших сомножителя числа n. Сочетанием из n по k называется неупорядоченное k-элементное подмножество nэлементного множества. По смыслу определения ясно, что k ≤ n. Число сочетаний из n по k обозначается C nk . Очевидно, что неупорядоченных подмножеств n-элементного множества в Ank n * (n − 1) * ... * (n − k + 1) = (*) Pk k! Помножая и деля это выражение на (n – k)! можно получить еще формулу: n * (n − 1) * ... * (n − k + 1)(n − k )! n! C nk = ; = k! (n − k )! k! (n − k )!
k! меньше чем упорядоченных подмножеств, т.е. C nk =
На практике, для вычисления C nk используют формулу (*) В приложении №1 приведены значения C nk , так называемый треугольник Паскаля. Некоторые важные свойства числа сочетаний, которые необходимо применять при решении различных задач: 1) C n0 = C 00 = 1; 2) C n1 = n; 3) C nk = C nn − k - эту формулу удобно применять при k > n/2 4) C n0 + C n1 + C n2 + C n3 + … + C nn = 2n; 5) C nk + C nk +1 = C nk++11 - рекуррентная формула. Размещение с повторениями из n элементов по k элементов может содержать любой элемент сколько угодно раз от 1 до k включительно, или не содержать его совсем, т.е. каждое
4
размещение с повторениями из n элементов по k элементов может состоять не только из различных элементов, но из k каких угодно и как угодно повторяющих элементов. Число размещений с повторениями вычисляется по формуле: Ank( с повт ) = n k Сочетание с повторениями из n элементов по k (k ⊆ n ) элементов может содержать любой элемент сколько угодно раз от 1 до k включительно, или не содержать его совсем, т.е. каждое сочетание с повторениями из n элементов по k элементов может состоять не только из k различных элементов, но из k каких угодно и как угодно повторяющих элементов. Следует отметить, что если, например два соединения по k элементов отличаются друг от друга только порядком расположения элементов, то они не считаются различными сочетаниями. Число размещений с повторениями вычисляется по формуле: (n + k − 1)! C nk с повт = C nk+ k −1 = ; Замечание: k может быть и больше n. k! (n − k )! Пусть имеется n + k + s предметов. Сколькими способами можно разделить эти предметы на три группы так, чтобы в одной группе было n предметов, в другой k предметов, в третьей s предметов? Это задача на перестановки с повторениями. Число перестановок с повторениями находится по формуле: (Pn + k + s )с повт = (n + k + s)! n! k! s!
( )
Комбинаторные уравнения и неравенства: 1) An3 − 5C153 = 455
5) 3C 2nn−1 = 5C 2nn −1 1 10) C n3 = C n4+ 2 5 2 Pn P 14) 2 n = P2 n −1 2 Pn − 2
2) A53 + 5Cn15 = 165
3) P5 − 3 An2 = 30 4) An3 − C n3 = 10C n3−1
C 2nn−1 C 2nn−+11 13 C 2nn −1 9 7 = 8) = 9) = 7 C 2nn−+11 13 C 2nn+1 C 2nn−1 17 P P C n −1 17 12) n2 n = 13) 2 n −1 = n − 2 2 Pn P2 n C 2 n −1 9
6) C nn − 2 + C nn −1 = 55 7) 11)
C 2nn −1 9 = C 2nn−1 17
An7 15) 5 = 1920 16) Cn19−1 < Cn19 17) Cn15− 2 > Cn15 18) Cnn −1 < C2nn+1 C15
19) C nk < C nk +1 20) C 27n > C 25n 21) Pn > C102 22) An5 = 18 An4− 2 23) An6 = 28 An5− 2 24) An3+1 Pn − 2 = 30 Pn ; 25) 2C nn+−22 = An2 ; 26) 4C nn+−41 = 3 An3+ 2 ; 27) 2C n2+ 5 − 15C n1 = 75
Комбинаторные задачи 1) В карточке спортлото 36 клеток. Играющий должен отметить 6. Каково число всех возможных вариантов? 2) Сколькими способами можно выбрать четырех человек на 4 различные должности из 15 кандидатов на эти должности? 3) В группе 28 студентов. Сколькими способами можно избрать 6 делегатов на профсоюзную конференцию? 4) Правление фирмы выбирает трех человек на различные должности из 10 кандидатов. Сколькими способами это можно сделать? 5) Сколькими способами можно выбрать 6 пирожных в кондитерской, где есть 4 разных сорта пирожных? 6) Из 20 милиционеров необходимо составить наряд из 6 человек.. Сколькими способами это можно сделать? 5
7) Сколько прямых можно провести через 8 точек, никакие три из которых не лежат на одной прямой? 8) Сколько различных правильных дробей можно составить из чисел 1,2,3,5,7,11,13, берущихся попарно? (а любых, в том числе неправильных?) 9) В группе детского сада 10 детей. Сколькими способами их можно поставить в колонну парами? 10) Сколькими способами можно переставить буквы слова «хорошо» так, чтобы три буквы «о» не шли подряд? 11) Сколько трехзначных чисел можно из множества цифр 1,2,3,4,5,6 а)без повторений; б)с повторениями? 12) Сколькими способами можно переставить цифры числа 123456789 так, чтобы четные цифры остались на четных местах? 13) Студенту необходимо сдать 4 экзамена на протяжении 8 дней. Сколькими способами это можно сделать? 14) На конференции по математике должны выступить 4 студента А, Б, С, Д. Сколькими способами их можно разместить в списке докладчиков, если Б не может выступать до того момента пока не выступит А? 15) Специалист по информационным технологиям ежедневно «посещает» 6 определенных сайтов в Интернете. Если порядок просмотра этих сайтов случаен, то сколько существует способов его осуществления? 16) В премьер лиге чемпионата страны по футболу 16 команд, в сезоне они встречаются друг с другом 2 раза: на своем и чужом поле. Сколько игр проводится в премьер лиге? Команды, занявшие 1,2,3 места, награждаются соответствующими медалями. Сколькими способами могут распределиться призеры? А команды, занявшие 2 последних места, покидают премьер лигу. Сколькими способами может сформироваться «клуб неудачников»? Сколькими способами могут распределиться места с 1-го по 16-е? 17) В скольких точках пересекаются диагонали выпуклого 10-тиугольника, если никакие три из них не пересекаются в одной точке? 18) Из скольких различных предметов можно составить 210 размещений по два элемента в каждом? 19) Замок сейфа открывается, если набрана правильная комбинация из четырех цифр от 0 до 9. Кода Вы не знаете. Найти наибольшее число безуспешных попыток для а) код не содержит одинаковых цифр; б) код содержит одинаковые цифры. 20) Из отделения военнослужащих 12 человек формируется караул, состоящий из начальника караула, его заместителя и трех караульных. Сколькими способами возможно сформировать такой караул? Найдите три различных подхода к решению задачи. 21) Сколько различных «слов» можно составить, переставляя буквы слова «математика»? 22) Сколько можно сделать костей домино, используя числа 0,1,2,3,4,5,6,7,8,9? 23) Сколькими способами можно разместить 12 предметов в трех различных ящиках? 24) Сколькими способами можно разбить 2n рабочих на бригады по два человека? 25) На погранзаставе 40 рядовых и 8 офицеров. Сколькими способами можно составить наряд по охране границы, если он состоит из дух офицеров и четырех рядовых? 26) В стройотряде 15 студентов. Сколькими способами можно их можно разбить на три бригады численностью 3, 7 и 5 человек? Решите эту же задачу при условии, что в каждой бригаде назначается старший. 27) Сколько можно изготовить трехцветных флажков, если использовать следующие цвета: белый, синий, красный, желтый, зеленый, черный? 28) Группа из 28 студентов обменялась фотокарточками. Сколько было фотокарточек? 29)В команду должны быть отобраны 4 спортсмена из 10. Сколькими способами это можно сделать, если два определенных спортсмена должны войти в команду? 6
30) Сколькими способами можно 5 шариков разбросать по 8 лункам, если каждая лунка может уместить все 5 шариков? 31)В корзине 12 яблок, 10 груш и 20 слив. Сколькими способами могут разделить между собой эти фрукты двое ребят, так чтобы каждый из них получил не менее четырех фруктов каждого вида? 32) Аккорд – одновременное звучание двух и более нот. Сколько аккордов модно воспроизвести на семи нотах? 33)Как известно, автомобильные номера содержат три буквы (используется 26) и три цифры. Сколько различных номеров существует? В нашем городе автомобильные номера начинаются с «К». Сколько таких номеров можно составить? 34)Сколькими способами можно расставить белые фигуры (2 коня, 2 слона, 2 ладьи, короля и ферзя) на первой линии шахматной доски? 35) Сколькими способами можно расставить на 32 черных полях шахматной доски 12 белых и 12 черных шашек? 36)На плоскости проведено n прямых, причем никакие две из них не параллельны и никакие три не пересекаются в одной точке. Сколько точек пересечения имеют эти прямые? 37)На одной из параллельных прямых отмечено 10 точек, на другой 7. Каждая точка одной прямой соединена с каждой точкой другой прямой. Найдите число точек пересечения полученных отрезков, если никакие три из них не пересекаются в одной точке.
Элементы теории вероятностей Классическое определение вероятности Наблюдаемые нами события можно разделить на достоверные, невозможные и случайные. Достоверным называется событие, которое обязательно произойдет, если будет осуществлена определенная совокупность условий. Невозможным называют событие, которое заведомо не произойдет, если будет осуществлена определенная совокупность условий. Случайным называют событие, которое может произойти, либо не произойти, если будет осуществлена определенная совокупность условий. Т.е. под случайным событием, связанным с некоторым опытом, будем понимать всякое событие, которое либо происходит, либо не происходит при осуществлении этого опыта. Вместо слов «осуществлена совокупность условий» зачастую говорят «произведено испытание». События называют несовместными, если появление одного из них исключает появление других событий в одном и том же испытании. Система событий образует полную группу для данного испытания, если любым исходом его является одно или только одно событие этой группы. Возможные, исключающие друг друга, результаты одного испытания называются элементарными исходами испытания. Исход испытания называется благоприятствующими некоторому событию, если в результате этого исхода появляется указанное событие. События называются равновозможными, если нет оснований считать одно из них более или менее возможным, чем остальные. Определение. Вероятностью Р(А) события А называют отношение числа благоприятствующих этому событию исходов m к общему числу n всех возможных m элементарных исходов испытания, образующих полную группу, т.е Р(А) = n Свойства вероятности: 1. Вероятность достоверного события равна единице. 2. Вероятность невозможного события равна нулю.
7
3. Вероятность случайного события есть число, заключенное между нулем и единицей. Таким образом, вероятность любого события А удовлетворяет неравенству 0 ≤ P(A) ≤ 1. Относительная частота и статистическая вероятность Классическое определение вероятности при переходе от простейших примеров к сложным задачам наталкивается на трудности принципиального характера. Во-первых, число элементарных исходов испытания не всегда конечно, во-вторых, очень часто невозможно представить результат в виде совокупности элементарных исходов, в-третьих, трудно указать основания, позволяющие считать элементарные исходы равновозможными. Поэтому используют также статистическое определение вероятности. Относительной частотой события А называют отношение числа испытаний m, в которых событие А появилось, к общему числу n фактически проведенных испытаний, m т.е. W (A) = . n При однотипных массовых испытаниях во многих случаях наблюдается устойчивость относительной частоты события, которая состоит в том, что в различных опытах относительная частота изменяется мало (тем меньше, чем больше произведено испытаний), колеблясь около некоторого постоянного числа. Это число называется вероятностью события А в статистическом смысле. Для осуществления статистической вероятности события А требуется: а) возможность хотя ба принципиально, проводить неограниченное число испытаний, в каждом из которых событие А наступает или не наступает; в) устойчивость относительной частоты события А в различных сериях большого числа испытаний. Задачи на непосредственное вычисление вероятностей 1) На трех одинаковых карточках напечатаны буквы К,Н,Х. Карточки положены буквами вниз и перемешаны. После чего извлекаются по одной, переворачиваются и кладутся слева на право. Какова вероятность, что Вы прочтете название нашего учебного заведения? 2)Та же по смыслу задача, но на карточках напечатано В,М,Э,1,2. Какова вероятность, что Вы прочтете название группы? А если на карточках напечатано В,М,Э,2,2 то искомая вероятность останется прежней? 3)Куб, все грани которого окрашены распилен на 1000 кубиков одинакового размера, которые затем тщательно перемешаны. Найти вероятность того, что наудачу извлеченный кубик будет иметь окрашенных граней а) одну, б) две, в)три. 4)При стрельбе относительная частота попаданий оказалась равной 0.85. Найти число попаданий, если всего было произведено 120 выстрелов. 5)Участники жеребьевки тянут из ящика жетоны с номерами от 1 до 100. Найти вероятность того, что номер первого наудачу извлеченного жетона не содержит цифры 5. 6)Набирая номер телефона абонент забыл последние 2 цифры и, помня лишь то, что эти цифры различны набрал их наудачу. Найти вероятность того, что набраны нужные цифры. 7)В ящике из 10 деталей 7 стандартных. Найти вероятность того, что среди взятых на удачу 6 деталей 4 стандартных. (Это, так называемая задача о выборке, обобщите ее и составьте аналогичные.) 8)Восемь различных книг расставляются рядом на одной полке. Найти вероятность того, что две определенные книги окажутся поставленными рядом. 9)В забеге участвуют 5 спортсменов: А, Б, В, Г, Д, каждый из которых имеет одинаковые шансы на успех. Какова вероятность того, что парвые три места займут соответственно бегуны А, Б, В? 10)Автобус должен сделать 8 остановок. Найти вероятность того, что никакие два пассажира из пяти, едущих в автобусе, не выйдут на одной и той же остановке. 11)Из 15 билетов выигрышными являются четыре. Какова вероятность того, что среди 6ти билетов, взятых на удачу, будет два выигрышных?
8
12)Монета подброшена два раза. Найти вероятность того, что хотя бы один раз появится цифра. 13)В круг вписан квадрат. Какова вероятность того, что точка, наудачу поставленная в круге, окажется внутри квадрата? 14)Квадрат со стороной a разбит на 4 части отрезками прямых, соединяющих середины противоположных сторон. В этот квадрат брошена монета радиуса r < a/4. Найти вероятность того, что монета не пересечет ни одной из сторон квадратов, на которые разбит основной квадрат. 15)Внутри круга радиуса 20см. проведены две непересекающиеся окружности – одна радиусом 5см., другая – радиусом 10 см. Найти вероятность того, что точка, взятая наудачу внутри большого круга, окажется лежащей внутри одной из малых окружностей. 16)Двое друзей условились встретиться в определенном месте между 13 и 14 часами. Пришедший первым ждет второго в течение 20 минут, после чего уходит. Определить вероятность встречи друзей, если моменты их прихода в указанном промежутке времени равновозможны. 17)Из коробки, содержащей карточки с буквами а, к, о, р, р, т, т извлекают одну за другой буквы и располагают в порядке извлечения. Какова вероятность, что Вы прочтете слово трактор? 18)(Занимательная задача: легкомысленный член жюри) В жюри из трех человек два члена независимо друг от друга принимают правильное решение с вероятностью p, а третий для выяснения решения бросает монету. Окончательное решение выносится большинством голосов. Жюри из одного человека выносит справедливое решение с вероятностью p. Какое из этих жюри вынесет правильное решение с большей вероятностью? Теоремы сложения и умножения вероятностей Суммой А + В событий называется событие, состоящее в том, что в результате опыта наступит или событие А, или событие В, или оба вместе. ( Другими словами, суммой А+В событий А и В называется событие, состоящее в появлении хотя бы одного из этих событий): Если события А и В несовместны, то А + В – это событие А, или событие В. Суммой нескольких событий называется событие, состоящее в появлении хотя бы одного из этих событий. Произведением АВ событий А и В называется событие, состоящее в совместном появлении и события А, и события В. Произведением нескольких событий называется событие, состоящее в их совместном появлении. Событием, противоположным событию А, называется событие, обозначаемое A и состоящее в том, что в результате опыта событие А не наступит.
Теорема сложения вероятностей несовместных событий. Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий: P(A + B) = P(A) + P(B) Следствие1. Вероятность появления одного из нескольких попарно несовместных событий, безразлично какого, равна сумме вероятностей этих событий: Р(А1 + А2+ …+ Аn) = P(A1) + P(A2) + P(A3) + …+ P(An). Следствие 2. Если события А1, A2, A3, …An образуют полную группу событий, то сумма их вероятностей равна единице: P(A1) + P(A2) + P(A3) + …+ P(An) = 1. Следствие 3. Сумма вероятностей противоположных событий равна единице: P(A) + P( A ) = 1. Событие А называется независимым от события В, если вероятность события А не зависит от того, произошло событие В или нет. 9
Несколько событий называются независимыми в совокупности, если любое из них не зависит от любой совокупности остальных. Событие А называется зависимым от события В, если вероятность события А меняется в зависимости от того, произошло это событие В или нет. Вероятность события А, вычисляемая при условии, что событие В произошло, называется условной вероятностью события а и обозначается PB(A) Теорема умножения вероятностей. Вероятность произведения двух событий равна произведению одного из них на условную вероятность другого, вычисленную при условии, что первое из них произошло: P(AB) = P(A)PA(B) = P(B)PB(A). Следствие 1. Если событие А не зависит от события В, то и событие В не зависит от события А. Следствие 2. Вероятность произведения двух независимых событий равна произведению вероятностей этих событий: P(AB) = P(A)P(B). Для вычисления вероятности совместного появления большего числа событий, например, четырех, используют формулу: P(ABCD) = P(A)PA(B)PAB(C)PABC(D). Для нескольких независимых в совокупности событий вероятность их произведения равна произведению их вероятностей: P(A1A2…A3) = P(A1)P(A2)…P(An). Следствие 3. Вероятность появления хотя бы одного из событий А1,A2…An., независимых в совокупности, равна разности единицы и произведения вероятностей противоположных событий A 1, A 2,… A n: PA1 + A 2 + …An) = 1 – P( A 1) P( A 2)… P( A n) Два события называются совместными, если появление одного из них не исключает появления другого в одном и том же испытании. Теорема сложения вероятностей совместных событий. Вероятность появления хотя бы одного из двух совместных событий равна сумме вероятностей этих событий без вероятности их совместного появления: P(A + B) = P(A) + P(B) – P(AB). Задачи на теоремы сложения и умножения вероятностей 1) В магазин поступило 30 телевизоров, 5 среди которых имеют скрытые дефекты. Наудачу отбираются 2 телевизора для проверки. Какова вероятность того, что оба они не имеют дефектов? 2) Вероятность безотказной работы двух независимо работающих сигнализаторов равна 0.6 и 0.7. Найти вероятность того, что сработают: а) оба сигнализатора, б) хотя бы один сигнализатор. 3) Изделия проверяются на стандартность. Вероятность того, что изделие стандартно равна 0.8. Найти вероятность того, что из двух проверенных изделий только одно стандартно. 4) Партия товара, состоящая из 15 ящиков, подлежит приемке, если при проверке наугад двух выбранных ящиков окажется, что содержащиеся в них изделия удовлетворяют стандарту. Найти вероятность приемки партии, содержащей в 5 ящиках нестандартные изделия. 5) В группе специалистов 3 экономиста и 5 юристов. Для проведения проверки работы фирмы наудачу отбираются 4 специалиста. Какова вероятность того, что в эта группа состоит из двух юристов и двух экономистов? 6) В партии деталей 12 стандартных изделий и 3 нестандартных. 5 деталей, выбранных наудачу, проверяют на соответствие стандарту. Найти вероятность того, что среди них не окажется нестандартных.
10
7) В экзаменационном билете три вопроса, Вероятность ответа на первый вопрос - 0.9; на второй - 0.7; на третий - 0.5. Найти вероятность различных оценок. 8) На складе телевизионного ателье из имеющихся 20 микросхем 6 изготовлены первым заводом, остальные - вторым. Найти вероятность того, что две наудачу взятых микросхемы изготовлены первым заводом. 9) Студент знает 20 вопросов из 25-ти. Найти вероятность того, что студент знает предложенные ему экзаменатором три вопроса. 10) В рабочем поселке 11 торговых точек, 8 из которых - ИЧП. Для проверки наудачу отбираются 5. Какова вероятность того, что в число проверяемых попадут только частные торговые предприятия? 11)Брошены монета и игральная кость. Найти вероятность совмещения событий: «появился герб», появилось 6 очков». 12)Монета бросается до тех пор пока 2 раза подряд не выпадет одной и той же стороной. Найти вероятности следующих событий: а)опыт окончится до шестого бросания; б)потребуется четное число бросаний. 13)Вероятности поражении цели первым стрелком равна 0,8, вторым 0,6. Найти вероятности следующих событий: а) цель поражена двумя попаданиями; б) одним выстрелом; в) цель не поражена. 14)В урне находится 5 белых, 4 черных и 3 синих шара. Каждое испытание состоит в том, что наудачу извлекают один шар, не возвращая его в урну. Найти вероятность того, что при первом испытании появится белый шар, при втором черный и при третьем – синий. 15)Три электрические лампочки последовательно включены в цепь. Вероятность того, что одна (любая) лампочка перегорит, если напряжение в сети превысит номинальное, равна 0,6. Найти вероятность того, что при повышенном напряжении тока в цепи не будет. 16)В урне 7 белых и 9 красных шаров. Из урны наугад вынимают первый шар, определяют цвет. Затем второй шар. Найдите вероятность, что они оба белые. 16.1)Из урны (задача 16) одновременно вынимают два шара. Найдите вероятность того, что они оба белые. (Это разные задачи?) Формула полной вероятности Пусть событие А может произойти в результате осуществления одного события из некоторой полной группы событий H1, H2, …Hn. События этой группы обычно называют гипотезами. Тогда P(A) = P(H1)PH1(A) + P(H2) PH2 +…+ P(Hn)PHn(A) (1) (формула полной вероятности), причем P(H1) +P(H2) +…+ P(Hn) = 1.
Пусть в результате испытания произошло событие А, которое могло наступить только вместе с одним из событий H1, H2,…Hn, образующих полную группу событий (они называются гипотезами). Требуется найти вероятность событий H1, H2,… Hn после испытания, когда событие А имело место, т.е. PA(Hi), i = 1,2,…n. Для нахождения этих вероятностей используют формулы Байеса (формулы гипотез): PA (Hi) =
P ( H i ) PH i ( A) P ( H 1 ) PH 1 ( A) + P( H 2 ) PH 2 ( A) + ... + P( Hn) PHn( A)
(2)
Замечания. 1) Вероятности PA(H1) называются послеопытными (апостериорными) вероятностями гипотез Hi, а вероятности P(Hi) - доопытными (априорными) вероятностями гипотез Hi. Эти вероятности различаются. 2) Знаменатель в правой части формулы (2) совпадает с правой частью формулы (1) и равен P(A). 11
Задачи 1 Два автомата производят детали, которые поступают на общий конвейер. Вероятность получения нестандартной детали на первом автомате равна 0.06, на втором 0.02. Производительность первого автомата втрое больше, чем второго. а) Найти вероятность того, что наудачу взятая с конвейера деталь нестандартна. б) Взятая с конвейера деталь оказалась нестандартной. Найти вероятность того, что она изготовлена на первом автомате. 2 Три хлебокомбината города производят продукцию, обеспечивающую город хлебобулочными продуктами в пропорции 2:3:5. Первый хлебокомбинат производит 30% продукции высшего качества, второй - 40%, третий - 60%. Найти вероятность того, что приобретенное хлебобулочное изделие оказалось высшего качества. Приобретенный продукт оказался высшего качества, найти вероятность того, что это изделие изготовлено на втором хлебокомбинате. 3 Сообщение можно передать письмом, по телефону и по факсу с одинаковой вероятностью. Вероятность того, что сообщение дойдет до получателя в каждой из перечисленных возможностей соответственно равны 0.7, 0.6 и 0.9. 1) Какова вероятность получения сообщения? 2) Сообщение адресатом получено, какова вероятность, что оно передано по факсу? 4 В группе 25 студентов: 4 отличника, 9 хорошистов, остальные - троечники. Вероятность получения оценки “отлично” на экзамене по математике для первых - 0.95, для вторых - 0.7, для троечников - 0.3. 1) Какова вероятность того, что наудачу взятый студент получил на экзамене пятерку? 2) Студент получил пятерку на экзамене. Найти вероятность, что он хорошист. 5 Из 1000 экземпляров однотипного товара 300 принадлежат первой партии, 500 второй и 200 - третьей. В первой партии 6%, во второй 5%, в третьей 4% бракованного товара. 1) Определить вероятность того, что наудачу выбранный экземпляр бракованный. 2) Наудачу выбранный экземпляр оказался стандартным, найти вероятность того, что он принадлежит третьей партии. 6 В торговое предприятие поступают однотипные изделия с трех фирмпроизводителей: 30% с первой, 50% со второй, 20% с третьей. Среди изделий первой фирмы 80% первосортных, второй - 90%, третья фирма изготовляет 70% первосортных изделий. 1) Куплено одно изделие, Найти вероятность того, что оно первосортное. 2) Купленное изделие оказалось не первосортным, найти вероятность того, что оно изготовлено третьей фирмой. 7 В ящике три детали, причем равновероятны все возможные предположения о числе стандартных деталей. В этот ящик брошена стандартная деталь после чего наудачу извлекается одна деталь. Найти вероятность того, что эта деталь стандартна. 8 В урне 7 белых и 3 красных шара. Из урны удаляются два шара, о цвете которых неизвестно. После этого из урны извлекается один шар, найти вероятность того, что этот шар красный. 9 На двух станках производятся одинаковые детали. Вероятность того, что деталь стандартная, для первого станка равна 0.8, для второго - 0.9. Производительность второго станка втрое больше, чем первого. 1) Найти вероятность того, что взята наудачу деталь стандартна. 2) Взятая наудачу деталь оказалась бракованной, найти вероятность того, что она сделана на первом станке. 10 В компьютерном классе института 7 IBM типа Pentium и 5 компьютеров других модификаций. Вероятность сбоя в работе в течение учебного занятия для Pentium равна 0.9, для других компьютеров - 0.7. Студент на занятии работает за произвольно выбранным компьютером. 1) Найти вероятность того, что в течение занятия его компьютер не “зависнет”. 2) На занятии компьютер дал сбой в работе, найти вероятность того, что студент работал на Pentiumе. 11)Найти вероятность того, что к первой наудачу извлеченной кости домино можно приставить и вторую.
12
12)В ящик, содержащий три одинаковых детали, брошена стандартная деталь, а затем извлечена одна деталь. Найти вероятность того, что извлечена стандартная деталь, если равновероятны все возможные предположения о числе стандартных деталей, первоначально находившихся в ящике. 13)Группе студентов для прохождения производственной практики выделено 30 мест: 15 – на «Азоте», 8 – на «Кванте», 7 – на «Арнесте». Какова вероятность того, что студент и студентка, которые дружат, будут направлены на одно предприятие, если руководитель практики ничего не знает об их отношениях? 14)Из колоды, содержащей 52 карты, наугад вынимают 4 карты. найдите вероятность того, что а) все эти карты разных мастей; б) эти карты одной масти; в) эти карты бубновой масти; г) две карты одной масти, другие две другой масти. 15)В сборной по футболу 7 игроков из «Спартака», 8 – из «Динамо», 6 – из «Локомотива» и 4 – из ЦСКА. Статистикой установлено, что вероятность забить гол в играх сборной для спартаковца составляет 0,5, для динамовца 0,4, для железнодорожника 0,35 и для армейца 0,3. В матче нашими футболистами забито 2 гола. Какова вероятность того, что один гол забил представитель «Спартака», другой – представитель «Локомотива»? 16)Какова вероятность того, что при n бросаниях игральной кости хотя бы один раз появится шестерка? Формула Бернулли Пусть проводится серия из n испытаний, в результате каждого из которых событие А может произойти или не произойти. Предполагаем, что вероятность p наступления события А в каждом испытании постоянна, т.е. не зависит ни от номера испытания, ни от результатов предыдущих испытаний. Последовательность испытаний, удовлетворяющих указанному условию, называется последовательностью независимых испытаний (или схемой Бернулли). Таким образом, в схеме Бернулли для каждого испытания имеется лишь два исхода: 1) событие А, P(A) = p; 2) событие A , P( A ) = q = 1 - p. Вероятность Pn(k) того, что в серии из n испытаний в схеме Бернулли событие А наступит ровно k раз (безразлично, в какой последовательности), выражается формулой Бернулли n! Pn (k) = C nk p k q n − k , где C nk = k!(n − k )! В некоторых задачах требуется определить вероятность того, что в n испытаниях событие А произойдет не менее k раз. Используя теорему сложения вероятностей и формулу Бернулли, искомую вероятность определяют по формуле: Pn (k) + Pn (k+1) +…+ Pn (n). Количество n испытаний, которое необходимо произвести для того, чтобы с вероятностью, не менее Р, можно было утверждать, что событие А произойдет хотя бы один раз, определяем по формуле: ln(1 − P) n≥ ln(1 − p) Наивероятнейшее значение µ появлений события А в n испытаниях равно целой части числа (n +1)p, а если это число целое, то наивероятнейших значений два µ1 = (n +1)p - 1, µ2 = (n+1)p. Локальная теорема Лапласа Формула Бернулли становится трудно применимой при больших n. Это связано с вычислением С nk Существует практически удобный способ вычисления вероятностей Pn(k) приближенный, но достаточно точный при больших значениях n.
13
Теорема Лапласа. Пусть p - вероятность появления события А в одном испытании, причем 0 < p < 1. Тогда вероятность того, что в условиях схемы Бернулли в n испытаниях событие А наступит ровно k раз, приближенно выражается равенством k − np
1
1
−
x2 2
ϕ (x), где x = , ϕ (x) = e ,q=1–p (1) npq npq 2π Формула (1) дает тем более точный результат, чем больше n. Для функции ϕ (x) cоставлены таблицы, лишь для x ≥0, так как ϕ (x) - четная функция, т. е. ϕ (-x) = ϕ (x). (См. приложения). Pn (k) ≈
Интегральная теорема Лапласа Во многих задачах требуется вычислить Pn(k1,k2) того, что в серии из n испытаний событие А произойдет не менее k1 и не более k2 раз. Вычисление этой вероятности с помощью формулы Бернулли при больших n весьма затруднительно. Удобный приближенный способ вычисления вероятностей Pn(k1, k2) в схеме Бернулли дает интегральная теорема Лапласа. Если вероятность наступления события А в каждом из n независимых испытаний постоянна и равна p (0 < p < 1), то имеет место приближенное неравенство Pn (k1, k2) ≈
x2
1
∫e
−
t2 2
dt , где где x1 =
k1 − np
k 2 − np
(1) 2π x1 npq npq Для вычисления вероятности Pn (k1, k2) формулу (1) представляют в виде: Pn (k1, k2) = Ф(x1) – Ф(x2) (1`) , где
1
x
−
, x2 =
t2 2
∫ e dt , функция Лапласа, для которой составлены таблицы значений. 2π 0 Так как Ф(х) функция нечетная, т.е. Ф(-х) = -Ф(х), то таблицы составлены лишь для х ≥ 0. (См. приложения) Замечание 1. Формула (1) (или (1`)) дает хорошие результаты при достаточно больших n. Замечание 2. Вероятность того, что событие А наступит не менее k раз в n испытаниях можно вычислять по формуле (1`), полагая k1 = k, k2 = n. Ф(х) ≈
Теорема Пуасона Рассмотрим схему Бернулли с малой вероятностью p появления события А в одном испытании и с большим количеством n испытаний. Пусть при большом n малая вероятность p такова, что pn = λ , где λ - некоторое число. Вероятность Pn(k) в такой схеме Бернулли
описывается теоремой Пуассона. Пусть n→∞, λ >0 постоянно и p =
λ
. Тогда в схеме n Бернулли из n независимых испытаний, в каждом из которых вероятность наступления события А равна p, имеет место приближенное равенство: λk e − λ Pn (k) ≈ (формула Пуассона). k! (Таблица значений для формулы Пуассона приведена в Приложении). Замечание. Формулу Пуассона можно применять в случаях, когда число n испытаний «велико», вероятность события p «мала», а λ = np «не мало и не велико».
Задачи 1 Вероятность сбоя в работе компьютера в одном сеансе работы равна 0.1. Найти вероятность двух сбоев в шести сеансах работы.
14
2 Вероятность появления события А в одном испытании равна 0.4. произведено 5 испытаний. Найти вероятность того, что событие А наступит не более одного раза. 3 Фирма выпускает изделия, из которых 80% высшего качества. Какова вероятность при отборе 100 изделий обнаружить ровно 18 изделий высшего качества? 4 Хлебокомбинат выпускает 90% продукции первого сорта. Какова вероятность того, что из 400 изделий хлебокомбината первосортных окажется не менее 380? 5 Что вероятнее выиграть у равносильного соперника (ничьи исключены): три партии из четырех или пять партий из восьми? 6 Рекламное агентство гарантирует, что в некоей лотерее 2% билетов выигрышные. Вы приобрели 100 лотерейных билетов. Что вероятнее, что четыре билета окажутся выигрышными или выигрышных не будет ни одного. 7 Вероятность появления события в каждом испытании равна 0.25. Найти вероятность того, что в 300 испытаниях событие наступит от 50 до 80 раз. 8 Всхожесть семян новой культуры 85%. На опытном участке посеяли 500 семян. Найти вероятность того, что прорастут от 400 до 450 семян. 9 Вероятность появления события А в одном испытании равна 0.4. произведено 400 испытаний. Найти вероятность того, что событие А наступит не менее 190 и не более 215 раз. 10 Типография гарантирует вероятность брака переплета книг 0.0001. Книга издана тиражом 25000 экземпляров. Какова вероятность того, что в этом тираже только одна книга имеет брак переплета? 11 Вероятность появления события А в одном испытании равна 0.9. произведено 100 испытаний. Найти вероятность того, что событие А наступит не менее 80 раз. 12Известно, что в данном селе 80% семей имеют телевизоры. Найти вероятность того, что среди 6 случайно отобранных семей 2 окажутся без телевизора. 13В квартире 8 электролампочек. Вероятность работы лампочки в течение года равна 0,9. Какова вероятность того, что в течение года придется заменить не менее половины лампочек.? 14При проведении некоторого испытания вероятность появления некоторого результата 0,01. сколько раз его нужно провести, чтобы с вероятностью 0,5 можно было ожидать хотя бы одного появления этого результата? 15Какова вероятность того, что среди наугад 500 выбранных человек двое родились 8го марта? 16Найти такое число k, чтобы с вероятность 0,9, можно было утверждать, что среди 900 новорожденных более k мальчиков. Вероятность рождения мальчика 0,515.
Дискретные и непрерывные случайные величины Случайной величиной называется величина, которая в результате испытания приобретает то или иное числовое значение из некоторого множества. При этом заранее неизвестно, какое значение имела случайная величина примет в результате опыта. Случайная величина называется дискретной, если все ее возможные значения изолированы друг от друга и их можно занумеровать. Случайную величину называют непрерывной, если она может принимать любые значения из некоторого промежутка (конечного или бесконечного). Случайные величины будем обозначать заглавными буквами, например, X, Y, а их возможные значения соответствующими малыми буквами x1, x2, … xn; y1, y2,…., ym. Вероятность того, что случайная величина примет значение, равное xi, обозначают P(X = xi) = pi. Законом распределения случайной величины называется соответствие между ее возможными значениями и вероятностями, с которыми эти значения принимаются.
15
Простейшей формой задания этого закона для дискретных случайных величин является таблица, первая строка которой содержит все возможные значения случайной величины, а вторая – их вероятности: x2 … xn Х x1 р p1 p2 … pn Отметим, что p1 + p2 +…+ pn = 1. Для того, чтобы придать закону более наглядный вид, прибегают к его графическому изображению: по оси абсцисс откладывают возможные значения случайной величины, а по оси ординат – их вероятности. Точки (xi pi ), i =1, 2,…n, соединяют отрезками прямых. Полученную фигуру называют многоугольником распределения.
Дискретные случайные величины Математическое ожидание дискретной случайной величины Математическим ожиданием дискретной случайной величины называется сумма произведений возможных значений случайной величины на их вероятности, то есть, если X дискретная случайная величина, закон распределения которой имеет вид: x2 … xn Х x1 р p1 p2 … pn находится по формуле: M(X) = x1p1 + x2p2 + …+ xnpn. Отметим, что при большом числе опытов среднее арифметическое наблюдавшихся значений случайной величины приближается к ее математическому ожиданию. Замечание. Математическое ожидание случайной величины есть величина неслучайная.
Основные свойства математического ожидания: 1.Математическое ожидание постоянной величины равно постоянной, т.е., если С = const, то M(С) = М 2. Постоянный множитель можно выносить за знак математического ожидания, т.е M(CX) = CM(X). 3. Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий этих величин, т.е. M(X+Y) = M(X) +M (Y) 4. Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий, т.е. M(XY) = M(X) M(Y), где X и Yнезависимые случайные величины. 5.Если производится n независимых испытаний, в каждом из которых вероятность появления события А постоянна и равна р. Тогда математическое ожидание М(Х) числа появления события А в n независимых испытаниях М(Х) = np Дисперсия дискретной случайной величины Пусть X – случайная величина. Случайную величину │X – M(X)│ называют отклонением. Очевидно, что математическое ожидание отклонения равно 0: M [X – M(X)] = 0 Дисперсией (рассеянием) случайной величины называют математическое ожидание квадрата отклонения от ее математического ожидания, т.е. D (X) = M((X - M(X)))2. (1) Дисперсия характеризует меру рассеяния возможных значений случайной величины по отношению к ее математическому ожиданию. Нередко вместо формулы (1) в вычислениях используют эквивалентную ей формулу D (X) = M(X2) – (M(X))2 (2) Свойства дисперсии: 1. Дисперсия постоянной величины равна нулю, т.е. D(С) =0
16
2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат, т.е. D(CX) =C2DX. 3. Дисперсия суммы или разности двух независимых случайных величин равна сумме их дисперсий D(X ± Y) = D(X) ± D(Y), 4. Дисперсия числа появления события А в n независимых испытаниях, в каждом из которых вероятность события А постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании: D(X) = npq. Следствие: D(C + X) = D(X), где С – постоянная. Замечание. Дисперсия D(X) имеет размерность квадрата единицы размерности случайной величины X. Это создает определенные неудобства, поэтому вводят показатель рассеяния случайной величины, имеющей ту же размерность, что и случайная величина. Для этого извлекают квадратный корень из дисперсии. Полученную величину называют средним квадратическим отклонением (стандартом) и обозначают σ(X), т.е. σ(X) = D(X) Отметим, что среднее квадратическое отклонение суммы конечного числа взаимно независимых случайных величин:
σ 2 ( X 1 ) + σ 2 ( X 2 ) + ... + σ 2 ( X n ) Начальным моментом порядка k случайной величины Х называют математическое ожидание величины Хk: ν k = M ( X k ) , в частности, ν 1 = M ( X ) , ν 2 = M ( X 2 ) Пользуясь этими моментами формулу для вычисления дисперсии можно записать так: D (X) = M(X2) – (M(X))2 = ν 2 − ν 12 Центральным моментом порядка k случайной величины Х называют математическое ожидание величины (Х – М(Х))k μ k = M [ X − M ( X )) k ] , в частности μ1 = M [ X − M ( X )) ] = 0 , μ 2 = M [ X − M ( X )) 2 ] = D( X ) Нетрудно вывести соотношения: μ 2 = ν 2 − ν 12 μ 3 = ν 3 − 3ν 1ν 2 + 2ν 13 μ 4 = ν 4 − 4ν 3ν 1 + 6ν 2ν 12 − 3ν 14 Приведем знаменитое в теории вероятностей неравенство П.Л. Чебышева: σ(X1 + X2 + X3 + … + Xn ) =
P( ⎪x - a⎪ ≥ ε) ≤
D ( x)
ε2
, где х – значения случайной величины, а – математическое ожидание,
ε - любое напер заданное сколь угодно малое число. Это неравенство позволяет оценить вероятность отклонения случайной величины от ее математического ожидания. Из этого неравенства можно получить закон больших чисел: (P(w – p) < ε) → 1, где w – относительная частота появления события А в n независимых испытаниях, p – классическая вероятность его появления в каждом отдельном испытании, т.е.: с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом числе независимых испытаний частота появления наблюдаемого события как угодно мало отличается от его вероятности в отдельном испытании. Задачи 1.Найти математическое ожидание a) M(X), b) дисперсию D(X), c)среднее квадратическое отклонение σ (X) дискретной случайной величины X по заданному закону распределения. 1.1 1.2
X p
-3 0,1
0 0,2
1 0,4
3 0,3
p
1.3
X 1 0,1
3 0,5
4 0,2
1.4
17
7 0,2
X 2 P 0,3
3 0,2
5 0,1
X p
6 0,4
-3 0,1
1.5 X p
1 0,4
2 0,1
2 4 0,3 0,1
5 0,2
X p
-3 0,1
1 0,5
3 0,2
-2 1 0,2 0,5
2 0,2
1.8 5 6 0,6 0,1
8 0,2
X p
-4 0,4
1.9 X p
1 0,2
1.6
1.7 X p
-2 0,5
-2 0 0,2 0,1
5 0,3
1.10 3 5 0,1 0,1
6 0,3
X p
2 0,1
3 6 0,4 0,3
8 0,2
2)Найти математическое ожидание числа появления события А в 20-ти независимых испытаниях, если в каждом испытании вероятность наступления события равна 0,25. 3)Найти математическое ожидание произведения n = 15 числа очков при одном бросании двух игральных костей. 4)Случайная величина Х может принимать два возможных значения: x1 с вероятностью 0,3 и x2 с вероятностью 0,7, причем x2 > x1. Найти x1 и x2, зная. что М(Х) = 2,7 и D(X) = 0,21 5)Стрелок поражает мишень с вероятностью 0,7. Он производит 4 выстрела. Построить закон распределения случайной величины Х: х0 - мишень не поражена, х1 – мишень поражена одним выстрелом и т.д. Найти математическое ожидание, дисперсию и среднее квадратическое отклонение 6)У охотника 4 патрона. Он стреляет по зайцу, пока не попадет или пока не кончаться патроны. Найдите математическое ожидание количества выстрелов, если вероятность попадания при одном выстреле 0,25. 7)Стрельба по мишени ведется до k-го попадания. Запасы патронов не ограничены. Вероятность попадания p. Вычислить, сколько в среднем будет израсходовано патронов. 8)В урне а белых и b красных шаров. Наугад вынимают k шаров (k < a + b). Найти математическое ожидание и дисперсию числа вынутых белых шаров. 9)Из всей выпускаемой фирмой продукции 95% составляют стандартные изделия. Наугад отобраны 6 изделий Пусть «х» - число стандартных деталей среди этих отобранных. Найдите D(x). 10)Автомобиль на пути встретит 4 светофора, каждый из которых пропустит его с вероятностью 0,6. Найдите математическое ожидание и дисперсию числа светофоров до первой остановки.
Непрерывные случайные величины Функция распределения и плотность вероятности Закон распределения, рассмотренный выше (в виде таблицы ), пригоден только для дискретных случайных величин. Для характеристики непрерывных случайных величин вводят функцию распределения F(x) = P (X < x), называемую также интегральной функцией распределения или интегральным законом распределения случайной величины X (x-произвольное действительное число). 18
Заметим, что функция распределения имеет смысл и для дискретных случайных величин и может быть записана в виде: F(x) = ∑ p к хк ≤ х
Свойства функции распределения: 1. F(x) – величина безразмерная и 0 ≤ F(x) ≤ 1 2. F(x) – неубывающая функция, т.е., если x1 >x2 то F(x1) ≥ F(x2) 3. Р( a ≤ X ≤ b) = F(b) - F(a) 5. lim F ( x) = 1, lim F ( x) = 0, График функции распределения показан на рис2. x → +∞
x → −∞
Для непрерывных случайных величин нередко вместо функции F(x) бывает удобнее использовать функцию f(x), определяемую равенством f(x) = F’(x) и называемую плотностью вероятности или дифференциальным законом непрерывной случайной величины Х. График плотности показан на рис1. Свойства плотности вероятности 1. f(x) ≥ 0, +∞
2.
∫ f ( x)dx = 1 , если же возможные значения случайной величины принадлежат отрезку
−∞
[a, b] , т.е.
ƒ(x) при a ≤ x ≤ b 0 при x < a и x > b
f(x)= b
∫ f ( x)dx = 1
3. Р( a ≤ x ≤ b) =
a
рис1.
то x
b
∫ f ( x)dx ;
∫ f ( x)dx .
4. F (x) =
−∞
a
рис2. Числовые характеристики непрерывной случайной величины
Математическое ожидание M(X) непрерывной случайной величины X, возможные значения которой принадлежат отрезку [a, b] , определяется формулой b
M(X) =
∫ xf ( x)dx = 1 , где f(x) - плотность вероятности случайной величины X. a
Если возможные случайные значения случайной величины принадлежат всей числовой +∞
оси, то M (X) =
∫ xf ( x)dx = 1 .
−∞
Аналогично дисперсии дискретной случайной величины определяется дисперсия непрерывной случайной величины: b
D (X) =
∫ ( x − M ( x))
2
dx . (*)
Если возможные значения случайной величины
a
+∞
принадлежат всей числовой оси, то D(X) =
∫ ( x − M ( x))
−∞
19
2
dx (**)
Практически вместо формул (*) и (**) бывает удобнее использовать соответственно формулы: +∞
b
D (X) =
2 2 ∫ x f ( x)dx − (M ( x)) ;
D(X) =
∫x
2
f ( x)dx − ( M ( x)) 2
−∞
a
Замечание. Свойства M(X) и D(X) аналогичны соответствующим свойствам числовых характеристик дискретной случайной величины. σ (X) = D ( X ) - среднее квадратическое отклонение случайной величины (стандарт). Задачи. Случайная величина Х задана функцией распределения F(x). Найти: а) функцию плотности распределения f(x); б) математическое ожидание M(X); в) дисперсию D(X) и среднее квадратическое отклонение σ(X); г) построить графики функций F(x) и f(x). ⎧0, x ≤ 0 ⎧0, x ≤ 0 ⎪ 2 ⎪ ⎪x 5.1 F ( x) = ⎨ x 2 , 0 < x ≤ 1 5.2 F ( x ) = ⎨ , 0 < x ≤ 2 ⎪4 ⎪1, x > 1 ⎩ ⎪⎩1, x > 2
5.3
0, x ≤ 0, F(x) = x2 / 9, 0<x≤3, 1, x>3,
5.4
0, x ≤0, F(x)= x2 /16, 0< x ≤ 2, 1, x>4,
5.5
0, x ≤ 0, F(x)= x2 / 25, 0<x≤5, 1, x>5,
5.6
5.7
0, x ≤ 0, F(x)= x2 / 49, 0 < x ≤ 7, 1, x>7,
5.8
5.9
0, x ≤ 0, F(x)= x2 /81, 0 < x ≤ 9, 1, x>9,
5.10 0, x ≤0, 2 F(x)= x /100, 0< x ≤ 10, 1, x>10.
F(x)=
0, x ≤0, x2 /36, 0< x ≤ 6, 1, x>6,
0, x ≤0, F(x)= x2 /64, 0< x ≤ 8, 1, x>8,
Равномерное распределение Распределение вероятностей называется равномерным, если на интервале, которому принадлежат все возможные значения непрерывной случайной величины, плотность вероятности сохраняет постоянное значение, а вне этого интервала она равна нулю. Для равномерно распределенной случайной величины X, возможные значения которой принадлежат отрезку [a, b] (см. рис3.), плотность вероятности имеет вид: ⎧0 при x ≤ a, ⎪ 1 ⎪ f (x) = ⎨ при a < x ≤ b, b − a ⎪ ⎪⎩0 при x > b
20
⎧0 при x ≤ a, ⎪x − a ⎪ Функция распределения F(x) = ⎨ при a < x ≤ b, см рис.4 b − a ⎪ ⎪⎩1 при x > b Числовые характеристики M(X) =
(b − a) 2 a+b , D(X) = ; 2 12
σ (X) =
b−a
2 3
.
рис.3
рис.4 Задачи. Для случайной величины X, распределенной равномерно на отрезке [a,b], написать функцию распределения F(x), плотность вероятности f(x). Найти математическое ожидание М(Х), дисперсию D(X) и среднее квадратическое отклонение σ(X), если задан отрезок: 6.1.1 [1,5]; 6.1.2 [2,6]; 6.1.3 [4,8]; 6,1.4 [0,5]; 6.1.5 [9,11]; 6.1.6 [8,10]; 6.1.7 [4,9]; 6.1.8 [3,13]; 6.1.9 [1,6]; 6.1.10 [10,15]. Нормальное распределение Непрерывная случайная величина X имеет нормальный закон распределения, если ее функция плотности вероятности имеет вид: ƒ(x) =
1
σ 2π
e
−
( x−a )2 2σ 2
, где a є R, σ > 0 - параметры распределения.
График функции f (x) называют нормальной кривой или кривой Гаусса рис.5.
рис.5 Она обладает следующими свойствами: 1. кривая симметрична относительно прямой x = a; 1 2) функция имеет максимум ƒ(a) = ; σ 2π 3) при x → ± ∞ кривая приближается к оси Ox; 4) кривая ориентирована вогнутостью вниз при x є (a - σ, a + σ) и вогнутостью вверх при x ∈ (−∞, a − σ ) ∪ (a + σ ,+∞ ), а – это математическое ожидание нормальной случайной величины, σ - ее среднее квадратическое отклонение 21
Вероятность попадания нормальной случайной величины в интервал (α,β) определяется по формуле: ⎛ β −a⎞ ⎛α − a ⎞ P(α < X < β) = Ф⎜ ⎟ − Ф⎜ ⎟ , где Ф(х) – функция Лапласа. ⎝ σ ⎠ ⎝ σ ⎠ Вероятность попадания нормальной случайной величины в интервал, симметричный относительно математического ожидания, определяется формулой: ⎛δ ⎞ P( X − a < δ) = 2 Φ ⎜ ⎟ . Из этой формулы получаем P( X − a < 3δ) = 2 Φ(3) = 0,9973, ⎝σ ⎠ откуда следует правило трех сигм для нормального распределения: практически достоверно, что отклонение нормальной случайной величины от ее математического ожидания не превышает утроенного среднего квадратического отклонения.(Слова «практически достоверно означают, что лишь в 0, 27% случаев отклонение нормальной случайной величины от ее математического ожидания может превзойти 3 σ ) Нормально распределенные случайные величины широко встречаются в природе, на практике. Выдающимся русским математиком А.М. Ляпуновым была доказана центральная предельная теорема теории вероятностей, из которой вытекает следующее следствие: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то эта случайная величина имеет распределение, близкое к нормальному. Задачи 1. Для случайной величины X, распределенной по нормальному закону, известны математическое ожидание M(X) и дисперсия D(X). Записать плотность вероятности f(x) и найти вероятность попадания случайной величины X в интервал (α,β): 1 M(X) = 1, D(X) = 1, (2,4); 6 M(X) = 2, D(X) = 4, (1,5); 2 M(X) = 3, D(X) = 4, (2,6); 7 M(X) = 2, D(X) = 9, (1,3); 3 M(X) = 5, D(X) = 4, (3,7); 8 M(X) = 6, D(X) = 16, (4,7); 4 M(X) = 1, D(X) = 4, (0,3); 9 M(X) = 3, D(X) = 16, (1,5); 5 M(X) = 8, D(X) = 4, (5,10); 10 M(X) = 4, D(X) = 9, (2,7) 2. Математическое ожидание нормально распределенной случайной величины равно 10, а дисперсия 4. Найти вероятность того, что в результате испытания эта случайная величина примет значение из интервала [12; 14]. 3.Производится измерение диаметра вала без системных ошибок. Случайные ошибки ξ подчинены нормальному закону с D(ξ) = 100мм. Найти Р(⏐ξ⏐ < 15). 4.15% продукции фирмы представляют изделия второго сорта. Магазин получил 1000 изделий. Какова вероятность того, что в полученной партии продукция второго сорта составит 15%±2%? 5. Исследователями установлено, что 20% школьников не знают правил уличного движения. В случайной выборке 1600 учеников. Сколько учеников знают правила уличного движения с гарантией в 95%? 6. На рынок поступила крупная партия говядины. Предполагается, что вес туш – случайная величина, подчиняющаяся нормальному закону распределения с математическим ожиданием а = 950кг. и средним квадратическим отклонением σ = 150кг. 6.1Определите вероятность того, что вес случайно отобранной туши: а) окажеся больше 1250кг.; б) окажется меньше 850кг.; в) будет находиться между 800 и 1300кг.; г) отклонится от математического ожидания меньше, чем на 50кг.; д) отклонится от математического ожидания больше, чем на 50кг. 6.2.Найдите границы, в которых отклонение веса случайно отобранной туши от своего математического ожидания не превысит утроенного среднего квадратического отклонения (проиллюстрируйте правило трех сигм).
22
6.3.С вероятностью 0,899 определите границы, в которых будет находиться весь случайно отобранной туши. Какова при этом условии максимальная величина отклонения веса случайно отобранной туши от своего математического ожидания? 7. Фирма собирается приобрести партию из 10000 единиц некоторого товара. Из прошлого опыта известно, что 1% товаров данного типа имеет дефекты. Какова вероятность того, что в данной партии окажется от 950 до 1050 дефектных единиц товара? 8. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания метала в каждой пробе для всех проб одинакова и равна 0,8. Найти вероятность того, что для проб с промышленным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0,05. 9.Фирма, занимающаяся продажей товаров по каталогу, ежемесячно получает заказы по почте. Число этих заказов есть нормально распределенная случайная величина со средним квадратическим отклонением σ = 560 и неизвестным математическим ожиданием. В 90% случаев число ежемесячных заказов превышает 12439. Найдите ожидаемое среднее число заказов, получаемых фирмой за месяц. 10.Вес тропического грейпфрута – нормально распределенная случайная величина с неизвестным математическим ожиданием и дисперсией, равной 0,04. Агрономы знают, что 65% фруктов весят меньше, чем 0,5кг. Найдите ожидаемый вес случайно вфыбранного грейпфрута. 11.Предположим, что в течение года цена на акции некоторой компании есть случайная величина, распределенная по случайному закону с математическим ожиданием, равным 48руб., и отклонением, равным 6. Определите вероятность того, что в случайно выбранный день цена за акцию была: а) более 60руб.; б) ниже 60руб.; выше 40руб.; г) между 40 и 50руб. 12.Для поступления в некоторый университет необходимо сдать вступительные экзамены. В среднем их выдерживают лишь 25% абитуриентов. В приемную комиссю поступило 1 889 заявлений. Чему равна вероятность того, что хотя бы 500 поступающих сдадут все экзамены (наберут проходной балл)? 13.Вес товаров, помещаемых в контейнер определенного размера, - нормально распределенная случайная величина. Известно, что 65% контейнеров с товаром имеют чистый вес больше, чем 4,9т. и 25% - имеют вес меньше, чем 4,2т. Найдите ожидаемый средний вес и среднее квадратическое отклонение чистого веса контейнера. 14.Компьютерная система содержит 45 одинаковых микроэлементов. Вероятность того, что любой микроэлемент будет работать в заданное время, равна 0,80. Для выполнения некоторой операции требуется, чтобы по крайней мере 30 микроэлементов находились в рабочем состоянии. Чему равна вероятность того, что операция будет выполнена успешно? Показательное распределение Непрерывная случайная величина X имеет показательный (экспоненциальный) закон распределения, если функция ее плотности вероятности имеет вид: ⎧0, если x < 0, f ( x ) = ⎨ − λx ⎩λe , если x ≥ 0, гдеλ > 0 − некоторый параметр График функции y = f(x) имеет вид рис.6: Функция распределения показательной случайной величины Х имеет вид: ⎧0, приx < 0, рис7. F(x) = ⎨ − λx 1 e , при x 0 . − ≥ ⎩ 1 1 1 Для показательной случайной величины Х: M ( X ) = , D( X ) = 2 , σ ( X ) =
λ
-λa
Вероятность попадания в интервал [a;b]: P(a <X < b) = e
23
-e
-λb
λ
λ
рис.6
рис.7
Задачи 1.Случайная величина Х распределена по показательному закону плотностью вероятности ⎧0, если x < 0, f ( x ) = ⎨ − λx ⎩λe , если x ≥ 0 1.Написать плотность вероятности f(x), функцию распределения F(x). Найти математическое ожидание М(х), дисперсию D(x) си среднее квадратическое отклонение σ(х), если: 1.1 λ = 1; 1.2 λ = 2; 1.3 λ = 4; 1.4 λ = 4; 1.5 λ = 5; 1.6 λ = 8; 1.7 λ = 10; 1.8 λ = 0,5; 1.9 λ = 0,25; 1.10 λ = 0,1; 1.11 λ = 0,125; 1.12 λ = 0,525; 1.13 λ = 0,8. 2. Время безотказной работы электронной схемы распределено по закону p(x) = 0,03e-0,03x, где х означает время в часах. Найти вероятность того, что микросхема проработает безотказно не меньше 100 часов. 3. 98% топливных насосов дизельных тракторов выходит из строя после 3000 моточасов. Какова вероятность того, что насос выйдет из строя в интервале времени от 2000 до 2500 моточасов?
24
Математическая статистика. Математическая статистика возникла и создавалась параллельно с теорией вероятностей в XVII веке. Дальнейшее развитие математической статистики (вторая половина XIX и начало XX веков) обязано, в первую очередь, П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову и др. Вариационные ряды. Генеральная совокупность и выборка Совокупность предметов или явлений, объединённых каким – либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения. - Количественным называется признак, значения которого выражаются числами. - Качественным называется признак, характеризующийся некоторым свойством или состоянием элементов совокупности. Каждый объект статистического наблюдения состоит из отдельных элементов – единиц наблюдения. Результаты статистических наблюдений представляют собой числовую информацию – данные. Статистические данные – это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности. Статистическая совокупность называется генеральной совокупностью, если исследованию подлежат все элементы совокупности. Выборочной совокупностью, или просто выборкой, называют часть элементов генеральной совокупности подлежащих исследованию. Она извлекается из генеральной совокупности случайно, чтобы каждый объект имел равные шансы быть отобранным. Значения признака, которые при переходе от одного элемента совокупности к другому изменяются, называются вариантами и обозначаются маленькими латинскими буквами. Порядковый номер варианта называется рангом. Ряд значений признака, расположенный в порядке возрастания или убывания с соответствующими им весами, называется вариационным рядом. В качестве весов выступают частоты или частости. Частота (mi) показывает, сколько раз встречается тот или иной вариант в статистической совокупности. Частость или относительная частота (wi) показывает, какая часть единиц совокупности имеет тот или иной вариант к сумме всех частот ряда. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда m wi = k i (1) ∑ mi i =1
Сумма всех частостей равна 1 k
∑w
(2)
i =1
i
Вариационные ряды бывают дискретными и интервальными. Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного ряда показан в таблице.
25
Значения признака (хi) Частоты (mi)
х1
х2
…
хk
m1
m2
…
mk
Интервальные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга на сколь угодно малую величину. Значения признаков в них задаются в виде интервалов. Общий вид интервального ряда имеет вид a1 – a2 a2 – a3 … ai-1 - ai Значения признака (хi) Частоты (mi) m1 m2 … mi В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной интервала. В общем виде интервальную разность ki представим как ki = xi (max) - xi (min) Первый и последний интервалы могут быть открытыми, т.е. иметь только одну границу. Если интервалы в вариационных рядах имеют одинаковую длину, их называют равновеликими, в противном случае неравновеликими. При построении интервального ряда (если строится ряд с равными интервалами), для определения оптимальной величины интервалов применяют формулу Стэрджесса x − x min k = max , 1 + 3.322 lg n где n число единиц совокупности; x max и x min – наибольшее и наименьшее значения вариационного ряда. Дискретный вариационный ряд графически можно представить с помощью полигона распределения частот или частостей. рис.8 Pi
P1 0
X1
P2
P3
X2
X3
P4 X4
P5 X5
P6 X6
Xi
рис.8 Интервальные вариационные ряды графически можно представить в виде гистограмм, т. е. столбчатой диаграммы. рис.9 mi
рис.9 0
a1
a2
a3
a4
a5
26ai
Xi
Абсолютная плотность – это отношение частоты интервала к его величине: m f (a) i = i , ki где f (a) i - абсолютная плотность i – го интервала; mi – его частота; ki – интервальная разность. Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала. Относительная плотность – отношение частости интервала к его величине: w f (o ) i = i , ki где f (o) i -относительная плотность i – го интервала; Относительная плотность показывает, какая часть единиц совокупности приходится на единицу интервала. Числовые характеристики вариационного ряда Одной из основных характеристик ряда распределения является средняя арифметическая. Существует две формулы для расчёта средней арифметической: простая и взвешенная. Простую среднюю арифметическую используют, когда данные наблюдений не сведены в вариационный ряд или все частоты равны единице (одинаковы). n
x=
∑x i =1
i
, n где хi – i-е значение признака; n – объём ряда (число наблюдений). Если частоты отличны друг от друга, расчёт производится по формуле средней арифметической взвешенной k
∑x m i =1 k
x=
i
∑m i =1
i
,
i
где хi – i-е значение признака; mi – частота i-го значения признака; k – число его значений (вариантов). При расчёте средней арифметической в качестве весов могут выступать и частости, тогда формула расчёта средней арифметической взвешенной примет следующий вид. k
x = ∑ x i wi , i =1
где wi – частость i-го значения признака; Колеблемость изучаемого признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: математическое ожидание, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Математическое ожидание – это числовая характеристика случайной величины, со средним арифметическим её наблюдаемых значений, которое является статистической характеристикой вариационного ряда и рассчитывается по формуле: n
M ( X ) = ∑ xi pi , i =1
где рi – вероятность i-го значения признака.
27
Дисперсию можно рассчитать по простой и взвешенной формулам имеющим вид n
D( X ) =
∑ ( xi −xi ) 2 i =1
n
n
;
D( X ) =
∑ (x i =1
i
−x i ) 2 mi ;
k
∑m i =1
i
Среднее квадратическое отклонение рассчитывается по формуле
σ ( X ) = D( X ). Коэффициент вариации определяется формулой σ (X ) V (X ) = ⋅100% . x Задачи на составление вариационных рядов 1) При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5; 3; 2; 1; 4; 6; 3; 7; 9; 1; 3; 2; 5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7; 4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4. Составьте вариационный ряд распределения частот. Постройте полигон распределения частот, кумуляту. Определите среднее число членов семьи Охарактеризуйте колеблемость размера семьи с помощью показателей вариации Объясните полученные результаты, сделайте выводы. 2) Имеются данные о еженедельном количестве проданных компьютеров одной из фирм: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499. 580, 606, 344, 455,505, 396, 347, 441, 390, 632, 400, 582. Составьте вариационный ряд. Найдите среднее количество проданных компьютеров. Рассчитайте показатели вариации 3) Администрацию магазина интересует частота покупок калькуляторов. Менеджер в течении января регистрировал данные о покупке МК и собрал следующие данные: 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6, 5, 7, 3, 2, 9, 8, 1, 4, 6, 5, 4, 2, 1, 0, 8. Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?
4) Число пассажиров одного из рейсов за 30 дней составило: 128, 121, 134, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129. Составьте вариационный ряд. Найдите среднее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных результатов. 5) Имеются данные о годовой мощности предприятий в 2003 году Предприятия с годовой мощностью, Количество предприятий тыс.т До 500 27 500 – 1000 11 1000 – 2000 8 2000 – 3000 8 Свыше 3000 2 Постройте гистограмму, кумуляту. Рассчитайте среднюю мощность предприятий. Найдите дисперсию. среднее квадратическое отклонение, коэффициент вариации. Сделайте анализ полученных результатов.
28
6) По данным выборочного обследования получено следующее распределение по среднедушевому доходу до 25 – 50 50 – 75 75 – 100 100 – 125 125 – 150 150 и Среднедушевой выше доход семьи в 25 месяц, у.е. 46 236 250 176 102 78 12 Количество обследованных семей Постройте гистограмму, кумуляту. Рассчитайте среднюю мощность предприятий. Найдите дисперсию. среднее квадратическое отклонение, коэффициент вариации. Сделайте анализ полученных результатов. 7) Постройте гистограмму частот, найдите среднюю заработную плату работников одного из цехов «Азота» Заработная 50 – 75 75 – 100 125 – 150 150 – 175 175 – 200 200 - 225 плата, у.е Число 12 23 37 19 15 9 работников Рассчитайте среднее квадратическое отклонение, коэффициент вариации заработной платы. 8) Продажа акций на аукционе характеризуется следующими данными: Продажа акций в % 9 - 15 15 – 21 21 – 27 27 – 33 Число акционерных 3 5 4 2 обществ Постройте гистограмму распределения частот. Найдите средний процент продажи акций. Охарактеризуйте колеблемость процента продажи акций с помощью соответствующих показателей. 9) Для оценки состояния деловой активности предприятий были проведены обследования и получены следующие результаты: Показатель деловой 0–8 8 – 16 16 – 24 24 - 32 активности Число предприятий 10 15 8 5 Постройте гистограмму распределения частот. Найдите среднее значение показателя деловой активности, дисперсию. среднее квадратическое отклонение, коэффициент вариации. Сделайте анализ полученных результатов. 10) Имеются данные о числе сделок, заключённых брокерскими фирмами: Число сделок 10 – 30 30 – 50 50 – 70 70 – 90 Число фирм 20 18 12 5 Постройте гистограмму распределения частот. Найдите средне число заключённых сделок, среднее квадратическое отклонение, коэффициент вариации, размах вариации. Объясните полученные результаты. 11) В колледже собранны данные о числе часов пропущенных по неуважительной причине студентами третьего курса: Число пропущенных часов в текущем 0 1 2 3 4 5 месяце Число студентов 10 27 25 28 30 17 Постройте полигон распределения частот. Найдите среднее число пропущенных дней, стандартное отклонение, коэффициент вариации. Является ли распределение симметричным? 29
12) Постройте гистограмму частот, найдите среднюю арифметическую, среднее квадратическое отклонение и коэффициент вариации для данных о дневной выручке в магазине электроники. Выручка, 0 – 200 200 – 300 300 – 400 400 – 500 500 – 600 600 – 700 у.е. Число 3 5 9 14 8 3 дней 13) Имеются данные о возрастном составе безработных по РФ: Возраст 16-20 20-24 25-29 30-49 50-54 55-59 60-65 Мужчины 7,7 17,0 11,9 50,9 4,2 5,7 2,6 Женщины 11,2 18,5 11,7 49,5 4,0 3,8 1,3 Найдите средний возраст безработных мужчин и женщин, дисперсию, среднее квадратическое отклонение и коэффициент вариации. Оцените различия показателей возрастного состава безработных мужчин и женщин. Сделайте выводы. 14) Проанализируйте данные годовых уровней прибыли трёх компаний. Год Cherry Computers Lemon Motors Orange electronics 1994 12,3 13,3 -10,6 1995 -16,2 -8,4 40,3 1996 15,4 27,3 5,4 1997 17,2 28,2 6,2 1998 10,3 14,5 10,2 1999 -6,3 -2,4 13,8 2000 -7,8 -3,1 11,5 2001 3,4 15,6 -6,2 2002 12,2 18,2 27,5 Найдите среднее значение и стандартное отклонение прибыли для каждой из компаний. Сравните результаты их деятельности за 9 лет. деятельность какой компании наиболее успешна? 15) Построить интервальный ряд, гистограмму, составить таблицу вычисления среднего арифметического, дисперсии и среднего квадратического отклонения, т. е. найти числовые характеристики или составить математическую модель различных социологических исследований. 2 5 3 4 1 3 6 2 4 3 4 1 3 5 2 3 4 4 3 3 2 5 3 4 4 1 3 3 4 4 3 2 5 3 1 4 3 4 2 5 6 2 3 1 6 4 3 3 2 1 7 17.5 17.8 18.6 18.3 19.1 19.9 20.6 22 20.1 21.4 17.5 18.5 21 19 20 22 20.6 19.1 18.6 17.9 22 19.1 17.5 22 22.6 18 21.4 19 17.8 18.3 19.9 20.1 21.4 20 18.5 20.6 18.6 21.4 21.4 2 21 20 18 18 17.5 18.6 19.1 20 20.6 18.6 17.5 4 4 3 5 2 3 3 4 4 3 2 5 3 1 4 3 4 2 6 3 1 4 3 5 2 3 7 7 1 2 3 3 4 3 5 1 1 3 4 4 3 2 3 4 5 6 7 1 3 3 2 190 191 192 194 196 198 206 202 204 200 198 193 190 220 195 215 193 201 203 215 220 195 200 195 201 198 191 193 220 199 210 205 213 200 213 210 212 215 199 4 201 215 199 200 203 212 212 198 215 190 200 45 48 54 60 58 59 47 49 57 59 64 53 57 59 49 64 58 53 49 47 48 60 53 60 62 60 63 50 45 60 55 50 47 45 63 49 45 49 47 5 60 62 45 55 47 59 48 53 60 54 48 30
6
7 8 9
10
16 20 30 40
21 17 26 27
26 18 18 21
31 22 30 32
36 33 40 41
41 43 46 19
46 19 44 44
19 20 21 35
45 29 39 16
18 16 40 43
35 46 37 37
37 44 32
42 16 41
1.0 5.9 4.2 3.8 3 3 4 5 1.75 1.90 2.14 2.10 25.6 18.0 27.0 31.7
2.5 3.6 2.5 1.0 3 5 3 3 1.78 2.00 1.90 2.00 36.7 17.0 29.6 29.0
2.7 1.3 2.7 4.2 8 6 8 4 1.86 2.2 1.78 1.80 16.0 28.8 21.0 20.5
3.0 3.7 3.6 4.8 7 4 7 7 1.83 2.06 1.83 1.80 27.9 24.4 25.7 30.4
3.6 4.9 4.8 4.9 8 8 9 9 1.91 1.91 1.99 1.80 22.6 30.0 25.8 28.5
4.4 5.6 6.0 5.0 9 5 3 8 1.99 1.86 2.01 1.75 32.0 30.1 25.0 24.7
1.3 1.3 1.7 1.9 6 4 4 8 2.06 1.79 2.14 1.86 25.2 37.0 15.0 26.2
2.1 2.0 2.5 2.6 4 3 5 6 2.01 1.91 1.85 1.91 32.0 26.7 16.0 27.4
5.0 4.3 4.9 1.7 5 5 6 5 2.20 2.20 2.00 2.06 21.5 23.1 23.5 18.0
4.9 1.9 3.2 6.0 3 6 8 9 2.14 1.90 2.06 1.86 35.0 25.3 30.8 23.4
6.0 4.0 4.0 5.7 4 3 3 5 1.75 1.75 2.14
1.1 3.7 4.3
2.3 5.3 2.8
6 7 6 9 1.85 2.20 2.26
4 9 2.1 2.01 1.8
23.0 23.4 22.1 29.0 30.8 24.0 36.5 25.3 31.5 28.5
Выборочный метод и статистическое оценивание. По одному из определений, статистика – это наука, позволяющая распространять выводы, сделанные на основе изучения части совокупности, на всю совокупность. В этом определении заключена сущность выборочного метода и его ведущая роль в статистике. Все единицы совокупности, обладающие интересующими исследователя признаками, составляют генеральную совокупность. Часть совокупности, случайным образом отобранная из генеральной совокупности составляют выборочную совокупность – выборку. Число элементов статистической совокупности называется её объёмом. Объём генеральной совокупности обозначается N, а объём выборки – n. Случайная выборка из n элементов – это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Такая выборка называется собственно – случайной. По способу отбора элементов различают два типа случайных выборок: собственно – случайная бесповторная и собственно – случайная повторная. Выбор схемы отбора зависит от характера изучаемого объекта. Статистическое оценивание. Пусть из генеральной совокупности извлекается выборка объёмом n, причём значение признака х1 наблюдаются m1 раз, х2 – m2 раз, …, хk наблюдается mk раз, k
∑m i =1
i
= n - объём выборки
Статистическим распределением выборки называется перечень возможных значений признака xi и соответствующих ему частот mi Числовые характеристики генеральной совокупности называются параметрами генеральной совокупности. Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р. Оценка параметра – это определённая числовая характеристика, полученная из выборки. Когда оценка определяется одним числом её называют точечной оценкой. В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. 31
Ошибки выборки. Так как выборочная совокупность это часть генеральной совокупности, то естественно, что выборочные характеристики не будут точно совпадать с соответствующими генеральными. Ошибка может быть представлена как разность между генеральными и ~ выборочными характеристиками изучаемой совокупности: ε = X − X , либо ε = p − ω . Применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объёме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала. t ⋅ σ ген 1 ~ P( X − X < ) > 1− 2 , t n ~ где X - средняя по совокупности выбранных единиц; X - средняя по генеральной совокупности; σ ген - среднее квадратическое отклонение в генеральной совокупности. О величине расхождения между параметром и статистикой t ⋅σ Δ= = t ⋅ μ, n можно судить лишь с определённой вероятностью, от которой зависит величина t.
Средняя ошибка выборки μ =
σ ген
. Согласно центральной предельной теореме n Ляпунова, выборочные распределения статистик (при n ≥ 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная совокупность. Следовательно, ~ P( X − X < tμ ) ≈ 2Φ 0 (t ) , где Φ 0 (t ) - функция Лапласа. В зависимости от способа отбора средняя ошибка выборки определяется по разному
μ Для средней
Для доли
Собственно случайный отбор повторный бесповторный
σ2
σ2
n
n
ω (1 − ω )
ω (1 − ω )
n
n
(1 −
n ) N
(1 −
n ) N
Здесь σ 2 - выборочная дисперсия значений признака; ω (1 − ω ) - выборочная дисперсия доли n значений признака; n – объём выборки; N – объём генеральной совокупности; - доля N n ) – поправка на бесповторность отбора. обследованной совокупности; (1 N
32
Формулы расчёта необходимой численности выборки для собственно случайного отбора определяются в таблице. Собственно случайный отбор μ повторный бесповторный Для средней t 2σ 2 N t 2σ 2
Для доли
Δ2
NΔ2 + t 2σ 2
t 2ω (1 − ω ) Δ2
t 2 Nω (1 − ω ) nΔ2 + t 2ω (1 − ω )
Интервальное оценивание Интервальной оценкой называют оценку, которая определяется двумя числами – концами интервала, который с определённой вероятностью накрывает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом. Для его определения вычисляется предельная ошибка выборки Δ. С помощью доверительного интервала можно оценивать различные параметры генеральной совокупности. Для оценки математического ожидания а нормально распределённого ~ количественного признака Х по выборочной средней X при известном среднем квадратическом отклонении σ генеральной совокупности при n ≥ 30 и собственно – случайном повторном отборе формула имеет вид σ σ ~ ~ P( X − t < X < X +t ) = 2Φ 0 (t ) = γ , n n где t определяется по таблицам функции Лапласа из соотношения 2Ф0(t) = γ; t ⋅σ Δ= n Для оценки математического ожидания а нормально распределённого ~ количественного признака Х по выборочной средней X при известном среднем квадратическом отклонении σ генеральной совокупности при n ≥ 30 и собственно – случайном бесповторном отборе формула примет вид t ⋅σ n σ n σ n ~ ~ Δ= 1− P( X − t 1− < X < X + t ) 1 − = 2Φ 0 (t ) = γ ; N N N n n n Для оценки математического ожидания а нормально распределённого ~ количественного признака Х по выборочной средней X при неизвестном среднем квадратическом отклонении σ генеральной совокупности при n<30 и собственно – случайном повторном отборе формула будет иметь вид s s ~ ~ P( X − t < X < X +t ) = 2S (t ) = γ , n n где t определяется по таблицам функции Стьюдента по уровню значимости α = 1 – γ и числу степеней свободы k = n – 1; s – исправленное выборочное среднее квадратическое отклонение; n объём выборки. t ⋅s Δ= n Для оценки математического ожидания а нормально распределённого ~ количественного признака Х по выборочной средней X при неизвестном среднем 33
квадратическом отклонении σ генеральной совокупности при n<30 и собственно – случайном бесповторном отборе формула примет вид t⋅s n s n s n ~ ~ Δ= 1− P( X − t 1− < X < X + t 1 − ) = 2 S (t ) = γ ; N N N n n n Для оценки генеральной доли р нормально распределённого количественного признака по выборочной доле ω = m / n при n ≥ 30 и собственно – случайном повторном отборе формула имеет вид ω (1 − ω ) ω (1 − ω ) P(ω − t < p <ω +t ) = 2Φ 0 (t ) = γ , n n где t определяется по таблицам функции Лапласа из соотношения 2Ф0(t) = γ; ω – выборочная доля; n – объём выборки ω (1 − ω ) Δ=t . n Для оценки генеральной доли р нормально распределённого количественного признака по выборочной доле ω = m / n при n ≥ 30 и собственно – случайном бесповторном отборе формула примет вид ω (1 − ω ) ω (1 − ω ) ω (1 − ω ) n n n P (ω − t (1 − ) < p < ω + t (1 − ) ) = 2 S (t ) = γ ; Δ = t (1 − ) . n N n N n N Задачи по теме «Статистическое оценивание». 1) С помощью собственно – случайного повторного отбора фирма провела обследование 900 своих служащих. Средний стаж работы в фирме равен 8,7 года, а среднее квадратическое отклонение – 2,7 года. Среди обследованных оказалось 270 женщин. Считая стаж работы служащих распределённым по нормальному закону определите: а) с вероятностью 0,95 доверительный интервал, в котором окажется средний стаж работы всех служащих фирмы; б) с вероятностью 0.9 доверительный интервал, накрывающий неизвестную долю женщин во всём коллективе фирмы. 2) Владелец автостоянки опасается обмана со стороны служащих. В течении года владельцем автостоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а стандартное отклонение их числа – 10 автомобилей. Считая отбор собственно случайным, с вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь. Обоснованы ли опасения владельца стоянки, если по отчётности охранников среднее число автомобилей составляет 395 автомобилей. 3) В 24 из 40 проверок число автомобилей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интервал для оценки истинной доли дней в течении года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц. 4) Служба контроля Энергосбыта провела выборочную проверку расхода электроэнергии жителями одного из домов. С помощью собственно – случайного отбора выбрано 10 квартир и определён расход электроэнергии в течении месяцев: 125; 78; 102; 140; 90; 45; 50; 125; 115; 112. С вероятностью 0. 95 определите доверительный интервал для оценки среднего расхода электроэнергии на 1 квартиру во всём доме при условии, что в доме 70 квартир, а отбор был: а) повторным; б) бесповторным. 5) С целью изучения размеров выручки киосков была произведена 10% -ая случайная бесповторная выборка из 1000 киосков города. В результате были получены данные о средней выручке составившие 500 у.е. В каких пределах с доверительной вероятностью 0,95 может находиться средняя дневная выручка, если среднее квадратическое отклонение составило 150 у. е.? 6) Фирма торгующая компьютерами собирает информацию о состоянии местного компьютерного рынка. С этой целью из 8 746 лиц в возрасте 18 лет и старше, проживающих 34
в этом городе, отобрано 500 человек. Среди них оказалось 29 человек, планирующих приобрести компьютер в новом году. Оцените долю лиц в генеральной совокупности в возрасте 18 лет и старше, планирующих приобрести компьютер в новом году, если α = 0, 05 7) Для оценки числа безработных среди рабочих в порядке случайной повторной выборки отобраны 400 человек. 25 из них оказались безработными. Используя 95% доверительный интервал, оцените истинные размеры безработицы. 8) Туристическое агентство утверждает, что для черноморского курорта характерна идеальная погода со среднегодовой температурой 200С. Пусть случайно отобраны 35 дней в году. Какова вероятность того, что отклонение средней температуры за отобранные дни от среднегодовой температуры не превысит по абсолютной величине 20С, если температура воздуха распределена по нормальному закону, а стандартное отклонение дневной температуры составляет 40С ? 9) В целях изучения среднедушевого дохода семей города Невинномысска, была произведена 1%-я повторная выборка из 30 тыс. семей. По результатам обследования среднедушевой доход семьи в месяц составил 1700 руб. со средним квадратическим отклонением 150 руб. С вероятностью 0,95 найдите доверительный интервал, в котором находится величина среднедушевого дохода всех семей города. 10) Выборочные обследования малых предприятий города показали, что 95% малых предприятий нерентабельны. Приняв доверительную вероятность равной 0,954, определите, в каких границах находится доля нерентабельных предприятий, если в выборку попали 100 предприятий. 11) Для изучения демографических характеристик населения выборочно обследовано 300 семей города Невинномысска. Оказалось, что среди обследованных семей 15% состоят из 2 человек. В каких пределах находится в генеральной совокупности доля семей, состоящих из 2 человек, если принять доверительную вероятность равной 0,95? 12) По данным выборочного обследования в 2003 году прожиточный минимум населения Северо-Кавказского региона составил в среднем на душу населения 1600 руб. в месяц. Каким должен был быть минимально необходимый объём выборки, чтобы с вероятностью 0,997 можно было утверждать, что этот показатель уровня жизни населения в выборке отличается от своего значения в генеральной совокупности не более чем на 100 рублей, если среднее квадратическое отклонение принять равным 300 рублей. 13) Строительная компания хочет оценить возможность успешного бизнеса на рынке ремонтно-строительных работ. Провели случайную бесповторную выборку, из 1000 домовладельцев отобрали 600 человек. По этой выборке определено, что средняя стоимость строительных работ, которую предполагает оплатить отдельный домовладелец, составляет 500 у.е. С какой вероятностью можно гарантировать, что эта стоимость будет отличаться от средней стоимости строительных работ в генеральной совокупности по абсолютной величине не более чем на 10 у.е., если стандартное отклонение стоимости строительных работ в выборке составило 50 у.е.? 14) Коммерческий банк, изучая возможности предоставления долгосрочных кредитов, опрашивает своих клиентов для определения среднего размера кредита. Из 9706 клиентов опрошено 1000 человек. Среднее значение необходимого кредита в выборке составило 675 у.е. со стандартным отклонением 146 у.е. Найдите границы 95% доверительного интервала для оценки неизвестного среднего значения кредита в генеральной совокупности. 15) Выборочные обследования показали, что доля покупателей, предпочитающих новую модификацию компьютеров, составляет 60% от общего числа покупателей данного товара. Каким должен быть объём выборки, чтобы можно было получить оценку генеральной доли с точностью не менее 0,05 при доверительной вероятности 0,9 16) При выборочном опросе 1200 телезрителей оказалось, что 456 из них регулярно смотрят программы телеканала СТС. Постройте 99%-й доверительный интервал, оценивающий долю всех телезрителей, предпочитающих программы телеканала СТС.
35
17) Для оценки остаточных знаний по математическим дисциплинам были протестированы 25 студентов 3-го курса групп ЭВМ. Получены следующие результаты в баллах: 107, 90, 114, 88, 117, 110, 103, 120, 96, 122, 93, 100, 121, 110, 135, 85, 120, 89, 100, 126, 90, 94, 99, 116, 111. По этим данным найдите 95%-й интервал для оценки среднего балла тестирования всех студентов 3-го курса. 18) Среднемесячный бюджет студентов Невинномысский химический колледж оценивается по случайной выборке. С вероятностью 0,954 найдите наименьший объём выборки, необходимый для такой оценки. если среднее квадратическое отклонение предполагается равным 100 рублей, а предельная ошибка средней не должна превышать 20 рублей. Проверка статистических гипотез Статистической гипотезой называется предположение о выборке. Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез. Выдвинутая гипотеза называется основной (нулевой) и обозначается Н0. По отношению основной гипотезе всегда можно сформулировать альтернативную (конкурирующую), противоречащую ей, которую обозначают Н1. Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н0. Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой. В других случаях гипотеза называется сложной. Так как проверка статистических гипотез осуществляется на основании выборочных данных, то решение неизбежно сопровождается вероятностью ошибочного заключения как в ту, так и в другую сторону. Так, в какой – то небольшой доле случаев α нулевая гипотеза может оказаться отвергнутой, в то время как она справедлива. Такую ошибку называют ошибкой 1-го рода, а её вероятность – уровнем значимости α Наоборот, в какой – то небольшой доле случаев β нулевая гипотеза принимается, в то время как на самом деле она ошибочна. Такую ошибку называют ошибкой 2-го рода. Вероятность ошибки второго рода β. Вероятность 1- β называют мощностью критерия. Результаты решения относительно нулевой гипотезы можно увидеть в таблице Нулевая гипотеза Н0 Результаты решения относительно Н0 Отклонена Принята Верна Ошибка 1-го рода, её Правильное решение, его вероятность вероятность Р(Н1/Н0) = α Р(Н0/Н0) =1- α Неверна Правильное решение, его Ошибка 2-го рода, её вероятность вероятность Р(Н0/Н1) = β Р(Н1/Н1) =1- β
Проверка статистических гипотез осуществляется с помощью статистического критерия (К), который является функцией от результатов наблюдения. Статистический критерий – это правило, по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0. Выбор критерия может быть осуществлён на основании различных принципов. Чаще всего пользуются принципом отношения правдоподобия, который позволяет построить наиболее мощный критерий. 36
Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия Кнабл. Значения критерия, разделяющие совокупность значений критерия на область допустимых значений и критическую область, определяемые на заданном уровне значимости α по таблицам распределения случайной величины К, выбранной в качестве критерия, называют критическими точками Ккр. Областью допустимых значений называют совокупность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется. Критической областью называют совокупность значений критерия К, при которых нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1. Различают левостороннюю и правостороннюю критические области. Если конкурирующая гипотеза – правосторонняя, т.е а > a0 то и критическая область – правосторонняя.
рис. 10 Если конкурирующая гипотеза – левосторонняя, т.е а < a0 то и критическая область – левосторонняя.
рис. 11 Если конкурирующая гипотеза – двусторонняя, т.е a ≠ a 0 , то и критическая область двусторонняя.
рис. 12 Основной принцип проверки статистических гипотез состоит в следующем: - если наблюдаемое значение критерия принадлежит критической области, то нулевая гипотеза отклоняется в пользу конкурирующей - если наблюдаемое значение критерия принадлежит области допустимых значений, то нулевую гипотезу нельзя отклонить. Задачи 1) 7 студентов из 10 сдавали практические работы так, как будто они были списаны друг у друга. На уровне значимости 0,05 определите, случайно ли это, или студенты действительно списывали. 2) На уровне значимости α = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности , если известны эмпирические и теоретические частоты 5 10 20 25 14 3 m (эмп)i m (теор)i 6 14 28 18 8 3 37
3) Техническая норма предусматривает в среднем 40 с на выполнение определённой технологической операции на конвейере. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на неё больше времени. Для проверки жалобы произведены измерения времени выполнения этой операции у 16 работниц, занятых на ней и получено среднее время 42 с . Можно ли по имеющимся хронометрическим данным на уровне значимости α = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если: а) исправленное выборочное отклонение s – 3,5с; б) выборочное среднее отклонение – 3,5 с? 4) Экономический анализ производительности труда предприятий позволил выдвинуть гипотезу о наличии 2 типов предприятий с различной средней величиной показателя производительности труда. Выборочное обследование 42 предприятий 1-й группы дало следующие результаты: средняя производительность труда 119 деталей. Выборочное обследование 35 предприятий 2-й группы показало, что средняя производительность труда составляет 107 деталей. Генеральные дисперсии соответственно равны 126,91 (дет.2) и 136,1 (дет.2). Считая, что выборки извлечены из нормально распределённых генеральных совокупностей Х и Y ,на уровне значимости 0.05, проверьте, случайно ли полученное различие средних показателей производительности труда или же имеются 2 типа предприятий с различной средней величиной производительности труда. 5) Предполагается, что применение новых компьютерных технологий сократит время решения задач. Хронометраж времени решения 9 задач без компьютерных технологий дал следующие результаты: среднее время решения 57 минут, исправленная выборочная дисперсия sх2 = 186,2 (мин2). Среднее время решения 15 задач с применением компьютерных технологий 52 минуты, а исправленная выборочная дисперсия sу2 = 166,4 (мин2). На уровне значимости α = 0,01 ответьте позволило ли применение компьютерных технологий сократить время решения задач. 6) Партия изделий принимается в том случае, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0,97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α = 0,02 принять партию 7) Для завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты Выборки Завод №1 Завод №2 Объём выборки n1 n2 Число бракованных деталей m1 m2 На уровне значимости α = 0,025 определите, имеется ли существенное различие в качестве изготавливаемых деталей? 8) Компания, производящая средства для похудения, утверждает, что приём таблеток в сочетании со специальной диетой позволяет сбросить в среднем в неделю 400гр веса. Случайным образом отобраны 25 человек, использующих эту терапию, и обнаружено, что в среднем еженедельная потеря в весе составила 430гр со средним квадратическим отклонением 110гр. Проверьте гипотезу о том, что средняя потеря в весе составляет 400гр. Уровень значимости α = 0,05 9) Компания утверждает, что новый вид зубной пасты лучше предохраняет зубы, чем зубные пасты других фирм. Для проверки в случайном порядке выбраны 400 детей, пользовавшихся новой пастой и 300 детей, которые пользовались зубными пастами других фирм. После окончания эксперимента было выяснено, что у 30 детей, использующих новую пасту, и 25 детей из другой группы появились новые признаки кариеса. Имеются ли у компании достаточные основания для утверждения о том, что новый сорт зубной пасты эффективнее. Принять уровень значимости α = 0,05 10) Инженер по контролю качества проверяет среднее время горения нового вида электроламп. Для проверки в порядке случайной выборки было отобрано 100 ламп, среднее время горения которых составило 1075 часов. Среднее квадратическое отклонение времени 38
горения составляет 100 часов. Используя уровень значимости α = 0.05, проверьте гипотезу о том, что среднее время горения ламп – более 1000 часов. 11) Компания, выпускающая в продажу новый сорт кофе, провела проверку вкусов покупателей по случайной выборке из 400 человек и выяснила, что 220 из них предпочли новый сорт всем остальным. Проверьте на уровне значимости α = 0,01 гипотезу о том, что по крайней мере 52% потребителей предпочтут новый сорт кофе. 12) Страховая компания изучает вероятность ДТП для подростков, имеющих мотоциклы. За прошедший год проведена случайная выборка 2000 страховых полисов подростков-мотоциклистов и выявлено, что 15 из них попадали в ДТП и предъявили компании требование о компенсации за ущерб. Может ли аналитик компании отклонить гипотезу о том, что менее 1% всех подростков – мотоциклистов попадали в ДТП в прошлом году. Принять уровень значимости α = 0,05. 13) Новое лекарство против гриппа должно пройти экспериментальную проверку для выяснения побочных эффектов. В ходе эксперимента лекарство принимали 4000 мужчин и 5000 женщин. Результаты показали, что 60 мужчин и 100 женщин испытывали побочные эффекты при приёме нового медикамента. Можно ли на основании эксперимента утверждать, что побочные эффекты нового лекарства у женщин проявляются в большей степени, чем у мужчин? Уровень значимости α = 0,05. 14) Производитель микрокалькуляторов утверждает, что 95% выпускаемых изделий не имеют дефектов. Случайная выборка из 100 микрокалькуляторов показала, что только 92 из них без дефектов. Проверьте справедливость утверждения производителя на уровне значимости α = 0,05. 15) В 2002 году годовой оборот 4 бирж в регионе Ставропольского края составил 4 12·10 у.е.; в Краснодарском крае годовой оборот 5 бирж - 125·103 у.е. Исправленная выборочная дисперсия оборота в регионе Ставропольского края равна 12·103 (у.е.)2, в Краснодарском крае - 2·104 (у.е.)2 . Можно ли на уровне значимости α = 0,05 утверждать, что средний оборот бирж в регионе Ставропольского края больше чем в Краснодарском крае. 16) Производитель нового типа аспирина утверждает, что он снимает головную боль за 30 мин. Случайная выборка 100 человек страдающих головными болями, показала, что новый тип аспирина снимает головную боль за 28,6 мин при среднем квадратическом отклонении 4,2 мин. Проверьте на уровне значимости α = 0,05 справедливость утверждения производителя. 17) Компания по производству безалкогольных напитков выпускает на рынок новый напиток. Компания хотела бы быть уверенной, что не менее 70% её потребителей предпочтут новый напиток. Этот напиток был предложен на пробу 2000 человек, и 1422 из них сказали, что он вкуснее старого. Может ли компания отклонить предположение о том, что только 70% всех её потребителей предпочтут новый напиток старому. Принять уровень значимости α = 0,05 18) Владелец фирмы считает, что добиться более высокой прибыли ему помешала неравномерность поставок по месяцам года. Поставщик утверждает, что поставки были не так уж равномерны. Распределение поставок имеет следующий вид: Месяц 1 2 3 4 5 6 7 8 9 10 11 12 Объём 19 23 26 18 20 20 20 20 32 27 35 40 поставок При α = 0,05 определите кто прав владелец фирмы или поставщик? Корреляционная зависимость. Дана система случайных величин (Х;У). Пусть в результате n испытаний получено n точек (х1;у1); (х2;у2)…(хn;yn), Необходимо вычислить коэффициент корреляции этой системы случайных величин.
39
Приняв во внимание закон больших чисел, при достаточно большом математическом ожидании получим следующие приближённые равенства:
n
M (X ) ≈ x =
∑ xi i =1
n
n
; M (Y ) ≈ y =
∑ yi i =1
n
n
∑ xi2
; δ 2x≈
i =1
n
n
− x 2 ; δ 2y≈
∑y i =1
2 i
n
− y2;
n
C xy ≈
∑x y i
i =1
n
i
− x i y i . Отсюда можно найти коэффициент корреляции по формуле: rxy =
C xy
δ xδ e
.
Если rxy ∗ n − 1 ≥ 3 , то связь между случайными величинами Х и У достаточна
устойчива. Если связь между Х и У установлена, то линейное приближение y x от х даётся формулой линейной регрессии: y x − y = rxy Линейное X y − x = rxy
приближение
δx ( y − y ) или δy
xy
от
δy δx
( x − x ) или у
даётся
y x = Cy + d формулой
X y = C y + d . Прямые y x = ax + b u
линейной
регрессии
x y = Cy + d различны.
-
Для построения уравнения линейной регрессии нужно: по исходной таблице значений (Х;У) вычислить x ; y; δ x2 ; δ y2 ; C xy ; rxy .
-
проверить гипотезу о существовании устойчивости между Х и У; составить уравнение обеих линий регрессии и изобразить графики этих уравнений.
Способ наименьших квадратов. Этот способ заключается в отыскании вида и значения параметров функциональной зависимости у = f(x), связывающий зафиксированные значения переменных х и у, подчиняются требованию наилучшего приближения значений функции к данным наблюдения. Этой цели соответствует подчинение искомой функции такому условию, чтобы сумма квадратов отклонений каждого значения такой функции f(x) от соответствующего значения х была наименьшей.
Пусть имеем следующие данные наблюдений: х2 … хn Х Х1 У У1 у3 … yn Это значит, что сумма [f(x1)-y1]2+ [f(x2) – y2]2 +…+[f(xn) – yn]2 должна удовлетворять условию минимума функции нескольких независимых переменных; или ими оказываются параметры, т.е. неизвестные коэффициенты искомой функции у = f(х), которая может иметь вид: f(х) = ах + b отыскиваются из нормальной системы ⎧⎪k ∑ x i2 + b∑ x i = ∑ x i y i откуда легко получить b = ⎨ ⎪⎩k ∑ x i + nb = ∑ y i
∑ y ∑ x −∑ x ∑ x y n ∑ x − (∑ x )
k= 40
i
2 i
2 i
i
i
2
i
n∑ x i y i − ∑ x i ∑ y i n∑ x i2 − (∑ x i ) 2
i
;
Для параболической функции F(x) = ах2 +bх + с коэффициенты находятся из системы линейных уравнений: ⎧a ∑ x i4 + b∑ x i3 + c∑ x i2 = ∑ x i2 y i ⎪⎪ 3 2 ⎨a ∑ x i + b ∑ x i + c ∑ x i = ∑ x i y i ⎪ 2 ⎪⎩a ∑ x i + b∑ x i + nc = ∑ y i Задачи 1) Туристическая компания предлагает места в гостиницах приморского курорта. Менеджера компании интересует, насколько возрастает привлекательность компании в зависимости от её расстояния до пляжа. С этой целью по 14 гостиницам города была выяснена среднегодовая наполняемость номеров и расстояние в км. до пляжа. Расстояние 0,1 0,1 0,2 0,3 0,4 0,4 0,5 0,6 0,7 0,7 0,8 0,8 0,9 0,9 Наполняемость 92 95 96 90 89 86 90 83 85 80 78 76 72 75 ,% Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. 2) Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей (Х) и стоимостью ежемесячного тех. обслуживания (Y). Для выяснения характера этой связи было отобрано 15 автомобилей. Х 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Y 13 16 15 20 19 21 26 24 30 32 30 35 34 40 39 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. 3) Врач исследователь выясняет зависимость площади поражённой части лёгких у людей, заболевших эмфиземой лёгких, от числа лет курения. Статистические данные, собранные им в некоторой области имеют следующий вид: Число лет курения 25 36 22 15 48 39 42 31 28 33 Площадь поражённой 55 60 50 30 75 70 70 55 30 35 части лёгкого, %
Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если человек курил 30 лет, то сделайте прогноз о степени поражения лёгких у случайно выбранного пациента 4) Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определённой модели цену, диффириенцированную по регионам. Следующие данные показывают цену в 8 различных регионах и соответствующее им число продаж. Число продаж, 420 380 350 400 440 380 450 420 шт. Цена, тыс. руб.
5,5 6 6,5 6 5 6,5 4,5 5 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,01. Постройте уравнение регрессии и объясните смысл полученных результатов. 41
5) Опрос 10 студентов НХК позволяет выявить зависимость между средним баллом по результатам предыдущей сессии и числом часов в неделю затраченных студентом на самостоятельную подготовку. Средний балл 4,6 4,3 3,8 3,8 4,2 4,3 3,8 4 3,1 3,9 Число часов 25 22 9 15 15 30 20 30 10 17 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. Если студент занимается самостоятельно по 12 часов в неделю, то каков прогноз успеваемости? 6) Имеется случайная выборка из 10 семей для изучения связи между числом телевизоров (Y) в домохозяйстве и числом членов семьи (Х) Х 6 2 4 3 4 4 6 3 2 2 Y 4 1 3 2 2 3 4 1 2 2 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,01. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. 7) Имеются данные о стаже работы (Х, лет) и выработке одного рабочего за смену (Y, шт.) Х 1 3 4 5 6 7 Y 14 15 18 20 22 25 Постройте график исходных данных и определите по нему характер зависимости. Рассчитайте выборочный коэффициент линейной корреляции Пирсона, проверьте его значимость при α = 0,05. Постройте уравнение регрессии и дайте интерпретацию полученных результатов. 8) Изучается зависимость себестоимости единицы изделия (Y, тыс. руб.) от величины выпуска продукции (Х, тыс. шт.) по группам предприятий за отчётный период. Экономист обследовал 5 предприятий и получил следующие данные: Х 2 3 4 5 6 Y 1,9 1,7 1,8 1,6 1,4 Полагая, что между Х и Y имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. 9) Имеются выборочные данные о глубине вспашки полей под озимые культуры (Х, см.) и их урожайность (Y, га) Х 10 15 20 25 30 Y 5 10 16 20 24 При α = 0,05 установить значимость статистической связи между признаками Х и Y. Если признаки коррелируют, постройте уравнение регрессии и объясните его смысл. Сделайте прогноз урожайности пшеницы при глубине вспашки 22 см. 10) Из студентов 3-го курса групп ЭВМ отобраны случайным образом 10 человек и подсчитаны средние оценки, полученные ими на 1-ом (Х) и 3-м (Y) курсе. Х 3,5 4 3,8 4,6 3,9 3 3,5 3,9 4,5 4,1 Y 4,2 3,9 3,8 4,5 4,2 3,4 3,8 3,9 4,6 3 Полагая, что между Х и Y имеет место линейная зависимость, определите выборочное уравнение линейной регрессии и объясните смысл полученных коэффициентов. Каковы значимость коэффициента корреляции, направление и теснота связи между показателями Х и Y, если α = 0,05? 11) Определите тесноту связи общего веса некоторого растения (Х, гр) и веса его семян (Y, гр) на основе следующих выборочных данных: Х 40 50 60 70 80 90 100 Y 20 25 28 30 35 40 45 42
Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте линейное уравнение регрессии и объясните его. 12) Перед сдачей экзаменов в конце семестра в 20 группах студентов НХК был проведён опрос о том, какую оценку по сдаваемым в сессию курсам они ожидают получить. После сессии средние полученные оценки были сопоставлены со средними ожидаемыми. Результаты приведены в таблице: Ожидаемая 3,4 3,1 3 2,8 3,7 3,5 2,9 3,7 3,5 3,2 Полученная 4,1 3,4 3,3 3 4,7 4,6 3 4,6 4,6 3,6 Ожидаемая 3 3,5 3,3 3,1 3,3 3,9 2,9 3,2 3,4 3,4 Полученная 3,5 4 3,6 3,1 3,3 4,5 2,8 3,7 3,8 3,9 Рассчитайте линейный коэффициент корреляции Пирсона, оцените его значимость при α = 0,05. 13) Определите тесноту связи между возрастом самолёта (Х, лет) и стоимостью его эксплуатации (Y, млн. руб.) по следующим данным: Х 1 2 3 4 5 Y 2 4 5 8 10 Установите значимость коэффициента корреляции. Если он значим, то постройте уравнение регрессии и объясните его смысл. Каким будет прогноз стоимости эксплуатации самолёта, если его возраст 1,5 года, а уровень значимости принять равным 0,05? 14) Определите тесноту связи объёма выпуска продукции (Х, тыс. шт.) и себестоимости единицы изделия (Y, тыс. руб.) на основе следующих данных: Х 3 4 5 6 7 Y 10 8 7 5 2 Проверьте значимость выборочного коэффициента корреляции на уровне значимости равном 0,05. Постройте уравнение линейной регрессии и объясните его. 15)Имеются данные по 14 предприятиям о производительности труда (Y, шт.) и коэффициенте механизации работ (Х, %). Х 32 30 36 40 41 47 56 54 60 55 61 67 69 76 Y 20 24 28 30 31 33 34 37 38 40 41 43 45 48 Проверьте значимость выборочного коэффициента корреляции при α = 0,05. Постройте уравнение регрессии и объясните его. 16) Дана таблица социального исследования Х 0,25 0,37 0,44 0,55 0,6 0,62 0,68 0,7 0,73 Y 2,57 2,31 2,12 1,92 1,75 1,71 1,6 1,51 1,5 Х 0,75 0,82 0,84 0,87 0,88 0,9 0,95 1 Y 1,41 1,33 1,31 1,25 1,2 1,19 1,15 1 Определите коэффициент корреляции и уравнения линий регрессии. 17) В результате опытов получена таблица социологических исследований. Определите коэффициент корреляции и уравнения линий регрессии. 1. Х 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 Y 1,3 1,21 1,12 1,62 1,73 1,45 1,44 1,52 1,68 1,7 2. Х 178 170 181 173 169 178 177 165 187 182 Y 72 65 92 75 68 79 78 67 80 81 3. Х 159 182 178 173 176 173 198 187 191 170 Y 56 82 77 63 80 65 85 89 87 72 4. Х 19 25 24 22 18 38 39 30 35 38 Y 20 20 15 15 10 4 6 10 10 5 43
5. Х Y
6,2 17,1
6,8 16
7 15,1
7,3 15
7,5 14,1
8,2 13,3
8,4 13,1
8,7 12,5
8,8 12
9 11,9
Х Y
2 1,34
7 1,85
12 3,41
17 3,85
22 4,45
27 4,98
32 5,63
37 5,74
42 6,82
45 7
Х Y
7 0,04
7,5 0,08
8 0,12
8,5 0,04
9 0,12
9,5 0,2
10 0,12
10,5 0,08
11 0,08
11,5
Х Y
4 13,8
3 14
7 14,1
6 14,2
5 14,3
2 14,4
3 14,5
8 14,6
9 13,9
2 14,7
Х Y
3,1 1,75
3,2 1,62
3,3 1,43
3,4 1,52
3,5 1,49
3,6 2,512
3,7 2
3,8 2,31
3,9 1,9
4 2
Х Y
1,9 2
2,5 2
2,4 1,5
2,2 1,5
1,8 1
3,8 0,4
3,9 0,6
3 1
3,5 1
3,7 0,5
6. 7. 8. 9. 10.
44
Литература Учебная и справочная Абезгауз Г.Г., Тронь А, П., Коненкин Ю.Н., Коровина И. А. Справочник по вероятностным расчётам. М.,1970 Агапов Г. И. Задачник по теории вероятности. М., 1986 Белинский В.А., Калихман И. А., Майстров Л. Я., Митькин А. М. Высшая математика с основами математической статистики. М., 1965 Боровков А.А. Курс теории вероятностей. – М.: 1978 Вайнберг Дж., Шумекер Дж. Статистика. М., 1979 Венецкий И. Г., Кильдишев Г. С. Теория вероятностей и математическая статистика М., 1975 Вентцель Е.С., Овчаров Л.А. Теория вероятности. – М.: 1977 Гершгон А. С. Элементы теории вероятностей и математической статистики. Львов, 1961 Гмурман В.Е. Руководство к решению задач по теории вероятности и математической статистике. М., 1975; 1979; 1997 Гмурман В.Е. Теория вероятности и математическая статистика. М., 1975; 1988 Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей. – М.: 1978 Ежов И. И., Скороход А. В., Ядренко М. И. Элементы комбинаторики. М., 1977 Емельянов Г. В., Скитович В. П. Задачник по теории вероятностей и математической статистике. Л., 1967 Ивашев-Мусатов О.С. Теория вероятности и математическая статистика. – М.: 1979 Калинина В. Н. Математическая статистика. М., 1981 Колмогоров А.Н. Основные понятия теории вероятностей. – М.: 1978 Колде Я. К. Практикум по теории вероятности и математической статистике. М., 1991. Лютикас В. Школьнику о теории вероятности. М., 1983 Л. И. Ниворожкина, З.А. Морозова Основы статистики с элементами теории вероятностей. – Ростов- на- Дону «Феникс» 1999 Румшиский Л. З. Элементы теории вероятности М., 1976 Четыркин Е. И., Калихман И. Л. Вероятность и статистика. М., 1982 Научно-популярная Глеман М., Варга Т. Вероятность в играх и развлечениях. - М.: 1979 Хургин Я.И. Как объять необъятное. – М.:1979 Хургин Я.И. Да, нет или может быть. – М.:1979 Тарасов Л.В. Мир, построенный на вероятности. – М.: 1984 Кравец А.С. Природа вероятности. – М.: 1976 Гнеденко Б.В. Из истории науки о случайном. – М.: 1981 Мостеллер Ф. Пятьдесят занимательных вероятностных задач с решениями. – М.: 1978 Скворцов В.В. Викторина по элементам теории вероятностей – М.: 1989 Кордемский Б.А. Математика изучает случайности. – М.: 1975 Виленкин Н.Я.Популярная комбинаторика. – М.: 1978
45
Треугольник Паскаля k
0
1
2
3
4
5
6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 3 6 10 15 21 28 36 45 55 66 78 91 105 120
1 4 10 20 35 56 84 120 165 220 286 364 455 560
1 5 15 35 70 126 210 330 495 715 1001 1365 1820
1 6 21 56 126 252 462 792 1287 2002 3003 4368
1 7 28 84 210 462 924 1716 3003 5005 8008
n
46
7
8
9
1 8 1 36 9 1 120 45 10 330 165 55 792 495 220 1716 1287 715 3432 3003 2002 6435 6435 5005 11440 12870 11440
10
11
12
1 11 66 286 1001 3003 8008
1 12 78 364 1365 4368
1 13 91 455 182
I. Таблица значений функции ϕ ( x) = x 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9
0 0,3989 3970 3910 3814 3683 3521 3332 3123 2897 2661 0,2420 2179 1942 1714 1497 1295 1109 0940 0790 0656 0,0540 0440 0355 0283 0224 0175 0136 0104 0079 0060 0,0044 0033 0024 0017 0012 0009 0006 0004 0003 0002
1 3989 3965 3902 3802 3668 3503 3312 3101 2874 2637 2396 2155 1919 1691 1476 1276 1092 0925 0775 0644 0529 0431 0347 0277 0219 0171 0132 0101 0077 0058 0043 0032 0023 0017 0012 0008 0006 0004 0003 0002
2 3989 3961 3894 3790 3653 3485 3292 3079 2850 2613 2371 2131 1895 1669 1456 1257 1074 0909 0761 0632 0519 0422 0339 0270 0213 0167 0129 0099 0075 0056 0042 0031 0022 0016 0012 0008 0006 0004 0003 0002
1 2π
3 3988 3956 3885 3778 3637 3467 3271 3056 2827 2589 2347 2107 1872 1647 1435 1238 1057 0893 0748 0620 0508 0413 0332 0264 0208 0163 0126 0096 0073 0055 0040 0030 0022 0016 0011 0008 0005 0004 0003 0002
e
−
x2 2
4 3986 3951 3876 3765 3621 3448 3251 3034 2803 2565 2323 2083 1849 1626 1415 1219 1040 0878 0734 0608 0498 0404 0325 0258 0203 0158 0122 0093 0071 0053 0039 0029 0021 0015 0011 0008 0005 0004 0003 0002
47
5 3984 3945 3867 3752 3605 3429 3230 3011 2780 2541 2299 2059 1826 1604 1394 1200 1023 0863 0721 0596 0488 0396 0317 0252 0198 0154 0119 0091 0069 0051 0038 0028 0020 0015 0010 0007 0005 0004 0002 0002
6 3982 3939 3857 3739 3589 3410 3209 2989 2756 2516 2275 2036 1804 1582 1374 1182 1006 0848 0707 0584 0478 0387 0310 0246 0194 0151 0116 0088 0067 0050 0037 0027 0020 0014 0010 0007 0005 0003 0002 0002
7 3980 3932 3847 3726 3572 3391 3187 2966 2732 2492 2251 2012 1781 1561 1354 1163 0989 0833 0694 0573 0468 0379 0303 0241 0189 0147 0113 0086 0065 0048 0036 0026 0019 0014 0010 0007 0005 0003 0002 0002
8 3977 3925 3836 3712 3555 3372 3166 2943 2709 2468 2227 1989 1758 1539 1334 1145 0973 0818 0681 0562 0459 0371 0297 0235 0184 0143 0110 0084 0063 0047 0035 0025 0018 0013 0009 0007 0005 0003 0002 0001
9 3973 3918 3825 3697 3538 3352 3144 2920 2685 2444 2203 1965 1736 1518 1315 1127 0957 0804 0669 0551 0449 0363 0290 0229 0180 0139 0107 0081 0061 0046 0034 0025 0018 0013 0009 0006 0004 0003 0002 0001
II. Таблица значений функции ϕ (x) = x 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,5 4,0 4,5 5,0
0 1 0,00000 00399 03983 04380 07926 08317 11791 12172 15542 15910 19146 19497 22575 22907 25604 26113 28814 29103 31594 31859 34134 34375 36423 36650 38493 38686 40320 40490 41924 42073 43319 43448 44520 44630 45543 45637 46407 46485 47128 47193 47725 47778 48214 48257 48610 48645 48928 48956 49180 49202 49379 49396 49534 49547 49653 49664 49774 49752 49813 49819 0,49865 49977 499968 499997 49999997
2 00798 04776 08706 12552 16276 19847 23237 26424 29389 32121 34614 36864 38877 40658 42220 43574 44738 45728 46562 47257 47831 48300 48679 48983 49224 49413 49560 49674 49760 49825 3,1 3,6
1 2π
3 01197 05172 09095 12930 16640 20194 23565 26730 29673 32381 34850 37076 39065 40824 42364 43699 44845 45818 46638 47320 47882 48341 48713 49010 49245 49430 49573 49683 49767 49831 49903 49984
x
∫e
−
t2 2
dt
0
4 01595 05567 09483 13307 17003 20540 23891 27035 29955 32639 35083 37286 39251 40988 42507 43822 44950 45907 46712 47381 47932 48382 48745 49036 49266 49446 49585 49693 49774 49836 3,2 3,7
48
5 01994 05962 09871 13683 17364 20884 24215 27337 30234 32894 35314 37493 39435 41149 42647 43943 45053 45994 46784 47441 47982 48422 48778 49061 49286 49461 49598 49702 49781 49841 49931 49989
6 02392 06356 10257 14058 17724 21226 24537 27637 30511 33147 35543 37698 39617 41309 42786 44062 45154 46080 46856 47500 48030 48461 48809 49086 49305 49477 49609 49711 49788 49846 3,3 3,8
7 02790 06749 10642 14431 18082 21566 24857 27955 30785 33398 35769 37900 39796 41466 42922 44179 45254 46164 46926 47558 48077 48500 48840 49111 49324 49492 49621 49720 49795 49851 49952 49993
8 03188 07142 11026 14803 18639 21904 25175 28230 31057 33646 35993 38100 39973 41621 43056 44295 45352 46164 46995 47675 48124 48537 48870 49134 49343 49506 49632 49728 49801 49856 3,4 3,9
9 03586 07535 11409 15173 18793 22240 25490 28524 31327 33891 36214 38298 40147 41774 43189 44408 45449 46327 47062 47670 48169 48574 48899 49158 49361 49520 49643 49736 49807 49861 49966 49995
Критические точки распределения Стьюдента γ k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞
0,5
0,6
0,7
0,8
0,9
0,95
0,98
0,99
0,999
1,000 0,816 765 741 727 718 711 706 703 700 697 695 694 692 691 690 689 688 688 687 686 686 685 685 684 684 684 683 683 683 681 679 677 674
1,376 1,061 0,978 941 920 906 896 889 883 879 876 873 870 868 866 865 863 862 861 860 859 858 858 857 856 856 855 855 854 854 851 848 845 842
1,963 1,336 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,046 1,041 1,036
3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645
12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,103 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960
31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326
63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576
636,619 31,598 12,941 8,610 6,859 5,959 5,405 5,041 4,781 4,587 4,487 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,767 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,551 3,460 3,373 3,291
49
Вопросы к экзамену 1. Случайные события и операции над ними. 2. Общие правила комбинаторики. Выборки элементов. Размещения и размещения с повторениями. 3. Перестановки, перестановки с повторениями. 4. Сочетания, сочетания с повторениями. 5. Вероятность события. Примеры непосредственного вычисления вероятностей. 6. Относительная частота, устойчивость относительной частоты 7. Теорема сложения вероятностей несовместимых событий. 8. Полная система событий. Противоположные события 9. Независимые и зависимые события. Теорема умножения вероятностей независимых событий. 10. Вероятность появления хотя бы одного события. Условная вероятность 11. Теорема умножения вероятностей зависимых событий. 12. Теорема сложения вероятностей совместимых событий. 13. Формула полной вероятности. 14. Вероятность гипотез. Формула Бейеса. 15. Повторение испытаний. Формула Бернулли. 16. Наивероятнейшее число наступлений события при повторении испытаний 17. Локальная теорема Лапласа. 18. Интегральная теорема Лапласа. 19. Вероятность отклонения относительной частоты от постоянной вероятности в независимых испытаниях. 20. Случайная величина. Дискретные и непрерывные случайные величины. 21. Закон распределения вероятностей дискретной случайной величины 22. Закон Биноминального распределения вероятностей . 23. Закон распределения Пуассона 24. Числовые характеристики дискретной случайной величины. 25. Дисперсия дискретной случайной величины. 26. Среднее квадратическое отклонение дискретной случайной величины. 27. Моменты распределения. 28. Закон больших чисел. Неравенство Чебышева. 29. Теорема Чебышева, её значение на практике. 30. Теорема Бернулли 31. Интегральная функция распределения, её свойства и график. 32. Дифференциальная функция распределения, её свойства и график. 33. Закон равномерного распределения вероятностей. 34. Закон нормального распределения. 35. Вероятность попадания в заданный интервал нормально распределённой случайной величины 36. Правило трёх сигм. 37. Система двух случайных величин. 38. Интегральная функция распределения двумерной случайной величины. 39. Вероятность попадания случайной величины в геометрические фигуры 40. Дифференциальная функция распределения непрерывной двумерной случайной величины. 41. Числовые характеристики системы двух случайных величин. 42. Выборка. Способы отбора. 43. Статистическое распределение выборки. 44. Статистические оценки параметров распределения. 45. Статистическое оценивание. 46. Ошибки выборки. 50
47. Интервальное оценивание 48. Проверка статистических гипотез. 49. Виды и формы связей различаемые в статистике. 50. Оценка уравнения парной регрессии. 51. Парная линейная зависимость. 52. Расчёт коэффициента уравнения регрессии. 53. Метод наименьших квадратов. 54. Измерение вариации по уравнению регрессии.
51