НАУЧНО-ПРОИЗВОДСТВЕННОЕ ОБЪЕДИНЕНИЕ ИМ. КУЗНЕЦОВА
ИВАНОВ А. И.
МЕТОДЫ ОЦЕНКИ НАРКОСИТУАЦИИ УЧЕБНОЕ ПОСОБИЕ ДЛЯ СЛУЖАЩИХ ГОСУДАРСТВЕННОГО АППАРАТА УПРАВЛЕНИЯ
САНКТ-ПЕТЕРБУРГ 2004
2
НАУЧНО-ПРОИЗВОДСТВЕННОЕ ОБЪЕДИНЕНИЕ ИМ. КУЗНЕЦОВА
ИВАНОВ А. И.
МЕТОДЫ ОЦЕНКИ НАРКОСИТУАЦИИ УЧЕБНОЕ ПОСОБИЕ ДЛЯ СЛУЖАЩИХ ГОСУДАРСТВЕННОГО АППАРАТА УПРАВЛЕНИЯ Под редакцией канд. биол. наук, проректора по науке Национального института здоровья Р.С. Минвалеева
САНКТ-ПЕТЕРБУРГ 2004
3
РЕЦЕНЗЕНТЫ: О.А. Малафеев д-р физ.-мат. наук, проф. факультета прикладной математики – процессов управления СПбГУ А.Н. Покровский д-р физ.-мат. наук, проф. НИИ вычислительной математики и процессов управления им. В.И. Зубова при СПбГУ Г.А. Секамова капитан юстиции, начальник отдела Следственного Управления при УВД Центрального района Санкт-Петербурга Т.В. Сергеева врач 17-ой (Александровской) городской больницы СПб
Иванов А.И. Методы оценки наркоситуации. Учебное пособие для служащих государственного аппарата управления / Под ред. Р.С. Минвалеева. – СПб: НПО им. Кузнецова, 2004. Настоящее учебное пособие является изложением некоторых классических прикладных методов анализа и обработки результатов наблюдений на минимальной аналитической основе, применимых к решению задач научной оценки наркоситуации в России. Пособие рассчитано на служащих Государственного аппарата Российской Федерации, по долгу службы имеющих непосредственное отношение к решению задач контроля и управления. Работая над книгой, автор ставил перед собой две цели. Первая - на примерах, в основном содержательных, а не узко иллюстративных, продемонстрировать возможности применения математического моделирования при решении задач оценки наркоситуации в России. Вторая - познакомить читателя с простейшими приемами и методами оценки наркоситуации, выполненной с использованием достижений современной науки. Пособие может быть рекомендовано как для госслужащих РФ, так и для работников оперативных, следственных и силовых государственных структур, врачей, преподавателей, студентов и аспирантов.
С автором и редактором книги можно связаться по телефонам: (812) 269 00 51 – Анатолий Иванович Иванов (812) 176 41 28 – Ринад Султанович Минвалеев E-mail:
[email protected] Web: www.realyoga.ru (раздел: Физиология йоги) Все права защищены. Вместе с тем, автор разрешает воспроизведение любой части книги при наличии ссылок на настоящее издание
4
Посвящается светлой памяти моего Учителя, великого русского ученого, основателя факультета прикладной математики – процессов управления СПбГУ Владимира Ивановича Зубова (1930 -2000)
5
СОДЕРЖАНИЕ Предисловие редактора Введение §1. Разные подходы к оценке наркоситуации и вытекающие из них трудности §2. О математическом моделировании в естествознании. 1.Краткая историческая справка. 2.Математическая модель и этапы ее поиска. §3. О мере оценки наркоситуации. 1.Противоречие между тем, что кажется и тем, что существует на самом деле. 2.Знакомство с вероятностной мерой. §4. Применение элементов комбинаторного анализа при оценке наркоситуации. 1.Основные определения. 2.Решение задач оценки наркоситуации применением общедоступных формул комбинаторного анализа. §5. Первые модели оценки случайных событий. 1.Краткая историческая справка. 2.Формула Бернулли. 3.Закон Пуассона. Наркомания живет по законам военного времени. §6. О сфере применимости закона нормального распределения при оценке наркоситуации. 1.Краткая историческая справка. 2.Случайные величины. 3.Об иллюзиях в оценке вероятностей. 4.Простейшие критерии согласия. 5.Дополнительные сведения о нормальном законе распределения. 6.Критерии асимметрии и эксцесса. §7. Оценка значения вероятности по результатам наблюдений и экспериментов. Интервальный метод. 1.Постановка задачи. 2.Доверительный интервал вероятностей, как мера оценки наркоситуации. 3.Упрощенный метод вычисления доверительного интервала для вероятности события.
6
4.Можно ли считать, что количество больных наркозависимостью в России возросло? §8. Кинематическая модель наркоситуации в России. 1.Предварительные замечания. 2.Линейная модель развития наркоситуации в России. 3.Экспоненциальная модель развития наркоситуации в России. 4.Логистическая модель развития наркоситуации в России. 5.Модель «Один наркоман против 145 миллионов россиян». Наркоман начинает и выигрывает. Модель «Один наркоман против 43 миллионов российской молодежи». Наркоман начинает и выигрывает. 6.О более точных моделях наркоситуации. 7.Применение к оценке наркоситуации математических моделей сообществ, борющихся за общую пищу. ЗАКЛЮЧЕНИЕ........................................ ЛИТЕРАТУРА........................................ Приложение 1...................................... Приложение 2...................................... Приложение 3...................................... Приложение 4...................................... Дополнение: Отзыв д. ф.- м. н. проф. Малафеева О.А. Отзыв д. ф.- м. н. проф. Покровского А.Н. Отзыв капитана юстиции Секамовой Г.А. Воспоминания проф. Покровского А.Н. о проф. Зубове В.И.
7
ПРЕДИСЛОВИЕ РЕДАКТОРА Идите вперед, а понимание придет потом! Ж.Л. Даламбер Актуальность учебного пособия "Методы оценки наркоситуации", написанного А.И. Ивановым, подтверждается тем, что существующая наркоситуация в России уже не может быть с требуемой для решения задач государственного контроля и управления наркоситуацией точностью охарактеризована субъективными и неоднозначными экспертными оценками, принятыми в настоящее время. Новизна предложенных в учебном пособии методов оценки наркоситуации состоит в том, что А.И. Ивановым, взамен приблизительных, опирающихся на субъективный опыт экспертов оценок наркоситуации, предложено и обосновано применение статистических оценок и оценок, найденных методом математического моделирования, рекомендованных в Государственных стандартах России для оценки результатов научных исследований. По моему мнению, особый интерес представляют найденные А.И. Ивановым модели, позволяющие не только оценить текущую стадию эпидемии, но и с высокой точностью решать задачи прогноза. Найденный результат может быть применен при решении задач доказательной медицины, организации здравоохранения, для повышения эффективности мероприятий государственных административных и силовых структур. Веским доводом в пользу адекватности найденных А.И. Ивановым прогностических моделей является то, что первая модель А.И. Иванова, найденная им в 1972 году, полностью подтвердилась – все мы знаем, что Советский Союз распался. Вместо «полной победы коммунизма» мы получили полную алкоголизацию всей страны. И распад Советского Союза, и поголовная пивная алкоголизация была предсказана А.И. Ивановым еще в 1972 году. Согласно расчетам А.И. Иванова распад СССР должен был произойти в 1989 году. Ошибка составила меньше трех лет. Подробное описание модели изложено во Введении. В настоящее время применением изложенной в § 8 книги модели «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает» доказано, что к 2015 году вся российская молодежь, в 100%, будет обязательно принимать наркотики. Поясним предсказанный результат. Много ли у вас есть таких знакомых, кто никогда, ни при каких обстоятельствах, ни в каких самых мизерных количествах не употребляет алкоголь? Ни пиво в жару, ни шампанское в Новый год, ни ритуальный бокал в день рождения… Вместе с тем известно, что алкоголь отнесен
8
Всемирной Организацией Здравоохранения к наркотикам (см., например, соответствующую статью в Большой Советской Энциклопедии). Так сколько же у нас в стране людей, не употребляющих наркотики?! Если читатель думает, что А.И. Иванов сгущает краски, то вот, что произошло совсем недавно. С некоторых пор наркотики в России не запрещены почти также как и алкоголь. А именно, с мая 2004 года Государственная Дума России приняла закон, согласно которому любой желающий имеет полное право не только употреблять любые наркотики, какие только пожелает, но и хранить у себя их запасы, и даже торговать ими. Разрешенные депутатами Государственной Думы «дозы» в пересчете на 1-ого человека составляют: героин – до 1 грамма, так называемые «легкие» наркотики, марихуана и т. п. – до 20 грамм. Иными словами, каждому гражданину Российской Федерации дано не только законодательное, но и моральное право и принимать, и распространять наркотики. Фактически решением Госдумы уже законодательно подтверждена правильность модели А.И. Иванова «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает», согласно которой к 2015 году вся молодежь России будет в обязательном порядке употреблять наркотики, как сейчас «шампанское в Новый год»! И в день рождения…. И в Рождество Христово…. И в день Независимости России! Однако предположим, что Госдума приняла бы противоположный закон, направленный на то, чтобы тем или иным способом запретить наркотики. Читатели знают, что в нашей недавней истории пример подобного решения уже есть – «горбачевский сухой закон». И вспомните, стали ли пить меньше? Поэтому решение «народных избранников» о фактической легализации наркотиков в нашей повседневности можно если не поддержать, то хотя бы понять. Но хохма (евр. ‘мудрость’) состоит в том, что если бы и был принят закон о запрете наркотиков, то полная наркотизация всей молодежи России все равно бы произошла к 2015 году. Вот почему модель А.И. Иванова названа «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает»! Иными словами, сколько нужно спичек, чтобы сжечь Вашу квартиру? Разве одной мало? А вообще, при чтении книги следуйте рецепту великого Даламбера: «Идите вперед, а понимание придет потом»! Кандидат биологических наук, проректор по науке Национального института Здоровья Р.С. Минвалеев
9
ВВЕДЕНИЕ Настоящее учебное пособие имеет целью ознакомить читателя с современными научными методами оценки наркоситуации как во всей России в целом, так и в ограниченных, подвергаемых специальному исследованию группах. Известно, что в настоящее время существует немало книг, учебников и учебных пособий, в которых изложены современные методы обработки результатов измерений и экспериментов, а также методы математического моделирования интересующих читателя явлений. Среди этих книг немало таких, содержание которых ориентировано на ознакомление с методами применения современного математического аппарата для решения прикладных задач в специализированных областях. Например, книги Солодовникова А.С. с соавт. "Математика в экономике" [77], Гланца С. "Медико-биологическая статистика" [78] и др. Однако до сих пор в России и, возможно, в мире нет книг, содержание которых специализировано на ознакомление читателя с современными количественными методами оценки наркоситуации. Первой, к сожалению не опубликованной работой автора по оценке наркоситуации в России была статья, написанная в начале 70-х годов XX века во время учебы автора на факультете прикладной математики процессов управления Ленинградского Государственного Университета им. А.А. Жданова. В статье была изложена математическая модель развития алкогольной ситуации в СССР. Остановимся подробнее на ключевых моментах модели. Известно, что в период развитого социализма в СССР, результаты любого научного исследования, в той или иной мере касающиеся общественных явлений, непременно должны были быть подкреплены соответствующими цитатами из произведений классиков марксизмаленинизма. Справедливости ради отметим, что в многотомных собраниях сочинений К. Маркса, Ф. Энгельса и В.И. Ленина всегда находилось достаточное количество высказываний практически по любым вопросам и обществоведения, и философии, и всего естествознания в целом. Поэтому, вооружившись 55-томным полным собранием сочинений В.И. Ленина, потратив необходимое для нахождения нужной цитаты время, в 43-ем томе собрания автор нашел: "... в отличие от капиталистических стран, которые пускают в ход такие вещи, как водку и прочий дурман, мы этого не допустим, потому что, как бы они ни были выгодны для торговли, но они поведут нас назад, к капитализму, а не вперед к коммунизму..." (Ленин В.И. Полн. собр. соч., т.43, с.326). После этого автор задал себе
10
вопрос о том, каким именно количеством потребления алкоголя, в пересчете на чистый этиловый спирт, характеризуется капиталистическое общество, целью которого является порабощение и эксплуатация трудящихся масс. В результате были найдены цифры, согласно которым в 1906-1910 годах душевое потребление алкоголя в пересчете на чистый спирт составляло во Франции - 22.9 литра, Италии - 17.3, Швейцарии 13.7, Испании - 10.8, Бельгии - 10.6, Австрии - 7.8, Венгрии - 7.6 литров. Замечание. Данные об употреблении количеств алкоголя на душу населения здесь заимствованы из книги Ф.Г. Углова "Из плена иллюзий" [76]. Вычислив среднее арифметическое из напечатанных выше количеств потребления алкоголя, находим, что оно равно 9.6 литра. Получалось, что как только количество выпитого алкоголя на душу населения в СССР превысит 9.6 литра, так сразу же страна, желая того или не желая, повернет с пути к светлому будущему - коммунизму на путь проклятого капитализма. Больше того, именно изменением употребления спиртного россиянами и объяснялось, по мнению автора, возникновение условий для Великой Октябрьской Социалистической Революции 1917 года, освободившей трудящихся от капиталистической эксплуатации. Рассмотрим статистические данные употребления спиртного на душу населения в России по спиртовому эквиваленту в виде 100% спирта. 1863-66 годы 1873 год 1883 1893 1894
- 4.55 литра, - 4.18 литра, - 3.32, - 2.46, - 2.98,
1906 1910 1913 1915-24
- 3.41, - 3.41, - 4.7, - 0 литров!
Получалось, что Великая Октябрьская Социалистическая Революция произошла если не по причине, то как минимум, на фоне сухого закона, изданного российским правительством вследствие начала в 1914 году Первой Мировой Войны. Получалось, что внезапно отрезвевшее сознание трудящихся, вследствие отрезвления, поняло бесчеловечность капиталистической системы и в октябре 1917 года, наконец, оторвало капиталистов-эксплуататоров от рычагов власти.
11
С другой стороны, автора тогда, в начале 70-х годов XX века, озаботил рост потребления количества алкоголя в спиртовом эквиваленте на душу населения в СССР. Приведем цифры. 1965 год 1966 1967 1968
- 4.56 литра, - 5, - 5.4, - 5.8,
1969 1970 1971
- 6.26, - 6.75, - 7.1 литра.
Квалификации студента-математика Ленинградского государственного университета было предостаточно, чтобы, используя эти данные найти математическую модель, применение результатов которой позволяло не только связать имеющиеся цифры единой формулой, но и выполнять прогноз роста употребления количества алкоголя в обозримом будущем. Считая за временную характеристику величину t и присваивая значения величины t для 1965 года t = 0, для 1966 года t = 1 и т. д., воспользовавшись найденной автором моделью Y(t) = 0.416t + 4.6
(*)
нетрудно вычислить количество алкоголя, употребляемого "в среднем" одним жителем в СССР в любой год. Например, для 1972 года t = 7. Подставив значение t = 7 в формулу (*) находим, что y(t) = 7.5 литров. Применив формулу (*) при t = 13, соответствующем 1978 году находим, что для 1978 года употребление алкоголя в спиртовом эквиваленте на душу населения в СССР становится равным 10 литрам, т. е. превышает 9.6 литров, необходимых для начала перехода развития страны из русла строительства коммунизма в русло возвращения к капитализму. Замечание. Косвенным подтверждением правильности прогноза автора послужило создание в СССР в 1976 году самостоятельной наркологической службы. До этого момента задачи наркологии в СССР решались в рамках психиатрии. Однако найденного результата показалось мало: если примерно с 1978 года в СССР незаметно начнутся процессы, направленные на переориентацию страны в сторону реанимации капиталистического строя, то примерно когда социалистический строй рухнет и снова будет объявлен ненавистный капитализм? Автор был уверен, что если капитализм и воскреснет, то Россия непременно станет ведущей страной мира капиталистического. Поэтому, вычислив среднее количество употребляемого спиртового эквивалента на душу населения в развитых
12
капиталистических странах Европы - Франции, Швейцарии, Австрии и Бельгии автор пришел к результату: (22.9 + 13.7 + 10.6 + 7.8)/4 = 13.75 литра. Применив модель (*) нетрудно было вычислить, что такое количество употребления спирта на душу населения приходилось на 1987 год. Итак, в 1973 году - году апогея развития мировой социалистической системы, студент пришел к заключению о том, что примерно в 1987 году СССР как социалистическая страна перестанет существовать! Нетрудно догадаться, какой была тогда реакция идеологических лидеров построения коммунизма на результаты математических прогнозов студента... В 1980 году, автор применил модель (*) для расчета на 1980 год. Получилось 10.84 литра. Трудно сказать, какие именно чувства испытал автор, обнаружив в 1981 году почти такую же цифру - 10.83 литра (отличие на сотую долю) в одном из официальных государственных статистических источников! До вычисленной в 1973 году даты разрушения СССР оставалось 6 лет... И вдруг - 1985 год. На всю страну прозвучало постановление правительства "О мерах по преодолению пьянства и алкоголизма". Начались времена "горбачевского сухого закона". Кривая употребления спиртного на душу населения в СССР резко сорвалась вниз. К сожалению, мы до сих пор не располагаем точными цифрами изменения употребления количества алкоголя в те годы. Но волна прошла и в 1990 году мы вышли на прогнозируемые применением формулы (*) 15 литров спиртового эквивалента на душу населения. Любознательный читатель легко заметит, что для применения формулы (*) 1990 год соответствует характеристике t = 25. Подставит, сосчитает, и получит зарегистрированную в статистических источниках цифру 15 литров. Применение найденной в 1973 году формулы продолжило оставаться актуальным и в 1990 году, вопреки осмеянному в настоящее время "горбачевскому сухому закону". Ниже на рисунке помещен график функции (*), на котором точками обозначено зафиксированное в статистических источниках количество спиртового эквивалента, употребляемого в год на душу населения в СССР.
13
На рисунке: по оси абцисс - годы, считая 1965 год за нулевой, 1966 - за первый и т. д. По оси ординат - употребление алкоголя в год на душу населения в СССР в литрах спиртового эквивалента. Воспользовавшись моделью (*), вычислим количество употребленного спиртового эквивалента на душу населения в России в 2000 году. Для 2000 года значение t = 35, следовательно, y(t) = 19.16 литров. Однако мы не знаем и вряд ли когда-нибудь узнаем о том, сколько литров спиртового эквивалента употребил за 2000 год "среднестатистический" россиянин: известно, что в 2000 году немалую долю спиртного составили импортные продукты, в том числе и контрабандные. Поэтому ограничимся пусть и не научным, но достойным источником информации об употреблении спиртных напитков: в одной из телепередач "Синие страницы" выступал Пивной Король России. По его утверждению, в 2000 году "в среднем" одним Россиянином выпито около 200 литров пива. Теперь, считая крепость пива за 6º, выполним пересчет: 200 · 0.06 = 12 литров стопроцентного спирта. Скорее всего, недостающая доля до вычисленных выше 19.16 литров набралась за счет вина, водки и других крепких напитков. Отметим, что согласно опубликованным в руководстве для врачей [79] данным, страны, с преимущественным употреблением алкоголя в виде пива, в спиртовом эквиваленте употребляют чистого алкоголя на душу населения почти в два раза больше, чем страны с преимущественным потреблением крепких спиртных напитков.
14
Напомним, что согласно решению Всемирной Организации Здравоохранения (ВОЗ) алкоголь является наркотиком (см., например, соответствующую статью в Большой Советской Энциклопедии [1]). Применив формулу (*) нетрудно заметить, что год от года потребление алкоголя на душу населения в России должно расти. До каких пор? Когда наступит предел потребления, после которого "больше не выпить?" И что стоит за ним? Увы, поиск ответов на поставленные вопросы уже не актуален. Мы знаем на них ответ - наркотики. По этой причине и написано настоящее пособие - "Методы оценки наркоситуации". В целях удобства читателя приведем краткую аннотацию книги. Пособие состоит из введения, восьми параграфов основного текста, заключения, списка использованной при написании пособия литературы и приложений. В §1 помещены определения наркотиков и наркомании, принятые в современной науке. Доказана актуальность создания специализированного учебного пособия для государственных служащих по оценке наркоситуации в России. Доказано, что методы интуитивно-эвристических и синоптических оценок наркоситуации являются устаревшими, так как найденные их применением решения не соответствуют государственным требованиям к точности решений, необходимой для обеспечения оптимального государственного контроля и управления наркоситуацией. Вместо устаревших методов экспертных оценок предложено применение методов оценок, рекомендуемых в государственных стандартах России. Доказано, что только методы оценок, опирающиеся на применение результатов математического моделирования, позволяют найти оценки наркоситуации, точность которых удовлетворяет современным требованиям, предъявляемым в России к результатам научных исследований. В §2 изложена краткая справка по истории возникновения и этапах математического моделирования. Перечислены цели математического моделирования. По замыслу автора, в целом содержание §1 и §2 должно способствовать преодолению расхожего мнения о том, что результатами математического моделирования могут пользоваться только профессиональные математики. В §3 в качестве меры оценки наркоситуации предложено применение вероятностной меры, рекомендованной в государственных стандартах. Проиллюстрирована недостаточность точности распространенной процентной оценки наркоситуации при решении государственных задач.
15
В §4 изложены типичные ситуации, возникающие при оценке наркоситуации в группах ограниченного объема. В качестве метода решения задач предложено применение результатов комбинаторного анализа. Изложены методы решения типичных задач. Содержание §5 ориентировано на ознакомление читателя с исторически первыми моделями случайных событий и методами их применения при оценке наркоситуации. Изложены методы применения моделей Бернулли и Пуассона при решении задач оценки наркоситуации. Продемонстрирована возможность применения методов математического моделирования при решении задач повышения эффективности контроля над действиями наркомафии и планирования методов борьбы с наркомафией. Содержание §6 знакомит читателя с методами применения одного из часто используемых законов распределения случайных величин - закона нормального распределения. Изложен метод использования свойств случайных величин, распределенных по нормальному закону при решении задач оперативно-следственных и силовых государственных инфраструктур, в сферу полномочий которых входит борьба с организованной преступностью, в частности, наркомафией. Изложены начальные сведения по исследованию операций и планированию. В §7 развивается общий подход к описанию наркоситуации количественными характеристиками, найденными применением изложенных в §1 - 6 методов. Этот подход состоит в расширении найденных точечных оценок характеристик до интервальных оценок, находимых с заданными государственными требованиями значениями надежности. Доказано, что применение интервальных оценок характеристик является более адекватным решением задачи оценки наркоситуации, чем применение точечных оценок. В целях создания систем оптимального государственного контроля и управления, обосновано применение предложенных автором пособия и апробированных при оценке наркоситуации (см. в отчете по НИР [10]) пессимистических и оптимистических оценок развития наркоситуации. В §8 изложены примеры применения разных математических моделей к решению задач оценки и прогноза наркоситуации в России. Доказана целесообразность и своевременность мер по контролю над наркоситуацией, предпринятых президентом и правительством России. Решена задача прогноза наркоситуации в России на ближайшие десятилетия. Предложенные модели выбраны вследствие того, что при чрезвычайно ограниченном объеме исходных данных - всего двух: 315 тысяч количестве наркоманов, зафиксированных в России в 1998 году и
16
340 тысяч - количестве наркоманов, зафиксированных в России в конце 2002 года, требовалось найти модели, допускающие временную экстраполяцию. В интересах читателя в конце параграфов помещены типичные задачи, возникающие при оценке наркоситуации. В целях удобства изучения читателем методов нахождения научно обоснованных оценок, все задачи снабжены ответами и решениями. В пособии применено два вида нумерации: для аналитических выражений использована сквозная нумерация, для определений и замечаний нумерация, в которой первая цифра обозначает номер параграфа, вторая - порядковый номер внутри параграфа. Список литературы состоит из 82 наименований. В приложении 1 помещено содержание файла NARKSIT. MTH, предназначенного для облегчения вычислительной части самостоятельных занятий читателя. В приложении 2, в учебно-методических целях, помещены значения среднесуточных температур приземного слоя окружающего воздуха в Санкт-Перербурге за 10 января с 1865 года. Список значений предназначен для самостоятельных упражнений по вычислению характеристик случайных величин. В приложениях 3 и 4 помещен вывод отдельных формул и моделей, примененных в пособии. В целях облегчения изучения материалов пособия, все предложенные в пособии методы оценки наркоситуации изложены на минимальной аналитической основе, сложность которой не превосходит сложности математического аппарата, изучаемого в средней общеобразовательной российской школе. Тем не менее, для читателя, испытывающего трудности, рекомендуется при первом чтении пособия ограничиться только общим, поверхностным знакомством с его содержанием и результатами вычислений. Более глубокое изучение методов оценки наркоситуации читатель может получить посредством посещения лекционных циклов, читаемых автором пособия. В целях полноты изложения сообщим сведения о том, как удалось издать столь неугодную и для потребителей, и для распространителей популярных наркотиков книгу. В процессе подготовки рукописи к печати мы обратились к ряду известных специалистов с просьбой дать письменный отзыв на книгу. В результате мы получили отзывы д. ф. - м. н., проф. Покровского А.Н., д. ф. - м. н., проф. Малафеева О.А. и капитана юстиции Секамовой Г.А., которые мы публикуем в Дополнениях к книге с разрешения авторов. Поддержку в издании нам оказал Гаврилов Д.С., отзыв которого мы помещаем на обложку книги.
17
Мы обратились за отзывом к известному своим категорическим отношением к алкоголю и наркотикам академику РАМН Углову А.Ф. Академик Углов А.Ф. дал согласие написать отзыв, попросив неделю на ознакомление с содержанием книги. Через неделю рукопись была нам возвращена без отзыва и каких-либо комментариев. Мы обратились за отзывом к главному наркологу СПб к. м. н. Николаенко В.Н. Он попросил время на ознакомление с содержанием книги и обещал дать письменный отзыв. Мы ждали полгода и вынуждены опубликовать книгу без каких-либо комментариев главного нарколога Комитета по Здравоохранению Администрации Санкт-Петербурга к. м. н. Николаенко В.Н. Автор считает своим долгом выразить глубокую благодарность д. ф. - м. н., проф. Покровскому А.Н., д. ф. - м. н., проф. Малафееву О.А. и капитану юстиции Секамовой Г.А. за внимательное ознакомление, ценные замечания и письменные отзывы. Автор выражает благодарность к. б. н. Р.С. Минвалееву за научное редактирование книги. В работе над книгой огромную помощь мне оказали также консультации врача 17-ой (Александровской) городской больницы СПб Сергеевой Т.В. Особую благодарность автор выражает Гаврилову Д.С., поддержавшему издание книги.
18
§1. РАЗНЫЕ ПОДХОДЫ К ОЦЕНКЕ НАРКОСИТУАЦИИ И ВЫТЕКАЮЩИЕ ИЗ НИХ ТРУДНОСТИ Изложим противоречивую ситуацию, сложившуюся при решении задач оценки наркоситуации в России. В целях полноты исследования приведем фрагмент статьи из Большой Советской Энциклопедии (в дальнейшем - БСЭ.- А.И.) [1]. «Наркомания (от греч. narke - оцепенение и мания), наркоманическая зависимость (человека от приема наркотика), заболевание, которое выражается в том, что жизнедеятельность организма поддерживается на определенном уровне только при условии постоянного приема наркотического вещества, и ведет к глубокому истощению физических и психических функций. Резкое прекращение приема наркотика вызывает нарушение многих функций организма - абстиненцию. Один из наглядных признаков наркомании - неудержимое влечение к опьянению, эйфории, достигаемой посредством приема наркотического вещества, что послужило основанием названию болезни. С течением болезни способность к эйфорическим ощущениям (эйфоризирующий эффект) падает, и влечение определяется лишь потребностью в наркотике как необходимом условии относительно удовлетворительного физического и психического состояния. Возможно пристрастие к какому-либо одному наркотическому веществу мононаркомания (морфинизм, героинизм, кодеинизм, гашишизм, кокаинизм, алкоголизм и пр.) или к их сочетанию - полинаркомания (опийно-барбитуровая, опийно-наксироновая, алкогольно-барбитуровая, опийно-алкогольная и пр.). Обычно полинаркомания оказывается следствием мононаркомании: по мере ослабления эйфорических ощущений наркоман в поисках эйфории начинает добавлять и другие наркотические средства. Результат постоянной наркотической интоксикации расстройство деятельности многих органов и систем организма, различные в зависимости от вида употребляемого наркотика. Особенно тяжелые последствия наблюдаются при полинаркоманиях. Таким образом, даже при регулярном приеме необходимой дозы наркотика больной наркоманией со временем становится неработоспособным, и его состояние благополучно лишь в сравнении с абстинентным синдромом. Чем сильнее выражен эйфоризирующий эффект вещества, тем скорее наступает формирование привыкания. Решающее условие развития наркомании - непонимание человеком опасности приема наркотиков. У молодежи наркомания может неразумного возникать как результат «экспериментирования», любопытства. Возможно развитие наркомании вследствие приема
19
наркотических веществ как обезболивающих, снотворных. Опасность заболеть наркоманией возрастает при эмоциональной неустойчивости, у людей, не владеющих своими побуждениями, психически незрелых, отвергающих общесоциальные нормы. Распространению наркомании способствует неправильное воспитание, дурной пример и давление нездоровой микросоциальной среды, отсутствие у человека интеллектуальных и социально-положительных установок, недостаточность просветительской работы; особую роль играют отсутствие строгого контроля над производством и потреблением наркотических веществ в обществе, существование черного рынка. На злоупотребление наркотическими средствами во всех обществах, в том числе и первобытных, накладывался нравственный запрет; с появлением государства начинается борьба с их незаконным производством, распространением, торговлей, поскольку наркомания наносит вред не только больному, но и обществу в целом. Заболевший исключается из созидательной деятельности, так как становится физическим и психическим инвалидом и его интересы сосредоточены на одном - как достать очередную порцию наркотического вещества; наступающее снижение психических функций и ситуация социального конфликта, в которой оказывается наркоман (необходимость лжи, противозаконного добывания наркотика), ведут к глубокой нравственной деградации личности заболевшего и преступному поведению» (конец фрагмента). В исламе строгий запрет на употребление наркотиков возведен в ранг религиозного догмата. В Коране [3] находим слова о том, что нарушившему запрет грозит смертный приговор по закону Шариата. В целях полноты изложения отметим, что в христианстве отсутствует запрет на употребление наркотиков. Больше того, некоторые из психотропных веществ, признанных Всемирной Организацией Здравоохранения (ВОЗ) наркотиками, например, алкоголь, рекомендуются к употреблению в ежедневных обрядах (например, в таинстве причастия). Подробную информацию по истории алкоголизации России и ее последствиям можно найти в книге Ф.Г. Углова «Из плена иллюзий» [76], по распространению наркомании и ее последствиям - в книге Ф.Г. Углова «Ломехузы» [13]. Сведения о действии галлюциногенов и других наркотических веществ заинтересованный читатель может найти в «Справочнике по психиатрии» [5] и др. специальной литературе. В «Справочнике практического врача» [80] наркомания определена как заболевание, обусловленное употреблением различных веществ,
20
вызывающих состояние опьянения. Указано, что список наркотиков утверждается комитетом экспертов по наркотикам ВОЗ. Известно, что до того, как перекочевать в Россию, волны наркомании успели поглотить значительную часть территории планеты. Так, еще в прошлом веке (28.3.1973) в послании президента Р. Никсона конгрессу США о борьбе с наркоманией отмечено: «Злоупотребление наркотиками один из самых опасных и разрушительных факторов, подрывающих сегодня саму основу американского общества... Общее число наркоманов в Соединенных Штатах - людей, которые сами тяжело страдают и причиняют страдания бесчисленному множеству других, - по-прежнему достигает сотен тысяч». Перейдем к краткому описанию наркоситуации в современной России. Только в 1975 году Коллегия Министерства здравоохранения СССР приняла решение о создании самостоятельной наркологической службы. Решение было вызвано тем, что действовавшая до него в СССР наркологическая сеть в рамках структуры психиатрической службы перестала в достаточной мере справляться со своими задачами. Это объяснялось все возрастающей потребностью в лечебно-профилактической помощи больным алкоголизмом. Отсутствие единого методического центра обусловило значительные различия в подходе врачей к выявлению больных наркоманией и алкоголизмом, как разновидностью наркомании, активному курсовому, поддерживающему и противорецидивному лечению, динамическому учету и медико-социальному контролю за состоянием больных в период терапевтической ремиссии. Организационной основой наркологической службы стало введение приказом Министерства здравоохранения СССР №131 от 05.02.76 в номенклатуру лечебнопрофилактических учреждений учреждения нового типа, называемого наркологический диспансер. До сих пор наркологические диспансеры являются основным звеном организации наркологической помощи населению, построенной по территориальному признаку. Это максимально приближает специализированную наркологическую помощь к населению. Известно и напечатано, например в [2, с.21], что в последние годы Россия начала играть роль крупного рынка сбыта наркотиков. В геополитическом плане страна оказалась на путях мировых потоков наркотиков, а также стала пограничной страной по отношению к тем странам и регионам, в которых наркобизнес является одним из основных средств получения денег на оружие, ведение войн, осуществление террористических актов. В самой России и граничащих странах СНГ появились опасные наркозоны - Чечня, Таджикистан, Казахстан и др., что влияет на распространенность наркотиков в масштабах всей страны.
21
Известно, что с учетом актуальности проблем распространения наркомании в России, особенно среди детей и молодежи, приказом Министерства образования Российской Федерации от 23.03.99 №718 вопросы организации работы по предупреждению злоупотребления психоактивными веществами в образовательной среде признаны приоритетными в деятельности Минобразования России, органов управления образованием субъектов Российской Федерации. Приказом от 17.12.99 № 1226 утвержден план основных мероприятий Минобразования России по выполнению федеральной целевой программы «Комплексные меры противодействия злоупотреблению наркотиками и их незаконному обороту на 1999-2001 годы». Известно, что в вышедшем в 2001 г. подготовленном Министерством образования Российской Федерации «Сборнике методических материалов по проблеме профилактики злоупотребления психоактивными веществами среди несовершеннолетних и молодежи» [2] частично изложена наркотическая ситуация среди детей и молодежи. С другой, в том же сборнике [2] и других работах, описывающих современную наркоситуацию в России, отсутствуют количественные оценки, позволяющие государственному чиновнику хотя бы приближенно судить о том, какова наркотическая ситуация в масштабе реального времени как в отдельно взятом регионе, так и стране в целом. Например, в [2, с.20] читаем: «По данным Минздрава России количество потребителей наркотиков на первое полугодие 1999 г. составило 315 тыс. человек. По мнению экспертов, реальная численность потребителей наркотиков в стране превышает этот показатель в 8-10 раз». Возникает вопрос: «Сколько же в нашей стране в 1999 г. было наркоманов, 315 тыс. или 3 миллиона 150 тысяч и могут ли масштабы принимаемых правительством, министерствами и ведомствами мер эффективно противостоять масштабам распространения наркомании?» В новейших данных, опубликованных в [66] читаем: «К началу 2003 года в стране было зарегистрировано более 340 тысяч больных наркоманией, однако реально эта цифра в 6-8 раз больше. Число потребителей наркотиков составляет около четырех миллионов человек, или три процента населения России», - заявил Виктор Черкесов. Выполним расчет: 340 тыс. × 8 = 2 млн. 720 тыс. человек. Непонятно, откуда взялась цифра – 4 миллиона? И из каких численных оценок наркоситуации нужно исходить чиновникам «на местах», чтобы принять конструктивные решения? К настоящему моменту времени точность результатов численных оценок наркоситуации в России, предоставляемых нам экспертами оставляет желать лучшего. Даже в рамках одних и тех же публикаций, например, [66], [67], результаты численных оценок наркоситуации в
22
России значительно отличаются друг от друга. Например, в публикациях [66], [67] можно найти разные, но одинаково обоснованные заключения. С одной стороны, опираясь на опубликованные результаты экспертных оценок можно утверждать, что в настоящее время в России около 2 млн. 700 тыс. больных наркозависимостью, с другой стороны, в тех же публикациях утверждается, что больных наркозависимостью в России более 4 миллионов. Но из той же статьи мы узнаем, что только среди молодых людей России ¼ больны наркоманией, а это уже больше 13 миллионов. Результаты деятельности экспертов не только не отражают хотя бы приблизительную оценку наркоситуации в России, но и дезинформируют государственных чиновников, делая невозможным принятие ими решений, адекватных фактической наркоситуации. Изложенная противоречивая ситуация ставит нас перед необходимостью нахождения динамической модели развития наркоситуации в России применением научно-обоснованных и закрепленных государственным стандартом РФ методов математического моделирования. Более точные численные оценки, пусть и не всей наркоситуации, но в большей степени поддающейся учету, находим в медицинских источниках. Например, в публикации [66] со ссылкой на медицинские источники заявлено, что к началу 2003 года на учете в России состояло примерно 340 тысяч больных наркозависимостью. Известно, что в настоящее время описанию пагубного влияния наркотиков и нахлынувшей на страну эпидемии наркомании посвящена многочисленная литература - от научной до научно-популярной, популярной и «бульварной». Однако до сих пор в распоряжении и специалистов-наркологов и государственных чиновников нет цифр, с требуемой точностью характеризующих наркоситуацию, а приводимые в разных источниках экспертные оценки не только не отличаются точностью, но и противоречивы. Приведем отдельные примеры. С одной стороны, в газете «Известия» в январе 1998 г. напечатано сообщение о том, что «... 1 доллар, вложенный в операции с наркотиками, приносит 12240 долларов» прибыли (процитировано по [6]. - прим. авт.). С другой, в том же источнике [6] находим, что по мнению экспертов «Рентабельность наркобизнеса - 10000 процентов. Рубль, вложенный в наркобизнес, приносит 1000 рублей прибыли». Возникает вопрос: «Если рентабельность наркобизнеса 10000 процентов, то почему вложенный рубль приносит всего 1000 рублей прибыли, а не 10000 рублей и какие научные заключения можно сделать, воспользовавшись приведенной экспертной оценкой?» В
23
том же источнике [6] читаем: «Для того, чтобы торговля наркотиками перестала приносить прибыль, из оборота необходимо изымать 75% поступающих туда веществ. Для высокоразвитых стран этот показатель не превышает сегодня 15% (в российской прессе назывались данные для нашей страны - от 0.1 до 1%)». Выполним простейший расчет. Если рентабельность наркобизнеса в России 1000% (в целях наглядности мы взяли наименьшую цифру), то при изымании органами правопорядка 75% незаконно изготовленных наркотиков прибыль от незаконного распространения наркотиков упадет с 1000% до 250%. Можно ли в этом случае считать, что торговля наркотиками перестанет приносить прибыль? В другом источнике [66] находим заявление о том, что «... только в прошлом году на южных рубежах страны перехвачено 96% всего героина, предназначавшегося российским потребителям». Как эта цифра - 96% изъятия сочетается с заявлением о том, что: «Для того, чтобы торговля наркотиками перестала приносить прибыль, из оборота необходимо изымать 75% поступающих туда веществ?» Автором внимательно прочтены десятки публикаций, специализированных на оценке наркоситуации в России и за рубежом. В частности, изучен информационный пакет «Drugbox» [19], состоящий из серии (9 шт.) отпечатанных на глянцевой бумаге брошюр размером 17.5×21 см. по 20-128 стр. Названия брошюр: «Наркотики: информация для учителей и других специалистов», «Аргументы», «Алкоголь», «Марихуана», «Табак», «Экстази», «Кокаин и другие психостимуляторы», «Растворители и клей», «Героин и другие опиаты». На внутренней стороне обложки каждой из брошюр напечатано: «Информационный пакет «Drugbox» рекомендован специалистами, работающими в сфере Межведомственной комиссией по профилактики наркомании, противодействию злоупотреблению наркотическими средствами и их незаконному обороту Администрации Санкт-Петербурга» (в целях точности текст воспроизведен дословно с сохранением порядка слов и орфографии. - А.И.). На последней странице каждой из брошюр напечатано, что текст брошюр составлен журналистом. На той же странице напечатано предупреждение: «Копирование запрещено. Брошюра охраняется авторским правом. Нарушения преследуются по закону». Рекомендуем заинтересованному читателю самостоятельно ознакомиться с содержанием пакета «Drugbox». В результате изучения литературы, излагающей наркоситуацию, нами найдено, что все содержащиеся в ней оценки основаны на заключениях экспертов, в результате чего численные значения оценок в разных источниках могут отличаться в десятки раз. В работе [20] в качестве
24
численных оценок наркоситуации взяты проценты опрошенных, утверждающих, что они употребляют или не употребляют наркотики. Какие из оценок считать в большей мере соответствующими действительности, остается решать чиновнику государственного аппарата, планирующему мероприятия по пресечению незаконного распространения наркотиков. На какие же цифры опираться в своих действиях врачам, учителям, родителям, сотрудникам правоохранительных и антинаркотических учреждений? Ответ будем искать в естествознании. Известно, что, приступая к изучению любого явления, мы не владеем и не можем владеть всей полнотой информации. По этой причине мы вынуждены ограничиться тем и только тем, что нам известно о явлении или объекте, т. е. умышленно упростить механизм явления. Такой подход в естествознании известен как моделирование. В БСЭ, в статье «Моделирование» читаем: «Моделирование, исследование объектов познания на их моделях, построение и изучение моделей реально существующих предметов и явлений (живых и неживых систем, инженерных конструкций, разнообразных процессов - физических, химических, биологических, социальных) и конструируемых объектов (для определения, уточнения их характеристик, рационализации способов их построения и т. п.). Моделирование, как познавательный прием неотделимо от развития знания. ... Моделирование ныне приобрело общенаучный характер и применяется в исследованиях живой и неживой природы, в науках о человеке и обществе». В статье «Модель» находим: «Модель (в широком понимании) - образ (в т. ч. условный или мысленный изображение, описание, схема, чертеж, график, план, карта и т. п.) или прообраз (образец) какого-либо объекта или системы объектов («оригинала» данной модели), используемый при определенных условиях в качестве их «заместителя» или «представителя». Так, Моделью Земли служит глобус, а моделью различных частей Вселенной (точнее - звездного неба) - экран планетария. ... Единая классификация видов моделирования затруднительна в силу многозначности понятия «модель» в науке и технике». При решении прикладных задач удобной оказалась классификация видов моделирования, предложенная в монографии «Математическое моделирование динамических систем» [7]. В настоящее время в теории моделирования систем различают три уровня моделирования: 1) концептуальный, 2) концептуально-структурный, 3) математический.
25
Дадим краткую характеристику изложенных уровней моделирования. По мере накопления знаний о некоторой совокупности явлений человек выдвигает различные принципы (концепции), позволяющие более кратко и просто и в более доступной форме объяснить наблюдаемые явления. Концептуальные модели состоят из словесных описаний исследуемого явления. Пример концептуальной модели: по мнению экспертов количество лиц, употребляющих наркотики год от года растет. Классическим примером концептуально-структурной модели является геоцентрическая модель Птолемея, согласно которой Земля является центром Вселенной; Солнце, звезды и планеты вращаются вокруг Земли. Известно, что геоцентрическая модель Птолемея просуществовала в качестве доктрины мироздания в христианском мире почти 16 веков и только в 1543 г. Н. Коперник в работе «О вращении небесных сфер» [8] предложил новую, гелиоцентрическую концептуально-структурную модель динамики Солнечной системы. Всему миру известны трагические судьбы последователей Н. Коперника. Характерным свойством концептуальных и концептуальноструктурных моделей является отсутствие в них доказательности. Последнее следует из того, что в концептуальных и концептуальноструктурных моделях отсутствует численная мера сравнения. На практике концептуальные и концептуально-структурные модели могут оказаться как правильными, так и неправильными. Однако отсутствие численной меры сравнения не позволяет в рамках концепций доказать правильность или неправильность модели. Что можно возразить, например, против модели: жизнь стала лучше, жизнь стала веселее! Доподлинно известно только то, что найдена эта модель применением результатов экспертных оценок. Известно и напечатано, например в энциклопедии [9], что свойства доказательности модель приобретает только тогда, когда объем знаний об исследуемом предмете достигает уровня количественной зрелости. В этом случае модель становится математической, доказательной. Языком математической модели являются аналитические выражения, т. е. формулы, уравнения, системы уравнений и т. п. объекты. По мнению автора, примером успешного применения результатов математического моделирования является зародившаяся на наших глазах доказательная медицина. Примером успешного применения методов математического моделирования при решении задачи оценки наркоситуации в Санкт-Петербурге может служить отчет о научно-исследовательской работе «Здоровое питание как элемент психосоматической профилактики наркомании» [10].
26
Подводя итог, отметим, что из специализированной по методам оценок научной литературы, например из справочника [11] известно, что экспертные оценки являются оценками, найденными методами концептуально-структурного моделирования. Вместе с тем доказано и опубликовано, например в [11], [12, с.155] и др. источниках, что наибольшей адекватностью описания исследуемых явлений обладают модели математические. Поэтому применение результатов, заявленных экспертами, но не доказанных аналитически, неизбежно приводит к ошибкам в оценке наркоситуации. В свою очередь это препятствует эффективной организации антинаркотических мероприятий и последующего контроля их результатов. По мнению автора, сложившаяся практика концептуально-структурного моделирования (т. е. так называемых экспертных оценок) динамики наркоситуации в России фактически не в состоянии отразить реальную эпидемиологическую ситуацию распространения наркомании. Назрела необходимость прекратить устаревшую практику неограниченного доверия оценкам избранных экспертов и перейти к научно-обоснованным методам математического моделирования эпидемиологии наркоситуации как в России в целом, так и в отдельных регионах. В настоящее время существует и распространено мнение о том, что математическое моделирование прерогатива математиков-профессионалов. На самом деле, это не совсем так, а точнее, совсем не так. Приведем пример. Известно, что материальный достаток многих современных пенсионеров России ниже официального значения прожиточного минимума. Вспомним ситуацию, при которой каждый из нас почти наверняка присутствовал, закупая продукты питания. В магазин входит бабушка, которая в состоянии сделать закупку не больше, чем на 50 рублей. Перечислим некоторые из возможностей, которые перед ней открываются. 1. Проиграть 50 рублей в игровом автомате. 2. Купить 2 бутылки «Пепси-колы». 3. Купить 1 бутылку «Пепси-колы» и упаковку «Чипсов». Каждая из возможностей 1-3 есть математическая модель расхода финансов. Нетрудно догадаться что бабушка, возможно и малограмотная, их отклоняет, выбирая четвертую модель: купить понемногу разных овощей, чуть-чуть какого-нибудь дешевого мясного продукта, немного жира, четвертинку хлеба. Что сделала, причем «в уме», бабушка?
27
1. Нашла несколько возможных математических моделей расхода ограниченных финансовых средств, т. е. нашла множество решений задачи расхода. 2. Выбрала из найденного множества решений такое решение, которое максимизирует решение задачи выживаемости при условии ограниченности средств, т. е. оптимальное в смысле выживаемости решение. ЗАДАЧИ К §1. Задача 1.1. Среди некоторых категорий лиц распространено мнение: существует ложь, наглая ложь и статистика. Можно ли считать такую модель доказательной? Решение. Изложенная модель может быть классифицирована как концептуальная. Концептуальные модели не обладают качеством доказательности, так как в них отсутствует мера сравнения. Ответ. Модель нельзя считать доказательной. Задача 1.2. Можно ли считать доказательной модель: если бы не было чиновников-бюрократов, жизнь была бы значительно лучше? Решение. Как и в задаче 1.1 изложенная модель является моделью концептуальной. Следовательно, бездоказательной. Ответ. Модель нельзя считать доказательной. Задача 1.3. Можно ли считать доказательным утверждение: больше спишь - меньше видишь, меньше видишь - меньше знаешь, меньше знаешь - крепче спишь! Решение. Несмотря на использование в модели математических соотношений меньше-больше, модель нельзя считать доказательной так как: 1) отсутствуют определения понятий меньше-больше; 2) отсутствует аналитическое выражение (формула или уравнение) описывающее зависимость между элементами модели; 3) практическая проверка результатов модели (верификация) представляется затруднительной вследствие неопределенности используемых в модели понятий. Задача 1.4. Если путь, пройденный телом обозначить через S, время пути через t, а скорость движения тела через v, то значение пути можно вычислить, воспользовавшись формулой S = v·t.
28
Решение. Формула для вычисления пути S = vt известна из школьного учебника элементарной физики, где доказано, что такое соотношение действительно имеет место при равномерном движении тела. Аналитическое выражение S = v·t есть математическая модель равномерного движения тела, проверенная многочисленными экспериментами. Ответ. Модель доказательная. Замечание 1.1. Математическая модель не считается верной и доказательной, если при ее нахождении или записи допущена ошибка. По этой причине математическая модель, записанная нагромождением формул и уравнений, скорее может оказаться ошибочной, нежели модель, допускающая запись в виде простых аналитических выражений.
29
§2. О МАТЕМАТИЧЕСКОМ МОДЕЛИРОВАНИИ В ЕСТЕСТВОЗНАНИИ 1. Краткая историческая справка В одной из лекций в Санкт-Петербургском государственном университете великий русский ученый В.И.Зубов (1930-2000) [9] сообщил о том, что одна из первых дошедших до наших дней математических моделей изложена в работе Архимеда (ок. 287-212 г. до н. э.) "О плавании тел в жидкостях". Работы Архимеда намного опередили свое время и были правильно оценены только в эпоху создания дифференциального и интегрального исчисления, начавшуюся со второй половины XYII в. и продолжающуюся и в наши дни. Однако создателем современной научной методологии часто считают Ф. Бэкона (1561-1626), изданная в книге "О принципах и началах" [15] классификация наук которого была принята французскими энциклопедистами. По мнению автора следует упомянуть и однофамильца Ф. Бэкона - Роджера Бэкона (1214-1292), который хоть и числился монахом францисканского ордена, но главными считал две вещи: математику и опыт. Р. Бэкон предугадал большое значение математики, без которой, по его мнению, не может существовать ни одна наука. Заинтересованный читатель в БСЭ в статье "Бэкон Роджер" может найти информацию о том, что Р. Бэкон предсказал многие открытия и изобретения XIX-XX вв., которые будут сделаны благодаря развитию математики: телефона, транспортных средств, не использующих живую тягловую силу, летательных аппаратов и т. д. Одним из первых ключевые принципы математического моделирования изложил Я. Бернулли (1654-1705) в работе "О законе больших чисел" [14]. В целях ознакомления читателя сообщим эти принципы в формулировке Я. Бернулли. 1. Догадкам не место в тех вещах, где можно достигнуть полной достоверности. 2. Не достаточно взвешивать один или другой довод; но нужно добавить все, которые могут дойти до нашего сведения и которые покажутся годными в каком-либо отношении для доказательства предположения. 3. Следует не только рассматривать доводы, приводящие к утверждению, но и все те, которые могут привести к противоположному заключению, дабы после должного обсуждения тех и других стало ясно, которые перевешивают.
30
4. Для суждения о вещах общих достаточны доводы отдаленные и общие, но для суждения о частных вещах следует присоединять также доводы более близкие и специальные, если только такие имеются. 5. В обстоятельствах неясных и сомнительных наши действия должны приостанавливаться, пока не прольется больший свет; но если необходимость действия не терпит отлагательства, из двух исходов нужно всегда избирать тот, который кажется более подходящим, безопасным, разумным или надежным, хотя бы ни один таковым на деле не был. 6. Что в некотором случае полезно, но ни в каком не вредно, следует предпочитать тому, что никогда не приносит ни пользы, ни вреда. 7. Не следует оценивать поступки людей по их результатам. Этот неоднозначно трактуемый в рамках разного менталитета принцип Я. Бернулли комментирует: "Ибо иногда самые безрассудные поступки сопровождаются наилучшим успехом, разумнейшие же, наоборот, - наихудшим. ... Так, если кто-нибудь собирается тремя костями с первого же раза выбросить три шестерки, то, хотя бы он и выиграл, однако должен считаться безрассудным. Напротив, следует отметить превратное суждение толпы, которая считает кого-либо тем более выдающимся, чем он счастливее, и у которой даже удачное и счастливое преступление большей частью называется добродетелью". 8. В суждениях наших следует остерегаться, чтобы не приписать вещам более, чем следует, и не считать самим, а равно и не навязывать другим, за безусловно достоверное нечто такое, что только вероятнее другого. 9. Однако, так как только в редких случаях можно достичь полной достоверности, то необходимость и обычай требуют, чтобы нравственно лишь достоверное считалось безусловно достоверным. Было бы поэтому полезно, если бы властью Правительства были установлены для нравственной достоверности известные пределы, например, если было бы определено, достаточно ли для достижения ее 99/100 или требуется 999/1000 достоверности. Замечание 2.1. К сожалению ни одна из опубликованных экспертных оценок наркоситуации в современной России не удовлетворяет перечисленным требованиям 1 - 9, принятым в науке еще в XYII в. Больше того, ни одна из изученных автором работ по оценке наркоситуации не соответствует действующим в настоящее время в России требованиям, законодательно закрепленным в ГОСТ 7.32.91.
31
С 8 августа 1900 г. и до настоящего времени в Мировой науке за ключевой принцип не только математического моделирования, но и всего естествознания в целом принята Основная аксиома Гильберта о разрешимости в широком смысле слова всякой математической задачи: "... вот проблема, или решение. Ты можешь найти его с помощью чистого мышления; ибо в науке не существует Ignorabimus! ("мы не будем знать")". Заинтересованный читатель может ознакомиться с проблемами Гильберта, воспользовавшись "Математическим энциклопедическим словарем" [9, с.151]. 2. Математическая модель и этапы ее поиска В целях точности изложения воспользуемся статьей о математических моделях из книги [9]. Определение 2.1. Математическая модель - приближенное описание какого-либо класса явлений внешнего мира, выраженное с помощью математической символики. Анализ математических моделей позволяет проникнуть в сущность изучаемых явлений. Математическое моделирование - мощный метод познания внешнего мира, а также прогнозирования и управления. Процесс математического моделирования, т. е. изучения явления с помощью математической модели, можно подразделить на четыре этапа. Первый этап - формулирование закона, связывающего основные объекты модели. Этот этап требует широкого знания фактов, относящихся к изучаемым явлениям, и глубокого проникновения в их взаимосвязи. Эта стадия завершается записью в математических терминах сформулированных качественных представлений о связях между объектами модели. Второй этап - исследование математических задач, к которым приводят математические модели. Основным вопросом здесь является решение прямой задачи, т. е. получение в результате анализа модели выходных данных (теоретических следствий) для дальнейшего их сопоставления с результатами наблюдений изучаемых явлений. На этом этапе важную роль приобретает математический аппарат, необходимый для анализа математической модели, и вычислительная техника - мощное средство для получения количественной выходной информации как результата решения сложных математических задач. Третий этап - выяснение того, удовлетворяет ли принятая гипотетическая модель критерию практики, т. е. выяснение вопроса о том, согласуются ли результаты наблюдений с теоретическими следствиями
32
модели в пределах точности наблюдений. Если ошибки найденных применением модели решений выходят за пределы точности наблюдений, то модель не может быть принята. Четвертый этап - последующий анализ модели в связи с накоплением данных об изучаемых явлениях и модернизация модели. В процессе развития науки и техники данные об изучаемых явлениях все более и более уточняются и наступает момент, когда выводы, получаемые на основании существующей математической модели не соответствуют нашим знаниям о явлении. Возникает необходимость построения новой, более совершенной математической модели. Типичным примером, иллюстрирующим характерные этапы в построении математической модели, является модель Солнечной системы. Наблюдения звездного неба начались в глубокой древности. Первичный анализ этих наблюдений позволил выделить планеты из всего многообразия небесных светил. Т. е. первым шагом было выделение объектов изучения. Определения объектов изучения и их взаимосвязей являются исходными положениями - своеобразными аксиомами гипотетической модели. Вторым шагом явилось нахождение закономерностей движений небесных светил. Модели Солнечной системы в процессе своего развития прошли через ряд последовательных усовершенствований. Первой была модель Птолемея, исходившая из положения, что планеты и Солнце совершают движения вокруг Земли и описывающая эти движения с помощью правил (формул), многократно усложнявшихся при накоплении наблюдений. Развитие мореплавания поставило перед астрономией новые требования к точности наблюдений. Н. Коперником в 1543 г. была предложена принципиально новая основа законов движения планет, полагающая, что планеты вращаются вокруг Солнца по окружностям. Это была качественно новая, но еще не математическая модель Солнечной системы. Однако не существовало параметров системы (радиусов окружностей и угловых скоростей движения), приводящих количественные выводы теории в должное соответствие с наблюдениями, так что Н. Коперник был вынужден вводить все новые и новые поправки в движения планет по окружности. Следующим шагом в развитии математической модели Солнечной системы были исследования И. Кеплера в начале XVII в., который сформулировал новые законы движения планет. Положения Н. Коперника и И. Кеплера давали кинематическое описание движения каждой планеты обособленно, не затрагивая того, что обусловливает эти движения. Принципиально новым шагом были работы И. Ньютона, предложившего во
33
второй половине XYII в. динамическую модель Солнечной системы, основанную на законе всемирного тяготения. Динамическая модель И. Ньютона полностью согласовывалась с кинематической моделью И. Кеплера, но развивала ее применением закона всемирного тяготения. Законы И. Кеплера логически вытекали из модели И. Ньютона. К 40-м гг. XIX в. выводы динамической модели И. Ньютона вошли в противоречие с накопленными к тому времени наблюдениями: наблюдаемое движение Урана уклонялось от теоретически вычисленного движения. В 1846 г. У. Леверье расширил систему наблюдаемых планет новой гипотетической планетой, названной им Нептуном, и, пользуясь новой математической моделью Солнечной систелы, вычислил массу и нашел закон движения новой планеты так, что в новой системе противоречие в движении Урана было снято. Позже планета Нептун была открыта в месте, предсказанном У. Леверье. Аналогичным методом, используя расхождения в теоретической и наблюдаемой траектории Нептуна, в 1930 г. была открыта планета Плутон. Математическая модель Солнечной системы и ее частей продолжает интенсивно развиваться. Подготовленный читатель может ознакомиться с некоторыми ее результатами, изучив работу В.И. Зубова "Теория физической либрации Луны" [17]. В настоящее время в естествознании метод математического моделирования, сводящий исследование внешнего мира к математическим задачам, занимает наиболее приоритетное место среди других методов исследования. Итак, резюмируя, можно сказать, что математическая модель нужна: 1) для того чтобы понять, как устроен конкретный объект: какова его структура, основные свойства, законы развития и взаимодействия с окружающим миром; 2) для того, чтобы научиться управлять объектом (или процессом) и найти наилучшие способы управления при заданных целях и критериях; 3) для того чтобы прогнозировать прямые и косвенные последствия реализации заданных способов и форм воздействия на объект. В целях облегчения труда читателя приведем из книги [16] некоторые весьма интересные высказывания известных ученых о математическом моделировании. В каждой науке ровно столько истины, сколько в ней математики. И. Кант.
34
Гипотез не измышляю. И. Ньютон. Он стал поэтом. Для математика у него не хватило воображения. К. Гаусс. Если человек не понимает проблемы, он пишет много формул, а когда поймет, в чем дело, их останется в лучшем случае две. Н. Бор. ЗАДАЧИ К §2 Предлагаемые задачи рассчитаны для лиц, владеющих знанием математики в объеме 8-9 классов Российской средней школы. По мнению автора, лица с меньшим фактическим образованием вряд ли смогут внести личный существенный вклад в решение Государственных задач оценки наркоситуации в России. Пожалуй, единственный разумный выход для тех, кто упорно не желает вспомнить школьную математику - не заниматься самостоятельно оценкой наркоситуации, а обратиться за помощью к специалистам-математикам. По мнению автора, единственный метод научиться решать задачи - это учиться их решать. Опираясь на личный опыт преподавания в вузах, автор пришел к заключению, что при попытке решения задач учащийся чаще всего сталкивается со следующей трудностью: с одной стороны, прочтенный теоретический материал кажется полностью понятным, и это действительно так - проверка знаний учащегося подтверждает наличие у него новых знаний, с другой стороны, простейшие задачи учащийся решить не может. В таких случаях автор рекомендовал выучить решения 10-20 типичных задач. Автором замечено, что после того, как студент выучивал решения 10-20 типичных задач, он успешно справлялся и с другими задачами. Все задачи, предложенные в пособии, даны с решениями. В интересах читателя и в целях более глубокого усвоения читателем материала, решения некоторых из задач пособия изложены не сразу после их формулировок, а в последующих параграфах пособия. По мнению автора, такой подход позволил использовать решения задач и в качестве иллюстраций и в качестве связующих звеньев предыдущего теоретического материала с последующим. Задача 2.1. В вузе 1000 учащихся. Из них специалистами обследовано 100 учащихся. Выявлено, что среди 100 обследованных студентов 10 систематически употребляют наркотики.
35
Можно ли считать, что 10% студентов данного вуза наркоманы? Решение. О количестве процентов студентов вуза, употребляющих наркотики, мы вправе судить, обследовав всю 1000 студентов. Выборочное обследование, заканчивающееся вычислением 10/100 = 0.1 = 10% не является нахождением математической модели. В рамках такого подхода задача не имеет решения. Ответ. Утверждение о том, что около 10% студентов вуза наркоманы ошибочно. Замечание 2.2. Изложенная задача может быть решена только применением методов математической статистики, которые будут изложены позже. Задача 2.2. Одной из простых моделей роста численности наркоманов среди населения является модель y(t) = Ce-kt + b, где C, k, b - константы, e ≈ 2.718, t - время (в годах), y(t) - процент доли наркоманов. Построить график зависимости роста численности наркоманов от времени при C = -2, k = -0.1, b = 1. Оценить, примерно, через сколько лет страна достигнет уровня наркотизации, превышающего 96% населения. Решение. Самым простым методом построения графиков является метод построения графиков по точкам. Подставив в заданное условием задачи аналитическое выражения значения постоянных C = -2, k = -0.1, b = 1, e ≈ 2.718 находим: y(t) = -2 ⋅ 2.718-0.1t + 1. Составим таблицу 1 значений функции y(t) при разных значениях аргумента t. Например, при t = 0, 5, 10, 15, 20, 30, 40. ТАБЛИЦА 1 ЗНАЧЕНИЯ ФУНКЦИИ y(t) t y(t)
0 -1
5 -0.21
10 0.264
15 0.55
20 0.73
30 0.9
40 0.96
Замечание 2.3. В целях удобства вычислений при вычислении значений функции y(t) при разных значениях аргумента t рекомендуется воспользоваться инженерным калькулятором или компьютером с установленным удобным для непрофессионального пользователя программным обеспечением. Например, системой символьной математики DERIVE. Доступное описание правил применения DERIVE можно найти в справочнике [18] и др.
36
Воспользовавшись численными значениями аргумента t и соответствующими им значениями функции y(t) из таблицы 1, помечаем на плоскости точки, соответствующие напечатанным в таблице координатам. Найденные точки соединяем кривой. В результате находим кривую, изображенную на рис. 1.
Рис.1. Из результатов вычислений напечатанных в таблице следует, что при значениях t > 40 лет процент наркотизации населения превысит значение 96%. Задача 2.3. Найти график функции
y ( x) =
1 e σ 2π
−
( x−a)2 2σ 2
при a = 0, σ = 1. Решение. Воспользовавшись методом нахождения графиков функций, изложенным в задаче 2.2, вычислим значения функции y(x) при значениях параметров a = 0, σ = 1 и при значениях аргумента x = -3, -2, -1, 0, 1, 2, 3. Вычисленные значения расположим в таблице 2.
37
ТАБЛИЦА 2 ЗНАЧЕНИЯ ФУНКЦИИ y(x) x y(x)
-3 0.0044
-2 0.054
-1 0.241
0 0.389
1 0.241
2 0.054
3 0.0044
Воспользовавшись численными значениями аргумента x и соответствующими им значениями функции y(x) из таблицы 2, помечаем на плоскости точки, соответствующие напечатанным в таблице координатам. Найденные точки соединяем кривой. В результате находим кривую, изображенную на рис. 2.
Рис.2. Задача 2.4. (Решить самостоятельно.) записываемой аналитическим выражением
Найти
график
прямой,
y(x) = kx + b при k = 0.5, b = 1. Замечание 2.4. Читателю, не владеющему математическим аппаратом настолько, что решения предложенных задач для него очевидны, настоятельно рекомендуется уделить должное внимание задачам 2.2-2.4, т. к. они широко применимы при решении задач оценки наркоситуации.
38
§3. О МЕРЕ ОЦЕНКИ НАРКОСИТУАЦИИ Я предпочитаю найти одну истину, хотя бы и в незначительных вещах, нежели долго спорить о величайших вопросах, не достигая никакой истины Галилей [24,с.143]. 1. Противоречие между тем, что кажется и тем, что существует на самом деле Очевидно, что прежде чем приступить к решению задачи оценки наркоситуации, необходимо в первую очередь иметь точную формулировку самой задачи. Таково требование, законодательно закрепленное в России и изложенное в ГОСТ 7.32-91 [21,с.5]. Замечание 3.1. На с.20 [21] напечатано: "Настоящий стандарт разработан методом прямого применения международного стандарта ИСО 5966-82. Взамен ГОСТ 7.32-81". Известно, что невыполнение требований, изложенных в Государственных стандартах, преследуется законодательными актами России. Известно, что в России изучение методов правильной и научно обоснованной формулировки задачи входит в программы дисциплин, преподаваемых в вузах. Среди многочисленной литературы, авторы которой претендуют на решение задачи оценки наркоситуации, нам не удалось найти работ, удовлетворяющих изложенным в ГОСТ 7.32-91 требованиям, а также требованиям, изложенным в государственных рекомендациях по стандартизации Р.50.1.037-2002 [23] и др. В целях точности изложения приведем фрагмент статьи из БСЭ. Задача. 1) поставленная цель, которую стремятся достигнуть. 2) Поручение, задание. 3) Вопрос, требующий решения на основании определенных знаний и размышления (математическая задача, шахматная задача, логическая задача). Вследствие того, что решение задачи оценки наркоситуации должно удовлетворять требованиям доказательности, мы имеем дело с задачей математической. Утвержденное в России требование к наличию математической формулировки при решении задач естествознания известно и изложено, в частности, в справочно-методических пособиях.
39
Например, в справочно-методическом пособии [22,с.110] читаем: "Здесь необходимо привести математическую модель объекта исследования, описать ее особенности (отличия от ранее использованных), обосновать принятые допущения и кратко охарактеризовать методы анализа (например, методы решения системы уравнений, если математическая модель представлена в виде системы уравнений)". Прежде чем приступить к изучению научных методов оценки наркоситуации рассмотрим типичный случай, возникающей при попытках экспертов дать оценку наркоситуации в целом применением данных, найденных в результате обследования групп ограниченного объема. Пример 3.1. В специальном государственном учреждении содержится 1000 лиц. Из них произвольно выбрали 100 и провели их тщательное обследование. Выяснили, что 10 из обследованных принимают наркотики. Требуется оценить наркоситуацию в учреждении. Как авторы многочисленных работ по экспертной оценке наркоситуации в большинстве случаев решают такую задачу? - Выполняют действие - 10/100 и пишут ответ: около 10% содержащихся в учреждении лиц употребляют наркотики. Нетрудно догадаться, что если такое решение считать правильным, то задача оценки наркоситуации в России не актуальна - метод решения прост и общеизвестен, результат очевиден, необходимость в государственных структурах, ориентированных на решение задачи, сомнительна. Разберем задачу подробнее. Во-первых, в условии не сказано о том, что является мерой оценки и можно ли считать проценты такой мерой. Во-вторых, не указаны требования к точности оценки. В-третьих, отсутствуют указания о том, что именно хочет заказчик, что означает "оценить наркоситуацию". Может быть, достаточно ответа "Наркоситуация в пределах нормы?" Кроме того, возникает целый ряд дополнительных вопросов, которые, казалось бы, выходят за рамки решения конкретной задачи, но без знания точных ответов на которые решить задачу невозможно. Например, является ли пожелание заказчика исследования наркоситуации объективным критерием ее оценки? Знает ли сам заказчик о существовании критериев, прописанных в Государственных стандартах? Например, в ГОСТ 2.105. Как видите, читатель, уже на стадии постановки задачи требуется весьма широкая науковедческая образованность не только специалиста-исполнителя, но и заказчика. Вернемся к примеру 3.1. При его решении эксперт выполнил правильное с его точки зрения действие - исходя из результатов того, что
40
из 100 отобранных для опроса человек 10 оказались наркоманами эксперт, воспользовавшись знанием арифметики, поделил 10 на 100 и получил 10%. Однако, что бы произошло, если бы из 100 человек не 10, а 11 или 9 оказались наркоманами. В этих случаях эксперту, исходя из его личного опыта, пришлось бы одиннадцать поделить на сто и получить в результате 11% наркоманов или девять поделить на сто и получить 9%. С одной стороны найденные новые оценки наркологической ситуации почти такие же, как и в первом случае. С другой стороны - другие. Некоторые из экспертов, назовем их "избранными", вследствие природной смекалки предпочтут дать ответ: в обследованном коллективе 9-11% наркоманов. Представим ситуацию: администрация нашего учреждения, из лучших гражданских побуждений озабоченная неблагоприятной наркоситуацией в доверенном ей учреждении, сразу же после первого обследования наркоситуации обратилась к государственным чиновникам с запросом об уточнении оценок. В свою очередь чиновники, также из лучших гражданских побуждений озабоченные неблагоприятной наркоситуацией, выделили из государственного бюджета новые деньги для нового обследования. Привлекли новых экспертов и они, снова отобрав из 1000 тех же самых подозреваемых 100, но уже других, провели новое исследование. Оказалось, что среди этих 100 других всего 2 наркомана. Поэтому в результате новой экспертной оценки выяснилось, что наркоманов не 9-11%, а всего 2%. Какая из экспертных групп права? вопрос риторический. Но на столах выделивших деньги чиновников появился новый отчет, в котором наркоситуация оценена в 2-11%. И чиновники, с полным на то основанием, написали уже в своих отчетах: "Результаты проводимых оценок наркоситуации значительно отличаются друг от друга и требуют уточнений". Чиновники снова "находят деньги", назначают дополнительное исследование, привлекают новых экспертов "избранных из избранных" - из-за границы. Выполнено новое исследование. Из 100 опрошенных 20 оказались наркоманами. В строках нового отчета (естественно, уже не на русском языке.- А.И.) читаем: "В результате исследования повышенной точности группа международных экспертов пришла к заключению о том, что количество наркоманов катастрофически растет и составляет 2 - 20% населения страны". Читатель без особого труда сам найдет немало таких примеров, познакомившись в общедоступной литературе с отчетами и публикациями по исследованию наркоситуации. И так, избегнув утомительных математических доказательств, в примере 3.1 мы продемонстрировали, что оценка среднего
41
арифметического процента не является приемлемой для наших целей. Необходима какая-то другая, удовлетворяющая современным требованиям российских и международных стандартов оценка. Доказано и известно, что для таких случаев подходит вероятностная оценка. Однако, для ее правильного применения и умения правильно трактовать результаты, излагаемые с помощью вероятностной оценки, необходимо ознакомиться с понятием вероятности, употребляемом не в бытовом, а в научном смысле. 2. Знакомство с вероятностной мерой Говоря словами П. Лапласа (см., например, в книгах [47], [44, с.863]) одного из основоположников применения вероятностной меры к оценке разных ситуаций, в том числе и юридических, и общественнополитических: "... теория вероятностей есть в сущности не что иное, как здравый смысл, сведенный к исчислению; она заставляет оценивать с точностью то, что справедливые умы чувствуют как бы инстинктом, часто не умея отдавать себе в этом отчета. Если принять во внимание аналитические методы, которые возникли из этой теории, истинность принципов, служащих ей основанием, утонченную и изящную логику, которой требует применение к решению задач, учреждения общественной пользы, опирающиеся на нее, и распространение, которое она получила и может поучить при применении ее к важнейшим вопросам естествознания и нравственных наук; если затем заметить, что даже в таких областях, которые не могут быть подчинены исчислению, она дает самые верные взгляды, которые могут нами руководить в наших суждениях, и что она нас учит предохранять себя от иллюзий, которые нас часто сбивают с пути, мы увидим, что нет науки, более достойной наших размышлений, и что было бы очень полезно ввести ее в систему народного просвещения. ...Аналитическая теория вероятностей, входящая в область прикладной математики, существенно отличается от других приложений чистого анализа. Анализ вероятностей подвергает рассмотрению и численной оценке явления, зависящие от причин не только совершенно неизвестных нам, но которые даже, по нашему неведению, не подлежат никаким предположениям. Тонкие, глубокомысленные умозаключения, приводящие к этой цели, составляют в совокупности надежный путь, если не для открытия безусловной истины, то, по крайней мере, для возможного приближения к ней. И когда примем в соображение, что при таком важном назначении, математическое учение о вероятностях обнимает в своих приложениях предметы физического и нравственного мира, то утвердительно можем сказать, что эта теория есть создание ума, наиболее
42
возвышающее человека, и указывающее на предел ведений, за которые ему не дано перейти". В целях наглядности рассмотрим пример. Пример 3.2. Бросается монета. Будем считать, что монета без изъянов и бросающий ее - не шулер. Известно, что в результате такого действия монета упадет вверх либо "орлом", либо "решкой". Случай, в котором монета оказывается вставшей на ребро рассматривать не будем прибережем его для экспертов, которые и монету заставят упасть на ребро. Какова вероятность того, что на монете выпадет "решка"? Не торопитесь. Ответ 50% - неправильный! Просим извинения у читателя, но и вопрос неправильный: мы еще не сообщили о том, что называется вероятностью. Определение 3.1. Вероятностью P события A называется число P(A), соответствующее событию A и принимающее значение от 0 до 1 включительно. Нетрудно увидеть, что процентная мера не является мерой вероятности, т.е. вероятность выпадения "решки" в примере 3.2 равна 0.5, а не 50%. Приведем пример другой часто встречающейся ошибки. Пример 3.3. Выполнен опыт: в течение декабря наблюдалось число дней, которое шел снег. Снег шел 20 дней. Чему равна вероятность того, что в произвольно выбранный день декабря произойдет снегопад? Часто встречающееся решение P1 = 20/31 = 0.645 является неправильным, т.к. не удовлетворяет напечатанному выше определению вероятности. Предположим, наблюдение проводилось бы в какой-то другой год, и количество снегопадов было бы не 20, а 15. Следуя тому же методу вычисления вероятности, находим: P2 = 15/31 = 0.48. Получилось, что одно и тоже событие происходит с разной вероятностью, что противоречит определению 3.1. Смекалистый эксперт решит, что нужно сложить количество дней со снегопадами, т. е. 20 + 15 и поделить на сумму дней в двух декабрях: (20 + 15)/(31 + 31) = 0.565. Однако заявление о том, что вероятность снегопада в декабре равна 0.565 также неправильное - прибавив результаты наблюдений еще в одном декабре и разделив количество дней со снегопадами на общее количество дней наблюдений, мы, скорее всего, получим какое-то новое число. "Избранный" эксперт посоветует провести наблюдение много декабрей и оставит за собой право заключения о том,
43
чему равно это "много". Забегая вперед, сообщим читателю, что, если проводить наблюдения за снегопадами в течение 100 декабрей, то и в этом случае мы не сможем ответить на вопрос о значении вероятности снегопада в декабре. Поскольку всегда можно потребовать 101 год наблюдений, 102, ... , 200 и т. д. Какова же вероятность того, что в назначенный день декабря пойдет снег? Предложенная задача не решается методом деления количества дней в декабрях (сколько бы их не наблюдали), в которые шел снег на общее количество дней в наблюдаемых декабрях. Частное от такого деления не есть вероятность, т. к. противоречит определению 3.1. Пример 3.4. Бросается монета. Требуется найти вероятность того, что выпадет "решка". Решение. Если исходить из распространенного мнения о том, что значение вероятности можно вычислить делением количества испытаний, при которых выпала решка на общее количество испытаний, то найденные результаты окажутся противоречивыми. Например, мы можем 100 раз подбросить монету и в результате такого опыта "решка" может выпасть 60 раз. Разделив 60 на 100, находим, что вероятность выпадения "решки" равна 0.6. Последнее противоречит здравому смыслу. Решение ошибочно. Известно, что К. Пирсон (1857-1936) [9, с.737] - английский математик, в начале XX в. 24000 раз подбросил монету и не получил таким методом желанной вероятности 0.5. Из истории математики известно, что первая попытка оценить искомое значение вероятности отношением количества исследуемых событий к общему количеству событий восходит к VII в. В настоящее время такое отношение называют относительной частотой события или точечной оценкой вероятности события. Определение 3.2. отношения
Величина
p*,
вычисляемая
применением
m n где n - количество опытов, m - количество появлений исследуемого события за n опытов, называется точечной оценкой вероятности p. Довольно часто число n называют общим числом исходов испытания, m - числом благоприятных (т. е. тех, которые мы исследуем) исходов испытания. Доказано, что при бесконечно большом увеличении числа n точечная оценка вероятности p* действительно приближается к значению вероятности p, т. е. p* =
44
n = lim p* = p n →∞ m n →∞ При любых конечных n p* ≠ p, т. е. значение точечной оценки вероятности p* не равно значению вероятности p и наглядный пример тому - опыт К.Пирсона, подбросившего монету 24000 раз и так и не получившего вероятность 0.5 делением m/n. Тем более невозможно оценить вероятность обнаружения наркомана в обследованной выборке из 100 человек, зафиксировав в ней, например, 20 наркоманов и поделив 20 на 100. В некоторых, относительно редких случаях, значение вероятности p известно заранее, до начала опытов, например, из общефизических соображений. К таким редким случаям относится бросание монеты без изъянов - и до опыта интуитивно понятно, что вероятность выпадения "решки" равна 0.5, бросание правильного кубика с написанными на его гранях числами от 1 до 6 - из условий опыта можно принять вероятность выпадения какого-либо из чисел от 1 до 6 одной шестой. lim
Определение 3.3. Будем называть полной группой событий такое множество равновозможных событий, которое состоит из всех возможных исходов исследуемого явления и сумма вероятностей всех равновозможных исходов равна 1. Применение вычисляемой по формуле (1) точечной оценки вероятности p* вместо вероятности p возможно в тех и только в тех случаях, в которых заранее известны все равновозможные исходы испытания. Например, если в колоде 36 карт и 4 из них тузы, то вероятность вытащить туз действительно равна 4/36. Как же вычислить искомую вероятность p некоторого события, имея в распоряжении только результаты опытов, но, не имея достаточных оснований считать, что значение p известно? Ответ на этот вопрос математики искали много веков, но нашли в 30-х годах XX века и то далеко не для всех возможных случаев. К счастью, для изучаемого нами случая оценки наркоситуации, решение известно. Подведем итог параграфу. 1. Вероятность события A есть число P(A) такое, что 0 ≤ P(A) ≤ 1. 2. Точечной оценкой p* вероятности p называется число, определяемое аналитическим выражением p* = m/n, где n - общее
45
количество возможных исходов испытания, m - количество благоприятных исходов. 3. Вероятность p равна точечной оценке p* тогда и только тогда, когда известна полная группа событий. ЗАДАЧИ К §3
Задача 3.1. В обследованной группе из 100 чел. обнаружено 20 наркоманов. Какова вероятность того, что случайно взятый из группы человек наркоман? Решение. Все возможные исходы исследуемого явления известны: в данной группе 20 чел. наркотики употребляют, 80 не употребляют, т.е. полная группа событий известна. Применив определение полной группы событий, приходим к заключению, что т. к. в нашем случае мы имеем полную группу событий, то сумма вероятностей полной группы событий, состоящей из 100 возможных исходов равна 1. Следовательно, вероятность того, что один из случайно взятых людей из обследованной группы наркоман равна 20/100 = 0.2. Замечание 3.1. Найденный результат - вероятность обнаружения наркомана в обследованной группе из 100 чел. равна 0.2 правилен только для данной группы и не распространяется даже приближенно на любую другую группу из 100 чел. Задача 3.2. В учреждении 1000 чел. Из них наугад выбрали 100 чел. и провели их обследование. Оказалось, что из 100 обследованных 20 наркоманы. Какова вероятность того, что наугад взятый из учреждения человек окажется наркоманом? Решение. По результатам обследования наугад выбранных 100 человек из 1000 возможных мы пока не можем сделать никакого доказательного заключения о том, какова вероятность того, что взятый наугад один из 1000 чел. окажется наркоманом. Задача 3.3. В консультативно-диагностической палате многопрофильной городской больницы находятся два обследуемых. Известно, что один из обследуемых употребляет героин, второй алкоголь. К палате подошел пьяный санитар и наугад взял на осмотр одного из обследуемых. После осмотра обследуемого вернули в консультативнодиагностическую палату. Пришел другой санитар, тоже пьяный, снова наугад взял на осмотр одного из содержавшихся в палате. Найти вероятность того, что хотя бы один раз на осмотр был доставлен субъект, употребляющий героин.
46
Изложим один из вариантов решения. Полная группа событий состоит из следующих событий: 1) субъект, употребляющий героин не доставлен ни одного раза, 2) доставлен один раз, 3) доставлен 2 раза. Следовательно, возможно всего 3 исхода. Два из них содержат событие - потребитель героина доставлен. Следовательно, вероятность того, что произойдет событие "субъект доставлен хотя бы один раз" равна 2/3. Замечание 3.3. Изложенное решение перечисленные события 1-3 не равновозможны.
неправильное,
т. к.
Изложим правильное решение. Решение. Обозначим через А событие, заключающееся в том, что на осмотр доставили алкоголика, через Г - субъекта, употребляющего героин. Найдем полную группу событий. Всего возможно 4 случая. Перечислим их. Первый случай - доставлен А и Г. Второй случай - Г и А. Третий случай - Г и Г. Четвертый случай А и А. Перечисленные случаи полностью описывают полную группу равновозможных событий. Из всех событий случай Г - на осмотр доставлен потребитель героина, встречается три раза: в событиях ГА, АГ и ГГ. Применив определение вероятности для случая полной группы событий, состоящей из 4-х событий, находим, что ¾=0.75. Ответ. Вероятность того, что хотя бы один раз на осмотр доставлен субъект, употребляющий героин, равна 0.75. Задача 3.4. Находящийся в консультативно-диагностической палате многопрофильной больницы пациент мечтает либо принять алкоголь, либо принять алкоголь и покурить марихуану. Найти вероятность того, что пациент мечтает: а) только об одном наркотике, т. е. либо принять алкоголь и потом еще принять алкоголь, либо покурить марихуану и потом еще покурить марихуану, б) о двух наркотиках: и принять алкоголь, и покурить марихуану. Решение. Обозначим через А - мечту о приеме алкоголя, через М мечту о приеме марихуаны. Тогда все возможные события, входящие в полную группу событий, есть события АА, ММ, АМ, МА. Всего 4 возможных элементарных события - 4 мечты. Из них мечта только об одном наркотике содержится в двух элементарных событиях АА и ММ , о двух наркотиках также в двух событиях АМ и МА. Следовательно, вероятности содержания мечтаний пациента одинаковы, т. к. и в том и в том случаях вероятность вычисляется, как 2/4=0.5. Ответ. Обе вероятности равны по 0.5. Замечание 3.4. Консультативно-диагностической палатой многопрофильной больницы называется специально оборудованное
47
изолированное помещение, предназначенное для временного содержания представляющих повышенную опасность для медицинского персонала пациентов с явно выраженным девиантным поведением. Задача 3.5. Из результатов многолетних (с 1865 г.) наблюдений за погодой в Санкт-Петербурге известно, что среднесуточная температура приземного слоя окружающего воздуха 10 января может колебаться от -350С до +30С. Разбив указанный интервал температур на отрезки значений по одному градусу, получим, что таких отрезков будет 37. Верно ли утверждение о том, что, рассматривая вероятность среднесуточной температуры как вероятность попадения ее значения в какой-либо из 37 отрезков мы можем считать, что множество событий, состоящее из всех возможных случаев попадания значения температура в какой-либо отрезок есть полная группа событий? Решение. Из результатов многолетних наблюдений известно, что есть значения среднесуточных температур, которые встречаются 10 января в СПб часто, например, -90С. Есть такие значения, которые встречаются редко. Например, -350С. Следовательно, рассматриваемые элементарные события не равновозможны и не могут считаться входящими в полную группу событий. Ответ. Изложенные условия, взятые из результатов наблюдений, противоречат тому, чтобы считать множество всех возможных температур полной группой событий. Замечание 3.5. По мнению автора, ошибочное рассмотрение множества возможных температур в качестве полной группы событий привело к некогда нашумевшей теории глобального потепления климата планеты, опровергнутой российскими учеными в работах [25], [26], [27] и др.
48
§4. ПРИМЕНЕНИЕ ЭЛЕМЕНТОВ КОМБИНАТОРНОГО АНАЛИЗА ПРИ ОЦЕНКЕ НАРКОСИТУАЦИИ 1. Основные определения
Пусть имеется множество, содержащее n элементов. Определение 4.1. Назовем множество упорядоченным, если между его элементами существует какое-либо отношение порядка. Пример 4.1. 1. Множество чисел 1, 2, 3, 4 упорядочено по возрастанию. 2. Множество чисел 4, 3, 2, 1 упорядочено по убыванию. Определение 4.2.Перестановкой из n элементов называется любое упорядоченное множество, в которое входят по одному разу все n различных элементов данного множества. Теорема. Число перестановок n различных элементов равно n!, т. е. Pn = n!.
(1)
Замечание 4.1. Доказано, что 0! = 1. Пример 4.2. Сколькими способами можно переставить числа 1, 2, 3? Решение. Из множества чисел 1, 2, 3 можно получить следующие множества: 1, 2, 3; 3, 2, 1; 1, 3, 2; 2, 1, 3; 2, 3, 1; 3, 1, 2. Итого 6 множеств. Применив формулу (2), избегая утомительного перебора, нетрудно вычислить: P6 = 3!= 3·2·1 = 6. Определение 4.3. Размещением из n элементов по m называется любое упорядоченное подмножество из m элементов множества, состоящего из n различных элементов. Теорема. Число размещений из n элементов по m можно вычислить, воспользовавшись формулой: n! (2) Am n = (n − m)! Кроме изложенных теорем при решении задач оценки наркоситуации могут оказаться полезными изложенные ниже правила. Правило умножения. Пусть требуется одно за другим выполнить какие-то k действий. Если первое действие можно выполнить n1 способами, второе действие - n2 способами и так до k-го действия, которое можно выполнить nk способами, то все k действий вместе можно выполнить n1·,n2·,nk способами.
49
Правило сложения. Если два действия взаимно исключают друг друга, причем одно из них можно выполнить m способами, а другое - n способами, то выполнить одно любое из этих действий можно n + m способами. Пример 4.3. В брошюрке 12 страниц. Необходимо на страницах брошюрки поместить 4 фотографии граждан, находящихся в тяжелом наркотическом опьянении. Сколькими способами это можно сделать, если ни одна страница брошюрки не должна содержать более одной фотографии? Решение. Первую фотографию можно поместить на любую из 12 страниц, т.е. 12 способами, вторую - на любую из оставшихся 11 страниц, т. е. 11 способами, третью - на любую из 10 оставшихся страниц, четвертую - на любую из оставшихся 9 страниц, т. е. девятью способами. Применив правило умножения, находим, что 4 фотографии можно разместить на 12 страницах 12 · 11 · 10 ·9 = 11880 способами. Применив формулу (3) можно найти решение значительно быстрее: для размещения фотографий следует отобрать 4 различные страницы газеты из 12 имеющихся. Затем, отобранные страницы необходимо упорядочить, не обращая внимания на их номера, т. е. определить, на какую страницу поместить первую фотографию, на какую вторую и т. д. Полученная упорядоченная совокупность страниц является согласно определению размещением из 12 элементов по 4, т. е. равно А412. Выполнив вычисления применением формулы (3) находим: n! 12! 4 (3) Am = А12 = = 11880. n = (n − m)! (12 − 4)! Ответ. 4 фотографии на 12 страницах можно расположить 11880 способами так, чтобы ни одна страница не содержала более одной фотографии.
Определение 4.4. Сочетанием из n элементов по m называется любое подмножество из m элементов, которое принадлежит множеству, состоящему из n различных элементов. Теорема. Число сочетаний из n элементов по m элементов можно вычислить, воспользовавшись формулой n! (4) Сm n = m!(n − m) Пример. 4.4. В целях лечения хронической наркомании 12 больным запланирована операция стереотаксической криоцингулотомии. В больнице есть две операционные, в одной из которых можно выполнить не
50
более пяти операций в неделю, в другой не более девяти операций в неделю. Сколькими способами группу из 12 больных можно разбить на две подгруппы, в одной из которых будет не более пяти, а во второй не более девяти больных. Решение. Первая подгруппа может состоять либо из трех, либо из четырех, либо из пяти больных. Подгруппу из трех больных можно выбрать C312 = 220 способами. Подгруппу из четырех больных – C412 = 495 способами, подгруппу из пяти больных – C512 = 792 способами. Учитывая, что выбор первой подгруппы однозначно определяет вторую, применив правило сложения, находим: C312 + C412 + C512 = 220 + 495 + 792 = 1507. Ответ. Разбиение группы из 12 наркоманов на две подгруппы при выполнении условий задачи можно осуществить 1507 способами. Теорема. Имеет место равенство
С 0n + C 2n + C3n + .... + C nn = 2 n
(5)
Пример 4.5. Для опроса о принадлежности к лицам, употребляющим наркотики, из класса отобрали 11 учащихся. Сколько существует вариантов опроса этих 11 учащихся за один сеанс опроса, если ни один из них не будет подвергнут опросу дважды и на сеансе может быть опрошено любое количество учащихся. Причем порядок, в котором опрашиваются учащиеся, безразличен? Решение. Опрашивающий специалист может не спросить ни одного из 11 учащихся, что является одним из вариантов. Этому случаю соответствует C011. Специалист может опросить только одного из учащихся. Таких вариантов C111. При опросе двух учащихся вариантов опроса будет C211, трех - C311 и т. д. Наконец, могут быть опрошены все учащиеся. Число вариантов в этом случае равно C1111. Тогда, применив правило сложения, находим, что число всех возможных вариантов опроса равно C011+C111+C211+C311+ ... +C1111 = 211 = 2048. Читатель без труда заметит, что применением результатов правил, теорем и определений настоящего и предыдущего параграфа можно вычислить вероятности того, что проведенный в исследуемом коллективе опрос в целях выяснения наркоситуации даст хоть какие-то значимые результаты. К сожалению, такие вероятности чрезвычайно малы.
51
Пример 4.6. Предположим в некотором коллективе из 100 чел. есть 2 наркомана. Какова вероятность того, что оба наркомана попадут в группу из 10 чел., наугад выбранную из 100 чел. в целях оценки наркоситуации в коллективе? Решение. Из 100 чел. группу объемом 10 чел. можно выбрать C10100 способами. Выполнив вычисления, находим: 100! С10 = 1.7303 ⋅ 1013 100 = 10!(100 − 10) Замечание 4.2. Автор не уверен, что все читатели знают, как называется в естествознании тринадцатизначное число. Число 1.7303 · 1013 - объем полной группы событий. Подсчитаем число исходов, благоприятствующих интересующему нас событию - среди 10 отобранных человек ровно 2 наркомана. Двух наркоманов можно взять из 2-х наркоманов C22 = 1 способом; при этом остальные 10 – 2 = 8 человек из группы в 10 человек должны быть не наркоманами; взять же 10 - 2 = 8 ненаркоманов из 100 – 2 = 98 ненаркоманов можно C10-2100-2 = C898 = 1.57366 · 1011 способами. Следовательно, число благоприятствующих исходов равно C22·C298 = 1 · 1.57366 · 1011. Искомая вероятность p того, что среди 10 отобранных человек окажется 2 наркомана, равна отношению числа исходов, благоприятствующих событию, к числу всех возможных элементарных исходов: p = (C22·C298 ) / C10100 = (1.57366 · 1011) / (1.7303 · 1013) = 0.0091. Вероятность p = 0.0091 весьма мала. Нетрудно догадаться, что в результате предложенного в задаче выборочного исследования вряд ли будет обнаружено, что в исследуемой группе из 100 человек есть наркоманы. Ответ. Вероятность того, что в исследуемой группе из 100 человек будут обнаружены наркоманы, равна 0.0091. Исследование нельзя считать научно обоснованным, так как применением его результатов невозможно адекватно интерпретировать имеющую место наркоситуацию. Вследствие некоторой громоздкости решений задач такого типа, но их частой встречаемости, избегая математических выкладок, приведем формулу для вычисления вероятности попадания k наркоманов в группу из
52
m обследуемых человек извлеченную из группы объемом N человек, если в группе из N человек n наркоманов. -k C kn ⋅ C m N-n (6) p= . Cm N По мнению автора, формула (6) может оказаться весьма полезной при решении задач оценки наркоситуации. Замечание 4.3. Подробнее с задачами комбинаторного анализа и методами их решений заинтересованный читатель может ознакомиться, воспользовавшись учебниками по математической статистике [28], [29] и задачником [30]. Прототипы изложенных задач и примеров заимствованы автором из книг [28], [29], [30] и др. В интересах читателя приведем типичный пример, иллюстрирующий возможности применения формулы (6). Пример 4.7. В учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что все 10 наркоманов попадут в обследуемую группу? Решение. Применим формулу (6). В нашем случае N = 1000, n = 10, m = 100, k = 10. Подставив эти значения величин N, n, m и k в формулу (6) и, выполнив вычисления, находим: -k C kn ⋅ C m N -n
10 100 −10 ⋅ С1000 С10 −10
10 90 ⋅ С990 С10
1 ⋅ 4.19602 ⋅ 10129 = = = = 6.57163 ⋅ 10 −11. p= m 100 100 139 CN С1000 С1000 6.38505 ⋅ 10 Ответ. Искомая вероятность оценивается числом несколько меньшим, чем число 7·10-11, т. е. ничтожно мала, практически равна 0. С такой вероятностью мы обнаружим наркоманов в обследуемом коллективе. Иначе говоря, уже до начала предлагаемого обследования понятно, что такое обследование не может способствовать решению задачи оценки наркоситуации в учреждении. Право принятия решения о том, финансировать такое обследование или нет, оставим государственным чиновникам. 2. Решение задач оценки наркоситуации общедоступных формул комбинаторного анализа
применением
Читатель, попытавшийся самостоятельно выполнить вычисления в рамках изложенных примеров наверняка заметил, что вычисление значений n! при больших значениях числа n весьма утомительно.
53
Например, уже вычисление 100! = 100 · 99 · 98 · ... · 2 · 1 ≈ 9.33262 · 10157 сталкивается со значительными трудностями. С одной стороны, можно воспользоваться инженерным микрокалькулятором, например марки fx-82TL, fx-115W, fx-350TL, fx-911W и др., в которых в силу частой встречаемости при решении инженерных задач вычисление числа сочетаний Cnm является встроенной функцией. Однако, большинство распространенных в России микрокалькуляторов не может отображать числа с более чем двухзначными степенями. Например, большинство конструкций микрокалькуляторов не могут оперировать с числом 10157 и не могут вычислить n! при n > 69, т. к. 69! ≈ 1.71122 · 1098, но уже 70! ≈ 1.19785 · 10100. Можно воспользоваться компьютером, но, во-первых, к сожалению далеко не на каждом компьютере установлено подходящее программное обеспечение, например пакет DERIVE [18]. Во-вторых, не всегда компьютер оказывается "под рукой". Замечание 4.4. Автор настоятельно рекомендует читателям установить на свой компьютер пакет математических программ DERIVE. Объем памяти, требующийся для установки пакета, ничтожен - в версии для DOS пакет в неархивированном виде помещается на одну дискету емкостью 1.44 МГб. Пользование пакетом столь просто, что автору без особого труда удавалось обучать ему школьников 6-7 класса. Задача вычисления значений n! для больших n возникла еще в средние века. Решена Д. Стирлингом (1692-1770). При решении прикладных задач достаточно применения приближенной формулы Стирлинга n
⎛n⎞ (7) n!= 2πn ⎜ ⎟ , ⎝e⎠ где e ≈ 2.718. Формально формула (7) справедлива только для очень больших значений числа n, т. е. при n→∞. Однако, даже при относительно небольших n применением формулы (7) можно найти вполне удовлетворительные результаты. Например, уже при n = 10 расчет значения 10! применением (7) приводит к ошибке меньшей 1%, при n = 50 меньшей 0.1%. В компьютерных программах для расчета значений n! при больших n применяется уточненная формула Стирлинга. Такой расчет приводит к еще меньшей ошибке. Применение формулы (6) позволяет найти решение задач оценки наркоситуации далеко не только в рамках рассмотренных в примерах случаях. В целях демонстрации возможностей применения формулы (6) изменим несколько требования, изложенные в примере 4.7.
54
Пример 4.8. В учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что 9 наркоманов из 10 попадут в обследуемую группу? Решение. В этом случае значения величин, подставляемых в формулу (6) будут соответственно равны: N = 1000, n = 10, m = 100, k = 9. Следовательно, p=
-k C kn ⋅ C m N -n
Cm N
=
9 100 −9 С10 ⋅ С1000 −10 10 С100
≈ 6.5 ⋅ 10 −9.
Читателю предлагается самостоятельно выполнить вычисления в напечатанной выше формуле. В целях освоения применения формулы (6) в условиях примера 4.8 найдем вероятность того, что в обследуемую группу попадут не 9, а 8 наркоманов. Читателю предлагается самостоятельно выполнить вычисления. Ответ: искомая вероятность приближенно равна 2.858 ⋅ 10-7. Замечание 4.5. В целях удобства применения компьютера формула (6) после очевидных алгебраических преобразований может быть записана как
p=
m!n!( N − m )!( N − n )! . k! N !(m − k )!(n − k )!( N + k − m − n )!
(6*)
Вычисления применением формулы (6*) дают те же результаты что и вычисления, выполненные применением формулы (6). Формулу (6 5* 0) рекомендуется записать как подпрограмму для дальнейшего использования, дав ей мнемонически удобное имя. Например, NARKSIT. MTH. В целях помощи читателю в приложении 1 помещена распечатка файла NARKSIT. MTH, которым пользовался автор при написании пособия. Обратите внимание на ряд найденных значений вероятности: 6.57163 · 10-11, 6.5 · 10-9, 2.858 · 10-7. Как видите, с уменьшением числа наркоманов, случайно попавших в обследуемую группу, вероятность растет. Рекомендуем самостоятельно выполнить вычисление для числа k наркоманов, случайно попавших в обследуемую группу k = 7, 6, 5, 4, 3, 2, 1. Ответим на "крамольный" для экспертов вопрос: какова вероятность того, что в отобранную из 1000 человек группу из 100 человек не попадет ни одного наркомана, т. е. решим задачу при k = 0. Применив формулу (6) и выполнив вычисления, находим, что вероятность того, что в исследуемую группу не попадет ни одного наркомана, приблизительно равна 0.347, т. е.,
55
говоря словами экспертов, "почти 35%". Самое большое значение из всех вычисленных нами вероятностей! Избегнув громоздких математических выкладок в рамках рассмотренных примеров, мы нашли весьма интересный результат: с вероятностью почти 1 можно утверждать, что если в каком-то коллективе присутствуют наркоманы, то все они никогда не попадут в исследуемую экспертом случайную выборку. Подводя итог, сообщим читателю о том, что путем относительно несложных рассуждений и вычислений мы приблизились к возможности понимания одного из ключевых законов теории вероятностей и математической статистики - закона распределения Я. Бернулли, который можно успешно использовать при решении задачи оценки наркоситуации. ЗАДАЧИ К §4
Задача 4.1. а). В школе a учащихся употребляют наркотики и b учащихся не употребляют. Найти вероятность того, что два случайно опрошенных учащихся школы окажутся наркоманами. Решение. Обозначим через В событие, состоящее в том, что оба случайно опрошенных учащихся школы окажутся наркоманами. Вычислим количество элементов n, входящих в полную группу событий. n = Ca2+ b . Вычислим количество случаев m, благоприятных событию B. m = Ca2 . Следовательно, вероятность P(B), т. е. вероятность события B заключающегося в том, что оба случайно опрошенных учащихся школы наркоманы можно вычислить, воспользовавшись формулой Ca2 P( B) = 2 . Ca +b б) Применим найденный результат к оценке результативности экспертных оценок, доводимых до сведения администрации школы учащимися школы. Пусть в школе 1000 учеников и из них 300 употребляют наркотики. Кроме того, пусть в той же школе есть 100 учащихся, по их утверждению, не употребляющих наркотики, но знающих тех, кто употребляет и готовых добровольно сотрудничать с администрацией, своевременно и точно информируя ее о действиях учащихся, наркотики употребляющих.
56
Какова вероятность того, что два случайно вызванных на беседу администрацией учащихся поделятся информацией о наркоситуации в школе?
P( B) =
2 C100 2 C1000
=
4950 = 0.01. 4.995 ⋅ 105
Нетрудно заметить, что попытка сделать объективный вывод о наркоситуации в школе в целом исходя из заявлений отдельных учащихся, добровольно сотрудничающих с администрацией, сомнительна. Задача 4.2. В рамках условий задачи 4.1.б найти, как будет изменяться вероятность события B заключающегося в том, что k случайно вызванных на беседу администрацией учащихся поделятся информацией о наркоситуации в школе? Решение. При k случайно вызванных учениках найденная при решении задачи 4.1.а) формула изменится на формулу Ck P( B) = ka . Ca +b Приняв во внимание условие задачи 4.1.б находим
P( B) =
k C100 k C1000
.
(*)
Вычислим значения P(B) при k = 1, 2, 3,...,100 обозначив их соответственно через P(1), P(2), ... , P(100). Применив формулу (*) находим, что P(1) = 0.1, P(2) = 0.01, P(3) ≈ 0.001, P(4) ≈ 10-4, ..., P(10) ≈ 7·10-11,..., P(50) ≈ 10-56,..., P(100) ≈ 1.6·10-140. Нетрудно заметить, что с увеличением числа k количества учащихся, желающих добровольно сотрудничать с администрацией школы в качестве экспертов в целях оценки наркоситуации, вероятность получения администрацией объективной информации быстро уменьшается. Читателю рекомендуется самостоятельно сделать вывод о том, способствуют ли увеличению эффективности борьбы с наркоманией "послушные учащиеся, "за заслуженное поощрение" своевременно и точно информирующие" администрацию школы о наркоситуации.
57
§5. ПЕРВЫЕ МОДЕЛИ ОЦЕНКИ СЛУЧАЙНЫХ СОБЫТИЙ 1. Краткая историческая справка.
Трудно сказать что-либо определенное о том, когда именно предпринимались самые первые попытки использования вероятностных оценок ситуаций. В книге [31,c.113] можно найти заявление о том, что известные науке первые попытки восходят к 2238 г. до н. э. и были осуществлены в Древнем Китае. Размышления о случайном (например, золотые правила игроков в азартные игры) были уже в древнейшие времена, но математические вычисления вероятностей появляются в письменных источниках начиная лишь с XV века. Хотя сегодня теория вероятностей имеет столько же общего с азартными играми, как и геометрия - с измерениями площадей при земляных работах, тем не менее, первые попытки создания математического аппарата теории вероятностей возникли из результатов изучения популярных азартных игр. Едва ли не первой книгой по теории вероятностей, дошедшей до наших дней, является книга «De Ludo Aleae» Д. Кардано (1501-1576). Вместе с тем, первооткрывателем, пожалуй, первого закона в этой области знания является Я. Бернулли. Согласно сведениям, опубликованным в «Биографическом словаре деятелей в области математики» [32] значительный вклад в развитие естествознания внесли 9 ученых с фамилией Бернулли: Я. Бернулли (ум. в 1583 г.), Я. Бернулли (1654-1705), И. Бернулли (1667-1748), Н. Бернулли (1687-1759), Н. Бернулли (1695-1726), Д. Бернулли (1700-1782), И. Бернулли (1770-1790), И. Бернулли (1744-1807), Я. Бернулли (17591789). В нашем случае мы говорим о Я. Бернулли (1654-1705), написавшем известный труд «Ars conjectandi» («Искусство предположений»), фрагмент из которого изложен в §2 пособия. Известно, что во второй половине XVII в. модным гедонистическим времяпровождением считалось участие в азартных играх. Как и всегда в таких случаях кому-то из игроков везло больше, чем остальным. Как и сейчас некоторые из игроков обращались за разъяснением причин везения к образованной части населения. В то время развитый математический аппарат теории вероятностей еще не был создан и ученые, к которым обращались за разъяснением причин своих выигрышей и проигрышей высокопоставленные особы, оказывались в затруднительном положении: есть сведения, что тогда, как и сейчас, финансирование научных исследований определялось решениями чиновников. Возможно, это и
58
послужило одной из причин, по которой лучшие представители естествознания были вынуждены заняться изучением закономерностей, проявляющихся в азартных играх. 2. Формула Бернулли
Пожалуй, самой простой игрой, в которой в качестве судьи используется случай, является игра в угадывание, «орел» или «решка» выпадет при бросании монеты. Интуиция подсказывает, что исходы равновозможны, однако опыт показывает, что в некоторых случаях выпадение «орла» или «решки» следует одно за другим много раз подряд. На этом основании игроки часто уверены, что если правильная монета много раз выпадет «гербом», то вероятность выпадения «решки» возрастет. Следует отметить, что похожее суеверие имеет место и среди игроков на современных электронных игровых автоматах. Считается, что если на каком-то автомате долго не выпадал выигрыш, то вероятность выиграть на нем выросла. Плодами суеверия успешно пользуется обслуживающий автоматы технический персонал: информацию о том, на каком автомате долго не было выигрыша, тайно продают посетителям. Вернемся к опытам по угадыванию выпадения «орла» / «решки» при бросании монеты. Предположим, что правильная монета 10 раз подряд выпала «решкой». Есть ли основание считать, что вероятность выпадения «орла» возросла? Очевидно, что у монет нет памяти, поэтому они не знают, сколько раз они выпали «орлом» или «решкой». По этой причине шансы выпадения «орла» или «решки» при каждом бросании монеты равны ½, даже если монета уже выпала «орлом» тысячу раз подряд. Я. Бернулли во второй половине XVII в. доказал, что при очень большом числе бросаний «герб» выпадет приблизительно столько же раз, сколько и решка, но вся суть в том, что означает «приблизительно». Найденный Я. Бернулли результат впоследствии многократно проверялся. В учебном пособии [33,с.18] сказано о том, известный французский естествоиспытатель XVIII в. Ж. Бюффон бросил монету 4040 раз, К. Пирсон, в 20-х годах XX в. бросил монету 24000 раз. Ж. Бюффон пришел к заключению, что точечная оценка вероятности выпадения «герба» равна 0.50693, К. Пирсон, что точечная оценка вероятности равна 0.5005. Многие факты, подмеченные на этой частной схеме, впоследствии служили путеводной нитью при изучении более сложных схем. В частности, была дана современная формулировка независимости событий.
Определение 5.1. Событие В называется независимым от события А, если наступление события А не изменяет вероятности события В.
59
Схема независимых испытаний предложена описывается найденной им математической моделью.
Я. Бернулли
и
Предположим, что вероятность появления события известна точно из общефизических соображений. Например, при бросании монеты будем считать ее равной 0.5. Я. Бернулли доказал, что вероятность того, что при n испытаниях событие произойдет ровно m раз можно вычислить, применив формулу
Р( x = m ) = Cnm p m (1 − p )n − m =
n! p m (1 − p )n − m . m!(n − m )!
(8)
Символом P(x = m) в формуле (8) обозначена вероятность того, что событие произойдет ровно m раз. Закон, записанный аналитическим выражением (8), называется биномиальным законом распределения вероятностей. Пример 5.1. Монету бросили 10 раз. Найти вероятность того, что ровно 5 раз из 10 опытов выпадет «орел». Решение. Возможно, читателю покажется, что вероятность будет близка к 0.5. Сравним то, что кажется с тем, что имеет место на самом деле. В нашем случае общее количество опытов n = 10, количество выпадений «орла» - m = 5, вероятность выпадения «орла» - p = 0.5. Выполнив вычисления применением формулы (8) находим: Р ( x = 5) =
10! 0.55 (1 − 0.5)10−5 = 0.246. 5!(10 − 5)!
Ответ: вероятность того, что при 10 киданий монеты ровно 5 раз выпадет «орел» равно 0.246. В целях демонстрации возможностей применения формулы Бернулли рассмотрим задачу, на первый взгляд имеющую такой же результат решения, как в примере 5.1. Пример 5.2. Монету бросили 100 раз. Найти вероятность того, что ровно 50 раз из 100 опытов выпадет «орел». Решение. В рассматриваем случае n = 100, m = 50, p = 0.5. Применив формулу (8) находим: Р( x = 50 ) =
100! 0.550 (1 − 0.5)100 −50 = 0.0796. 50!(100 − 50 )!
Ответ: при 100 киданиях монеты вероятность выпадения «герба» ровно 50 раз равна 0.0796.
60
Обратим внимание на то, что вероятность выпадения «герба» ровно в половине случаев при 10 киданиях монеты не равна вероятности выпадения «герба» также в половине случаев при 100 киданиях монеты. Читателю рекомендуется самостоятельно, применением формулы (8), найти вероятность того, что при 1000 бросаниях монеты «герб» выпадет 500 раз (Ответ: P(x = 500) = 0.025). Формула Бернулли доказана еще в XVII в., правильна и может быть чрезвычайно полезной при решении некоторых задач оценки наркоситуации. Однако, знание правильной формулы не гарантирует правильности ее применения. Важно различать парадоксы и софизмы. Первые - это справедливые, хотя и неожиданные утверждения, в то время как вторые - ложные результаты, найденные с помощью рассуждений, формально кажущихся правильными. По мнению автора, и парадоксы, и софизмы очень интересны и поучительны. Примеры парадоксов из теории вероятностей и математической статистики изложены в книге [31]. В ней же даны их решения. Исследование софизмов в математике изложено в книге «Ошибки в математических рассуждениях» [36]. Приведем пример современного софизма, который в одном из учебников для вузов по психологии выдан за доказательство того, что каждый последующий год жизни человека короче предыдущего. Обоснуем, что с возрастом «годы жизни» не только кажутся, но и на самом деле становятся короче: известно, что каждый год вашей жизни - это ее 1/n часть, где n - число прожитых вами лет. Но n + 1 > n и 1/(n + 1) < 1/n. Следовательно, каждый следующий год вашей жизни короче предыдущего. Изложим придуманный автором пособия пример софизма неправильного применения формулы Бернулли при решении задачи оценки наркоситуации. Пример 5.3. Вернемся к примеру 4.7: в учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что все 10 наркоманов попадут в обследуемую группу? Решение (неправильное). Известно, что в интересующей нас группе объемом 1000 человек 10 наркоманов. Таким образом, каждый человек из группы с какой-то вероятностью может оказаться либо наркоманом, либо не наркоманом. В нашем пространстве событий имеется 1000 событий. Т. к. мы имеем дело с полной группой событий, это дает нам право
61
вычислить вероятность того, что взятый наугад из группы человек наркоман. Количество благоприятных событий – m = 10, общее количество событий – n = 1000. Воспользовавшись формулой для вычисления вероятности p при наличии полной группы событий, находим: p = m/n = 10/1000 = 0.01. Найдем вероятность того, что при 100 испытаниях - случайном отборе из группы объемом 1000 человек группы объемом 100 человек все 10 наркоманов окажутся в отобранной группе объемом 100 чел. Воспользуемся формулой (8). В нашем случае n = 100, m = 10, p = 0.01. Выполнив вычисления, находим: Р( x = 10) =
100! 0.0110 (1 − 0.01)100−10 = 7 ⋅ 10 −8. 10!(100 − 10 )!
Ответ (неправильный!): p = 7 · 10-8. В примере 4.7 доказано, что искомая вероятность p = 6.57163 · 10-11. Найденная оценка наркоситуации – p = 7 · 10-8 отличается от результатов оценки той же наркоситуации – p = 6.57163 · 10-11 почти в 1000 раз! Предоставим читателю сделать самостоятельное обоснованное экспертное заключение о том, какова причина столь разных результатов оценки наркоситуации. Напомним, что правильное решение изложено в примере 4.7. Пример 5.4. Из российских источников, например из [6], публикующих результаты экспертных оценок наркоситуации в России известно, что только 0.1-1% наркотиков в России изымается из незаконного оборота правоохранительными органами. Найти вероятностную оценку успешности работы наркокурьера, если вероятность его задержания оценивается, как 0.001-0.01. Решение. Используем верхнюю границу оценки, заимствованную из [6]. Вычислим вероятность p успешного провоза наркотиков: p = 1 - 0.01 = 0.99. Применив формулу (8) вычислим вероятности того, что провоз наркотиков успешно осуществится в 1-м, 2-х, 3-х и т. д. случаях. Для таких случаев значения числа n в формуле (8) будут равны соответственно 1, 2, 3 и т. д. Значения числа m будут также равны 1, 2, 3 и т. д., то есть во всех случаях будет выполняться равенство n = m. Тогда формула (8) примет вид P(x = n = m) = pn , и значения вероятностей P(x = n =m) при n = 1,2,3... (с точностью до второго знака после запятой) соответственно будут равны 0.99, 0.98, 0.97 и т. д. Использовав нижнюю границу оценки p = 0.999, находим, что вероятности успешного провоза наркотиков при одной, двух, трех и т. д. попытках провоза будут равны
62
0.999, 0.998, 0.997 и т. д. В целях наглядности на рис. 3 помещены графики вероятностей успешного незаконного провоза наркотиков.
Рис.3. На рис. 3. По оси абсцисс - вероятности успешного незаконного провоза наркотиков, по оси ординат - количества случаев провоза. Нетрудно вычислить, что при вероятности успешного незаконного провоза p = 0.99 с вероятностью p = 0.9910 = 0.9 можно осуществить 10 успешных незаконных провозов. При оценке вероятности p = 0.999 нетрудно вычислить, что даже при 100 попытках незаконного провоза вероятность успеха превышает 0.9. Применение закона Бернулли (биномиального) на практике сопряжено с некоторой трудностью: для того, чтобы воспользоваться формулой (8) необходимо знание значения вероятности p. В некоторых случаях, например, при бросании монеты, значение вероятности p можно задать из общефизических соображений. Однако, такие случаи встречаются не так часто, как бы хотелось. В настоящее время известны методы математического моделирования, применение результатов которых позволяет оценить значение неизвестной вероятности p специальными
63
приемами обработки результатов опытов. Об этих приемах мы расскажем позже.
3. Закон Пуассона. Наркомания живет по законам военного времени Заимствуем из известного учебника [34] по теории вероятностей хрестоматийный пример. Опыт боевых действий во время Великой Отечественной войны (1941-1945) показал, что при выполнении некоторых условий самолет противника можно сбить из ручного пехотного оружия винтовки или автомата. Однако пулей самолет может быть подбит лишь при попадании в немногие уязвимые места - мотор, летчик, бензобаки и пр. Вероятность попадания в эти уязвимые места отдельным выстрелом весьма мала, но, как правило, по самолету вело огонь целое подразделение, и общее количество выстрелов, выпущенных по самолету, было значительным. В результате вероятность попадания хотя бы одной или двумя пулями имела значительную величину. Это обстоятельство было подмечено и чисто практически. Задолго до начала Второй Мировой войны С. Пуассоном (1781-1840) был найден вероятностный закон, применение результатов которого позволило найти научное объяснение (т. е. найти доказательную математическую модель) тому, что иногда, но все же обязательно, происходят почти невероятные явления. В целях изучения вероятностных моделей введем новое понятие. Определение 5.2. Пусть А - некоторое событие, которое может произойти с вероятностью P(A). Назовем подмножество всех событий, входящих в исследуемое множество событий, но не являющихся событием А противоположным событию А событием. Событие, противоположное событию А, будем обозначать, как событие Ā. Вероятность события Ā обозначим через P(Ā). Нетрудно заметить, что между вероятностью события и вероятностью противоположного события имеют место равенства: P(A) + P(Ā) = 1, P(Ā) = 1 - P(A).
(9)
Например, если вероятность события равна 0.2, то вероятность противоположного ему события равна 1 - 0.2 = 0.8. Вычисление вероятностей противоположных событий в некоторых случаях значительно упрощает решение прикладных задач. Вернемся к рассмотрению вероятностных законов, описывающих редкие явления.
64
Пример 5.5. Пусть вероятность p попадания в цель при каждом выстреле мала и равна 0.001. Найти вероятность попадания в цель одной и более пулями, если число выстрелов равно 5000. Решение. Первый способ. В нашем случае задачу можно решить, применив хорошо известную читателю формулу (8). Из условия задачи следует, что p = 0.001, n = 5000, m ≥ 01. Обозначим через P5000(0) вероятность события заключающегося в том, что ни одна из 5000 пуль не повредит самолет. Тогда противоположным событием будет событие, заключающееся в том, что либо одна, либо две, либо три и т. д. вплоть до всех 5000 пуль самолет подобьет. Нетрудно догадаться, что вероятность P5000(m ≥ 1) такого события описывается равенством P5000(m ≥ 1) = 1 - P5000(0).
(*)
Вычислим вероятность P5000(0). В этом случае величины, входящие в формулу (8) будут соответственно равны: n = 5000, m = 0, p = 0.001. Выполнив вычисления, находим, что P5000(0) = 0.007. Подставив найденное значение вероятности в равенство (*) находим, что P5000(m ≥ 1) = 1 - 0.007 = 0.993. Ответ. Вероятность того, что самолет будет сбит, равна 0.993. Как видите, читатель, вероятность весьма значительная. Однако тот же результат можно найти и применив закон, найденный Пуассоном.
Закон вероятности редких событий (закон Пуассона). Пусть вероятность p события чрезвычайно мала, т. е. p→0, а количество испытаний n чрезвычайно велико, т. е. n→∞. Обозначим через λ произведение λ = p·n. Тогда вероятность Pn(m) того, что при n испытаниях событие произойдет ровно m раз можно найти, воспользовавшись формулой
Pn (m) =
λm ⋅ e − λ m!
.
(10)
Замечание 5.1. В отличие от закона Бернулли, применение результатов которого гарантирует точное вычисление значения вероятности, применение закона Пуассона позволяет вычислить искомую вероятность приближенно. Однако ошибка, возникающая вследствие применения закона Пуассона вместо закона Бернулли, чрезвычайно мала и практически не влияет на точность результатов при решении прикладных задач. Что означают выражения «чрезвычайно мала» и «чрезвычайно велика» в общем случае решается отдельно для каждого конкретного случая. При решении
65
большинства прикладных задач достаточно точное значение искомой вероятности можно найти, если число p < 0.1, число n ≥ 100. Доказано, что во всех случаях применение закона Пуассона возможно при p<<0.5 и n>>10. Применим закон Пуассона для решения задачи, изложенной в примере 5.5. Решение. Второй способ. В нашем случае n = 5000, m = 0, p = 0.001. Откуда следует, что произведение λ = p · n = 0.001 · 5000=5. Подставив численные значения n = 5000, m = 0, λ = 5 в формулу (10) находим, что 5 0 ⋅ e −5 λm ⋅ e − λ = P5000 (0) = ≈ 0.0067. Pn (m) = 0! m! Применив формулу (9) для вычисления вероятности противоположного события находим, что P5000(m ≥ 1) = 1 - 0.0067 = 0.9933. Найденный результат практически совпадает с результатом, найденным применением закона (8) Бернулли. Вычисления, необходимые в случае применения закона Пуассона вместо закона Бернулли менее громоздки. В частности, при их использовании отпадает необходимость вычисления значений n! при больших n, создающие значительные вычислительные трудности. Например, необходимость применения формулы (7) Стирлинга. Если в рамках того же примера 5.5 заменить 5000 пуль на 5000 мелких, незначительных факторов, которые взятые по отдельности не могут причинить существенного вреда личности, а в качестве мишени не самолет, а человека, то, путем несложных рассуждений, применив закон Пуассона, нетрудно найти вероятностную математическую модель становления личности, для которой прием наркотиков сделался обязательным атрибутом социальной адекватности. Предлагаем читателю самостоятельно найти вероятностные математические модели, описывающие результаты воздействия на личность рекламы, конфессионально сектантской пропаганды, пропаганды гедонистического времяпрепровождения и т. п.
66
ЗАДАЧИ К §5
Задача 5.1. Предположим, что в некоторой силовой структуре, из многолетнего опыта работы N-ского подразделения известно, что в половине операций по задержанию дельцов наркомафии операции заканчивались успешно. Предположим, что в течение некоторого времени подразделение провело 11 операций, из которых 6 оказались успешными. Будет ли правильным доклад руководству о том, что бойцы подразделения стали проводить операции по задержанию успешнее, чем раньше? Решение. В нашем случае имеем схему независимых испытаний Бернулли. Значения величин, входящих в формулу (8), соответственно равны: n = 11, m = 6, p = 0.5. Подставив значения чисел n, p и m = 0, 1 , 2, 3,...,11 - количеств успешно проведенных задержаний в формулу (8), найдем вероятности того, что успех будет достигнут ни в одной, в одной, в двух и т. д., во всех 11 операциях. Выполнив вычисления, например применением подпрограммы NARKSIT. MTH или с помощью инженерного микрокалькулятора находим, что P(0) = 4.9 · 10-4, P(1) = 0.005, P(2) = 0.027, P(3) = 0.08, P(4) = 0.16, P(5) = 0.226, P(6) = 0.226, P(7) = 0.16, P(8) = 0.08, P(9) = 0.027, P(10) = 0.005, P(11) = 4.9 · 10-4. Найденный результат доказывает, что вероятность P(5) = 0.226 успешной операции по задержанию дельцов наркомафии в 5 случаях из 11 равна вероятности P(6) = 0.226 успешного задержания в 6 случаях из 11. Поэтому вывод о том, что бойцы подразделения стали работать успешнее, преждевременен, научно не обоснован и дезинформирует руководство силовой структуры. Задача 5.2. Начертить график, с помощью которого можно визуально проиллюстрировать изменение вероятности успешного задержания в зависимости от числа операций в задаче 5.1. Решение. Обозначив на плоскости точками координаты количеств успешных задержаний и соответствующих им вычисленных в решении задачи 5.1 вероятностей, соединим обозначенные точки кривой. Найденный график помещен на рис. 4.
67
Рис.4. На рис.4: по оси абсцисс - количества успешных задержаний, по оси ординат - вероятность успешного задержания. Задача 5.3. Рассчитана больше на проверку интуиции, чем на знания. Как вы думаете, чему равна площадь под кривой на рис.4? Ответ. Площадь под кривой равна 1. Задача 5.4. Ромео не употребляет наркотики. Однако в компании друзей Джульетты принято употреблять наркотики т. к. им известно, что многие модные музыканты, художники и диск-жокеи наркотики употребляют. Пусть вероятность того, что ради любимой Джульетты Ромео сменит свои убеждения и начнет употреблять наркотики, очень мала и равна 0.01. Какова вероятность того, что в течение года, общаясь с Джульеттой и ее друзьями, Ромео начнет принимать наркотики? Решение. Вероятность того, что Ромео начнет принимать наркотики, мала – p = 0.01, но число дней в году велико – n = 365. Пусть воспитанный в благополучной семье феодалов Ромео морально устойчив и вероятность того, что его антинаркотические убеждения пошатнутся, не изменится в зависимости от внешних обстоятельств. Таким образом, общение Ромео с наркоманами есть независимые испытания моральной устойчивости Ромео.
68
Следовательно, применима формула (10) Пуассона. Вычислим значение характеристики λ. λ = np = 365 · 0.01 = 3.65. Обозначим через P(0) вероятность события состоящего в том, что Ромео ни разу не примет наркотики. Для такого события значение числа m - количества раз, которое Ромео примет наркотики, равно нулю. Применив формулу (10) находим, что 3.650 ⋅ 2.718 −3.65 P(0) = = 0.028. 0! Вычислим вероятность противоположного события - «Ромео начнет принимать наркотики». 1 - 0.026 = 0.974. Ответ. Вероятность того, что Ромео начнет принимать наркотики, равна 0.974. Задача 5.5. Существует народная мудрость: «Зануда - это тот, кому легче уступить, чем доказать, что ты с ним не согласен». Какой математической моделью можно описать воздействие зануды на принятие решений его оппонентом? Ответ. Моделью Пуассона. Задача 5.6. Найти вероятность того, что подброшенная монета 1, 2, 3,...,n раз упадет «гербом» вверх. Решение. Вероятность выпадения «герба» не меняется от испытания к испытанию. Следовательно, мы имеем случай независимых испытаний, для которого применима формула (8) Бернулли. Известно, что вероятность p = 0.5 - вероятность выпадения «герба» при одном испытании. Известно, что общее число испытаний n. При этом в каждом из испытаний должен выпасть «герб». Следовательно, в нашем случае n = m - числу выпадений «герба». Подставив в формулу (8) значение m = n и выполнив алгебраические преобразования, находим, что Pn(n) - вероятность того, что при n испытаниях монета выпадет «гербом» n раз подряд, вычисляется по формуле Pn(n)=2-n. Выполнив вычисления, находим, что при n = 1, P1(1) = 2-1= 0.5, при n = 2, P2(2) = 2-2 = 0.25, при n = 3, P3(3) = 2-3 = 0.125. Продолжая вычисления, нетрудно найти, что монета, брошенная 10 раз, может выпасть десять раз подряд «гербом» с вероятностью P10(10) = 2-10 = 9.77·10-4. Найденный результат может быть применен к оценке вероятности правдивых ответов наркомана на вопросы эксперта. Известно и напечатано, например, в «Справочнике по психиатрии» [5], что: «...лживость наркоманов не знает границ». Предположим, что эксперту повезло, и он
69
беседует с «кристально честным» наркоманом. Пусть этот наркоман лжет всего в половине случаев. Тогда вероятность того, что наркоман ответил на 10 вопросов эксперта правдиво или правдиво заполнил анкету, состоящую всего из 10 вопросов, равна 9.77·10-4, т. е. чуть больше одной тысячной. Преобразовав формулу (8) для произвольного значения вероятности p, входящей в качестве параметра в (8), находим, что Pn(n) = pn. Например, если вероятность p того, что наркоман даст правдивый ответ на вопрос эксперта p = 0.1, то вероятность P10(10) того, что наркоман правдиво заполнит анкету из 10 вопросов P10(10) = 0.110 = 10-10, т. е. практически равна нулю. Такова оценка вероятности правильности результатов экспертных оценок.
70
§6. О СФЕРЕ ПРИМЕНИМОСТИ ЗАКОНА НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ ОЦЕНКЕ НАРКОСИТУАЦИИ Вероятность, основанная на ежедневном опыте или преувеличенная страхом и надеждою, поражает нас более, чем вероятность высшая, но являющаяся простым результатом исчисления. П. Лаплас 1. Краткая историческая справка
Замечено, что некоторые из случайных явлений происходят значительно чаще других, некоторые - реже, а некоторые - совсем редко. В силу исторических курьезов такая закономерность появления многих случайных событий была признана за некую норму. Поэтому, закон, описывающий вероятности их появления, был назван законом нормального распределения вероятностей. Термин "нормальное распределение" появился в естествознании относительно недавно - введен в XX веке К. Пирсоном (1857-1936). Считается что первым, кто нашел и начал использовать аналитическое выражение (формулу) закона нормального распределения был английский математик А. Муавр (1667-1754). Позже немецкий математик К. Гаусс (1777-1855) доказал и опубликовал в работе "Теория комбинации наблюдений, подверженных наименьшим ошибкам" [37] результаты, применение которых в отдельных случаях позволяет судить о величинах по их средним значениям. В связи с этим закон нормального распределения называют иногда законом Гаусса. Решения некоторых задач о границах применимости нормального закона найдены французским математиком П. Лапласом (1749-1827) и опубликованы в [45]. Поэтому одно из аналитических выражений, описывающих часто применяемый частный случай нормального закона называют функцией Лапласа. В дореволюционной России сочинения по теории вероятностей ведущих ученых Западной Европы многократно издавались в русских переводах. Например, был издан перевод книги П. Лапласа "Опыт философии теории вероятностей" [47]. Замечание 6.1. Самая старинная из книг по теории вероятностей, которую удалось найти и прочесть автору пособия - это монография
71
русского математика В.Я. Буняковского математической теории вероятностей" [46].
(1804-1889)
"Основания
Значительный вклад в исследования о применимости нормального закона внес основатель русской математической школы П.Л. Чебышев (1821-1894). Обобщением результатов Бернулли. Муавра, Гаусса, Лапласа и Чебышева служит центральная предельная теорема, доказанная русским математиком А.М. Ляпуновым (1857-1918) и опубликованная в 1899-1900 годах в работах "Об одной теореме теории вероятностей" и "Новая форма теоремы о пределе вероятности" [38]. По мнению автора, наиболее глубокое обобщение результатов работ перечисленных авторов в настоящее время можно найти в работе русского математика В.И. Зубова (1930-2000) "Аппроксимация и интерполяция функций в целом в равномерной метрике", опубликованной в книге [39]. В настоящее время результаты работ В.И. Зубова по интерполяции и аппроксимации вероятностных распределений развиваются его последователями и учениками. Например, в работах [40], [41], [42] и др. В целях сообщения о новых результатах публикуются новые работы [43], проводятся научные конференции. 2. Случайные величины
Приведем определения некоторых понятий, полезных для дальнейшего изложения. Определение 6.1. Под случайной величиной будем понимать переменную величину, принимающую то или иное значение в зависимости от исхода испытания. Случайные величины принято обозначать буквами греческого или латинского алфавита. Определение 6.2. Дискретной (прерывной) называют случайную величину, принимающую отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений случайной величины может быть конечным или бесконечным. Определение 6.3. Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Число значений непрерывной случайной величины не только бесконечно, но и несчетно. Замечание 6.2. Настоящие определения дискретной и непрерывной случайных величин не являются строгими в смысле выполнения требований, предъявляемых в современном естествознании к
72
определениям. Строгие определения заинтересованный читатель может найти в энциклопедии [44] и др. специальных источниках. Хрестоматийным примером дискретной случайной величины является величина с численным значением равным числу, написанному на грани кубика и случайно выпавшему при его бросании. Очевидно, что любому значению этой дискретной случайной величины соответствует вероятность 1/6. Примером дискретной случайной величины может служить число лиц, употребляющих наркотики и случайно попавших в обследуемую группу. Примером непрерывной случайной величины является температура приземного слоя окружающего воздуха: с одной стороны, каждое значение температуры может появиться с той, или иной вероятностью. С другой мы никогда не сможем измерить точно значение температуры, т. к. точность нашего измерения всегда будет ограничена точностью прибора, в данном случае термометра. Например, если точность термометра ±0.10 С, то температура 20.20 С и температура 20.2010 С будут для нас неразличимы. Большинство физических величин являются величинами непрерывными: длина, масса, температура, давление, яркость света и т. д. В наиболее полной мере случайные величины описываются законами распределения, которые называются функциями распределения и характеристическими функциями и изучаются в специальных дисциплинах. Замечание 6.3. Заинтересованный читатель, в зависимости от уровня своей естественнонаучной подготовки, может ознакомиться с методами нахождения и применения законов распределения, воспользовавшись учебниками разной сложности. По мнению автора, лиц со средним образованием, а также тех, кто не изучал математику в вузе, вполне удовлетворит учебник для средних специальных учебных заведений [28], имеющих начальное представление о математическом аппарате современной науки в рамках дисциплины "Высшая математика" - учебное пособие [29]. Для лиц с высшим техническим и университетским образованием можно рекомендовать учебник [34], пособия [48], [49] и др. 3. Об иллюзиях в оценке вероятностей
Почти все современные методы поиска закономерностей, применяемые при статистической обработке результатов наблюдений, в основе своей базируются на предположении о том, что найденные экспертами значения результатов опытов подчинены закону нормального распределения. Не вдаваясь пока в подробности того, какая именно случайная величина называется подчиненной нормальному закону и
73
забегая немного вперед, сообщим читателю прискорбную весть - на самом деле, обрабатывая результаты наблюдений, мы практически никогда не сталкиваемся с величинами, распределенными по нормальному закону. Однако формулы, которые принято применять при статистической обработке результатов экспериментов, выведены и доказаны только при условии, что исследуемое явление есть проявление нормальных законов. Поэтому, даже и при правильных результатах арифметических вычислений, эксперты вынуждены мириться с найденными таким способом результатами, весьма далекими от истинных значений оценок и являющихся по сути софизмами. О возможности появления ошибок такого рода в естествознании, в частности, среди медицинских и общественнозначимых оценок, предупреждал еще в начале XIX в. П. Лаплас. Замечание 6.4. В целях выполнения требований к точности результатов, предъявляемых в современной доказательной медицине и регламентированных Государственными стандартами России, в настоящем пособии излагаются методы оценки наркоситуации, свободные от принятия гипотезы о том, что результаты наших наблюдений и оценок непременно должны подчиняться нормальному закону. Напечатанный выше заголовок "Об иллюзиях в оценке вероятностей" заимствован автором пособия из книги П. Лапласа "Опыт философии теории вероятностей", вышедшей в Париже в 1814 г. В 1908 г. в России издан ее перевод [47]. По мнению автора, высказанные П. Лапласом в начале XIX в. замечания столь не утратили актуальности и сегодня, что вряд ли можно лучше начать изложение, чем переписав фрагмент из признанной в настоящее время классической книги [47] П. Лапласа. /Начало фрагмента./ ... Наши страсти, наши предрассудки и господствующие взгляды, преувеличивая благоприятствующие им вероятности и уменьшая противоположные, являются обильными источниками опасных иллюзий. Настоящее зло и причина, порождающая его, действуют на нас гораздо сильнее, чем воспоминания о зле, причиненном противоположной причиной; оно мешает нам справедливо оценить недостатки того и другого и вероятность тех средств, которые могли бы предохранить нас от них. Это и толкает поочередно к деспотизму и анархии народы, вышедшие из состояния покоя, к которому они и возвращаются всегда лишь после долгих и жестоких волнений. ... Одна из больших заслуг исчисления вероятностей - та, что оно учит не доверять первым впечатлениям. Так как в тех случаях, когда можно их
74
подвергнуть исчислению, оказывается, что они часто обманывают, то отсюда должно заключить, что и в других случаях следует на них полагаться лишь с крайней осмотрительностью. ... Существует при оценке вероятностей один ряд иллюзий, который, завися специально от законов устройства ума, требует для того, чтобы оградить себя от них, глубокого испытания этих законов. Желание проникнуть в будущее и отношение некоторых замечательных событий к предсказаниям астрологов, гадателей и жрецов, к предчувствиям и снам, к числам и дням, слывущим счастливыми или несчастливыми, породили массу предрассудков, еще и теперь очень распространенных. Совсем не думают о большом числе несовпадений, которые не произвели никакого впечатления или остались неизвестными; между тем как необходимо знать их, чтобы оценить вероятность причин, которым приписывают совпадения. Это знание без сомнения подтвердило бы то, что диктует нам разум относительно этих предрассудков. ... Все эти предрассудки и страх, внушаемый ими, зависят от физиологических причин, которые продолжают действовать и после того, как разум нас вывел из заблуждения. /Конец фрагмента./ Следуя рекомендациям П. Лапласа, углубим наше знание о том, как и какими методами, а также с какой достоверностью мы можем судить о значениях вероятности тех, или иных событий. Некоторое визуальное представление об исследуемой случайной величине можно получить, взглянув на ее гистограмму. Разъясним это понятие. С этой целью изложим необходимые определения. Определение 6.4. Множество всех возможных значений случайной величины называется генеральной совокупностью значений случайной величины или генеральной совокупностью. Определение 6.5. Выборочной совокупностью (выборкой) значений случайной величины называется множество, состоящее из случайно отобранных значений случайной величины. Как правило, мы не имеем в наличии генеральной совокупности значений случайной величины. Например, мы не знаем точно и вряд ли можем знать всех наркоманов и не наркоманов России. Выполняя исследование наркоситуации, мы почти всегда сталкиваемся с обследованием ограниченного контингента лиц. Например, ограничиваемся обследованием нескольких школ, вузов, дискотек, мест лишения свободы и т. д. Такое обследование всегда является выборочным,
75
а попавшие в него объекты - случайно отобранными. Вместе с тем, наша задача заключается в том, чтобы по результатам выборочного обследования сделать наиболее адекватные заключения о наркоситуации в целом. Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно ее представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Такое требование к свойствам выборки называется требованием репрезентативности (представительности) выборки. При нахождении вероятностей событий используются понятия "выборка с возвращением" и "выборка без возвращения". Предположим, наш опыт состоит в вытаскивании наугад карты из колоды, состоящей из 36 карт. Очевидно, что т. к. в колоде 36 карт и из них 4 "туза", то мы имеем дело с полной группой событий, состоящей из 36 возможных событий, 4 из которых благоприятные. Таким образом, m = 4 - число благоприятных исходов, n = 36 - общее возможное число исходов и вероятность p вытащить "туза" мы вправе вычислить, как p = m/n = 4/36 = 1/9. Но можно ли из колоды карт, в которой всего 4 "туза" вытащить 5 "тузов"? Оказывается, можно. Для этого, после вытаскивания любой случайной карты, ее нужно возвратить в колоду. В таком и только в таком случае вероятность вытаскивания "туза" всегда будет оставаться постоянной и равной 1/9. Очевидно, что при таких условиях опыта "туз" можно вытащить и не только 5, но любое большее количество раз. Определение 6.6. Испытание, при котором извлеченный элемент после испытания возвращается в совокупность, называется испытанием, выполненным с использованием повторной выборки (выборки с возвращением). В противном случае мы имеем дело с выборкой без возвращения. Очевидно, что при выборке с возвращением вероятность исследуемого события не меняется. Например, сколько бы раз мы не вытаскивали произвольную карту из колоды, но если перед вытаскиванием следующей карты возвратим предыдущую в колоду снова, вероятность вытащить "туз" будет всегда постоянной и равной 1/9. Замечание 6.5. Только при выполнении условий опыта "выборка с возвращением" применение формулы Бернулли (8) легитимно. В противном случае, применение формулы (8) недопустимо, т. к. неизбежно приведет к ошибке. Случай ошибочного применения формулы Бернулли,
76
повлекший ошибку в вычислении значения вероятности, изложен в неправильном решении примера 5.3. Одним из средств визуализации результатов выборочного обследования является гистограмма. В целях доступности объяснения понятия "гистограмма" начнем с примера ее нахождения. В нашем распоряжении имеется база данных наблюдений за погодой в Санкт-Петербурге (СПб) с 1865 г. В приложении 2 пособия напечатаны результаты измерений среднесуточных температур приземного слоя окружающего воздуха в СПб за 10 января с 1865 г. Замечание 6.6. Те же данные температур применены при написании книги "Математические основы экологии" [50]. Из таблицы приложения 2 нетрудно увидеть, что вопреки распространенному мнению о том, что самые низкие зимние температуры в СПб (Ленинграде) были в годы гитлеровской блокады, самая назкая среднесуточная температура за 10 января в СПб была в 1987 г. и равнялась -33.6 50 0 С. Самая высокая - в 1971 г. и равнялась +3.8 50 0 С. Все остальные зарегистрированные значения среднесуточных температур находятся в интервале [-33.6, +3.8]. Определение 6.7. Назовем разбросом (размахом варьирования) выборочных значений случайной величины величину R, определяемую через аналитическое выражение R = xmax - xmin,
(11)
где xmax - наибольнее численное значение, xmin - наименьшее численное значение случайной величины из выборки ее значений. Размах является простейшей характеристикой рассеяния случайной величины. Для нахождения гистограммы величину размаха разбивают на несколько частичных интервалов длиной h и находят, сколько значений из выборки оказалось в каждом частичном интервале. В целях удобства перед нахождением гистограммы рекомендуется все имеющиеся выборочные значения случайной величины расположить в порядке неубывания. Определение 6.8. Упорядочивание выборки (невозрастанию) называется ранжированием (невозрастанию).
по по
неубыванию неубыванию
77
Пример 6.1. Дана выборка: 3, 3, 1, 9, 9, 9, 10, 7. Ранжировать ее по неубыванию и по невозрастанию и найти значение разброса. Решение. Применив определение ранжирования, находим, что ранжированная по неубыванию выборка будет 1, 3, 3, 7, 9, 9, 9, 10 . По невозрастанию – 10, 9, 9, 9, 7, 3, 3, 1. В рассматриваемой выборке xmax = 10, xmin = 1. Применив формулу (11) находим, что значение разброса равно R = 10 - 1 = 9. Элементы ранжированной выборки принято нумеровать. Например, первому элементу ранжированной по неубыванию выборки из примера 6.1 присвоим номер 1, второму - 2 и т.д. В общем виде, если ранжированная выборка содержит n элементов, то ее можно записать, как x1, x2, x3,..., xn. Вернемся к описанию процесса нахождения гистограммы. Пусть мы выбрали какую-либо длину частичных интервалов h, не превышающую значения разброса R и разбили весь интервал значений случайной величины на частичные интервалы h1, h2, h3 и т. д. Обозначим через ni - количество значений случайной величины, попавших в i-й интервал. Определение 6.9. Гистограммой будем называть ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные отрезки длиной h и высоты которых равны отношению ni/n. Таким образом, если принять h = R, мы получим гистограмму, состоящую из одного прямоугольника, если принять за h = R/2 гистограмма будет состоять из 2-х прямоугольников, h = R/3 - из трех прямоугольников и т. д. Пример 6.2. Найти гистограммы значений среднесуточных температур приземного слоя окружающего воздуха в СПб за 10 января, состоящие из двух, трех, семи и десяти прямоугольников. Решение. Вычислим значение разброса температур. Воспользовавшись формулой (11) и значениями температур из приложения 2 находим: R = (+3.8) - (-33.6) = 37.4. Длины оснований прямоугольников для гистограмм, состоящих из двух, трех, семи и десяти прямоугольников будут соответственно равны: 37.4/2=18.7, 37.4/3=12.467, 37.4/7=5.34, 37.4/10=3.74. Высоты найденных прямоугольников нетрудно вычислить, воспользовавшись значениями температур, помещенными в таблице приложения 2 и сосчитав, сколько значений температур попало в каждый интервал, а затем поделив эти числа значений на n = 132 - объем выборки. Найденные гистограммы помещены на рис.5, 6, 7, 8.
78
Рис.5. На рис.5: гистограмма из двух столбцов.
79
Р Рис.6. На рис.6: гистограмма из трех столбцов. Нетрудно увидеть, что с увеличением количества столбцов гистограммы можно получить более детальное визуальное представление об элементах исследуемой выборки и их относительных количествах.
80
Рис.7. На рис.7: гистограмма из семи столбцов Замечание 6.7. В настоящее время процесс нахождения гистограмм полностью автоматизирован. На Российском рынке имеется огромное количество программных продуктов, применение которых сводит построение гистограммы к нажатию нескольких клавиш компьютера. К таким пакетам прикладных статистических программ относятся общеизвестные и общедоступные пакеты SPSS, STATISTICA, NCSS AND PASS и др. По вопросам применения пакетов издается постоянно обновляющаяся специальная литература. Примером такой литературы служит книга [51] и др..
81
Рис.8. На рис.8: гистограмма из десяти столбцов. К сожалению, прикладная ценность гистограммы незначительна. В некоторых изложениях можно найти заявления о том, что по форме гистограммы визуально можно оценить закон распределения изучаемой случайной величины. В частности утверждается, что если исследуемая гистограмма может быть "сглажена горкой", график которой является графиком функции − 1 y ( x) = e σ 2π
( x − а )2 2σ 2
,
(12)
где a и σ > 0 - некоторые постоянные числа, то исследуемая случайная величина распределена нормально. В целях иллюстрации такого заявления на рис.9 помещена гистограмма и "сглаживающая ее горка" функции y(x).
82
Рис.9. К сожалению, такое заявление не только не соответствует действительности, но и оказывает вредное влияние на достоверность предъявляемых научных результатов. Для решения задач о принадлежности исследуемых величин, численные значения которых являются результатами наших экспериментов к тому или иному закону распределения, в современной математической статистике применяются специальные критерии. Умение правильно пользоваться статистическими критериями требует от исследователя наличия высшего образования по специальности "Теория вероятностей и математическая статистика". Компетентный математик, подготовленный не по названной специальности, не склонен к заявлению о том, что он владеет аппаратом математической статистики в достаточном для решения научных задач объеме. Тем более заявления лиц, не имеющих математического образования, о том, что "ими выполнена статистическая проверка", звучат слишком торжественно.
83
Замечание 6.8. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Нормально распределенной случайной величиной ξ называется величина, функция распределения F(x) которой задана аналитическим выражением x − (t − a ) 2 e 2σ
2
F ( x) =
1 σ 2π
∫
dt.
(12)
−∞
В целях соответствия результатов исследований требованиям к точности, предъявляемым в современном естествознании, В СССР и в России, правила использования статистических критериев и границы их применимости законодательно регламентированы Государственными стандартами. Проверку того, к какому именно закону распределения принадлежит исследуемая случайная величина, требуется выполнять, исходя из требований, изложенных в Государственном стандарте [52]. В частности, требования для проверки значений параметров a и σ нормально распределенных случайных величин изложены в Государственном стандарте [53]. В настоящее время Государственные стандарты [52], [53], в целях соответствия изложенным в них требованиям международных стандартов, модифицированы. В частности, модифицированные требования, содержание которых передано текстом, аутентичным международному стандарту, можно найти в документе [54] и в других Государственных документах. Теоретическое обоснование требований, регламентированных Государственными стандартами, заинтересованный читатель может найти в книге [55] и др. В целях ознакомления читателя с критериями, применение которых позволяет объективизировать наши представления о законах распределения, остановимся на самых простых в применении критериях. 4. Простейшие критерии согласия
Изложенные ниже критерии согласия не могут служить достаточным основанием для заключения о том, что найденные нами в результате экспериментов значения изучаемой случайной величины распределены нормально: современные требования, предъявляемые к результатам научных исследований и изложенные в Государственных стандартах значительно строже. Тем не менее, результаты проверки выборочных данных на соответствие нормальному закону распределения, выполненные применением самых простых критериев, могут пусть и поверхностно, но все же обоснованно указать направление дальнейших действий. Говоря
84
словами сыщиков: "Когда есть холодное тело, нужно сразу же искать по горячим следам". Пусть дана выборка значений результатов некоторого эксперимента или результатов измерений и пусть выборка ранжирована по неубыванию. Обозначим такую выборку через X = {x1, x2, x3, ..., xn},
(14)
где x1, x2, x3, ..., xn - какие-то числа, являющиеся результатами измерений исследуемой в опыте величины X, нижний цифровой индекс при каждом элементе выборки обозначает порядковый номер элемента в выборке, n объем выборки, т. е. число, соответствующее количеству элементов, содержащихся в выборке. Например, если n = 20, то это означает, что в выборке содержится 20 элементов x1,...x20 или, в другой форме записи, {xi}, I = 1,.,20, т. к. иногда выборку (14) записывают, как X = {xi}, i = 1,.,n. Вследствие того, что выборка (14) ранжирована по неубыванию, между элементами xi, i = 1,.,n имеет место соотношение x1 ≤ x2 ≤ x3 ≤ ... ≤ xn. Определение 6.10. Назовем точечной оценкой среднего арифметического число xср., вычисляемое применением формулы x1 + x2 + x3 + ... + xn 1 n (15) хср. = = ∑ xi . n n i =1 Например, если выборка X = {1,2,3}, то, применив формулу (15), находим, что
1+ 2 + 3 = 2. 3 Нетрудно догадаться, что число xср., во-первых, весьма приблизительно характеризует выборку, во вторых, в общем случае, не является числом постоянным. Так, если мы выполним какой-то еще один опыт, в результате которого обнаружим, что значение исследуемой нами случайной величины равно 4, то наша выборка станет выборкой X = {1, 2, 3, 4} со значением хср. =
xср. = (1+2+3+4)/4 = 2.5, которое уже по-другому характеризует исследуемую нами величину, т. к. 2.5 ≠ 2. Получается, что с каждым новым опытом мы можем вычислить новое значение числа xср., а значит каждый новый опыт изменит результат. Можно ли в таком случае сказать что-то определенное о значении xср.? И в сколь затруднительном положении оказывается государственный
85
чиновник, вынужденный принимать решение, опираясь на заявления экспертов о том, что "в среднем среди учащейся молодежи такой-то процент наркоманов"? В рамках теоретических рассуждений очевидно, что при каком-то большом увеличении объема n выборки число xср. будет стремиться к числу x* постоянному, т. е. 1 n lim ∑ xi = x * n →∞ n i =1 Однако сколь большим должно стать число n, чтобы выполнилось равенство xср.= x*? В широко распространенной литературе по экспертным оценкам наркоситуации в России автор не только ни разу не нашел ответа на этот вопрос, но и самого вопроса. Замечание 6.9. Единственным исключением оказался отчет о научноисследовательской работе [10], выполненный в Национальном институте здоровья. Очевидно, что знания значения числа xср. при оценке наркоситуации недостаточно. Нужно еще какое-то число, характеризующее все элементы выборки. Определение 6.11. Будем называть точечной оценкой выборочной дисперсии S2 число, вычисляемое применением формулы 1 n S 2 = ∑ xi − xср. 2 . (16) n i =1 Однако, число S2 обладает тем же недостатком, что и число xср. - при изменении объема выборки n оно будет изменяться.
(
)
Замечание 6.10. При выполнении некоторых расчетов в знаменателе дроби, стоящей в правой части выражения (16), вместо числа n применяют число n + 1. Такое изменение формулы (16) позволяет вычислить так называемую несмещенную точечную оценку дисперсии. Доказано, что несмещенная точечная оценка дисперсии несколько точнее характеризует свойства выборки, но, тем не менее, остается весьма приблизительной. Пример 6.3. Вычислим точечную оценку выборочной дисперсии для выборки X = {1, 2, 3}. Решение. Оценка xср. для выборки уже найдена: xср.= 2. Применив формулу (16) находим: S2 =
(
)
1 (1 − 2)2 + (2 − 2)2 + (3 − 2)2 = 2 . 3 3
86
При всех недостатках числа S2 оно все же позволяет в какой-то мере полнее охарактеризовать выборку. Например, если взять две выборки: X={1, 2, 3} и Y={2, 2, 2}, то выполнив вычисления нетрудно убедиться в том, что значение xср.= yср.= 2. Вместе с тем значение 1 S 2 = (2 − 2)2 + (2 − 2)2 + (2 − 2 )2 = 0. 3
(
)
т. е. Sx2 ≠ Sy2. Замечание 6.11. Нижними индексами у величин Sx2 и Sy2 обозначено то, что они характеризуют разные выборки, т. е. выборки X и Y. Подведем итог. Значения точечных оценок средних арифметических рассмотренных выборок X и Y равны, однако значения точечных оценок дисперсий не равны: Sx2 = 2/3, Sy2 = 0. Последнее в какой-то мере свидетельствует о том, что значения элементов выборки X отличны от значения xср.= 2 больше, чем значения элементов выборки Y от значения yср.= 2. Точечная оценка среднего арифметического случайной величины дает нам первое ориентировочное представление о ней. Однако гораздо чаще встречаются случаи, в которых наиболее важные для практических целей свойства случайной величины требуют более детального рассмотрения. Пример 6.4. В отряде специального назначения по пресечению незаконной деятельности наркодельцов два снайпера. Отряду предстоит серьезная операция, в которой необходимо участие квалифицированных снайперов, однако в силу оперативных особенностей операции задействован в операции по пресечению может быть только один снайпер. В целях оценки квалификации снайперов между ними провели небольшое экспресс-соревнование, в котором требовалось выяснить, какой из двух снайперов из трех выстрелов по мишени наберет большее число очков. Мишени были устроены так, что при стрельбе по ним за один выстрел можно было набрать 0 (промах), одно, два или три очка. Результаты экспресс-соревнования помещены в таблицу 1.
87
ТАБЛИЦА 1 РЕЗУЛЬТАТЫ СНАЙПЕРОВ № выстрела
Число очков снайпера 1
Число очков снайпера 2
1 2 3
3 0 3
2 2 2
Обозначим через xср. и yср. - точечные оценки среднего числа набранных очков снайпером 1 и снайпером 2 и вычислим их. xср = (1/3)(3+0+3) = 2, yср. = (1/3)(2+2+2) = 2. Приходим к заключению, что xср.= yср.= 2, т. е. сравнение значений точечных оценок средних не позволяет решить задачу о том, какой из снайперов является стрелком более квалифицированным. Кого же из снайперов выбрать для проведения ответственной операции по пресечению незаконной деятельности наркодельцов? Обозначим через Sx2 и Sy2 - точечные оценки дисперсий первого и второго снайперов. Выполнив вычисления, находим, что Sx2= (1/3)((3-2)2 + (0-2)2 + (3-2)2) = 6/3 = 2, Sy2= (1/3)((2-2)2 + (2-2)2 + (2-2)2) = 0, т. е. численные значения точечных оценок дисперсий снайперов разные: Sx2 ≠ Sy2, Sx2 > Sy2. Применение найденного результата - вычисленных значений точечных оценок дисперсий, предоставляет больше возможностей для решения задачи сравнения квалификации снайперов. Выполнив сравнение, приходим к заключению, что, несмотря на одинаковые средние показатели, квалификация снайперов разная. Результаты первого снайпера менее устойчивы, чем второго. Практически это означает то, что если к операции будет привлечен первый снайпер, то в результате проведения спецоперации наркодельцы, скорее всего, не предстанут перед судом - либо смогут скрыться, т. к. снайпер промахнется, либо будут уничтожены в результате очень точного попадания пули. Если же к выполнению спецоперации привлечь второго снайпера, то, скорее всего наркодельцы, после оказанной им квалифицированной медицинской помощи, предстанут перед судом, т. к. скорее всего, второй снайпер нанесет им тяжелые ранения, вследствие которых наркодельцы будут не в состоянии оказать сопротивление бойцам спецотряда.
88
Более точно и научно обоснованно оценить квалификацию снайперов можно, применив метод доверительных интервалов. С методом доверительных интервалов читатель ознакомится в последующих параграфах пособия. Несмотря на очевидную простоту вычислений, применение точечной оценки дисперсии при решении задач оценки наркоситуации может оказать существенную помощь. В частности, значение точечной оценки дисперсии может служить хоть и приблизительной, но мерой оценки устойчивости результатов наблюдений и экспериментов. Примеры применения оценки дисперсии при решении разных задач естествознания в научно-популярном изложении заинтересованный читатель может найти в книге "Элементарное введение в теорию вероятностей" [56]. Замечание 6.12. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Примененное в пособии упрощенные определение дисперсии случайной величины не являются строгим в смысле выполнения требований, предъявляемых в современном естествознании к определениям. В целях полноты изложения напомним определение дисперсии. Дисперсией DX непрерывной случайной величины ξ называется центральный момент второго порядка, определяемый аналитическим выражением DX =
+∞
∫ (x − MX )
2
f ( x)dx.
−∞
где f(x) - плотность вероятности случайной величины, MX - начальный момент первого порядка, определяемый аналитическим выражением
MX =
+∞
∫x
f ( x)dx.
−∞
К сожалению, в многочисленных работах, написанных на основании заключений экспертов и претендующих на решение государственной задачи оценки наркоситуации, автору пособия не удалось найти примеров применения ни оценок дисперсии, ни других принятых в мировой науке и законодательно рекомендованных к применению характеристик. Своеобразными исключениями являются разве что многочисленные примеры применения противоречивых экспертных оценок среднего арифметического и процентных оценок. По мнению автора,
89
противоречивые экспертные оценки наркоситуации в России не могут быть использованы уполномоченными чиновниками государственного аппарата при решении задач управления и контроля. Очевидно, что названные задачи могут быть решены только при поручении решения задач оценки наркоситуации в России дипломированным государственными органами специалистам по математическому моделированию. В некоторых случаях при решении теоретических и прикладных задач применяется оценка S, называемая точечной оценкой среднеквадратического отклонения и определяемая аналитическим выражением
S = S2.
(17)
Случаи, в которых применяется оценка S, будут рассмотрены ниже. Продолжим изложение материала о простейших критериях согласия. Существуют критерии согласия, предназначенные для принятия или отклонения гипотез о законах распределения исследуемых случайных величин. Остановимся на критериях и методах их применения, предназначенных для проверки гипотезы о том, что исследуемая случайная величина распределена по нормальному закону. Напомним, для каких целей нужна проверка гипотезы о том, что найденные в результате выполнения экспериментов численные значения результатов измерений распределены по нормальному закону: имеющиеся в распоряжении исследователя аналитические выражения, предназначенные для нахождения вероятностных оценок, в большинстве случаев предназначены для обработки результатов измерений, распределенных по нормальному закону. Если же исследователь имеет в своем распоряжении результаты опытов и измерений, не распределенные по нормальному закону, то большинство формул, напечатанных в многочисленных пособиях и справочниках по статистической обработке результатов измерений неприменимы, так как их формальное применение приведет к ошибочным результатам. Образцы таких добросовестных заблуждений мы нередко находим в отчетах по научно-исследовательской работе, в которых статистическая обработка выполнена не специалистами по математическому моделированию, а врачами, физиологами, социологами и другими неспециалистами в этой области. Пожалуй, самым простым для применения критерием является критерий "трех сигм".
90
Критерий "трех сигм" Если доля результатов измерений, входящих в границы "трех сигм", составляет примерно 0.9973 от всех результатов измерений, то есть основания предполагать, что результаты измерений извлечены из генеральной совокупности численных значений нормально распределенной случайной величины. Покажем метод применения критерия "трех сигм" на примере. Пример 6.5. В приемный покой больницы №17 в СПб за сутки поступило 20 больных, вызвавших подозрение врачей о том, что эти больные находятся в состоянии алкогольного опьянения. Результаты последовавшего анализа крови этих больных подтвердили подозрение врачей. В таблице 2 расположены порядковые номера больных и количества промилле алкоголя, найденного в крови больного. ТАБЛИЦА 2 СОДЕРЖАНИЕ АЛКОГОЛЯ В КРОВИ В ПРОМИЛЛЕ № Содержание № Содержание больного алкоголя в больного алкоголя в крови крови 1 2 3 4 5 6 7
1.3 0.5 3 0.6 3 3.3 2
8 9 10 11 12 13 14
2.9 1.3 3.3 1.4 0.5 1 0.6
№ больного
Содержание алкоголя в крови
15 16 17 18 19 20
3.2 0.7 1.7 3.8 3.2 1.3
Замечание 6.13. В России в рамках медицины считается, что состояние человека можно квалифицировать, как состояние опьянения, начиная с концентрации алкоголя в крови, равной 0.5 промилле - "легкое опьянение". Известно, что по внешним признакам опьянения, содержанию алкоголя в крови близкому к двум промилле соответствуют признаки неустойчивой походки и нечеткой речи. Три промилле алкоголя в крови соответствуют состоянию крайне тяжелого опьянения и считаются смертельной дозой алкоголя для человека. Из рассказов врачей автору известно, что нередки случаи поступления больных с дозой алкоголя в крови, значительно превышающей смертельную дозу для человека. Своеобразным рекордом содержания алкоголя в крови, зарегистрированным в 17-й больнице
91
Санкт-Петербурга, было содержание алкоголя в крови, равное восьми промилле. Рекордсменом оказалось существо, внешним видом выдающее себя за молодую самку Homo sapiens. Проспавшись, существо совершило побег из больницы. Личность существа установить не удалось. Согласно показаниям свидетелей, видевших существо проснувшимся, существо способно вступать в речевой контакт, использовать нерегламентированные речевые слова и обороты, высказывать неуважение по отношению к государственным чиновникам России, а также осуществлять длинные монологи о правах человека. По сведениям, полученным от врачей 17-й городской больницы, существа с содержанием алкоголя в крови превышающем три промилле, склонны к аналогичному поведению. Применением критерия "трех сигм" сделать заключение о том, есть ли основание предполагать, что значения концентрации алкоголя в крови пациентов распределены нормально. Решение. Будем считать, что концентрация алкоголя в крови непрерывная случайная величина, которую мы обозначим через X, а количества алкоголя, выраженные в промилле есть численные значения этой случайной величины, которые мы обозначим через xi, i=1,...,20. В целях удобства расчетов ранжируем по неубыванию ряд выборочных значений концентрации алкоголя в крови. В результате получим неубывающий числовой ряд значений концентраций алкоголя в крови, состоящий из двадцати элементов: 0.5, 0.5, 0.6, 0.6, 0.7, 1, 1.3, 1.3, 1.3, 1.4, 1.7, 2, 2.9, 3, 3, 3.2, 3.2, 3.3, 3.3 3.8. В этом ряду первый элемент - x1 = 0.5, второй - x2 = 0.5, третий x3 = 0.6, ... , двадцатый - x20 = 3.8. Применив формулы (15) и (16), вычислим точечную оценку среднего арифметического xср. концентраций алкоголя в крови и точечную оценку дисперсии S2. Выполнив вычисления с точностью до сотых долей, находим, что: xср. = 1.93, S2 = 1.25, S = 1.12. Для применения критерия "трех сигм", численное значение характеристики S приравнивают величине, обозначаемой, как σ. В нашем случае, S= σ = 1.12. После этого, значение умножают на 3. В нашем случае 3·σ = 3·01.12 = 3.36. Затем, найденное значение "трех сигм" сначала отнимают, а потом прибавляют к значению xср.. Т. е. находят значения чисел xср. ± 3·σ. В нашем случае: xср.- 3·σ = 1.93 - 3.36 = −1.43, xср. + 3·σ = 1.93 + 3.36 = 5.29. Таким образом, интервал значений, вошедших в xср. ± 3 · σ есть интервал [−1.43, 5.29]. Из условий задачи известно и напечатано в табл.2, что наименьшее значение содержания алкоголя в
92
крови равно 0.5, наибольшее равно 3.8. Следовательно, в найденный нами интервал [-1.43, 5.29] вошли все имеющиеся в таблице 2 значения концентраций алкоголя в крови. Доля значений, которая могла не войти в интервал, равна 1 - 0.9973 = 0.0027, т. е. 20 · 0.0027 = 0.054 значения. 0.054 < 1, т. е. доля возможных значений не составляет и одного элемента выборки. Сформулируем окончательный результат: все элементы исследуемой выборки оказались принадлежащими интервалу xср. ± 3·σ, поэтому есть основание предполагать, что случайная величина, значения которой являются значениями исследуемой выборки, распределена по нормальному закону. Замечание 6.14. Результаты, найденные применением критерия "трех сигм", не являются доказательными. А именно: наличие основания предполагать, что в нашем случае исследуемая случайная величина распределена по нормальному закону, еще не доказывает, что величина действительно распределена по нормальному закону.
Расширение критерия "трех сигм" Одна и та же выборка, проверенная на нормальность закона распределения ее численных значений с помощью разных критериев, может оказаться и выборкой, которую можно считать извлеченной из генеральной совокупности численных значений нормально распределенной случайной величины и, наоборот, выборкой, извлеченной из генеральной совокупности численных значений случайной величины, не распределенной по нормальному закону. Таков, пожалуй, самый серьезный недостаток рассматриваемых нами простейших критериев согласия. Изложенное противоречие на самом деле является кажущимся противоречием: разные результаты, найденные при применении к одним и тем же выборочным данным разных критериев свидетельствуют о том, что результаты применения простейших критериев могут служить не больше, чем самой грубой ориентировкой при решении задачи нахождения закона распределения случайной величины. Однако совпадение результатов, найденных применением разных критериев, увеличивают уверенность в правильности принятой гипотезы о законе распределения случайной величины. Поэтому необходимо знание разных критериев согласия и умение их применять. Расширением критерия "трех сигм" является критерий "двух сигм" и критерий "одной сигмы".
93
Критерии "двух" и "одной сигм" Для того, чтобы можно было предположить, что исследуемая выборка есть выборка значений нормально распределенной случайной величины необходимо, чтобы доля выборки, приходящаяся на интервал значений выборочных данных xср. ± 2·σ была равна 0.9545 и доля выборки, приходящаяся на интервал значений выборочных данных xср. ± σ была равна 0.683. Пример 6.6. Использовав данные из таблицы 2 о содержании алкоголя в крови, применением критерия "двух и одной сигмы", сделать предварительное заключение о принадлежности выборочных данных к генеральной совокупности численных значений нормально распределенной случайной величины. Решение. Использовав из решения примера 6.5 знание о том, что xср.= 1.93, σ = 1.12, находим, что значения xср. ± 2·σ являются границами интервала [-0.31, +4.17]. В найденном интервале находятся все элементы исследуемой выборки; от xmin = 0.5 до xmax = 3.8, т. е. не доля выборки, равная 0.9545. Следовательно, оснований для принятии гипотезы о том, что исследуемая нами случайная величина является нормально распределенной, нет. Найденный результат противоречит применением критерия "трех сигм".
результату,
найденному
Найдем долю элементов выборки, приходящихся на интервал значений xср. + σ. Выполнив очевидные вычисления, находим, что; xср. – σ =1.931.12=0.81, xср. + σ = 1.93+1.12 = 3.05, т. е. искомый интервал значений [0.81, 3.05]. В этот интервал попадают 15 значений из 20 элементов выборки. 15/20 = 0.75, 0.75 ≠ 0.68. Следовательно, и на основании применения критерия "одной сигмы" нельзя считать, что исследуемая выборка есть выборка численных значений нормально распределенной случайной величины. Подведем итог. 1. Результаты применения критерия "трех сигм" свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. 2. Результаты применения критерия "двух сигм" не свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. 3. Результаты применения критерия "одной сигмы" не свидетельствуют в пользу того, что исследуемая нами выборка есть
94
выборка численных значений нормально распределенной случайной величины. Сформулируем окончательный результат применения критериев "трех, двух и одной сигм"; результаты применения указанных критериев не свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. Вследствие того, что примененные критерии являются критериями предварительной оценки, найденный результат является предварительным результатом.
5. Дополнительные сведения о нормальном законе распределения В целях изучения критериев согласия, изложим некоторые дополнительные сведения о нормальном законе распределения непрерывной случайной величины. Определение 6.12. Будем называть непрерывную случайную величину величиной, распределенной по нормальному закону, если закон распределения случайной величины описывается аналитическим выражением (12) y ( x) =
1 e σ 2π
−
( x − a )2 2σ 2
.
(12)
Функцию y(x) в выражении (12) будем называть плотностью распределения нормально распределенной случайной величины. Изучим некоторые свойства функции (12). С этой целью на рис.10 помещена графическая интерпретация (график) функции (12) при значениях характеристик a = 0 и σ = 1.
95
Рис.10. На рис.10. По оси абсцисс - значения аргумента x, по оси ординат значения функции y(x) (12). Если в функции (12) значение параметра а оставить прежним – а = 0, а значения параметра σ изменять, придавая им значения σ = 1, σ = 0.7 и σ = 2, то нетрудно заметить, что увеличение параметра σ ведет к тому, что "горка" графика становится "более высокой и более крутой". Уменьшение параметра σ приводит к тому, что "горка" становится "более низкой и пологой". На рис. 11 помещена графическая интерпретация изменений функции (12) при постоянном значении параметра а = 0 и разных значениях параметра σ: σ = 0.7, σ = 1, σ = 2.
96
Рис.11. На рис.11. По оси ординат: верхняя кривая – а = 0, σ = 0.7, нижняя кривая – а = 0, σ = 2, средняя кривая – а = 0, σ = 1. По оси абсцисс - значения аргумента x. При изменении значений параметра а функции (12): с увеличением значения параметра а "горка" сдвигается вправо, при уменьшении значений параметра а "горка" сдвигается влево. На рис. 12 помещена графическая интерпретация функции (12) при разных значениях параметра а и одинаковых значениях параметра σ = 1.
97
Рис.12. На рис. 12. По оси ординат: левая "горка" - σ = 1, а = -1, средняя "горка" - σ = 1, а = 0, правая "горка" - σ = 1, а = 1. По оси абсцисс значения аргумента x. Доказано, что площадь под любой "горкой" графика функции (12) всегда равна 1, независимо от того, "крутая это горка" или "пологая". Иначе говоря, площадь фигуры, ограниченной осью абсцисс и кривой графика функции (12) всегда равна 1. Это свойство функции (12) позволило применять ее при решении задач исчисления вероятностей: известно, что вероятность p любого события A не может быть меньше 0 или больше 1. Следовательно, любое значение вероятности можно интерпретировать, как часть площади под кривой функции (12). Замечание 6.15. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Указанное свойство площади под кривой функции (12) записывается, как x − (t − a ) 2 e 2σ
2
1 F ( x) = σ 2π
∫
−∞
dt ,
98 x − (t − a ) 2 e 2σ
2
1 σ 2π
∫
dt = 1.
−∞
Последнее равенство - условие нормировки. Для решения многих задач совсем не обязательно знать все возможные значения случайной величины и соответствующие им вероятности. Достаточно указать отдельные числовые параметры, которые позволяют в удобной, компактной форме отразить существенные особенности случайной величины. К таким числовым характеристикам относятся математическое ожидание, дисперсия, моменты разных порядков и т. д. Определим некоторые наиболее важные из характеристик. Определение 6.13. Математическим ожиданием MX случайной величины X называется сумма произведений всех возможных значений случайной величины на соответствующие вероятности появления этих значений, т. е. n
MX = ∑ xi pi .
(18)
i =1
Определение 6.14. Математическое ожидание квадрата отклонения случайной величины X от ее математического ожидания MX называют дисперсией случайной величины X и обозначают DX, т. е. DX = M(X - MX)2.
(19)
Определение 6.15. Среднеквадратическим отклонением случайной величины называется квадратный корень из дисперсии DX этой величины. Замечание 6.16. Символы MX и DX нужно воспринимать, как единые символы, своеобразные иероглифы, а не как произведения неких M или D на X. Замечание 6.17. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Для непрерывных случайных величин математическое ожидание и дисперсия определены, как
MX =
+∞
∫x
f ( x)dx.
−∞
DX =
+∞
∫ (x − MX )
−∞
где f(x) - плотность вероятности.
2
f ( x)dx.
99
Среди бесконечного, несчетного множества всех возможных законов распределения случайных величин, единственным законом распределения, у которого параметры, входящие в аналитическое выражение закона, равны математическому ожиданию и дисперсии случайной величины, является закон нормального распределения. А именно, для параметров a и σ аналитического выражения (12) имеют место равенства: a = MX, σ2= DX. По этой причине закон нормального распределения оказался чрезвычайно удобным в пользовании при решении прикладных задач. Еще больше популярности использованию нормального закона прибавило то его уникальное свойство, что в некоторых случаях значения неизвестных параметров закона a и σ2 можно оценить, заменив их найденными по выборочным данным значениями точечной оценки среднего арифметического xср., легко вычисляемого применением формулы (15) и точечной оценки дисперсии S2, вычисляемой применением формулы (16). Иначе говоря, при решении отдельных прикладных задач можно использовать приближенные соотношения 1 n a ≈ xср. = ∑ xi , n i =1
σ 2 ≈ S2 =
1 n xi − xср. 2 , σ = + σ 2 . ∑ n i =1
(
)
(20)
К сожалению, несмотря на простоту нахождения аналитического выражения функции распределения случайной величины применением обработки результатов измерений с использованием формул (20), при изучении природных явлений нормально распределенные случайные величины встречаются крайне редко. Тем не менее, чрезвычайно распространенной ошибкой статистической обработки результатов измерений является принятие неизвестного закона распределения, с которым встречается в практике обработки результатов опытов естествоиспытатель за нормальный закон распределения. В свою очередь, это влечет к неправильным выводам, заключениям и вытекающим из них рекомендациям, с которыми мы часто встречаемся на практике. Например, известно, что в России, с одной стороны, благодаря усилиям правительства, уже не один год существует развитая система контроля над наркобизнесом и незаконным оборотом наркотиков. Однако с другой стороны, не менее известно, что, несмотря на усилия правительства и правоохранительных органов, наркоситуация в стране весьма далека от полностью подконтрольной. По мнению автора пособия, одной из главных причин сложившейся неблагоприятной наркоситуации в России, является
100
отсутствие в распоряжении уполномоченных чиновников государственного аппарата адекватных численных оценок наркоситуации, т. к. применяемые в настоящее время результаты экспертных оценок не могут служить в качестве количественных характеристик для создания научно обоснованных систем управления. Больше того, результаты обследований, предоставляемые чиновникам госаппарата экспертами, даже в тех редких случаях, когда применялся аппарат математического моделирования, все же практически всегда являются ошибочными вследствие нецелевого применения закона нормального распределения. В целях устранения недостатков систем управления, вызванных применением ошибочных приемов математического моделирования, остановимся подробнее на изучении критериев, позволяющих выполнить объективную проверку гипотез о законе распределения случайной величины, проявлением которой являются найденные в результате обследования наркоситуации численные показатели.
6. Критерии асимметрии и эксцесса Читателю известно, что результаты применения критериев "трех сигм", а также критериев "двух сигм" и "одной сигмы" при решении задачи нахождения закона распределения по выборочным данным далеко не всегда гарантируют возможности однозначных заключений о законе распределения. Изложенное обстоятельство ставит исследователя перед необходимостью уметь применять не один или два, а несколько критериев. С целью изучения критериев асимметрии и эксцесса приведем полезные для дальнейшего изучения определения. Определение 6.16. Будем называть центральным эмпирическим моментом k-го порядка, k = 1, 2,... величину µk, заданную через аналитическое выражение
µk =
1 n ∑ xi − xср. n i =1
(
)k .
(21)
Нетрудно заметить, что эмпирическая дисперсия S2, заданная через аналитическое выражение (16), есть центральный эмпирический момент второго порядка µ2, т. е. вычисленный применением формулы (21) центральный момент при k = 2. Определение 6.17. Выборочным коэффициентом асимметрии называется число А, определяемое аналитическим выражением
101
A=
µ3 . σ3
(22)
Определение 6.18. Выборочным эксцессом называется число E, определяемое аналитическим выражением
E=
µ4 −3 . σ4
(23)
Правило применения асимметрии и эксцесса Если численные значения асимметрии и эксцесса, вычисленные использованием выборочных данных равны нулю, то это свидетельствует в пользу того, что выборка извлечена из нормально распределенной генеральной совокупности, т. е. исследуемая случайная величина распределена по нормальному закону. Замечание 6.18. Равенство нулю асимметрии и эксцесса еще не является доказательством того, что исследуемая выборка непременно извлечена из генеральной совокупности численных значений случайной величины, распределенной по нормальному закону. Однако, в силу относительной простоты вычислений, значения асимметрии и эксцесса используются, но только для предварительных заключений. Более точное решение задачи о принадлежности выборочных данных к генеральной совокупности численных значений случайной величины с тем, или иным законом распределения находится применением критерия χ2-Пирсона, Колмогорова-Смирнова, ω2-Мизеса и др. Изучение этих критериев выходит за рамки пособия. Заинтересованный читатель может ознакомиться с методами их применения, воспользовавшись книгами: [28] - для читателей со средним образованием, [30], [35] - для читателей с высшим образованием, [49], [57] с высшим физико-математическим образованием. Определение 6.19. По В.И. Чернецкому нахождение по выборочным данным точечной оценки среднего арифметического, точечной оценки дисперсии, точечной оценки среднеквадратического отклонения, значений асимметрии и эксцесса называется нахождением модели элементарной статистики. Подробнее, см. в монографии [58]. Пример 6.7. Пример дан исключительно в педагогических целях. На самом деле, при таком малом объеме выборки никаких заключений о принадлежности ее элементов к той, или иной генеральной совокупности сделать нельзя.
102
Есть ли основания утверждать, что выборка X = {1, 5, 2, 3, 2} извлечена из генеральной совокупности численных значений нормально распределенной случайной величины? Решение. 1. Ранжируем выборку по неубыванию. Выполнив ранжирование, находим: X = {1, 2, 2, 3, 5}. 2. Вычислим точечную оценку среднего арифметического. Воспользовавшись формулой (15) находим, что xср. = (1+2+2+3+5)/5 = 2.6. 3. Вычислим точечную оценку дисперсии и среднеквадратического отклонения. Воспользовавшись формулами (20) находим: S2 = σ2 = (1/5)((1-2.6)2 + (2-2.6)2 + (2-2.6)2 + (3-2.6)2 + (5-2.6)2) = 1.84, σ = √01.84 = 1.356. 4. Выполним проверку гипотезы о нормальности распределения элементов выборки, применив критерий "трех сигм". Вычислим границы интервала xср. ± 3σ: 3 · 1.356 = 4.07. xср. + 3σ = 2.6 + 4.07 = 6.67. Интервал xср. – 3σ = 2.6 – 4.07 = –1.46. xср. ± 3σ есть интервал [–1.46, +6.67]. Все элементы выборки принадлежат этому интервалу. Вывод 1. Есть основание предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 5. Применим критерий "двух сигм". Вычислим границы интервала xср. ± 2σ. 2σ = 2 – 1.356 = 2.71. 2.6 - 2.71 = –0.11. 2.6 + 2.71 = 5.31. Найден интервал [–0.11, +5.31]. Все элементы выборки принадлежат найденному интервалу [–0.11, +5.31]. Вывод 2. Есть основание предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 6. Применим критерий "одной сигмы". Вычислим границы интервала xср. ± 1σ. xср. – 1σ = 2.6 – 1.356 = 1.24. 2.6 + 1.356 = 3.956. Найден интервал [1.24, 3.956]. Этому интервалу принадлежат элементы выборки: 2, 2, 3. Не принадлежат интервалу элементы выборки:1, 5. Так как объем выборки 5 элементов, то доля элементов, принадлежащих вычисленному интервалу равна 3/5=0.6. Но 0.6 < 0.68.
103
Вывод 3. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 7. Применим критерий асимметрии. Воспользовавшись формулой (21), вычислим центральный эмпирический момент третьего порядка: µ3 = (1/5)((1–2.6)3 + (2-2.6)3 + (2-2.6)3 + (3-2.6)3 + (5-2.6)3) = 1.872. Вычислим значение σ3. σ3 = 1.3563 = 2.49. Воспользовавшись формулой (22), вычислим асимметрию. А = 1.872/2.49 = 0.752, т. е. А > 0. Вывод 4. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 8. Применим критерий эксцесса. Воспользовавшись формулой (21), вычислим центральный эмпирический момент четвертого порядка: µ4 = (1/5)((1–2.6)4 + (2-2.6)4 + (2–2.6)4 + (3–2.6)4 + (5–2.6)4) = 8. Вычислим значение σ4. σ4 = 1.3564 = 3.381. Воспользовавшись формулой (23), вычислим эксцесс. Е = (8/3.381) – 3 = -0.63. E<0. Вывод 5. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. Подведем итог: применением критериев "трех сигм" и "двух сигм" доказано: есть основание предполагать о том, что выборка извлечена из нормально распределенной генеральной совокупности. Применением критериев "одной сигмы", асимметрии и эксцесса доказано, что нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. Сформулируем окончательный результат: доказано, что нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. Детективная развязка. (Читателям с высшим естественнонаучным образованием можно пропустить.) – Ну и что?! - воскликнет скептически настроенный читатель. Предположим, мы доказали, что какая-то выборка X = {1, 5, 2, 3, 2} не является выборкой численных значений случайной величины, извлеченной из генеральной совокупности численных значений нормально распределенной случайной величины. Что из этого толку? Мы доказали какую-то истину. Но где от этой истины польза? Чему новому мы научились для решения задачи оценки наркоситуации?
104
И будет прав. Но к счастью и для читателя, и для автора, польза есть, и огромная. Давайте "оживим" выборку. Пусть элементами нашей выборки станут не абстрактные числа, а обнаруженные количества крупных наркодельцов в районах города. Правительственный чиновник хочет знать объективную информацию о наркоситуации. Ему нужно принимать решения, исходя из каких-то цифр, адекватно характеризующих наркоситуацию в городе. И что ему ответит эксперт, которому поручена оценка? Нетрудно догадаться, что эксперт, для солидности, поручит провести "статистическую обработку" кому-то из штата своих подчиненных с помощью компьютера. Владеющий выполнением элементарных арифметических действий подчиненный, как правило, не имеющий специального математического образования врач, бывший школьный учитель литературы или пения, или рядовой чиновник, не успевший стать начальником, или, даже, доктор наук, профессор, но по физкультуре и т.п., но не математик, добросовестно сложит значения элементов выборки и поделит сумму на число элементов выборки. В результате получится: (1+5+2+3+2)/5 = 2.6 - "в среднем" 2.6. И напишет в отчете чиновнику: "Компьютерная статистическая обработка на компьютере IBM PC в системе "Windows-2000" по программе "EXСEL" дала, что в среднем на каждый район города приходится по 2.6 крупных наркодельца". О чем скажет чиновнику цифра 2.6? Во-первых, ни в одном из районов подвластного чиновнику города нет 2.6 крупных наркодельцов. Во-вторых, с естественнонаучной точки зрения, цифра 2.6 не отражает ни наркоситуацию в отдельном районе, ни наркоситуацию в целом. Вспоминается фрагмент из русской народной сказки: "У царя было три сына: старший – умный был детина, средний был и так и сяк, младший вовсе был дурак". В таком случае, "расчет на компьютере даст", что будущий царь-государь империи непременно будет полудурком. Найденное решение косвенно свидетельствует в пользу того, что и нынешний царь-полудурок. Однако все мы знаем из истории, в том числе, России, что наследником власти царь назначит сына старшего - который умный. Замечание 6.19. Фрагмент отчета автор пособия, к сожалению, не выдумал, а процитировал отчет, по результатам которого ответственным государственным чиновникам пришлось принимать решение о мероприятиях по контролю за наркоситуацией. С тех пор в лучшую для чиновника сторону наркоситуация не изменилась, но экспертов стало больше.
105
Итак, в рамках примера 6.7 найдено решение: нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. Какую пользу мы можем извлечь из решения? Ответ дан в пункте 3 настоящего параграфа: "...обрабатывая результаты наблюдений, мы практически никогда не сталкиваемся с величинами, распределенными по нормальному закону. Однако формулы, которые принято применять при статистической обработке результатов экспертов, выведены и доказаны только при условии, что исследуемое явление есть проявление нормальных законов. Поэтому пусть и при правильных арифметических вычислениях, эксперты вынуждены мириться с найденными таким способом результатами, весьма далекими от истинных значений оценок и являющихся, по сути, софизмами". Вывод: в нашем случае применение формулы (15) для вычисления значения точечной оценки среднего неприемлемо для вычисления значения характеристики, которой эксперт решил охарактеризовать среднюю оценку наркоситуации в городе. Правительственный чиновник оказался обманутым. Крупный наркоделец поехал отдыхать не туда, куда ему ехать определено российским законом - в тюрьму, а на Канарские острова. А чиновника возмущенные россияне переизбрали - должен же хоть кто-то отвечать перед Законом! Распишем подробнее ситуацию, в которой чиновник принял решение, ориентируясь на полученные от эксперта результаты оценки наркоситуации. Напомним, что результатом экспертной оценки было заявление: в среднем в каждом районе города промышляют 2.6 наркодельца. Исходя из этой оценки приказом чиновника выделили средства. В город направили спецотряды по борьбе с организованной преступностью. В результате героических усилий бойцов спецотрядов наркоситуация изменилась. Но что изменилось в ее численной оценке? Вернемся к "оживленной выборке" X = {1, 5, 2, 3, 2} в которой значения элементов - количества крупных наркодельцов в районах. Предположим, что добросовестные бойцы спецотрядов пресекли в рамках данных им указаний преступную деятельность наркомафии - в каждом районе было задержано по 2.6 наркодельца. В результате, так как количество наркодельцов в районе не может быть меньше нуля, наркоситуацию стало можно охарактеризовать набором чисел X = (1–2.6, 5–2.6, 2–2.6, 3–2.6, 2– 2.6) = (0, 2.4, 0, 0.4, 0). На практике это означает то, что для оставшихся на свободе крупных дельцов наркомафии в городе значительно уменьшилась конкуренция. Дальнейшее развитие наркоситуации в городе предсказать нетрудно: оставшиеся на свободе наркодельцы, вследствие резкого роста своих
106
доходов смогли стать столь защищенными от правоохранительных органов и руководящего ими чиновника, что теперь могут расширять сферу влияния наркобизнеса. Например, приложить усилия к вовлечению в наркобизнес детей чиновника! Дальнейшее развитие событий составляет хорошо известный сюжет многих зарубежных кинофильмов...
7. Начальные представления об исследовании операций и планировании экспериментов Определение 6.20. Математической статистикой называется наука о принятии решений в условиях неопределенности. Необходимость принятия решений так же стара, как и человечество. В доисторические времена первобытные люди, отправляясь охотиться, вынуждены были принимать те или иные решения: в каком месте устроить засаду? Как расставить охотников? Чем их вооружить? Известно, что повседневная жизнь любого человека - это многократные решения задач по принятию решений: как одеться? Брать ли с собой зонтик? Каким видом транспорта воспользоваться? и т. д. Государственный чиновник, по роду профессиональной деятельности, должен постоянно принимать решения: какой организации какую работу поручить так, чтобы работа была выполнена с наилучшими результатами и наименьшими затратами? Или, например, кому и какой организации поручить оценку наркоситуации: избранным, ангажированным, "с мировым именем" экспертам, которые за значительное материальное вознаграждение выскажут свои мнения и вычислят среднее арифметическое или... профессиональному математику, результатом работы которого будет соответствующий требованиям Государственных стандартов России отчет о научно-исследовательской работе [10], в котором применены доказательные методы современной науки? Исследование операций, результатом которого будет предоставленная чиновнику объективная оценка наркоситуации, начинается тогда, когда для обоснования правильности решений чиновник может использовать результаты применения специалистами по математическому моделированию современного математического аппарата. Исследование операций - молодая наука. Известно, что авторство первой научной работы по исследованию операций принадлежит русскому математику Л.В. Канторовичу (1912-1986), который в 1939-40 гг. положил начало теории линейной оптимизации - методам решения экстремальных задач с ограничениями. Однако впервые название "исследование операций" появилось в годы Второй Мировой войны, когда в вооруженных силах
107
некоторых стран (СССР, США, Англии) были сформированы специальные группы научных работников (математиков), в задачу которых входила подготовка проектов решений для командующих боевыми действиями. Эти решения касались оптимального боевого применения разных видов оружия и распределения сил и средств научно-обоснованного ведения победоносной войны. (Возможно, одна из причин разгрома гитлеровских войск заключалась в том, что гитлеровские генералы так и не признали исследование операций за науку. - А.И.) Одной из первых задач исследования операций является задача проверки гипотез. В свою очередь, гипотезы могут быть научными и ненаучными. Гипотеза "На Марсе есть жизнь" не является научной, т. к. в ней не идет речь о каких-либо категориях, которые можно сформулировать аналитически, т. е. выполнить математическую постановку задачи. Установление закономерностей, которым подчиняются случайные явления, основано на изучении методами теории вероятностей и математической статистики результатов наблюдений. Первая задача математической статистики - указать способы сбора и группировки сведений, полученных в результате наблюдений или специально поставленных, научно спланированных и математически обоснованных экспериментов. Вторая задача - разработка методов анализа данных в зависимости от целей исследования для нахождения научных и практических выводов. Заявления типа: "Потому, что на десять девчонок по статистике девять ребят" не имеют никакого отношения ни к математической статистике, ни к данным, на основании которых Государственный чиновник может принять правильные решения, ни тем более, к науке в целом. Определение 6.21. Под статистической гипотезой понимают всякое высказывание о случайной величине, записанное в аналитической (т. е. в виде формулы) форме и проверяемое математическими методами использованием результатов экспериментов или наблюдений. Примером статистической гипотезы являются высказывание: генеральная совокупность, о которой мы располагаем лишь выборочными сведениями, есть генеральная совокупность численных значений случайной величины, распределенной по нормальному закону, записываемому аналитически, как
y ( x) =
1 e σ 2π
−
( x − a )2 2σ 2
.
108
Или: генеральная средняя нормально распределенной случайной величины равна 7, т. е. MX =
+∞
∫ y( x) dx.
−∞
По исследованию операций и планированию научно обоснованных экспериментов в России издана обширная литература от научнопопулярной, например [59], до учебников для вузов и специальных научных монографий, например [60], [61]. Популярное заявление: "Во вселенной наверняка есть разумные существа, посылающие нам, землянам, межгалактические сообщения" не является ни научной гипотезой, ни утверждением, которое может обсуждаться в рамках научного познания Мира. Научная задача в этом случае формулируется так: "Доказать, что среди радиосигналов, улавливаемых радиотелескопами, существуют радиосигналы, минимизирующие функцию
H ( x) =
+∞
∫ f ( x) ln( f ( x)) dx.
−∞
Замечание 6.20. Читателю, не знакомому с основами дифференциального и интегрального исчисления последние две формулы понимать не обязательно. Заявление: "Наркоситуация в России постоянно усложняется", согласно требованиям, изложенным в Государственных стандартах России, неприемлемо для отчетов о результатах научно-исследовательской работы. ЗАДАЧИ К §6
Задача 6.1. Используя численные значения результатов измерений среднесуточных температур в Санкт-Петербурге (СПб) за 10 января с 1865 г., помещенные в приложение 2, найти: 1. Гистограмму среднесуточных температур. 2. Значения характеристик температур xср., S2. 3. Применением критериев "трех сигм", "двух сигм", "одной сигмы", асимметрии и эксцесса доказать: имеет ли научное обоснование рассмотрение гипотезы о том, что закон распределения среднесуточных температур есть закон нормального распределения. 4. Построить на одном чертеже с гистограммой график нормальной кривой с характеристиками xср. и S вместо характеристик a и σ и объяснить,
109
правомерна ли в данном случае подстановка значений xср. и S в аналитическое выражение закона нормального распределения вместо параметров a и σ. Указание. Вследствие вычислительной громоздкости при решении задачи рекомендуется использование компьютера. Решение. Используя пакет прикладных программ STATGRAPHICS или любой другой пакет статистических программ, находим: 1. Гистограмму температур.
Рис.13. На рис. 13. Одна из возможных гистограмм среднесуточных температур в СПб за 10 января. По оси абсцисс - значения среднесуточных температур. 2. Применив формулы (15), (16), (17) к выборочным данным из приложения 2, выполнив арифметические вычисления, находим, что xср. = -7.670С, S2 = 52.55, S = 7.25. 3. Применим критерий "трех сигм". Известно, что при использовании критерия "трех сигм" можно считать, что S = σ .
110
Следовательно, σ = 7.25. Вычислим интервал xср. ± 3σ. - 7.67 - 3 · 7.25 = -29.42. -7.67+3 · 7.25 = 14.08. Т. е. интервал xср. ± 3σ есть интервал значений [-29.42, +14.08]. Найденный интервал не включает в себя 0.9973 всех значений температур из приложения 2. (Долю температур, входящих в интервал значений температур [-29.42, +14.08] читатель может без особых усилий вычислить самостоятельно.) Вывод 1. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 4. Применим критерий "двух сигм". xср. - 2σ = -7.67 - 2 · 7.25 = -22.17. xср. + 2σ = -7.67 + 2 · 7.25 = 6.83. Интервал значений [–22.17, 6.83] не включает в себя долю значений, равную 0.9545. Вывод 2. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 5. Применим критерий "одной сигмы". xср. - σ = –7.67 – 7.25 = –14.92. xср. + σ = -7.67 + 7.25 = –0.42. Интервал значений [–14.92, –0.42] не включает в себя долю значений, равную 0.683. Вывод 3. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 6. Применим критерий асимметрии. Выполнив вычисления применением формулы (22) находим, что А = -0.86 ≠ 0. Вывод 4. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 7. Применим критерий эксцесса. Выполнив вычисления применением формулы (23) находим, что Е = 0.62 ≠ 0. Вывод 5. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. Сформулируем окончательный вывод. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 6. Выполним визуальное сравнение гистограммы и кривой закона нормального распределения.
111
Подставив в формулу (12) вместо параметров a и σ значения характеристик xср. = - 7.67 и S = 7.25, находим аналитическое выражение функции распределения:
y ( x) =
1 e 7.25 2π
−
( x + 7.67 )2 2⋅7.25 2
.
График найденной функции на фоне гистограммы данных из приложения 2 расположен на рис.14.
Рис.14. На рис. 14. По оси абсцисс - среднесуточные температуры. Замечание 6.21. На самом деле, исследуемая случайная величина среднесуточная температура, не распределена по нормальному закону. Кривая нормального распределения, в рамках задачи 6.1, найдена в учебных целях. Задача 6.2. Использовав результаты решения задачи 6.1 можно ли утверждать, что средняя температура приземного слоя окружающего воздуха в СПб за 10 января равна -7.670С?
112
Решение. Температура -7.670С есть эмпирическое среднее значение среднесуточных температур за 10 января в СПб. Из этого не следует, что истинное значение среднесуточной температуры равно -7.670С, т. к. найденное нами значение температуры не является генеральным средним значением. В частности, это подтверждается тем, что исследованная нами температура не является нормально распределенной случайной величиной. Задача 6.3. Является ли случайной величиной настроение начальника? Решение. Случайная величина характеризуется: а) численными значениями, б) вероятностями появления этих численных значений. В настоящее время в естествознании не найдено единиц измерения настроения начальника. Поэтому настроение начальника нельзя считать случайной величиной. Задача 6.4. Предположим, что нам дана гистограмма значений некой случайной величины, по внешнему виду являющаяся ступенчатой "горкой". Можно ли на основании визуального ознакомления с гистограммой заключить, что случайная величина распределена нормально? Решение. Визуальное сходство гистограммы случайной величины с гистограммой, которая должна быть у нормально распределенной случайной величины не служит доказательством того, что случайная величина распределена по нормальному закону. Существует бесконечное множество случайных величин, гистограммы которых являются "идеальной горкой". Нормально распределенная величина - лишь одна из них. Поэтому, гистограмма в виде "горки" не дает никаких оснований не только к заключению, но и предположению о том, что случайная величина распределена нормально. Задача 6.5. Один человек съел курицу, второй - не съел ничего. Сколько курятины "в среднем" пришлось на одного человека? Решение. На самом деле задача не столь проста, как кажется на первый взгляд. Изложим пример такой же задачи, но более наглядной. Известно, что при очень большом числе бросаний монеты можно считать, что в половине случаев выпадет "герб", в половине - "решка". Риторический вопрос: можно ли считать, что "в среднем" монета встает на "ребро"? Другой пример: один человек – наркоман, другой - нет. Можно ли считать, что "в среднем" оба наркозависимы? Сложность нахождения решений таких задач велика рассмотрение выходит за границы пособия.
и
их
113
§7. ОЦЕНКА ЗНАЧЕНИЯ ВЕРОЯТНОСТИ ПО РЕЗУЛЬТАТАМ НАБЛЮДЕНИЙ И ЭКСПЕРИМЕНТОВ. ИНТЕРВАЛЬНЫЙ МЕТОД 1. Постановка задачи
Вернемся к задачам, изложенным в §5. В целях приближения к решению задач по оценке наркоситуации опишем типичную ситуацию, с которой сталкивается исследователь. В вузе 1000 учащихся. Сколько среди них наркоманов - неизвестно. Требуется выполнить оценку наркоситуации в вузе. Вследствие ограниченности временных и экономических ресурсов исследователь, как правило, не в состоянии обследовать всех учащихся. Поэтому выполняется выборочное обследование и на основании решений, найденных для выборочного обследования, делается заключение о наркоситуации в вузе в целом. Предположим, для выполнения выборочного обследования произвольно, воспользовавшись картотекой, отобрали 100 учащихся. Можно ли по количеству обнаруженных среди них учащихся, употребляющих наркотики, судить о наркоситуации во всем вузе? В целях наглядности приведем экстремальный пример: предположим, что среди 100 случайно отобранных учащихся не обнаружили ни одного наркомана. Можно ли на этом основании утверждать, что ни один из учащихся обследованного вуза не принимает наркотики? Можно ли считать, что если из 100 обследованных обнаружено 5 учащихся, употребляющих наркотики, то, говоря словами экспертов: "Показано, что около 5% учащихся вуза употребляют наркотики"? Обсудим приведенный фрагмент отчета. Во-первых, в требованиях, изложенных в Государственном стандарте России "ГОСТ 7.32.91. Отчет о научно-исследовательской работе. Структура и правила оформления" [21] сказано о том, что "... часть отчета должна содержать ... оценку достоверности полученных результатов..., математические доказательства, формулы и расчеты..." Другими словами требования, изложенные в Государственных стандартах сообщают о необходимости доказательности результатов. Находчивый эксперт, за отсутствием доказательности, подменил требуемое ГОСТом "доказано" ни к чему не обязывающим "показано". Во-вторых, и читатель знает почему, переносить результаты выборочного обследования на весь объект исследования недопустимо. Такой подход выходит за рамки научной деятельности, и приемлем разве что в фантастическом жанре. В-третьих, принимающий исходя из таких
114
результатов решение чиновник, в лучшем случае, оказывается обманутым добросовестно заблуждающимся экспертом. В-четвертых, ни в одном из законодательных актов России нет разъяснений того, как трактовать оценку "около 5%". В пятых, ... после прочтения предыдущих параграфов пособия читатель и сам может найти множество нелепостей экспертной оценки: "Показано, что около 5% учащихся вуза употребляет наркотики". Но, пожалуй, самое главное для читателя состоит в том, что как именно решить изложенную задачу - по выборке, состоящей из 100 студентов найти адекватную оценку наркоситуации в вузе, в котором учатся 1000 студентов, давно известно и правильность метода решения доказана, а не "показана". Известно, что решение любой задачи необходимо начинать с ее правильной математической формулировки. И если таковая выполнена, то согласно главной аксиоме Гильберта, "задача может быть разрешена в широком смысле". Это означает, что, либо находится доказательство того, что задача не имеет решения, либо доказывается, что решение задачи существует. Если найдено доказательство того, что решение задачи существует, переходят к следующему этапу решения: требуется доказать, имеет ли задача единственное решение или ее решений множество. Например, задача, состоящая в том, что требуется найти квадратный корень из четырех, имеет два решения. Действительно, 22 = 4, но и –22 = 4. Доказано, что наша задача оценки наркоситуации в вузе имеет решение и при том единственное. Остановимся подробнее на процессе математической формулировки задачи. В целях иллюстрации приведем пример неправильной формулировки задачи: какая погода будет завтра? В такой формулировке задача не имеет решения, т. к.: мы не знаем, что имел в виду спрашивающий под термином "погода", мы не знаем, какое именно место планеты спрашивающий имел в виду, мы не знаем, в каких единицах измерения ожидается наша оценка погоды, мы не знаем, с какого именно момента времени и до какого момента времени спрашивающий считает, что длится "завтра", мы не знаем, наконец, что именно хочет узнать спрашивающий, употребляя термин "какая". Мы хотим подробностей... Кроме того, любой наш ответ на вопрос: "Какая погода будет завтра"? будет заведомо неправильным с естественнонаучной точки зрения. А именно: любой наш ответ при такой постановке вопроса, найдет он завтра подтверждение, или не найдет, будет не доказательством, а заявлением. Читателю уже известно из первых двух параграфов пособия, что заявление не может быть принято в качестве научно обоснованного решения. Более
115
правильными, но еще не до конца математически сформулированным, будет вопрос: какое значение примет такого-то числа, такого-то года, в таком-то месте планеты температура приземного слоя окружающего воздуха. Вернемся к задаче оценки наркоситуации. Выполним математическую формулировку задачи. В вузе 1000 учащихся. В результате обследования 100 случайно выбранных из 1000 учащихся обнаружено, что 5 из них употребляют наркотики. Найти вероятность того, что любой случайно выбранный из 1000 учащихся вуза учащийся употребляет наркотики. В таком варианте задача сформулирована правильно, но не имеет решения, т. к. мы ничего не знаем и не можем знать об остальных 900 учащихся. Однако решение задачи, но с несколько измененной формулировкой, было найдено Ю. Нейманом (1894-1981), исходя из идей Р. Фишера (1890-1962) в 20-х годах XX в. Для того, чтобы понять метод решения, найденный Ю. Нейманом, необходимо освоить новые, не встречавшиеся в пособии понятия. 2. Доверительный интервал вероятностей, как мера оценки наркоситуации
Вернемся к определению 6.10 точечной оценки среднего арифметического. Известно, что точечной оценкой среднего арифметического называется число xср., вычисляемое применением формулы (15): xср. =
x1 + x2 + x3 + ... + xn 1 n = ∑ xi . n n i =1
Известно, что с изменением объема выборки, в общем случае, меняется и значение точечной оценки среднего арифметического ее элементов. Известно, что точечная оценка среднего арифметического станет величиной постоянной только при условии, что объем выборки станет бесконечно большим. Т. е. 1 n ∑ xi = xср. = x* = const . n →∞ n i =1 Таким образом, вследствие того, что мы никогда не будем располагать выборкой бесконечного объема, мы не можем никогда узнать точного lim
116
значения среднего арифметического. Однако, оказалось, что даже при весьма ограниченном объеме выборки, мы можем оценить границы, в которых находится искомое значение xср.= x* = const. Изложенный результат доказан Ю. Нейманом. Но кроме того Ю. Нейманом доказано, что значение величины xср.= x* будет находиться в некотором интервале и с некоторой надежностью. Перейдем к более общим формулировкам. Известно, что точечной называют оценку, которая определяется одним числом. Оценки, которые были рассмотрены нами до сих пор: xср., S2, S - точечные. При анализе выборочных данных оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при нахождении выборочных оценок следует пользоваться интервальными оценками. Определение 7.1. Интервальной будем называть оценку, границы которой определяются двумя числами - концами интервала. Применение интервальных оценок позволяет установить точность и надежность оценок (смысл этих новых понятий выяснится ниже). В целях общности изложения обозначим через Θ какую-либо искомую статистическую характеристику случайной величины. Например, среднее арифметическое, математическое ожидание, дисперсию, среднеквадратическое отклонение или, даже, какую-то характеристику, о которой мы ничего не сообщили в пособии. Пусть найденная каким-либо методом по выборочным данным статистическая характеристика Θ* служит вычисленной нами приблизительной оценкой неизвестного, но искомого нами параметра Θ. Очевидно, что в общем случае Θ*≠ Θ. Ясно, что значение числа Θ* тем ближе приближается к числу Θ, чем меньше абсолютная величина разности │Θ* - Θ│. Обозначив через δ > 0 число, вычисляемое как δ =│Θ* - Θ│ мы можем быть уверены в том, что чем меньше значение числа δ, тем точнее оценка. Определение 7.2. Число δ > 0, определяемое равенством δ = │Θ* - Θ│ будем называть точностью оценки параметра Θ.
(24)
Очевидно, что если число δ попытаться найти таким, чтобы выполнялось неравенство │Θ* - Θ│< δ, то точность оценки возрастет. Однако известные в настоящее время методы теории вероятностей и математической статистики не позволяют достигнуть того, чтобы можно было категорически утверждать, что оценка Θ* удовлетворяет неравенству
117
│Θ* - Θ│< δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществится. Определение 7.3. Надежностью (доверительной вероятностью) искомой оценки Θ по найденному значению оценки Θ* будем называть вероятность γ, с которой выполняется неравенство │Θ* - Θ│< δ. В настоящее время не существует методов, позволяющих вычислить значение надежности γ. Поэтому значения вероятности γ (надежности) задаются наперед в зависимости от требований к надежности, предъявляемых в разных областях естествознания. Чаще всего надежность γ задают равную 0.95, 0.99, 0.999. В каждом конкретном случае значения надежности γ регламентированы и записаны в Государственных стандартах. Поэтому исполнитель-математик всегда может уточнить у заказчика, с какой именно надежностью заказчик хочет получить результат оценки наркоситуации, или самостоятельно узнать значение надежности в текстах Государственных стандартов. Заменив неравенство │Θ* - Θ│< δ равносильным ему двойным неравенством Θ* - Θ< Θ < Θ* + Θ, имеем P(Θ* - Θ< Θ < Θ* + Θ) = γ.
(25)
Найденное двойное неравенство (25) следует понимать так: вероятность того, что интервал (Θ* - Θ, Θ* + Θ) заключает в себе (накрывает) искомое неизвестное значение параметра Θ, равна надежности γ. Подводя итог, сформулируем определение нового понятия доверительного интервала. Определение 7.4. Доверительным интервалом назовем интервал (Θ* Θ, Θ* + Θ), накрывающий неизвестное значение параметра Θ с заданной надежностью γ. Вернемся к задаче оценки наркоситуации в вузе. Переформулируем условие задачи, используя понятие доверительного интервала. В вузе 1000 учащихся. В результате обследования 100 случайно выбранных из 1000 учащихся обнаружено, что 5 из них употребляют наркотики. Найти границы доверительного интервала вероятности того, что любой случайно выбранный из 1000 учащихся вуза учащийся употребляет наркотики. В такой формулировке задача имеет решение и при том, единственное. Приступим к решению задачи. Напомним определения 3.1 и 3.2, т. е. определения вероятности P и ее точечной оценки p*.
118
Вероятностью P события A называется число P(A), соответствующее событию A и принимающее значение от 0 до 1 включительно. Величина p*, вычисляемая применением отношения m p* = , n где n - количество опытов, m - количество появлений исследуемого события за n опытов, называется точечной оценкой вероятности p. В нашем случае мы ничего не можем сказать о значении интересующей нас вероятности P. Однако, можем вычислить ее точечную оценку p*. Значение n - числа опытов известно – n = 100. Значение m числа появлений исследуемого события (в нашем случае, студентов, незаконно употребляющих наркотики) за n опытов тоже известно – m = 5. Однако, на самом деле, в выборке из 100 студентов их могло оказаться и меньше 5 и больше 5. Тем не менее, мы можем вычислить значение точечной оценки вероятности P: p* = 5/100 = 0.05. Известно, что искомая вероятность p должна находиться в каком-то доверительном интервале вероятностей. Обозначим через p1 - левую границу интервала, через p2 - правую границу. Через γ - желаемую нами надежность, с которой мы хотим найти доверительные границы интервала вероятности. В теории вероятностей и математической статистике доказано, применением каких формул можно найти границы доверительного интервала (p1,p2) при заданной надежности γ. Минуя этап весьма громоздкого доказательства, сообщим его результат: 2 n ⎡ t2 p * (1 − p*) ⎛ t ⎞ ⎤ ⎢ p1 = 2 p*+ −t +⎜ ⎟ ⎥, n n 2 t +n⎢ ⎝ 2n ⎠ ⎥ ⎣ ⎦ (26) 2 n ⎡ t2 p * (1 − p*) ⎛ t ⎞ ⎤ ⎢p*+ p2 = 2 +t +⎜ ⎟ ⎥. n 2n t +n⎢ ⎝ 2n ⎠ ⎥ ⎣ ⎦
где значение величины t при заданной надежности γ можно найти, воспользовавшись специальными статистическими таблицами. Наиболее полной книгой статистических таблиц, изданных в России, считается книга [62]. В более кратком изложении статистические таблицы напечатаны в книге [63]. Кроме того, в сокращенном виде таблицы печатаются в приложениях к учебникам и пособиям по теории вероятностей и математической статистике, например, в [28], [29] и т.д. В приложениях таблицы называются "Таблицы значений функции Лапласа
119
Φ(t)". Для удобства поиска таблиц сообщаем, что аналитическое выражение функции Лапласа записывается, как t
−x 2 Φ (t ) = e 2π ∫0
2
2
dx.
Замечание 7.1. Если в результате применения первой формулы из (26) окажется, что найденное значение левой границы p1 доверительного интервала меньше нуля, то в качестве левой границы нужно взять p1 = 0, т. к. вероятность не может быть меньше нуля. В целях удобства читателя в таблице 3 напечатаны некоторые из значений величины t, стоящей в правой части формул (26) для разных значений надежности γ. ТАБЛИЦА 3 ЗНАЧЕНИЯ ВЕЛИЧИНЫ t И НАДЕЖНОСТИ γ γ
0.95
0.96
0.97
0.98
0.99
0.995
0.999
t
2
2.1
2.2
2.4
2.6
2.8
3.5
0.9999 0.99999 3.8
4.5
Замечание 7.2. Напечатанные в таблице 3 значения надежности γ выбраны из таблиц книги [62] вследствие того, что при решении задач оценки наркоситуации вряд ли потребуется надежность меньшая, чем γ = 0.95 и большая, чем γ = 0.99999. Теперь у нас достаточно знаний, чтобы решить задачу оценки наркоситуации в вузе. Пример 7.1. В вузе 1000 учащихся. В результате обследования 100 случайно выбранных из 1000 учащихся обнаружено, что 5 из них употребляют наркотики. Найти границы доверительного интервала вероятности того, что любой случайно выбранный из 1000 учащихся вуза учащийся употребляет наркотики. Решение. Найдем точечную оценку искомой вероятности. p* = 5/100 = 0.05. Зададимся надежностью, с которой мы хотим гарантировать результат того, что доверительный интервал вероятностей накроет искомое значение вероятности. Положим надежность γ = 0.99. В таблице 3 находим, что для надежности γ = 0.99 значение величины t равно 2.6. Подставив значения n = 100, t = 2.6, p*= 0.05 в формулы (26) и выполнив вычисления находим, что p1 = 0.016, p2 = 0.14.
120
Ответ. С надежностью 0.99 можно утверждать, что случайно выбранный из 100 обследуемых студент с вероятностью от 0.016 до 0.14 окажется наркоманом. О том, с какой вероятностью любой случайно выбранный из 1000 студентов студент окажется наркоманом мы, пока, ничего сказать не можем. Однако, найденный использованием выборочных данных результат научно обоснован и может служить ориентиром при оценке наркоситуации. Замечание 7.3. В целях избежания вычислительных трудностей при использовании громоздких формул, все ключевые формулы пособия, в частности, формулы (26), помещены в файл NARKSIT. MTH, позволяющий в пакете DERIVE автоматизировать вычисления применением компьютера. Распечатка файла NARKSIT. MTH помещена в приложении 1. Действительно, если из N человек с целью оценки наркоситуации произвольно отобрали n человек, и среди этих n отобранных человек оказалось ровно k наркоманов, то эти k наркоманов - величина случайная. На самом деле, среди n отобранных для обследования могло оказаться и меньше, чем k наркоманов и больше, чем k наркоманов. Применение формул (26) позволяет с заданной надежностью γ не только учесть случайность величины k, но и найти численную оценку случайности в вероятностной мере. В связи с этим введем новые понятия, по мнению автора весьма полезные при оценке наркоситуации - пессимистическую оценку и оптимистическую оценку. Определение 7.5. Назовем нижнее значение вероятностной оценки наркоситуации оптимистической оценкой, верхнее значение вероятностной оценки наркоситуации пессимистической оценкой. Замечание 7.4. Впервые метод доверительных интервалов при решении задачи оценки наркоситуации применен в отчете о научноисследовательской работе [10]. Очевидно, что значение оптимистической оценки никогда не может быть меньше нуля, пессимистической - больше единицы. В примере 7.1 рассмотрена типичная ситуация, возникающая при оценке наркоситуации применением выборочного обследования. Однако, при применении выборочного обследования может возникнуть и курьезная ситуация: с одной стороны точно известно, что в группе из N человек есть те, кто употребляет наркотики, с другой, среди n отобранных из N человек для выборочного обследования не найдено ни одного наркомана. Как в таком случае оценить наркоситуацию в вузе? Оказывается, что применение методов математического моделирования позволяет решить и эту задачу.
121
Впервые острая необходимость в решении подобных задач возникла в начале XX века во времена Первой Мировой войны (1914-1918). Не в связи с необходимостью оценки наркоситуации, а в связи с необходимостью ведения боевых действий новыми видами оружия: гранатами, минами, снарядами. Их производство осуществлялось на специальных предприятиях военно-промышленного комплекса. В процессе производства и доставки гранаты, мины и снаряды могли претерпеть случайные падения. В некоторых случаях при случайных падениях боеприпасов происходили взрывы. Требовалось оценить вероятность того, что при случайном падении боеприпасов произойдет их незапланированный взрыв. С этой целью начали проводить дополнительные контрольные испытания боеприпасов: какое-то количество единиц боеприпасов умышленно сбрасывали с некоторой высоты с целью оценить, какая именно доля боеприпасов взорвется при таком испытании. Однако во многих случаях при проведении таких испытаний не наблюдалось ни одного взрыва, и задача оставалась нерешенной. Читатель пособия находится в несоизмеримо лучшей ситуации, чем испытатели самопроизвольного взрыва боеприпасов начала XX века. Задача. Применив метод математического моделирования, не проводя ни одного весьма небезопасного испытания боеприпасов на возможность самопроизвольного взрыва, требуется найти границы доверительного интервала вероятности того, что у случайно упавшего на твердую поверхность палубы военного корабля снаряда произойдет самопроизвольная детонация, повлекшая за собой взрыв снаряда. Решение. Очевидно, что значение левой границы интервала вероятности можно принять равным нулю, т. к. значение вероятности не может быть меньше нуля. Поэтому, представляет интерес нахождение значения только правой границы доверительного интервала вероятности. Предположим, что военный корабль снабжен боекомплектом объемом в 1000 снарядов. Предположим, что каждый из находящихся в боекомплекте корабля снарядов прошел испытание на случайное падение и не взорвался. Чему равна правая граница доверительного интервала вероятности того, что при новом случайном падении снаряд взорвется? Иначе говоря, требуется вычислить пессимистическую оценку вероятности самопроизвольного взрыва снаряда. В нашем случае количество опытов n = 1000, количество опытов, в которых произошел взрыв m = 0. Вследствие того, что все 1000 снарядов находятся на боевом корабле, и каждый из этих снарядов может либо взорваться, либо не взорваться, полная группа возможных исходов
122
событий состоит из 1000 элементов. Вычислим вероятность p самопроизвольного взрыва: p = m/n = 0/1000 = 0. Воспользовавшись второй формулой из формул (26), приняв значение p*= p =0 и выполнив очевидные алгебраические преобразования, находим, что при p*= p = 0 правую границу доверительного интервала вероятности можно вычислить, воспользовавшись формулой: t2 p2 = . (27) n + t2 Из соображений того, что вероятность выживаемости военного корабля в процессе боевых действий вряд ли превышает 0.99, примем надежность γ = 0.99. Воспользовавшись таблицей 3, находим, что при надежности γ = 0.99 значение величины t = 2.6. Подставив значения γ = 0.99 и t = 2.6 в формулу (27) и выполнив вычисления, находим, что p2 = 0.0067. Замечание 7.5. Находчивый эксперт не замедлит заявить о том, что "ему известно, что показано, что вероятность самопроизвольного взрыва снаряда на боевом корабле приблизительно равна около 0.7%". Читателю предлагается самостоятельно ответить на вопрос о том, по каким объективным причинам заявление находчивого или даже избранного эксперта нельзя считать научно обоснованным, а самого эксперта компетентным. Пример 7.2. В вузе 1000 учащихся. Из компетентных источников руководству вуза стало известно, что некоторые из учащихся употребляют наркотики. По независящим от руководства вуза причинам ни установить личности наркозависимых учащихся, ни провести расследование наркоситуации в короткие сроки невозможно. Оценить наркоситуацию в вузе. Решение. Проведем гипотетическое расследование. Предположим, что обследовали всю тысячу учащихся, но не обнаружили ни одного наркомана. Однако руководству вуза известно, что на самом деле наркоманы среди учащихся есть, т. е. p ≠ 0. В этом случае можно воспользоваться формулой (27). В целях страховки, задав значение надежности высоким, например γ = 0.999, воспользовавшись таблицей 3, находим, что значение величины t = 3.5. Выполнив вычисления, находим, что p2 = 0.012. Пожалуй, главным найденным результатом решения задачи является результат, заключающийся в том, что руководство вуза, не прибегая к обследованию, требующему значительных затрат материальных и
123
временных ресурсов, применением методов математического моделирования, становится вооруженным научно обоснованной оценкой наркоситуации в доверенном ему учреждении. Однако, при несомненной научной обоснованности, найденное решение является решением задачи не о том, какова наркоситуация среди 1000 человек, а о том, какова наркоситуация среди 100 человек, случайно выбранных из 1000. Поэтому вернемся вновь к нашей задаче, теперь частично решенной. Пример 7.3. В вузе 1000 учащихся. В результате обследования 100 случайно выбранных из 1000 учащихся обнаружено, что 5 из них употребляют наркотики. Найти наиболее вероятное количество учащихся вуза, употребляющих наркотики. С надежностью γ = 0.99 найти доверительный интервал вероятности того, что случайно выбранный из 1000 учащихся учащийся употребляет наркотики. Решение. Применим результаты комбинаторного анализа, элементы которого изложены в §4. Одним из результатов §4 является найденная формула (6), предназначенная для вычисления вероятности p события, заключающегося в том, что k наркоманов случайно попадает в группу из m обследуемых человек, извлеченную из группы объемом N человек, при условии, что в группе из N человек n наркоманов. C k ⋅ C m-k p = n mN -n . CN Там же, в §4 эта формула (6) приведена и в развернутом виде (6*):
p=
m !n ! ( N − m ) ! ( N − n ) ! . k ! N ! (m − k ) ! (n − k ) ! ( N + k − m − n ) !
Для применения формулы (6*) из условия примера нам известно, что N = 1000, m = 100, k = 5. Однако, мы не знаем, чему равно число n, т. к. его и нужно нам найти для оценки наркоситуации во всем вузе в котором учатся 1000 студентов. Кроме того, нам не известно значение числа p вероятности того, что в случайно отобранную группу объемом 100 человек попадут ровно k = 5 наркоманов. Таким образом, формула (6*) является для нас одним уравнением с двумя неизвестными. Кроме того, решение задачи осложняется тем, что не существует алгебраических методов, позволяющих выразить в виде формулы для вычисления неизвестное n. Создается впечатление, что задача не имеет решений. И это действительно так, но в рамках элементарной математики. В рамках высшей математики задача решение имеет.
124
Замечание 7.6. Читатель, знакомый с элементами высшей математики, возможно, догадался, что задача может быть решена каким-либо из известных методов оптимизации функционалов. Попробуем, не прибегая к применению методов высшей математики, пусть и не столь красиво, как принято в научной работе, но все же решить задачу. Нам известно, что количество наркоманов k, попавших в контрольную группу из 100 человек равно 5. Следовательно, в группе из 1000 человек, из которой извлечена группа из 100 человек, наркоманов должно быть не меньше 5. Событие, состоящее в том, что в контрольную группу из 100 человек попало ровно 5 наркоманов, есть событие случайное. Возникает вопрос: при каком числе наркоманов n в группе из 1000 учащихся вероятность того, что в отобранную из этой группы группу из 100 учащихся попадет ровно 5 наркоманов будет максимальной? Иначе говоря. считая вероятность p функцией от числа n, т. е. функцией p(n) требуется найти такое значение аргумента n при котором функция p(n) претерпевает максимум. Решим задачу нахождения экстремума функции p(n), в нашем случае максимума, т. е. найдем max p(n) . n
В целях удобства читателя избежим применения методов высшей математики, применив простейший прием элементарной математики: будем перебирать все значения числа n, начиная с n = 5 и заканчивая n = 1000. С этой целью, подставив в формулу (6*) значения N = 1000, m = 100, k = 5 и выполнив очевидные упрощения, находим, что
1.26344 ⋅ 10−290 ⋅ n(n − 1)(n − 2 )(n − 3)(n − 4 )(1000 − n ) ! p ( n) = . (905 − n ) !
(28)
Подставляя поочередно в формулу (28) для вычисления значений функции p(n) значения аргумента n = 5,6,...,900 и выполнив вычисления, находим, что при n = 5,6,...,900 p(5) = 9.13·10-6, p(10) = 0.0014, p(20) = 0.031, p(30) = 0.1, p(40) = 0.168, p(50) = 0.19, p(60) = 0.17, p(70) = 0.13, -6 -25 p(100) = 0.03, p(200) = 7.13·10 , p(500) = 6.9·10 , p(700) = 2.36·10-48, p(900) = 5.73·10-120. Замечание 7.8. В целях экономии места напечатаны только некоторые из значений функции p(n). Значения функции p(n) при пропущенных значениях аргумента n читатель, при желании, может вычислить самостоятельно.
125
Нетрудно увидеть, что максимального значения функция p(n) достигает при n = 50: p(50) = 0.19. Т. е. функция p(n) при n = 50 достигает максимума. Замечание 7.7. Ту же задачу можно решить, заменив факториалы функцией (7) Стирлинга и воспользовавшись результатами теоремы о значениях производной функции в стационарных точках. И так, мы доказали, что наиболее вероятным значением числа n количества наркоманов в группе из 1000 учащихся является значение n = 50. Зная, что полная группа событий состоит из 1000 элементов и зная, что число благоприятных событий - взятый из 1000 учащихся один учащийся окажется наркоманом, равно 50, находим, что вероятность того, что любой учащийся обследуемого вуза наркоман, равна p*= 50/1000 = 0.05. В целях решения задачи окончательной оценки наркоситуации в вузе, применим метод доверительных интервалов. Воспользовавшись формулами (26) при n = 1000, t = 2.6, p = p*= 0.05, выполнив очевидные вычисления, находим, что значение левой границы доверительного интервала вероятности p1= 0.035, правой границы - p2= 0.071. Это означает, что с надежностью 0.99 можно утверждать, что в вузе из 1000 учащихся от 35 до 71 студента наркоманы. Сформулируем окончательный результат. Доказано, что если в вузе, в котором обучается 1000 студентов, в целях решения задачи оценки наркоситуации, из 100 взятых наудачу студентов 5 оказались наркоманами, то с надежностью γ = 0.99, наиболее вероятным доверительным интервалом значения вероятности того, что любой студент данного вуза наркоман, является интервал (0.035, 0.071), т. е. среди учащихся вуза от 35 до 71 наркоманов. 3. Упрощенный метод вычисления доверительного интервала для вероятности события
Применим изложенный в § 6 материал о законе нормального распределения к решению задачи вычисления доверительного интервала вероятности события, точечная оценка которой найдена использованием зафиксированных результатов экспериментов. Доказано, известно и напечатано, например, в книге [64], что распределение точечной оценки вероятности p* при больших значениях числа n близко к нормальному закону распределения с параметрами a = p*,
126
σ=
( p * (1 − p *)) n
.
(29)
В нашем случае, в рамках примера 7.3 известно, что n = 1000, p*= 0.05. Воспользовавшись формулами (29) находим, что для нашего случая значения параметров нормально распределенной случайной величины соответственно равны: а = 0.05, σ = 0.0069. Подставив найденные значения параметров в аналитическое выражение для закона нормального распределения (12) находим, что − 1 f ( p) = e 0.0069 2π
( p − 0.05) 2 2⋅0.0069
.
(30)
В целях иллюстрации найденного результата на рис.15 помещена графическая интерпретация функции (30).
Рис.15. На рис.15. По оси абсцисс - значения вероятности того, что случайно взятый из 1000 студентов - наркоман. По оси ординат - плотность вероятности, графическая интерпретация закона распределения (30). Двумя вертикальными прямыми ограничена площадь под кривой функции f(p).
127
Из § 6 читателю известно, что площадь, ограниченная напечатанной на рис.25, кривой и осью абсцисс, равна 1. Вертикальными прямыми из фигуры площадью 1 вырезан участок, ограниченный значениями аргумента 0.035 и 0.071. Вертикальные границы этого участка соответствуют границам найденного нами доверительного интервала вероятностей p1= 0.035, p2= 0.071. Заштрихованная часть площади под кривой равна 0.99, т. е. надежности γ = 0.99, с которой доверительный интервал (0.035, 0.071) накрывает значение неизвестной вероятности p. Читатель, знакомый с элементами интегрального исчисления может самостоятельно убедиться в том, что 2
1 0.0069 2π
0.071 − ( p − 0.05) 2 e 2⋅0.0069
∫
dp ≈ 0.99 = γ
0.035
Замечание 7.8. Стоящее выше аналитическое выражение читатель, испытывающий затруднения с математикой, при первом прочтении может пропустить без потери смысла изложения. По мнению автора, напомнить школьный курс математики можно, воспользовавшись учебником [65]. Границы доверительного интервала вероятности значительно сужаются при увеличении объема выборки. Например, пусть среди 100 обследованных обнаружено 5 наркоманов, т. е. точечная оценка вероятности p* того, что любой, взятый наудачу из 100 обследованных наркоман - p*= 5/100 = 0.05. Пусть задана надежность γ = 0.99 которой, согласно напечатанному в таблице 3, соответствует значение величины t = 2.6. Применив формулы (26) находим, что значения левой границы p1 и правой границы p2 доверительного интервала вероятности соответственно равны: p1= 0.017, p2= 0.14. При объеме выборки 1000 человек и количестве обнаруженных в ней наркоманов, равном 50, точечная оценка также равна 0.05. Задав ту же надежность γ = 0.99 с t = 2.6 и применив формулы (26), находим, что границы доверительного интервала вероятности p1 и p2 соответственно равны: p1= 0.035, p2= 0.07. Результатом такого же расчета, но при объеме выборки 10000 и количестве обнаруженных в ней наркоманов 500, границы доверительного интервала будут: p1= 0.045, p2= 0.056. На рис.16 расположены графики изменения границ доверительного интервала при p*= 0.05, γ = 0.99, t = 2,6 и разных объемах n выборки.
128
Рис.16. На рис.16. По оси абсцисс - объем выборки. По оси ординат - значения границ доверительных интервалов. Изложенный результат: с увеличением объема выборки границы доверительного интервала вероятности сужаются, очевиден, чем больше мы имеем данных об исследуемом явлении, тем точнее результат, получающийся при расчете точечной характеристики Θ*. Приведем пример вычисления границ доверительного интервала вероятности при выборке очень большого объема. Известно, что население России – 145 млн. человек. Из источника [66] известно, что в России зарегистрировано 340 тысяч наркоманов. Следовательно, точечная оценка p* вероятности того, что любой наугад взятый россиянин наркоман: p*= 340 тыс./145 млн. = 0.002345. Зададимся надежностью γ практически равной единице. Возьмем γ = 0.999999999. При таком значении надежности величина t = 6. Выполнив вычисления применением формул (26) находим, что границы доверительного интервала вероятности p1 и p2 соответственно равны: p1= 0.00232, p2= 0.00237, т. е. отличаются только в пятом знаке после запятой. Это означает, что приближенная цифра - в России 340 тыс. зарегистрированных больных наркоманией, может с надежностью почти
129
равной единице колебаться в границах 336400 - 343650 больных. С другой стороны в [66] заявлено, что "регулярно наркотики употребляют 3% населения России". Но 3% = 0.03, а вычисленная правая граница вероятности - 0.00237, т. е. отличается в 12 раз. Таким образом, доказано, что опубликованное в [66] заявление экспертов о том, что "...в России более 4 млн. человек больны наркоманией" выглядит сомнительно, т. к. находится далеко за границами вычисленного доверительного интервала вероятности лиц, больных наркоманией. А именно: при заданной нами надежности вычисляемого результата, приближающейся к единице γ = 0.999999999, число 4 млн. ≈ 0.03 = 3% больных должно войти в границы доверительного интервала p1 = 0.00232, p2 = 0.00237. Однако доказано, что оно в границы доверительного интервала не входит, а находится далеко вправо от правой границы - p2 = 0.00237. Еще более сомнительно выглядит опубликованный там же в [66] результат экспертов "... реальное количество больных наркоманией в 6-8 раз больше, т. е. более 4 миллионов". Выполним элементарное вычисление: 340 тыс. умножим на 8. В результате получим 2 млн. 720 тысяч человек. Откуда взялось "более четырех миллионов"? Чтобы получить результат "более четырех миллионов", число 340 тыс. нужно умножать не на 6-8, а почти на 12: 340 тыс. умножить на 11.765 и будет "более четырех миллионов". Не вызывает сомнения, что глава Госнаркоконтроля В. Черкесов, от имени которого в [66] опубликовано, что "340 тыс. умножить на 8 равно более четырех миллионов", считать умеет. Однако, сложившаяся практика неграничного доверия анонимной группе "избранных" экспертов привело к ошибкам, которые ставят в двусмысленное положение и правительство России, и главу Госнаркоконтроля Российской Федерации. Более того, в том же источнике [66] от 28.07.2001 опубликовано заявление, согласно которому "По данным специалистов, каждый четвертый молодой человек в России страдает наркозависимостью". Однако, согласно данным, опубликованным в "Статистическом ежегоднике" [67] на 1 января 2001 года, в России было 54 млн. 121 тыс. человек возраста от 10 до 34 лет, т. е. тех, кого можно считать молодыми людьми. Четверть от этого количества - это 13 млн. 530 тыс. 250 человек. Получается, что в рамках одного и того же источника, по данным уполномоченных экспертов в России уже не 4 миллиона наркоманов всех возрастов, а более 13 миллионов наркоманов только среди молодых людей. Сформулируем окончательный вывод: результаты экспертных оценок не только не отражают хотя бы приблизительную оценку наркоситуации в России, но и дезинформируют государственных чиновников, делая
130
невозможным принятие ими решений, адекватных фактической наркоситуации. Изложенная противоречивая ситуация ставит нас перед необходимостью нахождения динамической модели развития наркоситуации в России применением научно-обоснованных и закрепленных государственными стандартами РФ [21], [53], [54] и др. методов математического моделирования. 4. Можно ли считать, что количество больных наркозависимостью в России возросло?
Вследствие доказанности того, что значения экспертных оценок не могут служить объективными характеристиками наркоситуации в России, для решения задачи о приросте больных наркоманией воспользуемся методом доверительных интервалов. Обратимся к неэкспертным оценкам. В сборнике [2] находим, что "По данным Минздрава России количество потребителей наркотиков на первое полугодие 1999 г. составило 315 тыс. человек". Из источника [66] известно, что по данным Минздрава России, к началу 2003 г в России зарегистрировано 340 тысяч больных наркоманией. С какой надежностью можно утверждать, что за истекшие 4 года количество больных наркоманией возросло? Иначе говоря, с какой надежностью можно утверждать, что увеличение количества больных наркоманией с 315 тысяч до 340 тысяч не есть случайное колебание численности больных. Считая, что с 1999 года по 2003 год общее количество жителей России не претерпело значительных изменений, условимся, что Россию населяет 145 миллионов человек. Вычислим точечные оценки p* и p** вероятностей того, что взятый наугад житель России болен наркозависимостью. p* = 315000/145000000 = 0.00217. p** = 340000/145000000 = 0.00234. Нам известно, что значения точечных оценок p* и p** не есть точные значения искомых вероятностей. Нам известно, что значения искомых вероятностей находятся в границах некоторых доверительных интервалов вероятностей. Нам известно также, что границы доверительных интервалов вероятностей можно вычислить, воспользовавшись формулами (26) и значениями величины t, взятой из таблицы 3 при заданной надежности γ. Обозначим через p*1 и p*2 границы доверительного интервала значения вероятностной оценки наркоситуации в 1999 году, через p**1 и p**2 - к началу 2003 года.
131
Вследствие того, что искомый результат имеет важное государственное значение, зададимся высокой надежностью. Положим надежность γ = 0.99999. В таблице 3 находим, что для такого значения надежности значение характеристики t, необходимой для применения формул (26), равно 4.5. Подставив в формулы (26) значения n = 145 млн., t = 4.5, p*= 0.00217 и выполнив вычисления, находим, что p*1 = 0.00216. p*2 = 0.0022. Выполнив такой же расчет для n = 145 млн., t = 4.5 и p**= 0.00234 находим, что p**1 = 0.00233, p**2 =0.0024. Итак, нами найдены доверительные интервалы (0.00216, 0.0022) и (0.00233, 0.0024). Значение правой границы первого доверительного интервала меньше, чем значение левой границы второго доверительного интервала, т. е. 0.0022 < 0.00233. Значит, найденные доверительные интервалы не пересекаются. Так как интервалы не пересекаются, приходим к заключению о том, что изменение количества больных наркозависимостью с 315 тысяч в 1999 году до 340 тысяч в 1992 году явление неслучайное. Имеет место рост заболеваемости наркозависимостью. Вывод. С надежностью 0.99999 можно утверждать, что увеличение количества больных наркозависимостью в России с 315 тысяч до 340 тысяч доказано. Ту же задачу можно решить, воспользовавшись свойствами нормально распределенной случайной величины. Известно, что если считать точечную оценку вероятности случайной величиной, то при больших значениях объемов выборок эта случайная величина распределена по нормальному закону со значениями характеристик а и σ, вычисляемыми применением формул (21). В нашем случае, применив формулы (21) для оценки 1999 года при n = 145 миллионов находим, что а = 0.00217, σ = 3.86647 · 10-6. При t = 4.5 правая граница первого доверительного интервала будет равна: 0.00217 + 4.5 · 3.86647 · 10-6 = 0.0022. Применив формулы (21) для оценки 2003 года при n = 145 миллионов находим, что а = 0.00234, σ = 4.01662 · 10-6. При t = 4.5 левая граница второго доверительного интервала будет равна: 0.00234 - 4.5 · 4.01662 · 10-6 = 0.00233.
132
Сравнив значения правой границы первого доверительного интервала и левой границы второго доверительного интервала замечаем, что 0.0022<0.00233. Следовательно, границы интервалов не пересекаются. Вывод. С надежностью 0.99999 можно утверждать, что увеличение количества больных наркозависимостью в России с 315 тысяч до 340 тысяч доказано. Применение свойств нормально распределенной случайной величины позволило при решении задачи избежать использования громоздких и труднозапоминаемых формул (26). Имеющий математическую подготовку в объеме технического вуза читатель может ознакомиться с новыми результатами решения задач нахождения границ доверительных интервалов, воспользовавшись работой [81]. ЗАДАЧИ К §7
Задача 7.1. Специалистами выявлено, что среди 500 воспитанников-выпускников школы 29 употребляют наркотики. Найти доверительный интервал, накрывающий с надежностью 0.99 неизвестную вероятность p того, что выпускник школы окажется наркоманом. Решение. Вычислим точечную оценку p* искомой вероятности p. p*= 29/500 = 0.058. Воспользовавшись формулами (26) при p*= 0.058, n = 500, t = 2.6 (см. в таблице 3 для γ = 0.99) находим: p1= 0.036, p2= 0.092. Ответ. Вероятность p того, что выпускник школы - наркоман подчинена неравенству 0.036 < p < 0.092. Говоря бытовым языком: 3.6 - 9.1%. Замечание 7.9. Согласно данным, опубликованным в [66], каждый четвертый молодой человек в России страдает наркозависимостью. Задача 7.2. Согласно данным, опубликованным в "Российском статистическом ежегоднике" [67], на 1 января 2001 г. в России насчитывалось 54 млн. 121 тыс. человек в возрасте от 10 до 34 лет включительно. Согласно данным, опубликованным в [66] от 28.07.2001, четверть молодых людей России страдает наркозависимостью. С надежностью 0.99999 вычислить границы доверительного интервала вероятности, что любой молодой человек возраста от 10 до 34 лет включительно страдает наркозависимостью.
133
Решение. Согласно данным, опубликованным в [66], p*= 0.25. Согласно данным, опубликованным в [67], количество людей в России возраста от 10 до 34 лет – n = 54121000. Для надежности γ = 0.99999 в таблице 3 находим: t = 4.5. Подставив найденные значения p*= 0.25, n = 54121000 и t = 4.5 в формулы (26) и выполнив вычисления, находим, что p1= 0.249735, p2= 0.2503. Вероятности p1= 0.249735 и p2= 0.2503 отличаются столь незначительно (всего на пять десятитысячных), что их можно считать одинаковыми. Ответ. Границы доверительного интервала вероятностей столь незначительно отличаются, что оценку "четверть молодых людей России страдают наркозависимостью" можно рассматривать и без применения доверительного интервала вероятностей... Если продолжать поручать оценку наркоситуации экспертам-специалистам, а не специалистам по математическому моделированию. Задача 7.3. Специалистами выявлено, что среди 500 воспитанниковвыпускников школы 29 употребляют наркотики. Можно ли считать, что среди выпускников школы "обычно 29/500 = 5.8% наркоманов"? Решение. Во-первых, вероятностная оценка при выполнении научных исследований не исчисляется в процентах. Во вторых, данная задача является типичной задачей, требующей в качестве оценки наркоситуации нахождения доверительного интервала вероятностей. Задача 7.4. Для читателей, знакомых с элементами дифференциального и интегрального исчисления в объеме 1-го курса вуза. В вузе выполнено обследование. Из всех студентов вуза отобрали 100 человек и обнаружили, что среди них 10 наркоманов. С какой надежностью можно утверждать, что вероятность того, что любой наудачу выбранный студент вуза наркоман, находится в интервале (0.09, 0.11). Решение. Найдем значение точечной оценки вероятности. p*= 10/100 = 0.1. Известно, что распределение точечной оценки вероятности при больших объемах выборки близко к нормальному закону. Будем считать, что число n = 100 - достаточно большое. Тогда, применив формулы (21) находим, что a = 0.1, σ = 0.03. Подставив найденные значения характеристик в аналитическое выражение плотности вероятности (12) нормально распределенной случайной величины находим, что плотность вероятности y(x) записывается, как
134
y ( x) =
1 e 0.03 2π
−
( x − 0.1)2 2 ⋅ 0.032
.
Выполнив интегрирование в пределах от 0.09 до 0.11 находим, что 1 0.03 2π
0.11 −
∫
e
( x −0.1)2 2 ⋅ 0.032
dx = 0.26
0.09
Ответ. Надежность результата равна 0.26. Вряд ли такое значение надежности можно считать приемлемым при решении Государственных задач оценки наркоситуации в России.
135
§8. КИНЕМАТИЧЕСКАЯ МОДЕЛЬ НАРКОСИТУАЦИИ В РОССИИ 1. Предварительные замечания
Очевидно, что для нахождения временной модели развития наркоситуации необходимо иметь в наличии численные характеристики наркоситуации в разные моменты времени. Тогда, применив методы математического моделирования, можно найти закон, по которому происходит изменение наркоситуации во времени. От точности численных значений исходных характеристик полностью зависит точность найденной модели. Затем, в свою очередь, применив результаты найденной модели к какому-либо будущему моменту времени можно выполнить прогноз наркоситуации в каком-нибудь будущем году. Например, в 2010 и т. д. Однако, к настоящему времени точность результатов численных оценок наркоситуации в России, предоставляемых нам экспертами оставляет желать лучшего. Читателю известно, что даже в рамках одних и тех же публикаций, например, [66], [67], результаты численных оценок наркоситуации в России значительно отличаются друг от друга. Например, в публикациях [66], [67] можно найти разные, но одинаково обоснованные заключения. С одной стороны, опираясь на опубликованные результаты экспертных оценок можно утверждать, что в настоящее время в России около 2 млн. 700 тыс. больных наркозависимостью, с другой стороны, в тех же публикациях утверждается, что больных наркозависимостью в России более 4 миллионов, но из той же статьи мы узнаем, что только среди молодых людей России ¼ больны наркоманией, а это уже больше 13 миллионов. Точные численные оценки, хоть и не всей наркоситуации, но в большей степени поддающиеся учету, мы получаем из медицинских источников. Например, в публикации [66], со ссылкой на медицинские источники сообщено, что к началу 2003 года на учете в России состояло 340 тысяч больных наркозависимостью. Некоторые из врачей-эпидемиологов и наркологов утверждают, что развитие наркоситуации в России происходит по законам развития эпидемии. В рамках естествознания законы развития эпидемии найдены и не только опубликованы, но и вошли в специальные учебники, учебные пособия и хрестоматии. Например, популярное изложение некоторых из моделей развития эпидемии, по сложности изложения рассчитанное на школьников старших классов и преподавателей средней школы, можно найти в брошюрах "Дифференциальные уравнения в приложениях" [68] и "Познакомьтесь с математическим моделированием" [69]. Более подробное
136
изложение моделей динамики популяций, в том числе популяций, охваченных эпидемией, напечатано в книгах [50], [70], [71] и др. Попытки математического моделирования динамики популяций, в том числе популяций, пораженных эпидемией, предпринимались давно. Принято считать, что одной из первых моделей роста изолированной популяции является математическая модель, предложенная в 1798 году Мальтусом (1766-1834). Позже, в некоторых направлениях естествознания, найденную Мальтусом модель стали называть законом Мальтуса. Развитие и уточнение модели Мальтуса найдено в 1825 году Б. Гомпертцем. В свою очередь, уточнение модели Гомпертца найдено в 1838 году Ф. Ферхюльстом. По мнению авторов книги [71], наиболее серьезное исследование моделей биологических сообществ было приведено в работе [72] В. Вольтерра (1860-1940). По мнению автора, наиболее современное развитие модели В. Вольтерра найдено В.И. Зубовым и опубликовано в работе [73] и др. 2. Линейная модель развития наркоситуации в России
Из школьного курса математики известно, что самой простой встречающейся в естествознании зависимостью, является зависимость прямо пропорциональная и обратно пропорциональная. Из того же школьного курса математики известно, что прямо пропорциональная и обратно пропорциональная зависимость есть зависимость линейная, записываемая в общем виде, как y = kt + b,
(30)
где t - время, k = const, b = const - постоянные, вычисляемые применением результатов измерений, выполненных в разные моменты времени, y - количество наркоманов в момент времени t. Доказано и известно, что математическое моделирование, выполненное применением линейной модели (30), с одной стороны, позволяет без использования громоздкого математического аппарата найти решение задачи прогноза исследуемого явления, с другой стороны, найденное решение в большинстве случаев является весьма приблизительным и не может быть использовано в качестве результата решения задач, требующих высокой точности результатов. Поэтому, как правило, при решении задач прогноза приближение линейной моделью используется лишь для прогнозирования в относительно коротких временных интервалах. Тем не менее, хоть и нечасто, но иногда применение линейного прогноза позволяет находить весьма точные результаты. Например, из книги [76] известны количества алкоголя в
137
пересчете на чистый этиловый спирт, производимые в СССР на душу населения с 1965 по 1980 годы. Запишем эти числа в таблицу 4. ТАБЛИЦА 4 КОЛИЧЕСТВО ПОТРЕБЛЯЕМОГО АЛКОГОЛЯ НА ДУШУ НАСЕЛЕНИЯ В СССР В ПЕРЕСЧЕТЕ НА ЧИСТЫЙ ЭТИЛОВЫЙ СПИРТ Год
1965
1970
1975
1980
Литров спирта
4.56
6.75
8.74
10.83
Считая 1965 год за нулевую точку временного отсчета, 1975 год будет соответствовать моменту времени t = 5 и т. д. Обозначив через y(t) потребление спирта на душу населения в СССР, применив методы линейного прогноза, воспользовавшись данными из таблицы 4, можно найти линейное уравнение, описывающее функциональную зависимость между номером года t и количеством чистого спирта y(t), употребляемого за год "в среднем" одним жителем СССР. y(t) = 0.416 t + 4.6.
(30*)
Например, для 1980 года значение времени t = 15. Откуда y(t) = 10.84. Найденный результат только на 0.1 отличается от табличного значения, т. е. хорошо соответствует фактическим данным. К сожалению, автор не располагает подробными многолетними данными о количествах наркотиков, употребленных наркоманами России в разные годы. Поэтому вследствие того, что мы не имеем почти никаких объективных исходных данных, численно характеризующих наркоситуацию в России, используем данные, наиболее заслуживающие доверия - результаты учета больных наркозависимостью в России врачаминаркологами. В сборнике [2,с.20] напечатано, что по данным Минздрава России, количество поставленных на учет наркоманов на начало 1999 года составляло 315 тысяч. В публикации [66] находим, что по данным Минздрава России, количество поставленных на учет наркоманов на 1 января 2003 года составляло 340 тысяч. Для нахождения значений коэффициентов k и b модели (30) будем считать, что начало 1999 года соответствует концу 1998 года, т. е. количество наркоманов в России, зарегистрированных в Минздраве в конце 1998 года было 315 тысяч, в конце 2002 года 340 тысяч. Примем момент времени, соответствующий концу 1998 года за нулевой момент времени. Тогда конец 1999 года будет соответствовать моменту времени
138
t = 1, конец 2000 года моменту времени t = 2, 2001 года - t = 3, 2002 года t = 4 и т. д. Итак, в момент времени t = 0 зарегистрированных в Минздраве России наркоманов было 315 тысяч, в момент времени t = 4 – 340 тысяч. Подставив значения t = 0 и t = 4 и соответствующие им значения y = 315 · 103 и y = 340 · 103 в выражение (30) и выполнив вычисления, находим, что k = 6250, b = 315 · 103. Следовательно, линейную модель развития наркоситуации в России можно записать, как y = 6250 t + 315 · 103.
(31)
Линейная модель (24) не учитывает увеличения скорости роста наркомании. Например, выполнив прогноз количества наркоманов в России на конец 2003 года (2003 году соответствует t = 5) применением модели (31) находим, что y = 6250 · 5 + 315 · 103 = 346250 человек. Найденный результат противоречит заявлениям представителей правоохранительных органов России о том, что темпы роста количества больных наркозависимостью в 2003 году возросли по сравнению с 2002 годом. И, несмотря на то, что заявления отдельных, пусть и уполномоченных лиц в средствах массовой информации нельзя приравнивать к официальным государственным статистическим данным, все же, за неимением последних, с некоторыми оговорками, по содержанию заявлений уполномоченных лиц можно приблизительно судить о качественном характере изменений наркоситуации. Поэтому линейную модель наркоситуации нельзя считать адекватно описывающей развитие наркоситуации в России. Следовательно, необходимо применение методов нелинейного математического моделирования. Одним из классов нелинейных моделей являются модели экспоненциальные. 3. Экспоненциальная модель развития наркоситуации в России
Вследствие того, что мы не имеем почти никаких объективных исходных данных, численно характеризующих наркоситуацию в России, используем данные, наиболее заслуживающие доверия - результаты учета больных наркозависимостью в России врачами-наркологами. В сборнике [2, с.20] напечатано, что по данным Минздрава России количество поставленных на учет наркоманов на первое полугодие 1999 года составляло 315 тысяч. В публикации [66] находим, что по данным Минздрава России количество поставленных на учет наркоманов на 1 января 2003 года составляло 340 тысяч. В п.2 настоящего параграфа оговорено, что за нулевую временную точку отсчета t = 0 будем считать 1998 год. Тогда значение временной
139
характеристики t в последующие годы будет равно: 1999 год – t = 1, 2000 год – t = 2, 2001 год – t = 3, 2002 год – t = 4, 2003 год – t = 5 и т. д. Нам неизвестны меры, которые будут предприняты правительством России и государственными чиновниками по контролю наркоситуации. Кроме того, нам неизвестно, к каким последствиям приведут эти будущие меры по контролю наркоситуации. Предположим крайний вариант: в целях упрощения модели предположим, что государственные чиновники России будут полностью бездействовать и никаких новых, ни законодательных, ни исполнительных актов по пресечению действий наркодельцов предпринято не будет. Для еще большего упрощения будем считать, что количество населения России продолжит оставаться постоянным - 145 млн. человек. При таких весьма широких допущениях для описания наркоситуации применима модель Мальтуса, записываемая аналитически, как N = N0 ekt,
(30)
где N0 - количество наркоманов в начальный момент времени, t - время, отсчитываемое в годах от начального момента времени t0= 0, k коэффициент, называемый относительной или удельной скоростью изменения количества наркоманов, фактически представляющий собой разность между коэффициентом воспроизводства новых наркоманов (т. е. скорости, с которой наркоман заражает своей болезнью в единицу времени на одного человека) и коэффициентом смертности, N - общее количество зарегистрированных наркоманов в России, e - константа, приблизительно равная 2.718. Замечание 8.1. Вывод модели (30) см. в приложении 3. Примем за нулевую точку отсчета конец 1998 года, т. е. условимся считать, что величина t для конца 1998 года равна 0. Тогда при t = 0 значение N0= 315 · 103. Следовательно, аналитическое выражение (30) примет вид N = 315 · 103 · ekt . Нам известно, что количество зарегистрированных наркоманов на конец 2002 года было равно 340 тысяч, т. е. при t = 4, N = 340 · 103. Следовательно, имеет место равенство: 340 · 103 = 315 · 103 · ek·4. Из найденного равенства, применив логарифмирование, находим, что k = 0.019. Таким образом, экспоненциальную модель (30) развития наркоситуации в России можно записать, как
140
N = 315 · 103 · e0.019t.
(31)
Найденное аналитическое выражение (31) есть закон изменения количества больных наркоманией с течением времени, считая за нулевое время конец 1998 года. Модель описывает изменение во времени количества зарегистрированных наркозависимых больных. Применив модель (31) вычислим время, через которое все 145 миллионов жителей России будут зарегистрированы, как больные наркозависимостью. Приравняв значение величины N в правой части равенства (26) значению 145 · 106 запишем: 145 · 106 = 315 · 103 · e0.019t. Применив логарифмирование и выполнив вычисления, находим, что t ≈ 320 лет. Может показаться, что найденное применением модели (31) время полной наркотизации всего населения России представляет интерес разве что для писателей-фантастов. Однако известно, что на самом деле значительная часть больных наркоманией находится вне поля регистрационного медицинского контроля. Поэтому, найденный применением модели (31) результат является заведомо завышенным. Для того, чтобы применением модели (31) можно было описать фактическую картину наркоситуации в России, необходимо внести в нее уточняющий коэффициент. С этой целью обозначим через Q - уточняющий безразмерный коэффициент, численно равный отношению фактического количества больных наркоманией к количеству больных наркоманией, зарегистрированных в Минздраве России. Например, если органами здравоохранения зафиксирован 1 больной, а коэффициент Q = 10, то это означает, что фактическое количество больных в 10 раз больше зарегистрированного числа больных. Значение коэффициента Q в настоящее время неизвестно и его нахождение требует дополнительных исследований, назначенных компетентными государственными чиновниками. Очевидно, что значение коэффициента Q > 1. Запишем экспоненциальную модель наркоситуации в России с учетом коэффициента Q: N = 315 · 103 · Q · e0.019t. Положим Q = 10, тогда уточненная модель: N = 315 · 104 · e0.019t .
(27)
Вычислим применением уточненной модели время t, через которое 145-миллионное население России будет полностью поражено эпидемией
141
наркозависимости. Для этого приравняем число N, стоящее в левой части модели, 145 миллионам. Запишем: 145 · 106 = 315 · 104 · e0.019t. Решив уравнение относительно t, находим, что t ≈ 201 год. Создается впечатление, что наркоситуация в России не является тревожной и, как минимум, в ближайшие десятилетия не представляет угрозы для нации. Вместе с тем, найденный результат доказывает, что Россия является чрезвычайно притягательным рынком сбыта для отечественных и зарубежных производителей наркотиков, как минимум, на ближайшие обозримые десятилетия. По мнению автора, не случайно в Послании Федеральному собранию Российской Федерации президент В.В. Путин оценил проблему распространения наркотиков и психотропных средств в России, как достигшую угрожающих масштабов и поставил ее в один ряд с опасностью применения оружия массового уничтожения. Не случайно в 2003 году в России создан Госкомитет Госнаркоконтроля Российской Федерации. В целях иллюстрации на рис.17 помещена графическая интерпретация модели (31) и модели (32) при значении Q = 10.
Рис.17.
142
На рис.17. По оси абсцисс - время в годах. По оси ординат количество больных наркозависимостью в России. Горизонтальная прямая на значении ординат 145 миллионов - население Росси. Кривая слева: модель (32) - график функции N = 315 · 104 · e0.019t. Кривая справа: модель (31) - график функции N = 315 · 103 · Q · e0.019t. Опишем подробнее физический смысл коэффициента k, входящего в модели (31) и (32) со значением k = 0.019. Коэффициент удельной скорости роста k характеризует внутренне присущую живым организмам способность к увеличению численности в отсутствие лимитирующих факторов внешней среды. Показатель k используется для количественного выражения "репродуктивной способности" носителей эпидемии. Если через B обозначить коэффициент рождаемости, т. е. скорость появления нового зараженного наркоманией субъекта в единицу времени на одну особь зараженной популяции, а через D - коэффициент смертности, то они окажутся связанными с коэффициентом k равенством B – D = k. Величину k в экологии иногда называют мальтузианским параметром популяции. При значениях k > 0 количество пораженных эпидемией особей с ростом времени растет. При k < 0 - уменьшается, при k = 0 - остается постоянным. Замечание 8.2. Читатель, знакомый с дифференциальными уравнениями заметит, что модель (30) есть решение дифференциального уравнения dN =k. N dt По мнению автора, найденный применением модели (30) результат население России есть почти неисчерпаемый рынок сбыта для дельцов наркомафии, является доказательством того, что первостепенное влияние на сценарий развития наркоситуации в России в обозримом будущем могут оказать только государственные меры по управлению наркоситуацией. В связи с этим, особо важную роль приобретает необходимость применения исключительно только научно-обоснованных методов оценки наркоситуации и создания научно-обоснованных средств, методов и систем управления текущим состоянием наркоситуации. Решение такой задачи возможно только на государственном уровне. Усилия отдельных гражданэнтузиастов, даже объединенных в общественные организации, не могут оказать существенного влияния на прекращение распространения наркоэпидемии в России. В свою очередь, оценка текущей наркоситуации и прогноз ее развития должен быть поручен только лицам,
143
профессионально подготовленным в государственных высших учебных заведениях по специальностям, ориентированным на применение методов математического моделирования и математической теории управления. Замечание 8.3. По мнению автора, базовым учебником по теории управления является книга [74]. 4. Логистическая модель развития наркоситуации в России
Модель развития наркоситуации, изложенная в п.3 настоящего параграфа, является в значительной мере моделью приближенной. Изложим найденную автором более точную модель, основанную на логистическом законе развития эпидемии. Известно, что логистический закон записывается аналитическим выражением
N (t ) =
kN 0 e kt
(
k − aN 0 1 − e kt
),
(33)
где N0 - количество пораженных эпидемией особей в момент времени t = 0, a = const, k = const - коэффициенты, вычисляемые применением результатов измерений количества больных наркозависимостью в разные моменты времени t, N(t) - количество больных наркозависимостью в момент времени t ≥ 0. Исходя из того, что в нулевой момент времени, соответствующий 1998 году, количество зарегистрированных больных наркозависимостью в России было 315 тысяч, а к началу 2003 года возросло до 340 тысяч, вычислены значения коэффициентов a и k: a ≈ 1.29 · 10-10 , k ≈ 0.02. Замечание 8.4. Для применения модели (33) необходимо знание количества наркоманов не за 2 года, т. е. 1998 и 2002 годы, а хотя бы за 3 года. Вследствие того, что мы не располагаем такими данными, применением модели (26) вычисляется прогноз количества наркоманов, например, на 2004 год. Только после этого становится возможным вычисление значений констант а и k. Однако, для вычисления значений а и k требуется применение методов решения нелинейных уравнений. Например, метода Ньютона. Вследствие относительной громоздкости, ход вычислений значений констант а и k не изложен. О методе Ньютона заинтересованный читатель может прочесть в книге [82] и др. Подставив значения констант a и k в правую часть аналитического выражения (33) находим, что логистическая модель развития наркоситуации в России может быть записана, как
144
0.02 ⋅ 315 ⋅ 103 ⋅ e 0.02t . N (t ) = 0.02 − 1.29 ⋅ 10 −10 1 − e 0.02t
(
)
(34)
Замечание 8.5. В целях удобства читателя в выражении (34) арифметические вычисления не сделаны. Модель (34) учитывает естественную убыль количества наркозависимых больных вследствие их ускоренного вымирания по сравнению с естественной смертностью непораженной эпидемией наркомании частью населения. Кроме того, модель (34) учитывает ограниченность объема человеческих ресурсов. Прогноз, выполненный применением модели (34), позволяет прийти к заключению о том, что все население России окажется больным наркоманией приблизительно через 440 лет. Графическая интерпретация модели (34) помещена на рис.18.
Рис.18. На рис.18. По оси абсцисс - время в годах. По оси ординат количество больных наркозависимостью. Логистическая модель является моделью, более адекватно описывающей наркоситуацию, чем модели линейная и экспоненциальная. Логистическая модель хорошо отражает начальный экспоненциальный рост количества больных наркозависимостью и асимптотическое
145
установление ее численности к некоторому конечному значению - всему населению России. При относительно малых значениях числа N - больных наркоманией рост количества больных носит экспоненциальный характер. С возрастанием времени t растет число больных N, ресурсы населения уменьшаются, скорость роста количества больных постепенно замедляется. В конечной фазе развития все население страны становится больным наркоманией. Найденный применением логистической модели результат - для полной наркотизации России потребуется более 400 лет, подтверждает доказанный в п.3 настоящего параграфа вывод автора о том, что Россия почти неисчерпаемый рынок сбыта для наркоторговцев. Поэтому решение задачи управления наркоситуацией возможно только применением мер государственного регулирования. 5. Модель "Один наркоман против 145 миллионов россиян". Наркоман начинает и выигрывает
Очевидно, что для того, чтобы иметь возможность контролировать наркоэпидемию, т. е. своевременно применять те или иные мероприятия, необходимо уметь сравнивать эффективность этих мероприятий. В свою очередь, сравнивать разные методы предполагаемого контроля возможно только в тех случаях, в которых есть возможность предсказать, как именно при том или ином мероприятии будет меняться ход развития наркоэпидемии. Отсюда вытекает необходимость нахождения математической модели, применение результатов которой может служить целям прогноза. В целях простоты найдем математическую модель самого простого мероприятия - отсутствия какого-либо контроля со стороны чиновников и подчиненных им силовых структур за развитием наркоситуации в России. Такая модель в какой-то мере позволит оценить фактическую эффективность принимающихся в настоящее время и планируемых на будущее операций наркоконтроля. Пусть имеется N = 145 · 106 здоровых людей. Для простоты будем считать, что в настоящее время из 145 миллионов россиян нет ни одного наркомана. Пусть в некоторый момент времени t = 0 в Россию попадает 1 наркоман. Будем предполагать, что с этим наркоманом не случится какойнибудь несчастный случай или его своевременно не ликвидируют. Будем предполагать, что этот единственный на всю Россию наркоман за год сможет найти среди россиян такого, который под влиянием этого единственного наркомана тоже станет наркоманом. Будем предполагать, что теперь уже два наркомана в следующий год вовлекут в наркоманию по
146
одному человеку. В следующий год уже четыре наркомана вовлекут в наркоманию каждый всего по одному человеку и т. д. Будем также предполагать, что никакого удаления наркоманов из России и никакого ограничения их контактов с населением происходить не будет. Кроме того, будем считать, что любой заболевший наркоманией в течение исследуемого нами промежутка времени не умрет и не прекратит по какой-либо причине употреблять наркотики. Через какое время все 145 миллионов человек, населяющих Россию, станут наркоманами? Минуя громоздкие математические выкладки, представляющие собой составление дифференциальных уравнений и нахождения их решений, запишем окончательный результат:
N (t ) =
N +1
N ⋅ e − a ( N +1)t + 1
,
(35)
где N = 145 · 106 - количество россиян, t - время в годах, а коэффициент пропорциональности. N(t) - количество человек, ставших наркоманами по прошествии времени t. Замечание 8.6. Вывод формулы (30) см. в приложении 4. Найдем неизвестное значение коэффициента а. При t = 0, как и следует ожидать, N(0) = 1, т. е. пока наркоман одинок. Однако при t = 1, т. е. по прошествии года, наркоманов стало уже 2, т. е. N(1) = 2. Подставив значение t = 1 и N(t) = 2 в выражение (35) и выполнив вычисления, находим, что 4.78 · 10-9. Подставив значение коэффициента а = 4.78 · 10-9 в правую часть выражения (35), запишем модель развития наркоситуации. N (t ) =
N +1 N ⋅e
− 4.78⋅10 − 9 ⋅( N +1)t
+1
,
(36)
Применив найденную модель (36), нетрудно вычислить количество наркоманов в любой момент времени t. В частности, оценить время t, через которое все 145 · 106 жителей России станут наркоманами. Минуя вычислительные выкладки, приведем результат: в изложенной игре "Один наркоман против всех 145 миллионов Россиян". Наркоман начинает и выигрывает всего через 38 лет.
147
На рис.19 помещена графическая интерпретация модели (36).
Рис.19. На рис.19: по оси абсцисс - время в годах, по оси ординат - значения функции N(t), т. е. количества человек, пораженных наркоманией. По мнению автора, интересной особенностью сферы применения модели (36) является возможность численной оценки временной точки отсчета, с которой началась наркоэпидемия в России. Подставив в левую часть модели (36) вместо величины N(t) количество зарегистрированных в России в конце 1998 года больных наркоманией N(t) = 315 · 103 (человек) и решив найденное уравнение относительно неизвестного времени t, находим, что значение t = 18.27 лет. Если же в левую часть модели (31) подставить N(t) = 340 · 103 - количество зафиксированных в России наркоманов в конце 2002 года, то решив найденное уравнение относительно неизвестного времени t находим, что t = 18.38 лет, т. е. несмотря на отличие исходных значений зарегистрированных количеств наркоманов, применением результатов модели (36) мы находим близкие по времени вычисленные моменты начала наркоэпидемии в России: 1998 – 18 = 1980 год или 2002 - 18 = 1984 год. Предположим, что фактическое количество больных наркоманией в Росси к концу 1998 года было не 315 · 103 человек, а в 10 раз большее -
148
N(t) = 315 · 104, а к концу 2002 года не 340 · 103, а N(t) = 340 · 104 человек. Подставив значения N(t) = 315 · 104 и N(t) = 340 · 104 в левую часть модели (36) и решив найденные уравнения относительно t, находим, что t = 21.6 ≈ 22 и t = 21.7 ≈ 22 года. Откуда нетрудно вычислить время начала наркоэпидемии: 1998 - 22 = 1976 год или 2002 - 22 = 1980 год. Вычисленные моменты начала эпидемии, несмотря на значительную, более чем в 10 раз, разницу в исходных данных, в результате применения результатов модели (31), приводят нас к одному и тому же заключению: начало наркоэпидемии в России произошло в конце 70-х - начале 80-х годов XX века. Найденный результат полностью подтверждает справедливость неоднократно обнародованного в средствах массовой информации заявления президента России В.В. Путина о том, что толчком к началу наркоэпидемии в Росси послужил хлынувший в страну контрабандный поток наркотиков из Афганистана в период СоветскоАфганской войны, начавшейся в 1979 году и длившейся до 1989 года. Выполнив исследование модели (36) на нахождение стационарных точек нетрудно вычислить, что стационарным точкам модели (36) соответствуют точки значений временного аргумента t с координатами t ≈ 25 лет, t ≈ 27 лет и t ≈ 29 лет от начала эпидемии. Приняв за момент начала наркоэпидемии в России 1980 год, приходим к предварительному заключению о том, что примерно с 1980 + 25 = 2005 года ожидается резкое увеличение количества наркоманов в России, которое продлится до 1980 + 27 = 2007 года. С 2007 года начнется спад скорости роста наркоэпидемии, который с 1980 + 29 = 2009 года замедлится. Замечание 8.7. Изложенные результаты расчета выполнены применением результатов модели, не учитывающей будущие государственные мероприятия по контролю над наркоситуацией. В частности, расчет выполнен без учета мероприятий, которые будет проводить созданная в 2003 году государственная инфраструктура Госнаркоконтроля Российской Федерации. Модель "Один наркоман против 43 миллионов российской молодежи. Наркоман начинает и выигрывает"
Применим модель (35) для оценки времени, которое требуется для того, чтобы вся молодежь России стала наркоманами. Будем считать, что молодежью являются те люди, возраст которых от 15 до 34 лет. Воспользовавшись статистическим ежегодником [67] находим, что на 1 января 2001 года в России насчитывалось 42 миллиона 597 тысяч молодежи, т. е. N = 4.2597 · 107. Применив формулу (35) при t = 1 и N(t) = 2
149
находим, что в этом случае значение коэффициента а равно 1.62 · 10-8. Подставив найденное значение коэффициента а = 1.62 · 10-8 и значение N = 4.2597 · 107 в правую часть выражения (30) находим: N (t ) =
4.2597 ⋅ 10 7 + 1 4.2597 ⋅ e − 4.78⋅10
−9
(
)
⋅ 4.2597⋅10 7 +1 ⋅t
+1
.
(37)
Найденная модель (37) есть модель, описывающая изменение количества молодежи, ставшей наркоманами, в зависимости от значения текущего времени t. Выполнив вычисления применением результатов модели (32) находим, что для того, чтобы все 42 миллиона 597 тысяч молодежи России стали наркоманами, требуется 35 лет, т. е. всего на 3 года меньше, чем для распространения эпидемии наркомании на все 145-миллионное население России. Итак, если в среду, состоящую из 42 миллионов 597 тысяч российской молодежи считая, что среди нее нет ни одного наркомана, допустить всего одного наркомана и допустить, что в течение одного года каждый наркоман будет вовлекать в употребление наркотиков всего одного человека, то через 35 лет у нас не останется молодежи, не употребляющей наркотики! Применив модель (37) вычислим, сколько лет назад началась эпидемия наркомании среди молодежи России. Считая, что в 1998 году в России было зарегистрировано 315 тысяч наркоманов, и что все наркоманы принадлежат возрастной категории лиц от 15 до 34 лет, подставив число 315 тысяч в левую часть выражения 32 и решив получившееся уравнение, находим, что t ≈ 18 годам. Выполнив вычисление: 1998 - 18 = 1980, мы снова нашли тот же результат - эпидемия наркомании в России началась около 1980 года, т. е. начало наркоэпидемии совпадает с начальным периодом Советско-Афганской войны. В целях углубления знаний о динамике развития наркоэпидемии в России исследуем скорость роста количества больных наркозависимостью среди молодежи. Исследовав производную функции N(t), записанной выражением (32) можно найти, что стационарной точкой функции, соответствующей ее максимуму, является точка с координатой абсциссы t ≈ 25 лет, т. е. примерно соответствует 2005 году. В целях иллюстрации на рис.20 помещен график функции изменения скорости роста наркомании среди молодежи в России.
150
Рис.20. На рис.20. По оси абсцисс - время в годах. За нулевую точку отсчета принят 1980 год. По оси ординат - скорость роста количества больных наркоманией среди молодежи в России. Замечание 8.8. Найденная модель не учитывает влияния будущих, неизвестных автору мероприятий по контролю над наркоситуацией. 6. О более точных моделях наркоситуации
Читателю известно, что более точные модели развития популяции и эпидемии внутри популяции были найдены уже в XX веке В. Вольтерра (1860-1940), А.Н. Колмогоровым (1903-1987), В.И. Зубовым (1930-2000). Для применения результатов этих моделей автору необходимо наличие значительно большего количества численных исходных данных о состоянии наркоситуации в России. Это, в свою очередь, требует глобальных - в масштабах всей России, дополнительных исследований, выполнить которые, опираясь только на личный энтузиазм, не представляется возможным. Кроме того, известно, что лишь в редких случаях удается решить систему дифференциальных уравнений в замкнутой форме, т. е. представить решение в виде формул, использующих конечное число
151
операций над элементарными функциями. Такая ситуация схожа с ситуацией, имеющей место при решении алгебраических уравнений, известных из школьного курса элементарной математики: в случае алгебраических уравнений первой и второй степени их решения могут быть легко найдены. Если обратиться к уравнениям третьей и четвертой степени, то их решения хоть и могут быть найдены в виде формул, но эти формулы становятся чрезвычайно громоздкими. Что же касается решений алгебраических уравнений степени выше четвертой, то решение таких уравнений в виде готовых формул (в радикалах), в общем случае, не может быть найдено. В случаях, в которых исследуемое явление описывается системой дифференциальных уравнений, а к таким случаям относится и подробное исследование наркоситуации в России, приходится прибегать к применению результатов качественной теории дифференциальных уравнений. Последняя выходит далеко за рамки сложности математического аппарата, допустимого к применению в данном пособии. В целях пусть и поверхностного, но все же ознакомления читателя с результатами применения более сложных математических моделей, покажем отдельные черты, для них характерные. Ознакомимся с одной из моделей и качественными результатами ее применения. Пусть имеется некоторая исходная группа людей численностью N. Например, в качестве такой группы может выступать население Российской Федерации по данным переписи 2001 года. Будем считать, что в рассматриваемой группе есть три типа людей: к первому типу относятся те люди, которые с одной стороны восприимчивы к заболеванию наркоманией, с другой, в настоящий момент времени еще здоровы. Изменение количества людей первого типа в зависимости от времени будем обозначать через S(t). Ко второму типу относятся те, которые являются больными наркозависимостью. Будем считать, что они неизлечимы и могут в результате своей жизнедеятельности вовлекать в прием наркотиков здоровых людей из первой группы. Обозначим функцию изменения количества наркоманов в зависимости от текущего времени через I(t). Третья группа людей - это люди, которые здоровы и ни при каких внешних условиях не станут употреблять наркотики. Вследствие каких-то причин, например религиозных (ислам) или гражданских убеждений, эти люди не считают для себя возможным хотя бы и однократный прием наркотиков. Обозначим функцию изменения количества людей третьей группы через R(t). Таким образом, можно записать: N = S(t) + I(t) + R(t).
152
Будем считать, что, когда количество больных наркоманией начнет превосходить некоторое число I*, скорость вовлечения в наркоманию людей, наркоманией пока не больных, будет пропорциональна количеству людей из подгруппы, численность которой описывается функцией S(t). Поэтому каждый человек из первой подгруппы, в конце концов, обязательно должен заболеть наркоманией и когда именно это произойдет вопрос времени. Понятно, что такие искусственно введенные предположения упрощают фактическую ситуацию, но все же описывают существо дела. В иллюстративных целях, не излагая громоздкого математического аппарата, изложим результаты развития наркоситуации во времени при условии соблюдения изложенных выше допущений. Введем дополнительное условие - отношение общества к наркозависимым. Рассмотрим три возможных сценария. Сценарий 1. Общество считает наркозависимых полноценными равноправными членами и с одной стороны не поощряет наркоманию, с другой - не оказывает наркозависимым каких-либо дополнительных, пусть и якобы незначительных благ, по сравнению с ненаркозависимой частью населения. Например, общество не рекламирует достижения в области культуры и искусства, созданные под воздействием наркотических веществ (назовем ее психоделической культурой). В этом случае, количество наркозависимых членов общества некоторое время будет расти за счет пополнения их числа из тех, кто пока не наркозависим, но может таковым стать при некоторых благоприятных для этого стечений обстоятельств, т. е. за счет пополнения из группы S. Иначе говоря, группа S постепенно переродится в группу I. При этом, количество людей из группы R - тех, которые ни при каких обстоятельствах не приемлют для себя пусть и однократного приема наркотиков, будет также расти, но незначительно по сравнению с ростом группы I. Начиная с некоторого времени количество людей в группе I, достигнув предела, прекратит увеличиваться, т. к. его пополнение невозможно ни за счет группы S, ни, тем более, за счет группы R. В результате все население страны разделится на две подгруппы: первую основную часть, состоящую из тех, кто, либо "время от времени", либо постоянно принимает наркотики и вторую, очень немногочисленную "белых ворон", т. е. тех людей, которые так и не примкнут к многочисленным представителям наркоэтноса. Графическая интерпретация результатов развития первого сценария расположена на рис.21.
153
Рис.21. На рис.21. По оси абсцисс - время. По оси ординат - значения функций S(t), I(t) и R(t). Сценарий 2. Общество считает наркозависимых полноценными равноправными членами и не предпринимает каких-либо радикальных мер против распространения наркоэпидемии. Кроме того, пусть и в самой незначительной мере, но общество допускает рекламу и пропаганду достижений, например, в области культуры и искусства, созданных под воздействием наркотических веществ. В этом случае, количество наркозависимых членов общества некоторое время будет расти за счет пополнения их числа из тех, кто пока не наркозависим, но может таковым стать при благоприятных для этого стечений обстоятельств, т. е. за счет пополнения из группы S. Иначе говоря, группа S постепенно переродится в группу I. При этом, количество людей из группы R - тех, которые ни при каких обстоятельствах не приемлют для себя пусть и однократного приема наркотиков, постепенно снижается, но, дойдя до какого-то небольшого количества, становится постоянным.
154
Графическая интерпретация результатов развития второго сценария расположена на рис.22.
Рис.22. На рис.22. По оси абсцисс - время. По оси ординат - значения функций S(t), I(t) и R(t). Сценарий 3. Общество считает наркозависимых полноценными равноправными членами и не только не предпринимает каких-либо радикальных мер против распространения наркоэпидемии, но и предоставляет наркозависимым отдельные преимущества по сравнению с ненаркозависимыми. Рекламируются и пропагандируются достижения в области культуры и искусства, созданные под воздействием наркотических веществ, из государственных и частных фондов выделяется больше средств, например, на медицинское обслуживание, для тех, кто употребляет наркотики, чем для тех, кто не употребляет наркотики. Наркокультура признается за часть национального достояния. Общественной, пусть и официально не провозглашенной нормой становится употребление наркотиков "для облегчения общения", во время отдыха, на молодежных дискотеках, в ночных клубах и т. д.
155
В этом случае, количество наркозависимых членов общества будет расти за счет пополнения их числа из тех, кто пока ненаркозависим, но может таковым стать при благоприятных для этого стечений обстоятельств, т. е. за счет пополнения из группы S. Группа S постепенно перерождается в группу I. Количество людей из группы R - тех, которые ни при каких обстоятельствах не приемлют для себя пусть и однократного приема наркотиков, постепенно снижается и со временем ассимптотически стремится к нулю, т. е. группа вымирает. Замечание 8.9. По мнению автора, результаты эволюции по третьему сценарию для случая с наиболее распространенным наркотиком алкоголем уже имеют место в современной России. Автор не претендует на признание его личной трактовки алкогольной ситуации в России. Графическая интерпретация результатов развития третьего сценария расположена на рис.23.
Рис.23. На рис.23. По оси абсцисс - время. По оси ординат - значения функций S(t), I(t) и R(t). Третьей (вымирающей) группе людей, отрицающих наркокультуру, соответствует нижняя кривая.
156
7. Применение к оценке наркоситуации математических моделей сообществ, борющихся за общую пищу
Известно, что одним из первых авторов моделей такого вида был В. Вольтерра. Ключевая идея для последующего математического моделирования здесь состоит в том, что неким существам, для того, чтобы обеспечить свое выживание во внешней среде, необходимо потреблять из среды какие-то продукты: пищу, возможности для размножения, отдыха и т. д. Существа разбиты на группы с разными возможностями использования необходимых, причем одних и тех же благ для продолжения жизнедеятельности. Общее количество благ ограничено. Естественно, что при таких условиях между отдельными группами сообщества возникает конкурентная борьба. Чем, в конечном итоге, должна закончиться такая борьба? Математические модели, применение результатов которых позволяет точно и однозначно решить изложенную задачу, давно найдены. Давно найдены, доступно сформулированы, опубликованы и вошли в учебники и ответы к задачам. Избегая громоздких математических выкладок и аналитических описаний, сообщим читателю готовый ответ, который в современном естествознании известен под названием принципа Гаузе. Два вида с одинаковыми экологическими потребностями не могут существовать в одной экологической нише. Интересующийся читатель может самостоятельно применить доказанный в естествознании принцип Гаузе к сообществу наркозависимые-ненаркозависимые. Замечание 8.10. Подробный математический вывод принципа Гаузе можно найти в книге [50].
157
ЗАКЛЮЧЕНИЕ В заключении приведем краткую сводку результатов. Известно, что в настоящее время в России сложилась сложная наркологическая ситуация, для контроля и управления которой не достаточно только организованных в 1976 году наркологических диспансеров. Известно, что для решения задач контроля и управления наркоситуацией, чиновникам государственных уполномоченных инфраструктур необходимо знать точные сведения, основанные на количественных оценках наркоситуации. Субъективные оценки, предоставляемые экспертами, не удовлетворяют требованиям, изложенным в Государственных стандартах России. Теми же свойствами обладают процентные оценки и оценки среднего арифметического - они также не удовлетворяют требованиям, предъявляемым к точности результатов научных исследований изложенным в Государственных стандартах России. Больше того, результаты экспертных субъективных, эвристических оценок и оценок, найденных без применения методов математического моделирования не только не отражают хотя бы приблизительно фактическую картину наркоситуации в России, но и дезинформируют государственных чиновников, делая невозможным принятие ими решений, адекватных имеющей место наркоситуации. Возникшее противоречие порождает необходимость перехода от применения экспертных оценок, оценок среднего арифметического и процентных оценок, к применению научно обоснованных доказательных оценок, таких, как оценки надежности, доверительного интервала, оптимистической оценки, пессимистической оценки, а также требований состоятельности, несмещенности, эффективности и др. Известно, что требованиям, изложенным в государственных стандартах России и предъявляемым в России к результатам научных исследований, удовлетворяют только оценки, найденные применением метода математического моделирования. Однако, несмотря на очевидность требований, изложенных в государственных стандартах, метод математического моделирования до сих пор не применялся для решения задач оценки наркоситуации в России. Больше того, не существует специализированных учебных пособий, позволяющих государственному чиновнику научиться пользоваться результатами адекватных и научно обоснованных оценок наркоситуации. Настоящее учебное пособие является первым целевым пособием по оценке наркоситуации в России, и, судя по доступной автору литературе, в мире.
158
В пособии изложены методы, применение результатов которых позволяет государственным чиновникам осуществлять контроль и управление наркоситуацией, исходя из объективных численных оценок, чем своевременно предотвращать последствия решений, принятых на основании субъективных бездоказательных экспертных оценок. Кроме того, изучение материалов пособия позволяет служащим государственного управленческого аппарата овладеть умением отличать научно обоснованные оценки, выполненные специалистами по обработке результатов наблюдений от оценок, предоставляемых ангажированными, но не компетентными источниками. Впервые для оценки наркоситуации изложены методы нахождения и применения оптимистических и пессимистических оценок, интервальных оценок и оценок надежности. Изложены методы применения результатов математического моделирования при решении задач контроля, прогноза и управления на примере оценки наркоситуации. Применением результатов математического моделирования доказано, что Россия является почти неисчерпаемым рынком сбыта продукции наркомафии на ближайшие десятилетия. Доказано, что изменение наркоситуации в России возможно только методами государственного регулирования. По мнению автора, найденный результат - изменение наркоситуации в России возможно только методами государственного регулирования, дает научное обоснование для признания ведущей роли правительства, чиновников государственного аппарата, а также работников оперативных, следственных и силовых государственных структур в решении задачи контроля и управления наркоситуацией в России. Это, в свою очередь, ставит исполнителей перед необходимостью умения правильного использования оценок, предоставляемых специалистами. По мнению автора, настало время, когда в целях повышения эффективности работы государственного аппарата управления, необходимо обучить чиновников умению пользоваться научно обоснованными оценками специалистов по математическому моделированию.
159
ЛИТЕРАТУРА 1. Большая Советская энциклопедия. М.: "Советская энциклопедия". 1970 - 1977. 2. Профилактика злоупотребления психоактивными веществами. Сборник методических материалов по проблеме профилактики злоупотребления психоактивными веществами среди несовершеннолетних и молодежи. М.: Издательство Академии повышения квалификации и переподготовки работников образования. 2001.-183 с. 3. Коран. Пер. В. Пороховой. - М.: "Бук Чембэр Интернэшнл". 1991.415 с. 4. Библия. Книги священного писания Ветхого и Нового завета. Канонические. В русском переводе с параллельными местами. - М.: Изд-во Московской Патриархии. 1979. - 1227 с. 5. Справочник по психиатрии. Под ред. А.В. Снежневского. М.: "Медицина". 1974.-391 с. 6. Речнов Д.Д, и др. Шаг за шагом от наркотиков. Книга для родителей. СПб.: Копи-Р. 2000.-91 с. 7. Чернецкий В.И. Математическое моделирование динамических систем. Петрозаводск.: Петрозаводский гос. ун-т. 1996. - 432 с. 8. Коперник Н. О вращении небесных сфер. Серия "Классики науки". М.: Наука. 1964. 9. Математический энциклопедический словарь / Гл. ред: Ю.В. Прохоров; Ред. кол.: С.И. Адян, Н.С. Бахвалов, В.И. Битюцков, А.П. Ершов, Л.Д. Кудрявцев, А.Л. Онищик, А.П. Юшкевич. - М.: Советская энциклопедия, 1988. - 847 с., ил. 10. "Здоровое питание как элемент психосоматической профилактики наркомании" Отчет о научно-исследовательской работе / П.П. Горбенко, Р.С. Минвалеев, А.И. Иванов: СПб.: УДК ВГК ОКП № госрегистрации РНК 04.000.02.00067. 11. Айвазян С.А. Прикладная статистика: Основы моделирования и первичная обработка данных. Справочное издание / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. - М.: Финансы и статистика. 1983. – 471 с. 12. Дулов В.Г., Цибаров В.А. Математическое моделирование в современном естествознании: Учеб. Пособие / Под ред. Чл.-кор. РАН В.Г. Дулова. - СПб.: Издательство СПбГУ, 2001. – 244 с. 13. Углов Ф.Г. Ломехузы: Очерк/Оформ. худож. Глазыриной А.О. -Л., 1991. - 159 с.
160
14. Бернулли Я. О законе больших чисел: Пер. с лат.- М.: Наука. Гл. ред. физ.-мат. лит. 1986. - 176 с. 15. Бэкон Ф. О принципах и началах. 2-е изд. - М.: Новая Атлантида. 1962. 16. Белонучкин В.Е. Кеплер, Ньютон и все-все-все... - М.: Наука. Гл. ред. физ.-мат. лит. 1990.-128 с. - (Б-чка "Квант"; Вып. 78) 17. Зубов В.И. Теория физической либрации Луны / Доклады Академии наук СССР. 1991. Т. 321, № 5. С. 919-924. 18. Дьяконов В.П. Справочник по системе символьной математики DERIVE. -М.: "СК Пресс". 1998.-236 с., ил. 19. RNS информационный пакет Drugbox: "Аргументы", "Алкоголь", "Марихуана", "Табак", "Экстази", "Кокаин и другие психостимуляторы", "Растворители и клей", "Героин и другие опиаты". 20. Городская и вузовская антинаркотическая политика / Под. ред. Г.В. Зазулина. - СПб.: Изд-во Санкт-Петербургского госуниверситета. 2001. – 68 с. 21. ГОСТ 7.32.91. Отчет о научно-исследовательской работе. Структура и правила оформления. Издание официальное. М.: ИПК издательство стандартов. 2000.-20 с. 22. Евсеев В.С. Подготовка и защита диссертации: Справочнометодическое пособие. - СПб.: Политехника. 1991. – 304 с. Р.50.1.0372002. Рекомендации по стандартизации. - М.: Госстандарт России. Издание официальное. 2002. 23. Dobbs B.J. T. Newton's Alchemy and His Theory of Matter // ISIS, 1982. Vol. 13, №269. P. 511-528. 24. Кондратьев К.Я. Проблема краткосрочного прогноза землетрясений и вулканических извержений / Методы обнаружения краткосрочных предвестников землетрясений и спорадических естественных и антропогенных выбросов в атмосферу (АЭС): Сборник тезисов международного симпозиума 13.11-15.11.2000. СПб.: 2000. 25. Зубов В.И. Апокалипсис. Завет ушедших поколений. Ленинград СПб.: Мобильность плюс. 1993. - 56 с. 26. Иванов А.И. О глобальном похолодании климата Земли. // Проблемы окружающей среды и природных ресурсов: обзорная информация. Вып. №1. М.: РАН. 2003. 27. Калинина В.Н. Панкин В.Ф. Математическая статистика: Учеб. для студ. сред. спец. учеб. заведений. - 3-е изд., испр. - М.: Высшая школа. 2001. – 336 с.: ил.
161
28. Гмурман В.Е. Теория вероятностей и математическая статистика. Учеб. пособие для втузов. Изд. 5-е, перераб. и доп. - М.: "Высшая школа". 1977.- 479 с. 29. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для студентов втузов. -3-е изд., перераб. и доп. - М.: Высш. школа. 1979. - 400 с.: ил. 30. Секей Г. Парадоксы в теории вероятностей и математической статистике: Пер. с англ. М.: Мир. 1990. - 240 с.: ил. 31. Бородин А.И. Бугай А.С. Биографический словарь деятелей в области математики. Пер. с укр. под ред. И.И. Гихмана. - К.: Рад. школа. 1979. - 607 с. 32. Боев Г.П. Теория вероятностей. - М.: Государственное издательство технико-теоретической литературы. 1950. - 368 с. 33. Гнеденко Б.В. Курс теории вероятностей. Учебник для университетов. - М.: Государственное книжное издательство техникотеоретической литературы, 1950. - 387 с. 34. Смирнов Н.В. Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений: Учеб. пособие для высших технических учебных заведений. 2-е изд. испр. и доп. - М.: "Наука". Главная редакция физико-математической литературы. 1965. – 511 с.: ил. 35. Брадис В.М. Минковский В.Л. Харчева Л.К. Ошибки в математических рассуждениях. 3-е изд. - М., 1967. 36. Гаусс К.Ф. Теория комбинации наблюдений, подверженных наименьшим ошибкам. Избр. геод. соч., т.1. - М.: Геодезиздат. 1957. 37. Ляпунов А.М. Избранные труды. М.: Издательство Академии Наук СССР. 1948. - 540 с. 38. Зубов В.И. Проблема устойчивости процессов управления. -2-е изд., испр. и доп. - СПб.: НИИ Химии СПбГУ. 2001. – 354 с. 39. Шмыров А.С. Аппроксимация функций распределения случайных величин /Методическая разработка к курсу лекций "Теория вероятностей и математическая статистика". - СПб.: Издательство СПбГУ. 1999. - 8 с.: ил. 40. Иванов А.И. Приближение смесью нормальных распределений: Приложение к книге В.И. Зубова "Проблема устойчивости процессов управления". -2-е изд., испр. и доп. - СПб.: НИИ Химии СПбГУ. 2001. – 354 с. В.Б. Аппроксимация плотностей вероятностных 41. Лернер распределений. Проверка статистических гипотез: Процессы управления
162
и устойчивость. Труды XXXI научно-практической конференции факультета ПМ-ПУ. - СПб.: ООП НИИ Химии СПбГУ, 2000.-556 с. 42. Материалы научно-практической конференции, посвященной памяти В.И. Зубова. СПб. 12-13 янв. 2002 г. Спб.: Научнопроизводственное объединение им. Кузнецова. 2002, - 118 с. 43. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В. Прохоров. - М.: Большая Российская энциклопедия, 1999. – 910 с. 44. Laplace P. Theorie analytique des probabilites, Paris, 1812. 45. Буняковский В.Я. Основания математической теории вероятностей. - СПб: Типография Императорской Академии Наук, 1846. 46. Лаплас П. Опыт философии теории вероятностей. Популярное изложение основ теории вероятностей и ее приложений. Пер. с фр. A.I.B. Под ред. А.К. Власава. - М.: 1908. 47. Азизов А.М. Курицын А.Г. Никитенко В.Г. Основы прикладной математики. Теория вероятностей и математическая статистика. - СПб.: "Химия". Санкт-Петербургское отделение. 1994.-264 с. 48. Боровков. Курс теории вероятностей: Учеб. пособие для студентов математических и физических специальностей вузов. - М.: Издательство "Наука". Главная редакция физико-математической литературы. 1972.287 с. 49. Федоров М.П. Романов М.Ф. Математические основы экологии / Под ред. чл.-кор. РАН В.И. Зубова. СПб.: Изд-во СПбГТУ, 1999. – 156 с. 50. Тюрин Ю.Н. Макаров А.А. Анализ данных на компьютере/ Под ред. В.Э. Фигурнова. - М.: ИНФРА-М. Финансы и статистика. 1995. – 384 с. 51. ГОСТ 11.007-74. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. - М.: Издательство стандартов. 1981. 52. ГОСТ 11.004-74 (СТ СЭВ 876-78). Прикладная статистика: Правила определения оценок и доверительных границ для параметров нормального распределения. - М.: Издательство стандартов. 1981. 53. ГОСТ Р 50779 ИСО 5479-2002. Статистическое представление данных. Проверка отклонения распределения вероятностей от нормального. - М.: Издательство стандартов. 2002. 54. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. - Л.: Энергоатомиздат. 1991. - 303 с. 55. Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей. - М.: Главная редакция физико-математической литературы изд-ва "Наука".1976. - 167 с.
163
56. Беляев Ю.К., Носко В.П. Основные понятия и задачи математической статистики: Учеб. пособие. - М.: Изд-во МГУ. ЧеРо. 1998. – 192 с. 57. Чернецкий В.И. Математическое моделирование стохастических систем. - Петрозаводск: Издательство Петрозаводского университета. 1994. – 486 с. 58. Гасс С. Путешествие в страну линейного программирования. Пер. с англ. Ю.Н. Сударева. Предисловие Ю.В. Овсиенко. - М.: "Мир". 1973. 176. (В мире науки и техники) 59. Вентцель Е.С. Введение в исследование операций. - М.: Издательство "Советское радио". 1964. - 388 с. 60. Вагнер Г. Основы исследования операций. В 3-х томах. - М.: Мир. 1972. 61. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука. Главная редакция физико-математической литературы. 1983. 416 с. 62. Мюллер П., Нойман П., Шторм Р. Таблицы по математической статистике. М.: "Финансы и статистика". 1982. - 272 с. 63. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. - М.: Издательство "Наука". Главная редакция физико-математической литературы. 1968. - 288 с. 64. Башмаков М.И. Математика: Учеб. для профтехучилищ. 2-е изд., перераб. и доп. - М.: Высш. шк. 1994. - 542 с.: ил. 65. Скробот А. Виктор Черкесов сосчитал наркоманов / Независимая газета. 10.09.2003. 66. Российский статистический ежегодник. 2001. 67. Амелькин В.В. Дифференциальные уравнения в приложениях. - М.: Наука. Главная редакция физико-математической литературы. 1987.-160 с. 68. Горстко А.Б. Познакомьтесь с математическим моделированием. М.: Знание. 1991.-160 с. 69. Гроссман С. Тернер Дж. Математика для биологов: Пер. с англ. / Предисл. и коммент. Ю.М. Свирежева. - М.: Высш. школа. 1983.- 383 с. 70. Петросян Л.А. Захаров В.В. Математические основы экологии. СПб.: Издательство Санкт-Петербургского госуниверситета. 1997.-256 с. 71. Вольтерра В. Математическая теория борьбы за существование. М.: 1976. – 288 с. 72. Зубов В.И. Моделирование биологических процессов при помощи дифференциальных уравнений // Вопросы кибернетики. 1975. Вып. 25. С. 3-9.
164
73. Зубов В.И. Лекции по теории управления. - М.: Наука. Главная редакция физико-математической литературы. 1975. - 495 с. Н.М. Методы интегрирования обыкновенных 74. Матвеев дифференциальных уравнений: Учебник для механико-математических факультетов университетов. Изд. третье, испр. и доп. М.: Издательство "Высшая школа". 1967.-564 с. 75. Углов Ф.Г. Из плена иллюзий. Л.: Лениздат. 1986. - 288. с. 76. Солодовников А.С., Бабайцев В.А., Браилов А.В. Математика в экономике: Учебник: в 2-х ч. - М.: Финансы и статистика. 2000. 77. Гланц С. Медико-биологическая статистика. Mc Graw-Hill, 1994; М.: Практика, 1998. - 459 с. 78. Алкоголизм: (руководство для врачей) / Под ред. Г.В. Морозова, В.Е. Рожнова, Э.А. Бабаяна. - М.: Медицина. 1983. - 432 с. 79. Справочник практического врача/Ю.Е. Вельтищев, Ф.И. Комаров, С.М. Невашин и др.; Под ред. А.И. Воробьева; Сост. В.И. Бородулин. - 4е изд., перераб. и доп. - М.: Баян, 1993. – 608 с. 80. Иванов А.И. Доверительный интервал математического ожидания случайной величины с функцией распределения смесь нормальных распределений: Материалы научно-практической конференции, посвященной памяти В.И. Зубова. СПб. 12-13 янв. 2002 г. - СПб.: Научнопроизводственное объединение им. Кузнецова. 2002, - 118 с. 81. Демидович Б.П. Марон И.А. Основы вычислительной математики: Учебное пособие для высших технических учебных заведений. 3-е изд. М.: "Наука". Главная редакция физико-математической литературы. 1966. - 664 с.
165
ПРИЛОЖЕНИЕ 1 ПОДПРОГРАММА NARKSIT. MTH ;Simp(User) m!*n!*(z-m)!*(z-n)!/(k!*z!*(m-k)!*(n-k)!*(z+k-m-n)!) n!/(m!*(n-m)!) n!/(m!*(n-m)!)*p^m*(1-p)^(n-m) SQRT(2*pi*n)*(n/EXP(1))^n a^m*EXP(-a)/m! ;Sub(User) n/(t^2+n)*(p+t^2/(2*n)-t*SQRT(p*(1-p)/n+(t/(2*n))^2)) ;Sub(User) n/(t^2+n)*(p+t^2/(2*n)+t*SQRT(p*(1-p)/n+(t/(2*n))^2)) ;Simp(User) t^2/(n+t^2) 1/(s*SQRT(2*pi))*EXP(-(x-a)^2/(2*s^2)) SQRT(p*(1-p)/n) n*EXP(k*t) k*x*EXP(k*t)/(k+a*x*(1-EXP(k*t))) (n+1)/(n*EXP(-a*(n+1)*t)+1)
166
ПРИЛОЖЕНИЕ 2 СРЕДНЕСУТОЧНЫЕ ТЕМПЕРАТУРЫ за 10 января в Санкт-Петербурге Год
°C
Год
°C
Год
°C
Год
°C
Год
°C
1865 1866 1867 1868 1869 1870 1871 1872 1873 1874 1875 1876 1877 1878 1879 1880 1881 1882 1883 1884 1885 1886 1887 1888 1889 1890 1891
-0.3 -2.1 -0.4 -1.0 0.3 1.7 -18.2 -2.6 -1.9 -5.0 -13.4 -16.8 -4.3 -7.0 -15.8 -11.7 -13.4 0.5 -26.9 -12.2 -1.6 -8.2 -6.1 -5.4 -7.2 2.0 -3.4
1892 1893 1894 1895 1896 1897 1898 1899 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915 1916 1917 1918
-8.3 -15.5 -6.4 -4.6 -8.4 -12.2 -10.8 -10.8 -14.0 -2.4 -3.1 -4.2 -5.9 -1.4 -5.7 -5.0 -17.8 -7.9 -7.9 -0.3 -13.4 -5.7 -15.0 -8.9 -4.4 -9.4 -24.5
1919 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945
-1.9 -2.0 0.3 -16.5 0.7 -5.4 -3.1 -23.3 -10.6 -1.9 -1.1 2.2 -6.2 -5.0 -7.3 -3.1 -13.7 -4.1 -6.0 -13.5 -18.4 -10.5 -1.6 -23.2 -16.2 -10.1 -5.6
1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972
1.4 -13.4 -9.1 -3.5 -25.1 -14.4 2.2 -6.4 -11.2 -8.2 -7.6 1.4 -19.2 -2.4 -13.0 0.2 1.2 -14.4 0.7 -11.3 -14.1 -18.8 -23.4 -8.6 -14.7 3.8 -6.4
1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
-1.6 -13.4 -7.1 -21.1 -6.4 0.1 -0.1 -7.1 -2.3 -17.8 1.7 -7.6 -10.5 -6.4 -33.6 -0.9 1.6 0.4 2.8 -7.4 0.9 -4.6 -1.9 -7.1 -7.6
167
ПРИЛОЖЕНИЕ 3 НАХОЖДЕНИЕ НЕКОТОРЫХ МОДЕЛЕЙ ИЗ ПОСОБИЯ Обозначим через x(t) - число особей в популяции в момент времени t. Через А обозначим число особей в популяции, рождающихся в единицу времени, через В - число особей, умирающих в единицу времени. Тогда с достаточным основанием можно утверждать, что скорость изменения числа особей x(t) в популяции в зависимости от времени описывается дифференциальным уравнением dx = A− B (3.1) dt Теперь задача состоит в том, чтобы найти зависимость величин А и В от x. Для самого простого случая можно считать, что справедливы равенства A = ax, B = bx, (3.2) где через a и b обозначены коэффициенты рождаемости и смертности особей популяции в единицу времени t. Перепишем дифференциальное уравнение (3.1) с учетом равенств (3.2): dx = ( a − b) ⋅ x (3.3) dt Положим, что моменту времени t=t0 соответствует число особей в популяции x=x0. Выполнив интегрирование уравнения (3.3), с учетом начальных условий (t0,x0) находим, что
x(t ) = x0 ⋅ e ( a −b)(t −t0 ) .
(3.4)
Из решения (3.4) следует, что если a > b, т. е. коэффициент рождаемости больше коэффициента смертности, то при неограниченном возрастании времени t, t→∞ число особей x(t) неограниченно возрастает, т. е. x(t)→∞. Если коэффициент смертности больше коэффициента рождаемости, т. е. b > a, то при неограниченном возрастании времени t→∞ количество особей в популяции x(t)→0. Популяция со временем вымирает. В более общем виде модель (3.3) следует рассматривать, как модель dx = f (x) dt где f(x) - непрерывная дифференцируемая функция.
(3.5)
168
В качестве функции f(x) можно взять, например, функцию f(x) = ax - bx2, в которой а и b - положительные константы. Тогда дифференциальное уравнение (3.5) перепишется, как уравнение dx = ax − bx 2 dt
(3.6)
Положив в уравнении (3.6) x = x0 интегрирование уравнения, находим, что
x(t ) =
( x0 a ) / b
x0 + [(a / b ) − x0 ] ⋅ e − a (t −t ) 0
при
t = t0
и
выполнив (3.7)
Из найденного решения (3.7) следует, что при t→∞ количество особей в популяции будет стремиться к числу a/b. В свою очередь здесь возможны два случая: случай, в котором выполняется неравенство (a/b) > x0 и случай, в котором выполняется неравенство (a/b)<x0. Нетрудно доказать, что и в случае выполнения неравенства (a/b)>x0 и в случае выполнения неравенства (a/b)<x0 при неограниченном возрастании времени t объем популяции будет ассимптотически стремится к некоторым константам C1 и C2. Обозначив через C1 - значение константы, к которой стремится объем популяции при условии (a/b)>x0 и через C2 при условии (a/b)<x0 нетрудно доказать, что в этом случае C1>C2.
169
ПРИЛОЖЕНИЕ 4 МОДЕЛЬ "ОДИН НАРКОМАН ПРОТИВ ВСЕХ РОССИЯН" Пусть имеется группа, состоящая из N человек, не употребляющих наркотики, т. е. здоровых людей. Пусть в момент времени t = 0 в эту группу попадает один наркоман, которого мы будем рассматривать как источник заражения здоровых людей наркоманией. Предположим, что этот один наркоман за какой-то промежуток времени вовлекает в наркоманию одного из здоровых людей. В качестве такого временного промежутка можно взять любой промежуток. Например, 1 год. Будем также считать, что никакого удаления заболевших наркоманией из группы не происходит, т. е. нет ни выздоровления заболевших, ни их гибели, ни специально организованной государственными органами социальной изоляции или физической ликвидации наркоманов. Будем также считать, что вновь появившиеся наркоманы сразу же после того, как стали наркоманами, также становятся существами, вовлекающими в употребление наркотиков пока еще здоровых окружающих людей. Обозначим число источников наркозависимости в момент времени t через x(t), а число тех, кто может заболеть наркоманией, через y(t). Тогда для любого момента времени t справедливо равенство: x(t) + y(t) = N + 1.
(4.1)
Для начального момента времени t = 0 выполняется условие x(0) = 1. Рассмотрим временной интервал t+∆t, где ∆t - малая величина. Найдем ответ на вопрос о том, сколько новых больных наркоманией появится за промежуток времени t+∆t. Не теряя общности рассуждений можно предположить, что численность зараженных будет пропорциональна величине ∆t и числу встреч пока здоровых и уже больных наркоманией. Запишем аналитически наше предположение о том, что численность зараженных наркоманией будет пропорциональна величине ∆t и числу встреч еще здоровых и уже больных наркоманией:
∆x ≈ x(t ) ⋅ y (t ) ⋅ ∆t
(4.2)
Вследствие того, что выражение (4.2) найдено применением предположения, а не доказательства, уточним выражение, характеризующее величину ∆x, введя некоторый коэффициент а, численное значение которого мы пока не знаем. Тогда, учитывая введенное уточнение, выражение (4.2) можно переписать, как
170
∆x ≈ a ⋅ x(t ) ⋅ y (t ) ⋅ ∆t
(4.3)
В свою очередь, выражение (4.3) можно записать, как
∆x ≈ a ⋅ x(t ) ⋅ [N + 1 − x(t )] ⋅ ∆t
(4.4)
Мы условились, что время ∆t - малая величина. Поэтому, не пренебрегая общностью рассуждений, можно считать, что величина ∆t сколь угодно малая, т. е. что ∆t→0. Перепишем формально выражение (4.4), разделив его левую и правую части на ∆t. Выполнив очевидные алгебраические упрощения, находим, что ∆x ≈ a ⋅ x ⋅ [N + 1 − x ] (4.4) ∆t Замечание. В целях краткости функцию x(t) мы записали как x. Учитывая, что ∆t→0, выражение (4.4) можно переписать как дифференциальное уравнение dx = a ⋅ x ⋅ [N + 1 − x ] . (4.5) dt Найденное дифференциальное уравнение (4.5) вместе с условием x(0) = 1 полностью определяет функцию x(t), т. е. численность заболевших в любой момент времени t. Для того, чтобы найти аналитическое выражение, описывающее функцию x(t), решим дифференциальное уравнение (4.5). Для избегания громоздких аналитических выкладок при поиске решения уравнения (4.5) введем вспомогательную функцию u(t), определив ее как функцию 1 . (4.6) u (t ) = x(t ) Выполнив дифференцирование функции (4.6) по аргументу t находим, что 1 dx du (4.7) ⋅ = x 2 (t ) dt dt Использовав соотношения (4.6) и (4.7) и выполнив элементарные алгебраические упрощения, преобразуем дифференциальное уравнение (4.5) к виду du = − a ( N + 1)u (t ) + a (4.8) dt Решим найденное дифференциальное уравнение (4.8). Из курса дифференциальных уравнений, изложенного, например, в учебнике [75] известно, что общее решение уравнения (4.8) может быть
171
представлено в виде суммы общего решения однородного уравнения и частного решения неоднородного уравнения, т. е. 1 u (t ) = Ce − a ( N +1)t + , 1+ N где C=const - произвольная постоянная. Следовательно, принимая во внимание равенство (4.6), можно записать аналитическое выражение для искомой функции x(t):
x(t ) =
N +1 N ⋅ e − a ( N +1)t + 1
Найдем аналитическое выражение для константы С. Так как известно, что при t = 0 значение x(t) = 1, то для нахождения константы С имеет место выражение 1 = 1/[C+(1/(N+1)]. Откуда следует, что C = N/(N + 1). Запишем окончательный результат:
x(t ) =
N +1
(4.9)
N ⋅ e − a ( N +1)t + 1
Найденный результат - аналитическое выражение (4.9) для функции x(t) - зависимости числа заболевших наркоманией от времени. Выполним анализ выражения (4.9). При t = 0 находим, что x(0) = 1, что полностью соответствует оговоренным условиям: в группу численностью N здоровых людей в нулевой момент времени t = 0 попадает один наркоман. При возрастании времени t знаменатель в правой части выражения (4.9) убывает, следовательно, значение функции x(t) увеличивается. Это соответствует оговоренным нами условиям - с течением времени число заболевших наркоманией может только увеличиваться. Исследуем, как меняется скорость увеличения числа больных. Из курса дифференциального исчисления известно, что ускорение роста функции есть ее вторая производная. Поэтому изучим поведение второй производной функции x(t) по времени t. Дифференцируя функцию x(t) дважды по аргументу t находим: −e d 2 x ( N + 1) 3 a 2 N [Ne = 3 dt 2 Ne − a ( N +1)t + 1 −2 a ( N +1) t
[
]
− a ( N +1) t
]
.
(4.10)
172
При значении ln N a ( N + 1) числитель дроби, стоящей в правой части выражения (4.10), обращается в нуль. Следовательно, при выполнении условия t=
⎡ ln N ⎤ d 2x t ∈ ⎢0, , величина > 0 , при выполнении условия ⎥ 2 a ( N + 1 ) dt ⎣ ⎦ ⎡ ln N ⎤ d 2x dx t∈⎢ , ∞ ⎥ , величина 2 < 0 . Следовательно, функция dt dt ⎣ a( N + 1) ⎦ скорость возрастания числа заболевших наркоманией - растет вплоть до ln N , после чего убывает. момента t = a ( N + 1) Замечание. Прототипом модели "Один наркоман против всех россиян" послужила модель эпидемии, изложенная в книге [69].