МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образ...
46 downloads
170 Views
932KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Государственное образовательное учреждение высшего профессионального образования
СЕВЕРО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ ЗАОЧНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра информатики и вычислительной математики
Математические методы в организации транспортного процесса Рабочая программа Методические указания к выполнению контрольных работ Задания на контрольные работы
Факультет экономики, менеджмента и автомобильного транспорта Направление подготовки дипломированного специалиста: 653400 – организация перевозок и управления на транспорте 240100.01 - организация перевозок и управления на транспорте (автомобильный транспорт) Специализация 240101.01 – организация перевозок Направление подготовки бакалавров 551400 – наземные транспортные системы
Санкт-Петербург 2004 г.
Утверждено редакционно-издательским советом университета УДК 519.2 (07)
Математические методы в организации транспортного процесса: Рабочая программа, задание на контрольную работу, методические указания к выполнению контрольной работы, задания на контрольные работы - СПб.: СЗТУ, 2004. – 46 с. Рабочая программа разработана в соответствии с государственными образовательными стандартами высшего профессионального образования по направлению подготовки дипломированного специалиста 653400 (специальность 240100 – Организация перевозок и управление на транспорте(автомобильный транспорт) Методический сборник содержит рабочую программу, методические указания к изучению дисциплины, тематический план лекций и практических занятий, задание на контрольную работу и методические указания к выполнению контрольной работы. Рассмотрено на заседании кафедрыинформатики и вычислительной математики 2 декабря 2003г. 4 декабря 2003г., одобрено методической комиссией факультета информатики и систем упрвления
Рецензенты: Н.М. Петухова, Г.Н. Дюбин. Составители Г.Г. Ткаченко, Д.В. Бутенина, Шарый В.А.
©Северо-Западный государственный заочный технический университет,2004
Предисловие Целью изучения дисциплины «Математические методы в организации транспортного процесса» является усвоение студентами основных методов, используемых в организации перевозок и управлении на транспорте. В результате изучения дисциплины студент должен Знать: -основные понятия и определения теории графов; -определение транспортной сети; -основные этапы эконометрического моделирования; -основы парного регрессионного анализа; - метод наименьших квадратов для парной регрессии; -основы нелинейного регрессионного анализа; -основные гипотезы множественной регрессии; -основные этапы моделирования и оптимизации систем массового обслуживания. Уметь: -решать оптимизационные задачи на графах; -строить линейно-регрессионную модель; - анализировать качество уравнения регрессии. Программа
предусматривает
различные
виды
занятий:
лекции,
лабораторные занятия. Студентам необходимо решить две контрольные работы, охватывающие разделы: -элементы теории графов и транспортные сети; -линейно-регрессионный анализ. Связь курса с дисциплинами специальности. Изучение курса базируется на знаниях, полученных
при изучении общенаучных
и общетехнических
дисциплин, а также дисциплин транспортного профиля: «Общий курс транспорта», «Основы теории транспортных систем». Дисциплина является базовой
при
изучении
следующих
курсов:
«Основы
организации
автотранспортного автотранспортными
производства», предприятиями»,
«Автоматизация «Информационные
управления технологии
на
транспорте», «Менеджмент». 1.Содержание дисциплины 1.1.Рабочая программа (объем дисциплины 110 часов) Раздел 1. Элементы теории графов и транспортные сети Определение графа. Геометрическая реализация графа. Основные понятия и определения теории графов. Классификация задач теории графов. Задача о минимальном числе аварий. Задача о кратчайшем пути. Алгоритм Дейкстры. Транспортные
сети.
Поток.
Алгоритм
Форда-Фалкерсона
построения
максимального потока. Раздел 2. Линейно-регрессионный анализ Независимые и зависимые случайные величины. Ковариация случайных величин. Коэффициент корреляции и его свойства. Выборочные ковариация и коэффициент корреляции. Парный регрессионный анализ. Метод наименьших квадратов для парной регрессии. Экономическая
интерпретация коэффициента регрессии
при
объясняющем факторе в парной регрессии. Коэффициент детерминации R2 и его свойства. Связь коэффициента детерминации и коэффициента корреляции в парной регрессии. Основные гипотезы. Теорема Гаусса-Маркова. Нормальное распределение коэффициентов в парной регрессии. Стандартная ошибка s(b1) коэффициента регрессии b1 в парной регрессии. Проверка гипотезы о наличии зависимости между объясняющим и результирующим факторами по t - статистике. Построение доверительного интервала для коэффициента регрессии b1 в парной регрессии. Построение доверительного интервала прогнозов в парной регрессии.
Регрессии нелинейные по объясняющим переменным и нелинейные по параметрам. Степенная регрессия и сведение ее к линейной. Множественная регрессия. Основные гипотезы. Матричная форма записи коэффициентов
множественной
регрессии
и
уравнения
множественной
регрессии. Сведение полиномиальной регрессии к множественной регрессии. Мультиколлинеарность. Проверка гипотезы о мультиколлинеарности по критерию хи-квадрат. Проверка гипотезы о значимости коэффициентов множественной
регрессии
по
t-статистике.
Построение
доверительных
интервалов для коэффициентов множественной регрессии. Экономическая интерпретация коэффициентов множественной регрессии. Раздел 3. Элементы теории массового обслуживания Системы массового обслуживания и их классификации. Основные понятия: поток, очередь, канал обслуживания.
Показатели эффективности
систем массового обслуживания. Простейший поток и его свойства. Система дифференциальных уравнений для потока и ее решение. Системы массового обслуживания с марковскими потоками событий. Размеченный
граф
состояний,
определение
основных
характеристик
обслуживания. Условие существования стационарного состояния. Основные этапы моделирования и оптимизации систем массового обслуживания. Проблема сбора и обработки исходной статистической информации.
1.2. Тематический план лекций для студентов очно-заочной формы обучения (20 часов) Темы лекций 1.Основные понятия теории графов. Способы задания графов. Комбинаторные задачи теории графов. Алгоритмы на графах. Задача о кратчайшем пути……………………………………………………… 2.Транспортные сети. Поток. Алгоритм Форда-Фалкерсона построения максимального потока……………………………………... 3.Парный регрессионный анализ: результирующий фактор, объясняющий фактор, детерминированная (неслучайная) составляющая, случайная составляющая. …………………………….. 4. Метод наименьших квадратов для парной регрессии: линия регрессии, сумма квадратов остатков, коэффициенты регрессии, графическая интерпретация…………………………………………….. 5. Экономическая интерпретация коэффициента регрессии при объясняющем факторе в парной регрессии. Коэффициент детерминации R2 и его свойства. Связь коэффициента детерминации и коэффициента корреляции в парной регрессии. …………………… 6.Основные гипотезы. Теорема Гаусса-Маркова. Нормальное распределение коэффициентов в парной регрессии. Стандартная ошибка s(b1) коэффициента регрессии b1 в парной регрессии……… 7.Проверка гипотезы о наличии зависимости между объясняющим и результирующим факторами по t - статистике. Построение доверительного интервала для коэффициента регрессии b1 в парной регрессии. Построение доверительного интервала прогнозов в парной регрессии ……………………………………… 8.Системы массового обслуживания и их классификации. Основные понятия: поток, очередь, канал обслуживания. Простейший поток и его свойства. Системы массового обслуживания с марковскими потоками событий. Основные этапы моделирования и оптимизации систем массового обслуживания.
Объем, часы 2 4 2 2
2 2
2
4
1.3. Перечень тем лабораторных занятий (8 часов) Темы практических занятий 1.Задачи о кратчайшем пути. 2.Задача о нахождении максимального потока. 3.Метод наименьших квадратов для парной регрессии. 4.Анализ качества уравнения регрессии.
Объем, часы 2 2 2 2
2. Библиографический список Основной: 1.
Оре О. Графы и их применение. –М.: Мир, 1985.
2.
Вентцель Е.С. Исследование операций. –М.: Высшая школа, 2001.
3.
Кремер Н,Ш., Путко Б.А Эконометрика. –М.: ЮНИТИ, 2002.
Дополнительный: 4.
Майника Э. Алгоритмы оптимизации на сетях и графах. -М.: Мир,
1981. 5.
Свами М., Тхуласираман К. Графы, сети и алгоритмы. -М.: Мир, 1984.
3. Методические указания к выполнению контрольных работ Раздел 1. Элементы теории графов и транспортные сети [1], с.11…40; с.80…85; [4], с.42…63;с.84…100; [5], с.361-368; с. 404-415 Тема 1.1 Определения. Классификация задач теории графов Теория графов является разделом дискретной математики. В дискретной математике важное место занимают задачи, связанные с упорядочением тех или иных объектов, а также задачи, в которых изучаются отношения между различного рода объектами. Приведем в качестве примера некоторые задачи. 1. Указать для водителя такой маршрут, чтобы пройденное им расстояние было минимальным. 2. Для имеющейся сети населенные пункты,
шоссейных дорог, соединяющих
указать маршрут
между двумя
данные
любыми заданными
пунктами, который обеспечил бы максимальный транспортный поток между ними. Задачи такого рода удобно формулировать и решать, пользуясь рисунком, состоящим из точек (вершин) и отрезков (ребер или дуг), соединяющих эти вершины. Структуры такого типа объединяются названием - графы, а изучающий их раздел дискретной математики носит название теории графов. Приведем ряд определений и понятий, связанных с графами. Определение графа Пусть задано некоторое конечное множество элементы которого будем называть
вершинами.
X = ⎨x1 , x2 , ... , xn⎬, Образуем из него новое
множество U = ⎨ u1 , u2 , ... , um ⎬ , состоящее из пар элементов ( xi , xj ) множества X . Будем при этом различать два случая : а) когда безразлично, в каком порядке берутся вершины при образовании из них пар; в этом случае пара (xi , xj ) ( или (xj , xi) - все равно) называется ребром, соединяющим вершины xi и xj ;
б) когда существенно, в каком порядке выбираются вершины, т.е. когда пары (xi , xj ) и (xj , xi ) считаются различными; в этом случае пару (xi , xj) будем называть дугой. Пара множеств G= (X, U) называется конечным графом, если имеет место случай “ а “. В случае
“ б “ пара G= (X, U) называется конечным
ориентированным графом или орграфом. В случае графа говорят, что ребро (xi, xj) инцидентно вершинам xi , xj . В свою очередь вершины xi , xj инцидентны ребру (xi , xj ). Если граф ориентированный, то говорят, что дуга ( xi , xj ) исходит из вершины xi и заходит в вершину xj . Вершину xi называют при этом предшественником вершины xj , а вершину xj последователем вершины xi. Подграфом графа G=(X,U) называется граф G′ = (X′,U′) такой, что X′ является подмножеством множества X, а U′ - подмножеством множества U. Если при этом X′ совпадает с X, то G′ называется остовным подграфом графа
G. Граф называется полным, если для любых двух его вершин
существует соединяющее их ребро.
Рис. 1.1 На рис. 1.1,а изображен граф, на рис. 1.1,б - один из его подграфов, на рис. 1.1,в основной подграф этого графа. На рис. 1.1,г приведен пример полного графа с четырьмя вершинами.
Матричный способ задания графа Кроме представления графа в виде рисунка, существуют и другие способы задания графа, одним из которых является задание графа с помощью матрицы смежностей. Этот способ, изложение которого приведено ниже, очень удобен для “введения” графа в память ЭВМ. Построение матрицы смежностей производится следующим образом. Пусть G=(X,U) граф, где X=⎨x1, x2, ... ,xn⎬ - множество его вершин. Любая пара взятых вершин соединена или нет ребром. Нарисуем квадратную таблицу (матрицу) размером n×n, элементы которой формируются по следующему правилу. Если в графе G вершины xi и xj
соединены ребром, в таблице на
пересечении i- й строки и j- го столбца поставим единицу, в противном случае на соответствующем месте поставим нуль. Заполненная таким образом таблица и носит название матрицы смежности. Нетрудно убедиться, что матрица смежности симметрична относительно главной диагонали, элементами которой будут нули. Если граф имеет петли, т.е. ребра вида (xi, xi ) или дуги, выходящие из некоторой вершины и в нее же заходящие, то на главной диагонали в соответствующих местах будут стоять единицы. Для графа, изображенного на рис.1.1, а, например, матрица смежностей имеет вид (см. табл. 1.1).
x1 x2 x3 x4 x5 x6
x1 0 0 0 1 1 1
x2 0 0 0 1 1 1
x3 0 0 0 1 1 1
x4 1 1 1 0 0 0
Таблица 1.1 x5 x6 1 1 1 1 1 1 0 0 0 0 0 0
Для ряда практических задач удобно использовать понятие взвешенного графа. Граф называется взвешенным, если каждому его ребру (дуге) (xi , xj) поставлено в соответствие вещественное число pij , называемое весом этого ребра
(дуги).
Для взвешенного графа аналогичным образом определяется
матрица весов. В зависимости от конкретной задачи веса несуществующих ребер считаются равными нулю или бесконечности. Простой путь, цикл графа. Дерево Приведем еще ряд понятий и определений, которые нам потребуются в дальнейшем. Простой путь в графе - это последовательность смежных ребер, у которой все вершины, за исключением, может быть, последней и первой, различны. Простой путь можно задавать последовательностью смежных вершин в виде xi1, xi2, ... , xip. Если G - орграф, то путь в нем называется ориентированным. Если в пути первая и последняя вершины совпадают, то такой путь называется циклом. Так, для графа на рис.1.1, а из вершины x1 в x4 можно попасть, например, путями: x1, x4; x1, x5, x2, x4. На этом же графе путь x1, x5, x2, x4, x1 является циклом. Если для любой пары вершин существует хотя бы один путь между ними, то граф называется связным. Так, все графы, изображенные на рис.1.1(а-г), являются связными. Деревом называется связный граф, не содержащий циклов. Если у дерева выделена одна вершина, то она называется корнем дерева, а сам граф корневым деревом. Так, легко видеть, что графы 1.1,б, 1.1,в являются деревьями, причем 1.1,б - корневым деревом (корень x1); графы же 1.1,а, 1.1,г не являются деревьями, как содержащие циклы. Классификация задач теории графов Задачи, возникающие в теории графов, условно можно разбить на два класса: 1. Собственные задачи теории графов, в частности задачи подсчета числа объектов с заданными свойствами.
2. Задачи, связанные с построением того или иного объекта на графе, явного задания некоторой “ наилучшей” конфигурации на графе. Это так называемые алгоритмы на графах. Приведем
постановку
некоторых
задач,
имеющих
отношение
к
организации транспортного процесса, на одной из которых - задаче о кратчайшем пути - остановимся более подробно. Тема 1.2 Алгоритмы на графах В задачах этого класса производится поиск такой конфигурации ребер (дуг) и вершин заданного графа, которая обладала бы некоторым оптимальным свойством. Говоря иными словами, на графе выбирается подграф, обладающий этим свойством. Как правило, для конечных графов эта задача принципиально всегда разрешима. Для этого достаточно перебрать все возможные варианты и выбрать из них наилучший в соответствующем оптимальном смысле. Однако в подавляющем большинстве случаев подобный перебор практически не осуществим за любое реальное мыслимое время ввиду обилия имеющихся возможных
вариантов.
Поэтому
приходится
изобретать
алгоритмы,
уменьшающие количество перебираемых вариантов. Приведем
теперь
несколько
задач,
связанных
с
практическими
проблемами, возникающими в организации транспортных (в широком смысле) процессов. Задача о минимальном остовном дереве На практике очень часто решается задача о построении сетей шоссейных или железных дорог (водных путей, газопроводов, линий электропередач) с минимальной “стоимостью “, причем, под “ стоимостью “ соответствующих объектов можно понимать не только финансовые затраты, но также и количество материала, требующееся для построения объекта. На языке теории графов эта задача формулируется, следующим образом: Дан взвешенный граф с
n
вершинами. Построить для него остовное
дерево с минимальным суммарным весом ребер. Здесь в качестве вершин графа
выступают пункты, к которым следует проводить элементы соответствующей сети, а в качестве ребер - участки этой сети. Вес
pij
ребра ( xi , xj
) в
зависимости от конкретной задачи может интерпретироваться как количество материала, используемого на изготовление ребра ( xi , xj ), или его денежную стоимость. Опишем в общих чертах одну из процедур решения задачи о минимальном остовном дереве - так называемый алгоритм ближайшего соседа. 1. Выбираем произвольную вершину, скажем x1, и сравниваем веса всех ребер, инцидентных этой вершине. Ребро с минимальным весом включаем в искомое дерево. Другую вершину выбранного ребра обозначим через x2. 2. Просматриваем все ребра, отличные от (x1, x2), инцидентные вершинам x1 и
x2, выбираем из них ребро с минимальным весом и включаем его в
будущее дерево. Другую вершину, инцидентную этому ребру, обозначим через x3. 3. На каждом из следующих шагов добавляем самое дешевое из звеньев, при присоединении которого к уже построенным ребрам не образуется никакого цикла. Если имеется несколько звеньев одной и той же стоимости, выбираем любое из них. Дальнейшая процедура ясна: алгоритм прекращает работу после того, как будут пройдены все n вершины графа. Мы оставляем без доказательства два следующих утверждения: а). В процессе построения мы никогда не получим циклов, б). Описанная выше процедура действительно порождает минимальное остовное дерево. Задача о кратчайшем пути Многие прикладные задачи на языке теории графов могут быть сформулированы следующим образом. Пусть дан граф такой, что для любых двух его вершин из одной исходит, а в другую заходит не более одного ребра (иначе говоря, граф не имеет
параллельных ребер). Пусть, кроме того, каждому ребру (xi, xj) приписано неотрицательное число Rij - его вес (здесь удобно интерпретировать веса ребер как их длины). Веса несуществующих ребер будем считать как угодно большими и обозначать их символом ∞. Для любых двух выделенных вершин графа требуется найти длину кратчайшего пути между ними и указать этот путь. Для решения поставленной задачи используем алгоритм Дейкстры. Он состоит в присваивании вершинам графа временных меток, которые по определенному
правилу
заменяются
постоянными.
В
общем
виде
рассматриваемый алгоритм выглядит следующим образом. Первой из двух выделенных вершин, скажем x1, присваиваем постоянную метку 0 (расстояние вершины до самой себя), а всем остальным вершинам присваиваем временные метки ∞. Дальнейшая процедура состоит в том, чтобы определенным образом изменять метки вершин, присваивая некоторым из них постоянные метки. Делается это так. Шаг 1. Если вершины xj не имеют окончательных меток и они являются последователями вершины xi , которой на предыдущем шаге была присвоена постоянная метка
L∗(xi), то для каждой из вершин
xj вычисляется новая
временная метка, равная min ⎨L(xj), Rij + L∗(xi)⎬,
(1.1)
где L(xj) - старая временная метка вершины xj , Rij - расстояние от вершины xi до вершины xj, т. е. вес ребра (xi , xj ). Шаг 2. Из всех имеющихся временных меток (сюда входят не только метки вершин xj , последователей вершины xi) выбирается наименьшая, которая становится постоянной для своей вершины. Процедура заканчивается после того, как второй из выделенных вершин, до которой ищется кратчайший путь, будет присвоена постоянная метка. Затем по имеющимся постоянным меткам восстанавливается кратчайший путь.
Пример. Пусть требуется найти кратчайший путь между вершинами в графе, приведенном на рис. 1.2. Расстояния между вершинами графа даны в табл. 1.2 (для простоты знак ∞ в таблице опущен). Таблица 1.2 x1 x1 x2 x3 x4 x5 x6 x7 x8
x2 x3 x4 x5 x6 x7 2 1 6 9 2 3 5 1 1 6 3 2 2 5 1 2 3 9 2 2 3 2 2 1
x8
2 1 Рис. 1.2
1) Определим кратчайшее расстояние между вершинами x1 и x8. На нулевой итерации полагаем L∗(x1)= 0 (знак ∗ у метки означает, что рассматриваемая метка постоянная); L(xj) = ∞ ( j=2, 3, ... , 8) - все вершины, кроме первой, имеют временные метки. Первая итерация Шаг 1. Пусть Г(x1) - множество вершин - последователей вершины x1 . В нашем случае Г(x1) = ⎨x2, x3 , x4 , x6⎬ . Вычисляем новые временные метки вершин из Г(x1) в соответствии с (1.1). L( x2 ) = min ⎨∞ , 2+0⎬ = 2, L( x3 ) = min ⎨∞ , 1+0⎬ = 1, L( x4) = min ⎨∞ , 6+0⎬ = 6, L( x6 ) = min ⎨∞ , 9+0⎬ =9. Шаг 2. Превращаем временные метки в постоянные: min L( xj) = min ⎨ 2, 1, 6,∞, 9, ∞, ∞⎬ = 1. 2≤j≤8
Вершина
x3, как имеющая минимальную временную метку, получает
постоянную метку L∗(x3) = 1. Результаты вычислений будем оформлять в виде табл. 1.3. Причем записывать будем только обновленные метки и помечать их в том столбце, в котором они родились. Кроме того, для каждой итерации в строке под номером итерации будем помещать вершину, отмеченную “звездочкой” на предыдущей итерации. Таблица 1.3 вершины 0 x1 x2 x3 x4 x5 x6 x7 x8
0∗ ∞ ∞ ∞ ∞ ∞ ∞ ∞
1 x1
И т е р а ц и и 2 3 4 5 6 x3 x2 x5 x4 x7
2∗ 1∗ 6
5 2∗
7 x6
4∗
9 5∗
6∗ 6∗
Вторая итерация Шаг 1. Рассматриваем Г(x3) = ⎨ x1, x5 ⎬. Временную метку имеет только вершина x5. Обновляем ее (метку). L (x5) = min ⎨∞, 1+1⎬ = 2. Шаг 2. Вычисляем min по всем временным меткам. min ⎨ L(x2), L(x4), L(x5), L(x6), L(x7), L(x8) ⎬ = min ⎨2, 6,2, 9, ∞, ∞⎬ =2. В качестве постоянной можно взять любую из меток L(x2) и L(x5), которые совпадают и равны вычисленному
минимуму. Пусть постоянную метку
получит, например, вершина x2, т.е. L∗(x2)=2.
Третья итерация Шаг 1. Г(x2) = ⎨ x1, x4, x5 ⎬. Вершины x4 и x5 имеют временные метки. Обновляем метки. L(x4) = min ⎨ 6, 3+2⎬ = 5, L(x5) = min ⎨ 2 , 5+2⎬ = 2. Шаг 2.
min ⎨ L(x4), L(x5), L(x6), L(x7), L(x8) ⎬ = min ⎨5,2, 9, ∞, ∞⎬ =2.
Наименьшую метку имеет вершина x5. Эта метка становится постоянной, т.е. L∗(x5) = 2. Четвертая итерация Шаг 1. Г(x5) = ⎨ x2, x3, x4, x7⎬. Временные метки имеют вершины x4 и x7. Обновляем их. L(x4) = min ⎨ 5, 2+2⎬ = 4, L(x7) = min ⎨ ∞, 3+2⎬ = 5. Шаг 2.
min ⎨ L(x4), L(x6), L(x7), L(x8) ⎬ = min ⎨4, 9, 5, ∞⎬ = 4.
Величина x4 получает постоянную метку L∗(x4) = 4. Пятая итерация Шаг 1. Г(x4) = ⎨x1, x2, x5, x6⎬. Временную метку имеет только вершина x6 . Ее новая метка L(x6) = min ⎨ 9, 2+4⎬ = 6. Шаг 2. min ⎨ L(x6), L(x7), L(x8) ⎬ = min ⎨ 6, 5, ∞⎬ = 5. Полагаем L∗(x7) = 5. Шестая итерация Шаг 1. Г(x7) = ⎨ x5, x6, x8 ⎬. Временные метки - у вершин x6 и x8. Имеем L(x6) = min ⎨ 6, 2+5⎬ = 6, L(x8) = min ⎨ ∞, 1+5⎬ = 6. Шаг 2. min ⎨ L(x6), L(x8) ⎬ = min ⎨ 6, 6 ⎬ = 6. Любую из меток L(x6), L(x8) можно сделать постоянной. Пусть L∗(x6) =6.
Седьмая итерация Шаг 1. Г(x6) = ⎨ x1, x4, x7, x8 ⎬. Единственная вершина из Г(x6) с временной меткой - это x8 . L(x8) = min ⎨ 6, 2+6⎬ = 6. Шаг 2. min ⎨ L(x8) ⎬ = min ⎨ 6 ⎬ = 6. Вершина x8 получает постоянную метку L∗(x8) = 6. Процесс расстановки меток закончен. Значение постоянной метки вершины x8 дает кратчайшее расстояние между x1 и x8, которое равно 6. 2)Для нахождения кратчайшего пути между x1 и x8 воспользуемся табл. 1.3. Вершина x8 получила постоянную метку на шестой итерации. Значит, ей предшествует вершина x7. Постоянная метка вершины x7 находится в столбце под номером 4. Значит, ей предшествует вершина x5. И так далее. Таким образом, кратчайший путь из x1 в x8 S= ⎨ x1, x3 , x5, x7, x8 ⎬. 3) Построим основное дерево кратчайших путей для данного графа. Говоря другими словами, следует найти связный подграф исходного графа, который не содержал бы циклов, и в котором длина пути от вершины x1 (корня дерева) до каждой из вершин графа была бы наименьшей по сравнению с любым другим путем из x1 до рассматриваемой вершины. Для этого используем строку табл. 3.1, содержащую последовательность вершин {x1 x3 x2 x5 x4 x7 x6}. Каждую вершину из этой последовательности, начиная с первой,
нужно соединить
ребром с вершинами, отмеченными в соответствующем столбце символом “*”. Так, в столбце под x1 помеченными являются вершины x3 и x5. Значит, соединяем ребрами x1 с этими вершинами. Следующая ветвь дерева строится уже от вершины x3 до вершины x5. Согласно последовательности, строить дерево продолжаем от вершины x5. От нее должны идти ребра к вершинам x4 и x7 (см. столбец, соответствующий 4-й итерации). На 5-й итерации соединяем ребром вершины x4 и x6. На 6-й итерации проводим ребро от вершины x7 до x8. Последнюю вершину x6 не с чем соединять, так как в последнем столбце нет помеченных вершин. Таким образом, процесс построения дерева завершен.
Соответствующий
построенному
дереву
кратчайших
путей
граф
представлен на рис. 1.3.
Рис. 1.3 Заметим, что сравнение рис. 1.2 и 1.3 подтверждает известную теорему о графах: наименьшее число ребер p, которое нужно удалить из связного графа, чтобы получить дерево, удовлетворяет соотношению p= N - n + 1, где N - число ребер исходного графа, n - число вершин графа. В нашем случае p = 13 - 8 + 1 = 6 , т.е. количество удаляемых ребер графа для получения дерева не может быть меньше шести. Непосредственный подсчет показывает, что в рассматриваемой задаче оно равно шести. Тема 1.3 Транспортные сети. Построение максимального потока Основные определения Двухполюсной транспортной сетью S называется произвольный орграф без петель с множеством вершин X и с множеством дуг U, для которых выполняются следующие условия: 1.Существует одна и только одна вершина s ∈ X , в которую не заходит ни одной дуги. Эта вершина называется источником или входом сети. 2.Существует одна и только одна вершина t ∈ X , из которой не исходит ни одной дуги. Эта вершина называется стоком или выходом сети.
3.На множестве дуг сети U определена неотрицательная функция
С : U → R + ∪ 0 , ставящая в соответствие каждой дуге u ∈ U неотрицательное число c(u), называемое пропускной способностью сети. Потоком в сети S=(X,U) от входа к выходу (или от источника в сток) называется
произвольная
неотрицательная
вещественная
функция,
определенная на множестве дуг сети ϕ : U → R + ∪ 0 , для которой выполняются
следующие условия: 1. 2.
0 ≤ ϕ (u ) ≤ c(u ) для любой дуги;
∑ ϕ (u ) = ∑ ϕ (u ) для любой вершины x ∈ X , x ≠ s, x ≠ t , где
u∈U x+
u∈U x−
U x+ -множество дуг, заходящих в вершину x, U x− -множество дуг, выходящих из вершины x. Это условие означает, что количество потока, входящего в каждую вершину сети (кроме вxода и выxода) равно количеству потока, выходящего из этой вершины. Следовательно, количество потока, выходящего из вxода s равно количеству потока, входящего в выxод t . Эта величина называется величиной потока и обозначается ϕ s . С
помощью
производственной
транспортной системы,
сети
включающей
можно склады
моделировать заготовок,
работу готовой
продукции, технологическое и транспортное оборудование. При этом склад заготовок - вxод сети, склад готовой продукции - выxод сети, станки остальные вершины сети. Вершины будут соединяться дугами в том случае, если между соответствующими станками осуществляется транспортировка. Поток не может исчезать и накапливаться в промежуточных вершинах сети, поэтому модель будет соответствовать ситуации с отсутствием брака и незавершенного производства. Пропускная способность дуг сети в этом случае должна учитывать способность транспортной системы и производительность станков.
Интересна задача нахождения максимального потока в сети (например, максимальное число деталей, которое может обработать в единицу времени производственная система). Разрезом сети S=(X,U), заданным на множестве вершин A ≠ 0 , A ≠ X , s ∈ A, t ∈ X \ A
A⊂ X ,
называется множество дуг ( xi , x j ) ∈ U таких,
что xi ∈ A , x j ∈ X \ A . Разрез обозначается P(A). Иными словами, разрезом сети является множество дуг сети, обладающих следующим свойством: любой путь от входа к выходу сети пройдет хотя бы по одной дуге разреза. При удалении разреза вход сети отделяется от выхода, т.е. сеть как бы разрезается. Пропускной способностью разреза или величиной разреза C(A) называется сумма пропускных способностей входящих в него дуг: C ( A) = ∑ c(u ) . u∈ P ( A )
Минимальным разрезом, разделяющим вход s и выход t сети, называется произвольный разрез P(A), s ∈ A,
t ∈ X \ A с минимальной пропускной
способностью. Теорема Форда-Фалкерсона Величина каждого потока от вxода к выxоду не превосходит пропускной способности минимального разреза, разделяющего вxод и выxод сети, причем существует максимальный поток, чья величина равна пропускной способности минимального разреза. Дуга u ∈ U , соединяющая вершины xi ∈ X , x j ∈ X сети S, является допустимой, если для нее выполняется одно из следующих условий: 1) Направление дуги совпадает с направлением потока и значение потока по этой дуге меньше ее пропускной способности: u = ( xi , x j ) , ϕ (u ) < c(u ) . 2) Направление дуги противоположно направлению потока и по ней проходит ненулевой поток: u = ( xi , x j ) , ϕ (u ) > 0 .
Дуги, для которых выполняется условие 1), называются увеличивающими или согласованными. Дуги, для которых выполняется условие 2), называются уменьшающими или несогласованными. Увеличивающей цепью, соединяющей вход и выход сети, называется простая
цепь,
все
дуги
которой
являются
допустимыми.
Знание
увеличивающей цепи позволяет увеличить поток по ней на величину
δ = min{∆(u )} , где ∆(u ) = c(u ) − ϕ (u ) , если u –увеличивающая. ∆(u ) = ϕ (u ) , u
если u – уменьшающая. Алгоритм построения максимального потока Шаг1.Задать начальное значение потока, если оно не задано. Удобно задавать начальное значение потока равным 0. Перейти к шагу 2. Шаг2.Построить увеличивающую цепь от входа к выходу сети. Если увеличивающей цепи не существует, то максимальный поток построен. В противном случае перейти к шагу 3. Шаг3.Вдоль построенной цепи увеличить значение потока на величину δ . Перейти к шагу 2. Замечание. Для того, чтобы алгоритм Форда-Фалкерсона сходился за конечное число шагов для произвольных значений пропускных способностей, нужно в качестве увеличивающей цепи выбирать цепь, содержащую минимально возможное число дуг [4,5]. Пример
Пусть дана матрица пропускных способностей некоторой транспортной сети (табл. 1.4). Учтем,
что
веса,
Построим сеть, соответствующую этой матрице (рис.1.4). равные
нулю,
означают
отсутствие
ребра
между
соответствующими вершинами, а ненулевое значение, стоящее на пересечении k-й строки и l-го столбца означает, что из вершины xk идет дуга в вершину xl. Буквами s и t обозначены вершины, соответствующие истоку и стоку. Над
каждой дугой проставлена ее пропускная способность и начальное значение потока (в скобках). x1 7 0 0 0 0
s x1 x2 x3 x4
x2 0 3 0 0 0
Таблица 1.4 x3 x4 t 4 0 0 0 5 0 2 0 5 0 4 0 0 0 6
x1
x2
s
t Рис. 1.4
x3
x4
Рассмотрим алгоритм Форда-Фалкерсона Итерация первая Шаг 1. Зададим начальное значение потока ϕ (u ) = 0 . На дугах орграфа рядом с пропускными способностями в скобках будем помещать очередное значение потока. Шаг 2. Строим увеличивающую цепь. Дуги, входящие в цепи, должны быть допустимыми. Так, например, цепь {s x3 x4 x1 x2 t} не является увеличивающей, так как дуга (x4 ,x1) не является допустимой - ее направление противоположно направлению потока и величина потока по ней равняется 0. Значит, на первой итерации нужно строить цепь, направление дуг которой совпадает с направлением потока. Пусть это будет цепь G1={s x1 x4 t}. Шаг 3.
Дуги (s, x1), (x1, x4), (x4 t) , входящие в цепь G1, являются
увеличивающими, поэтому ∆(u ) = c(u ) − ϕ (u ) , u ∈{sx1, x1x4,
ϕ (u ) = 0 , то ∆(u ) = c(u ) и δ = min{c(u )} = min{7;5;6} = 5 . u
x4t}. Так как
Увеличим величину потока в цепи G1 на величину
δ . Результат отобразим
на рис. 1.5. x1
x2
s
t Рис. 1.5 x3
x4
В следующих итерациях сразу переходим ко второму шагу. Итерация вторая Шаг 2. Построим увеличивающую цепь G2={s x3 x4 t}. Вычислим
δ.
δ = min{4 − 0;4 − 0;6 − 5} = 1 . Шаг 3. Увеличим поток по цепи G2 на величину δ =1 (см. рис.1.6.) . x1
x2
s
t
x3
x4 Рис. 1.6
Итерация третья Шаг 2. Построим увеличивающую цепь G3={s x1 x2 t}. Вычислим
δ.
δ = min{7 − 5;3 − 0;5 − 0} = 2 . Шаг 3. Увеличим поток по цепи G3 на величину δ =2 (см. рис.1.7.).
x1
x2
s
t
x3
x4 Рис. 1.7
Итерация четвертая Шаг 2. Построим увеличивающую цепь G4={s x3 x4 x1 x2 t}. В этой цепи дуга (x4 x1) будет уменьшающей, так как ее направление противоположно направлению потока и допустимой, так как величина потока ϕ ( x4 x1 ) = 5 ≠ 0 .
Причем для этой дуги ∆( x 4 x1 ) =5 –значение потока. Для остальных дуг, являющихся увеличивающими,
∆(u )
вычисляется согласно правилу по
формуле ∆(u ) = c(u ) − ϕ (u ) . Вычислим δ .
δ = min{4 − 1;4 − 1;5;3 − 2;5 − 2} = 1 Шаг 3. По дуге (x4 x1) уменьшим поток на величину δ , на всех остальных увеличим на δ (см. рис.1.8.). x1
x2
s
t
x3
x4 Рис. 1.8
Итерация пятая
Покажем, что дальнейшее построение увеличивающих цепей невозможно. Любая цепь, для которой конечным звеном является недопустимая дуга (x4t) (для нее ϕ ( x 4 t ) = c( x 4 t ) = 6 ), должна быть отброшена. Остаются
цепи,
проходящие через дугу (x2t). Но любая из этих цепей содержит хотя бы одну из недопустимых дуг (x1x2) (поток равен пропускной способности), (x3x2) (по ней проходит нулевой поток). Таким образом, невозможно дальнейшее построение увеличивающих цепей
и,
значит,
максимальный
поток
найден.
Его
величина
ϕs = 7 + 2 = 3 + 6 = 9 .
Проверить правильность полученного ответа можно, определив величину минимального разреза. Его значение должно совпадать со значением максимального потока. Из рис. 1.9 видно, что в минимальный разрез входят дуги (x1x2) и (x4t). Сумма их пропускных способностей с( x 1 x 2 ) + c( x 4 t ) = 9 = ϕ s . x1
x2
s
t x3
x4 Рис. 1.9
Построим матрицу потока. x1 s x1 x2 x3 x4 Сумма потока, входящего в вершины
x2
x3
x4
t
7 0 0 0 0
0 3 0 0 0
2 0 0 0 0
0 4 0 2 0
0 0 3 0 6
7
3
2
6
9
Таблица 1.5 Сумма потока, выходящего из вершины 9 7 3 2 6
Раздел 2. Линейно- регрессионный анализ
[3], с.9…21; [3], с.50…76 Линейно-регрессионный анализ связан с построением функциональных зависимостей y=f(x) между независимой переменной x и зависимой переменной y. Будем называть y откликом, а x – объясняющим фактором, влияющим на отклик y. Построение
функциональной зависимости y от x основано на
известных исходных данных (xi, yi), где yi – значение отклика при значении фактора xi, i=1,2,…,n. Например, существует зависимость между затратами автохозяйства и числом работающих автомобилей. Здесь фактором x служит число работающих автомобилей, а откликом y – затраты автохозяйства. Исходные данные состоят из n пар чисел (xi, yi), где xi - число работающих автомашин, а yi – затраты автохозяйства. Предположим, что наблюдаемое значение отклика y можно разделить на две составляющие: неслучайную f(x) и случайную u, т.е. y= f(x)+u.
Это означает, что исходные данные (xi, yi) удовлетворяют равенствам i=1,2,…,n.
yi= f(xi)+ui,
Разделение отклика на две составляющие можно сделать только гипотетически. Реально ни f(xi), ни ui в отдельности неизвестны, а известна их сумма. Поэтому относительно этих составляющих делаются некоторые предположения. В
классической
регрессионной
модели
относительно
случайной
составляющей предполагается, что 1) случайные
величины
ui
статистически
независимы,
т.е.
все
случайности, вызвавшие отклонение отклика y от неслучайной части f(x) в одном опыте не оказывают влияние на подобные отклонения в других; 2) случайные величины ui одинаково распределены, т.е. статистическая природа этих отклонений неизменна во всех опытах;
3) случайные величины ui распределены по нормальному закону с математическим ожиданием 0 и дисперсией σ2. Отсюда следует, что неслучайная часть f(x) является средним значением отклика y на факторе x. Следующим предположением является предположение о возможном виде зависимости между x и y. Примерами
такой зависимости может служить,
например, линейная функция y=a0+a1x, квадратный трехчлен y=a0+a1x+a2x2 и другие функции. Здесь неизвестные числовые параметры a0,a1,a2 необходимо оценить по исходным данным. Тема 2.1. Метод наименьших квадратов
Предположим, что существует линейная зависимость между откликом y и объясняющим фактором x: y=a0 +a1x+u. Это означает, что исходные данные (xi,yi) удовлетворяют равенствам yi=a0 +a1xi+ui.
(2.1) (2.2)
Необходимо оценить неизвестные значения коэффициентов a0, a1 по исходным данным (xi, yi), т.е. определить числа b0, b1 так, чтобы функция yпр= b0+b1x (2.3) “наилучшим” образом отражала исходные данные (xi, yi). Эта функция
называется функцией регрессии, а числа b0 и b1 – коэффициентами регрессии. Найдем коэффициенты регрессии b0 и b1 методом наименьших квадратов. Пусть yi – отклик на фактор xi ,а yiпр= b0+b1 xi
прогноз этого отклика по уравнению регрессии. Разность между откликом yi и его прогнозом y iпр называется остатком ei: ei= yi - yiпр = yi –( b0+b1xi).
Коэффициенты регрессии b0, b1 находятся из условия минимума суммы квадратов остатков, т.е. они доставляют минимум функции
S(b 0 , b1 ) =
n
n
e i2 =
∑ 1
∑ 1
(y i − b0 − b1xi ) 2 .
Приравнивая нулю частные производные по b0, b1 от функции S(b0, b1), получаем систему уравнений n
n
1
1
b0 n + b0 ∑ xi = ∑ yi ; n
n
1
1
b0 ∑ xi + b1∑
x2i
n
= ∑ xiyi . 1
Эта система уравнений называется нормальной системой. Ее решение можно найти по формулам n
n
n
1
1
1
n∑ xiyi − ∑ xi ∑ yi
xy− x⋅ y ; D(x)
(2.4)
1n 1n b0 = ∑ yi − b1 ∑ xi = y − b1 x . n1 n1
(2.5)
b1 =
⎛ ⎞ n∑ x2i − ⎜⎜ ∑ xi ⎟⎟ ⎝ 1 ⎠ 1 n
n
2
=
Здесь черта означает среднее арифметическое, а D(x) обозначает выборочную дисперсию фактора x: D(x) =
1 n 2 x i − ( x) 2 . ∑ n 1
Коэффициенты регрессии b0, b1 служат оценками реально неизвестных коэффициентов a0 и a1.Теперь необходимо оценить по исходным данным дисперсию случайной части σ2. В математической статистике показано, что в качестве
ее
оценки
s2 =
можно
выбрать
1 e2i . ∑ n− 2
Величину s в компьютерных пакетах называют стандартной ошибкой.
величину
(2.6)
Рассмотрим
метод
наименьших
квадратов
на
примере
затрат
автохозяйства. Пример 1
Допустим, что вопреки реальности точно известно соотношение (2.1) между фактическими затратами y автохозяйства в у.е. и числом работающих автомобилей x в десятках единиц: y=1+20x+u, (2.7) а случайная величина u распределена нормально с математическим ожиданием m=0 и стандартным отклонением σ =9.
Допустим, что исходные данные состоят из фактических затрат автохозяйства при 10,20,…100 работающих автомашинах, т.е. объясняющий фактор x принимает значения 1,2..,10.
По предположению (2.7) фактические
затраты yi при факторе xi удовлетворяют равенству yi=1+20xi+ui. В этом равенстве неслучайная часть
(2.8)
yiср = 1 + 20 xi определяет средние затраты автохозяйства при xi десятках автомобилей, а случайная часть ui – отклонение фактических затрат от средних. Значения ui будем моделировать с помощью таблицы случайных чисел, распределенных нормально с математическим ожиданием 0 и дисперсией 1. Из таблицы нормально распределенных случайных величин (см. приложение) выбираем любые десять значений. Обозначаем их zi и поместим в первый столбец табл. 2.1. По выбранным значениям zi отклонения от средних затрат ui вычислим по формуле ui=σ⋅ zi..
В нашем примере σ=9. Эти значения составят второй столбец табл. 2.1. Теперь можно вычислить фактические затраты yi по формуле (2.8). Получим фактические затраты автохозяйства при десяти автомобилях, т.е. при x=1. В этом случае из (2.8) следует, что фактические затраты в первом наблюдении равны
y1 = 1+20×1-8.48 =12.52 .
Заметим, что значение –8,48 означает, что фактические затраты оказались на 8,48 у. е. меньше
их среднего значения 21.
Аналогично вычисляются
фактические затраты y2 во втором наблюдении при x=2. y2=1+20×2+9×(-0,32)=38.16.
Продолжая моделирование аналогичным образом для x=3,4 …,10, построим исходные данные для десяти наблюдений. Они помещены в пятом столбце таблицы. Рассчитаем коэффициенты регрессии по формулам (2.4) и (2.5). Для этого необходимо предварительно вычислить xiyi , xi2, yi2, заполнить шестой, седьмой и восьмой столбцы таблицы, а затем найти среднее арифметическое этих столбцов. Тогда коэффициенты регрессии будут равны
b1 =
776,95− 5,5× 110,085 171,4835 = = 20,79, 8,25 38,5 − 5,52 b0=110,085-20,786×5,5=-4,24.
Таким образом, уравнение регрессии имеет вид yпр=-4,24+20,79x.
(2.9) Таблица 2.1
z -0,94 -0,32 -0,29 0,40 -0,56 0,28 -0,09 0,45 -0,11 0,16
u -8,48 -2,84 -2,63 3,63 -5,01 2,5 -0,8 4,08 -1,03 1,43 сумма среднее
x
yср
1 2 3 4 5 6 7 8 9 10 55 5,5
21 41 61 81 101 121 141 161 181 201
y 12,52 38,16 58,37 84,63 95,99 123,5 140,2 165,08 179,97 202,43 1100,85 110,085
xy 12,52 76,32 175,11 338,52 479,95 741 981,4 1320,6 1619,7 2024,3 7769,5 776,95
x2 1 4 9 16 25 36 49 64 81 100 385 38,5
y2 156,7504 1456,186 3407,057 7162,237 9214,08 15252,25 19656,04 27251,41 32389,2 40977,9 156923,1 15692,31
yпр 16,55 37,34 58,12 78,91 99,69 120,48 141,26 162,05 182,83 203,62
ei -4,03 0,82 0,25 5,72 -3,70 3,02 -1,06 3,03 -2,86 -1,19
Коэффициент b1=20.79 служит оценкой коэффициента a1, а коэффициент b0=-4,24 - оценкой a0.
Уравнение регрессии (2.9) позволяет вычислить прогноз средних затрат yср(x) при x работающих автомобилях. При десяти автомобилях (x=1) средние
затраты составят ycр(1)=1+20×1=21 у.е. , а их прогноз yпр(1)=-4,24+20,79 × 1=16,55 у. е. При этом фактические затраты по исходным данным составляли 12,52 у.е.. Расхождение между фактическими и прогнозируемыми затратами называют остатками ei. При x=1 остаток составит величину e1=y1-yпр(1)=12,52-16,55= -4,03 .
Все значения yпр(x) и остатки ei помещены в двух последних столбцах таблицы. Ниже построен график, линиями регрессии и точками отмечены исходные данные. Оценку дисперсии
σ2 найдем по формуле (2.6), используя последний
столбец таблицы:
s2 =
1 1 2 e2i = {(4.03)2 + ( 0.82) ... + ( − 1.2)2 } = 11.56 ∑ n− 2 8
Следовательно, стандартная ошибка s =
11,56 =3,4.
y = 20,79x - 4,24
250 200 150 100 50 0 0
2
4
6
8
10
12
Теперь можно сравнить параметры уравнения (2.8) с параметрами уравнения (2.9) и стандартное отклонение σ со стандартной ошибкой s: параметр a0 =1, а его оценка b0 =-4.24, параметр a1 =20, а его оценка b1 =20.79,
параметр σ =9, а его оценка s =3.4. Сравнение показывает близость оценки b1 и параметра a1. Относительно остальных параметров этого сказать нельзя. Используя предположения 1-3 о случайной составляющей u, можно статистически точно определить качество уравнения регрессии. Тема 2.2. Оценка значимости уравнения регрессии
Проверим, соответствует ли математическая модель зависимости отклика y от объясняющего фактора x: y=a0 +a1x+u
экспериментальным данным (xi, yi). Если в этом равенстве коэффициент a1=0, то отклик y изменяется чисто случайно, не завися от фактора x. В противном случае при a1≠0 отклик y зависит от фактора x. Таким образом, о зависимости отклика
y
от
объясняющего
фактора
x
можно
сформулировать
две
взаимоисключающих гипотезы: нулевую гипотезу H0: a1=0 об отсутствии зависимости между x и y и альтернативную гипотезу H1: a1≠0 о наличии этой зависимости.
Будем говорить, что уравнение регрессии yпр= b0+b1x значимо, если коэффициент регрессии b1, рассчитанный по исходным данным
(xi,yi), подтверждает гипотезу H1. В математической статистике доказано, что при предположениях 1-3 о случайной составляющей u распределенными
коэффициенты регрессии являются нормально
случайными
величинами.
В
частности,
коэффициент
регрессии b1 имеет математическое ожидание a1 и стандартное отклонение
у . n⋅ D(x) Заменяя в последней формуле величину σ на ее оценку s, получаем формулу для стандартной ошибки коэффициента b1 в уравнении регрессии
s(b1) =
s . n⋅ D(x)
(2.10)
В качестве критерия для принятия гипотезы H0 возьмем величину
t=
b1 . s(b1 )
(2.11)
Она отражает число стандартных ошибок s(b1) в коэффициенте регрессии b1 и имеет распределение Стъюдента с (n-2) степенями свободы. Построим
критическую область, т. е. те значения t-статистики, которые свидетельствуют о зависимости между переменными y и x. Выбираем уровень значимости α и α найдем по таблицам квантилей t-распределения α-квантиль tкрит . Это значение
определяет границу критической области, в которой нулевая гипотеза H0 отвергается. Сформулируем правило принятия гипотезы H0 : если рассчитанное по уравнению регрессии фактическое значение критерия
tфакт =
b1 б удовлетворяет неравенству tфакт > tкрит , то альтернативная s(b1)
гипотеза
H1
принимается,
если
же
выполняется
противоположное
неравенство tфакт < tбкрит , то результат расчета не противоречит гипотезе H0.
Найдем доверительный интервал для коэффициента a1. Обозначим через γ доверительную вероятность (γ=1−α). Тогда доверительный интервал для коэффициента a1 имеет нижнюю границу, равную и
b1 − s(b1)tбкрит ,
верхнюю границу, равную
b1 + s(b1)tбкрит .
(2.12)
Можно определить содержательный смысл коэффициента b1, если удалось установить справедливость гипотезы H1 о зависимости отклика y и фактора x. Коэффициент b1 показывает, на сколько в среднем изменится отклик y, если
фактор
x
увеличится
на
единицу,
а
доверительный
интервал
для
коэффициента a1 указывает границы этого изменения с надежностью 100γ%.
Уравнение регрессии yпр= b0+b1x
можно использовать для прогноза фактического значения отклика y. Если в это уравнение подставить в правую часть значение фактора x0, то левая часть yпр(x0) даст значение прогноза отклика y0 при значении фактора x0. Построим доверительный интервал для значения отклика y0. Найдем предельную ошибку m для отклика y0 по формуле 1 (x − x)2 m . 1+ + n nD(x) Тогда доверительный интервал для значения отклика y0 имеет = tбкрит (n- 2)× s×
нижнюю границу, равную
yпр(x0)- m;
верхнюю границу, равную
yпр(x0)+m.
(2.13)
(2.14)
Проверим качество уравнения регрессии, найденного в примере 1. Пример 2. В примере 1 было установлено, что параметр a1 =20, а его
оценка b1 =20.79. Рассчитаем стандартную ошибку коэффициента b1:
s(b1) =
3.4 s = =0.37 . n⋅ D(x) 10 ⋅ 8.25
Гипотеза H0 : a1=0 означает, что затраты автохозяйства не зависят от числа автомобилей. Гипотеза H1: a1≠0 означает, что затраты автохозяйства зависят от числа автомобилей. Зададим уровень значимости α=0,05 и по таблице квантилей t– распределения при числе степеней свободы n-2=8 найдем критическое значение t 0кр,05 (8)=2.306. Тогда критическая область имеет вид
2.306
-2.306
Найдем фактическое значение t-статистики: tфакт =
b1 20,79 = = 55,52 . s(b1) 0,3744
Так как для найденного фактического значения t-статистики выполняется неравенство |tфакт|=55.52> означает, что
tбкрит (8) =2.306, то гипотеза H0 отвергается. Это
коэффициент регрессии b1=20.79 свидетельствует о наличии
линейной зависимости между фактическими затратами автохозяйства y и числом работающих автомобилей x. Построим
доверительный
интервал
для
коэффициента
a1
при
доверительной вероятности γ=0,95. Из формул (2.11) получаем значение нижней границы b1-s(b1) t α крит (8) =20,79-0,3744×2,306=19,923
и верхней границы b1+s(b1) t αкрит (8) =20,79+0,3744×2,306=21,649.
Отсюда видно, что доверительный интервал [ 19.923 , 21,649 ] накрывает коэффициент a1=20. Из экономической интерпретации коэффициента регрессии b1 следует: при увеличении числа автомобилей на 10 ( x увеличивается на 1) затраты увеличатся в среднем на 20,79. Следовательно, доверительный интервал
означает : при увеличении числа автомобилей на 10 с уверенностью в 95% можно утверждать, что затраты в среднем составят от 19,923 до 21,649 у.е.
Уравнение регрессии yпр (x)=-4,24+20,79x
можно использовать для прогноза фактических затрат. Возьмем x0=11 и подставим в уравнение регрессии : yпр(11)=-4,24+20,79×11=224,45 у.е.
Это значение служит точечной оценкой фактических затрат y при 110 работающих автомашинах. Построим 95% доверительный интервал для фактических затрат y при x=11. Найдем предельную ошибку прогноза m по формуле (2.13): m= tбкрит (n- 2)× s×
1 (x − x)2 = 1+ + n nD(x)
= 2.306 × 3.4 1 + 0,1 +
(11 − 5,5) 10 ⋅ 8,25
2
= 9.497
.
Тогда 95% доверительный интервал для фактических затрат y при x.=11 работающих автомобилях имеет нижнюю границу, равную
yпр(11)- m=224.450-9,497=214,95;
верхнюю границу, равную
yпр(11)+m=224,450+9,497=233,95.
Следовательно, с надежностью 95% можно утверждать, что при 110 работающих автомашинах фактические затраты будут в интервале (214,95, 233,95), т.е. затраты составят не менее 214,95 и не более 233,95 . Замечание. В приложении 2 приводятся диалоговые окна для вывода итогов функцией регрессия в пакете прикладных программ Exsel.
4. ЗАДАНИЯ НА КОНТРОЛЬНЫЕ РАБОТЫ Задание на контрольную работу №1
В контрольной работе №1 студенты должны выполнить две задачи, номера которых выбираются из табл. 4.1. Таблица 4.1
Последняя цифра шифра Номера выполняемых задач
0 1 15
1 2 16
2 3 17
3 4 18
4 5 19
5 10 20
6 9 11
7 8 12
8 7 13
9 6 14
В задачах 1-10 для заданного графа построить матрицу весов, определить кратчайший путь из х1 в х8, применяя алгоритм Дейкстры; построить остовное дерево кратчайших путей.
В задачах 11-20 для заданной матрицы пропускных способностей построить транспортную сеть. Определить на ней максимальный поток и найти величину минимального разреза.
Матрицы пропускных способностей x1 x2 x3 x4
11.
t
s 10 20 x1 7 14 x2
13.
s x1
6
x4
5
19
8 14 x1 x2 x3 x4 25
x3
9
s x1
19.
s x1
t
t
22
5
t
15 t
x2
9 21
x3 8
4
x4
17 x1 x2 x3 x4
20.
s 8 x1
14 7
x4
7 x1 x2 x3 x4
18.
15
x1 x2 x3 x4
18 5
17
18
x4
14
x3
10
s 15 14 x1 7 10
6
x2
10
x3 16 4
17
5
18
s 19 30 x1 9 20
9
11
t
11
x1 x2 x3 x4
16.
20
8
5
5
x1 x2 x3 x4
x3
x2
x2
x2 x4
t
21
15
8
4 14
x4 17.
s 26 x1 8
x4
10 7 16 6
x2
18
x3 14
4
11
x1 x2 x3 x4
14.
16
x4
s x1
t
6
x4
15 5 9 10
x3
7
x3 11
x2
15.
x2
9
x1 x2 x3 x4
t
s 10 15 x1 5 6 15
x3
x1 x2 x3 x4
12.
9
4 23
16 7 6 12
x2 x3 x4
t
9 5
4 10
Задание на контрольную работу №2
В контрольной работе №2 студенту необходимо выполнить две задачи. В задачах 21-30 для параметров, определенных по последней цифре, требуется: 1.
Построить исходные данные, моделируя уравнение затрат
автохозяйства y=a0+a1x для десяти значений фактора x=1,…,10. Отклонения от средних затрат ui необходимо найти с помощью таблицы нормально распределенных случайных чисел, выписывая из нее подряд вниз по столбцу десять значений, начиная с числа, стоящего на пересечении строки, равной предпоследней цифре шифра +1, и столбца, равного последней цифре шифра (если таковая равна 0,
используется предпоследняя цифра
шифра); 2. Рассчитать коэффициенты регрессии b0,b1 и построить исходные данные и график уравнения регрессии; 3. Найти предсказанные значения yпр средних затрат и остатки для x=1,…,10 4. Рассчитать стандартную ошибку s; 5. Провести сравнение всех параметров линейной модели a0,a1,σ с их оценками. В заданиях 31-40 оценивается качество уравнения регрессии, полученного в предыдущем задании: 1.
Проверить гипотезу по t-статистике о зависимости затрат
автохозяйства от числа работающих автомобилей с уровнем значимости α=0,05;
2.
Рассчитать доверительный интервал для параметра a1;
3.
Дать
экономическую
интерпретацию
найденного
в
предыдущей задаче коэффициента b1 и доверительного интервала для a1.
4.
Найти прогноз и доверительный интервал для затрат
автохозяйства при 110 работающих автомобилей, т.е. при x=11. Параметры модели выбрать по последней цифре шифра. 21. a0=10; a1=25; σ=3
26. a0=10; a1=26; σ=4
22. a0=11; a1=25; σ=3
27. a0=10; a1=27; σ=4
23. a0=12; a1=25; σ=3
28. a0=10; a1=28; σ=4
24. a0=13; a1=25; σ=3
29. a0=10; a1=29; σ=4
25. a0=14; a1=25; σ=3
30. a0=10; a1=30; σ=4
ПРИЛОЖЕНИЯ Приложение 1 ТАБЛИЦА НОРМАЛЬНО РАСПРЕДЕЛЕННЫХ СЛУЧАЙНЫХ ЧИСЕЛ
-0,942 -0,316 -0,292 0,403 -0,557 0,278 -0,089 0,453 -0,114 0,159 -0,957 -0,644 -1,356 -0,641 -0,417 0,473 -1,520 0,060 -0,616 -0,292 0,357 0,840 -0,629 -1,011 0,034 -0,801 -0,598 0,357 0,717 0,041 0,520 1,284
0,724 0,550 0,527 -0,432 0,513 -2,101 -0,212 0,383 -1,578 0,303 0,385 1,504 -0,894 0,841 -0,848 0,339 1,373 0,488 0,756 0,701 -1,229 0,233 0,115 -0,756 0,646 -1,653 0,780 -0,140 -0,248 -0,273 0,998 -1,027
-1,558 0,170 -0,715 0,507 -0,239 0,390 -0,455 1,447 0,748 -0,193 -0,804 -0,773 -0,371 -0,095 0,079 -0,454 -1,284 -0,224 1,560 -0,314 0,952 2,424 0,905 -0,196 -2,134 0,273 0,140 1,482 -1,077 -0,069 0,158 -0,815
0,946 -0,605 1,509 0,309 -0,675 -0,778 -0,654 1,027 0,074 -0,296 -2,195 1,466 -0,284 -0,460 -0,239 1,348 1,151 -1,673 0,226 0,066 -0,340 1,569 -0,679 0,805 0,225 -0,285 -0,781 -0,605 -0,862 0,723 0,187 -1,310
1,476 1,236 0,243 1,582 -0,712 0,509 0,014 -0,253 0,231 -0,949 1,002 -1,071 1,008 1,125 -1,210 -0,311 -0,750 -0,777 1,149 -0,476 -1,140 -0,474 0,065 -0,389 0,070 -0,064 -0,007 -0,914 -0,588 -0,832 1,697 -1,090
-2,072 -0,414 -0,770 -0,026 -0,443 0,134 1,045 -0,116 -0,208 1,299 0,104 -2,279 0,559 0,511 0,360 -0,524 -0,467 -0,901 -0,360 0,531 -0,660 -0,959 0,968 0,378 0,282 -0,668 -0,444 -0,680 -1,538 -1,888 -0,771 -0,412
-1,461 -0,780 -0,707 -0,004 -2,307 1,139 -3,014 0,150 -0,606 -0,058 0,959 2,314 -0,854 0,164 -0,253 -0,597 0,472 -0,034 0,539 -1,344 0,600 -0,834 0,115 0,603 0,212 1,059 1,580 0,262 -0,611 -1,186 -0,437 0,393
1,157 -1,091 -0,129 -0,723 -2,085 1,213 0,549 -0,758 -0,421 2,260 -0,464 -0,318 0,554 0,569 0,786 1,099 -0,562 -0,549 -0,587 -1,068 -1,711 0,919 -0,791 -0,542 -0,070 -2,084 -2,733 0,452 0,760 0,526 1,167 -0,784
2,076 0,072 -0,080 0,101 0,567 1,858 0,861 -0,662 0,049 0,474 -1,197 -1,005 0,049 0,169 -0,814 -0,154 -1,344 -1,039 -0,057 -0,027 -0,069 0,513 0,575 -1,531 0,953 0,283 -1,691 0,503 1,551 -0,526 0,655 0,082
Приложение 2 ВЫВОД ИТОГОВ ФУНКЦИЕЙ РЕГРЕССИЯ
Сервис Анализ данных Регрессия ОК
Содержание ПРЕДИСЛОВИЕ............................................................................................................................................................. 3 1.СОДЕРЖАНИЕ ДИСЦИПЛИНЫ............................................................................................................................ 6 1.1.РАБОЧАЯ ПРОГРАММА .............................................................................................................................................. 6 1.2. ТЕМАТИЧЕСКИЙ ПЛАН ЛЕКЦИЙ ............................................................................................................................... 8 1.3. ПЕРЕЧЕНЬ ТЕМ ЛАБОРАТОРНЫХ ЗАНЯТИЙ .............................................................................................................. 8 2. БИБЛИОГРАФИЧЕСКИЙ СПИСОК ................................................................................................................... 9 3. МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ КОНТРОЛЬНЫХ РАБОТ. .................................... 10 РАЗДЕЛ 1. ЭЛЕМЕНТЫ ТЕОРИИ ГРАФОВ И ТРАНСПОРТНЫЕ СЕТИ ................................................... 10 ТЕМА 1.1 ОПРЕДЕЛЕНИЯ. КЛАССИФИКАЦИЯ ЗАДАЧ ТЕОРИИ ГРАФОВ ........................................................................ 10 Определение графа ................................................................................................................................................. 10 Матричный способ задания графа ....................................................................................................................... 12 Простой путь, цикл графа. Дерево....................................................................................................................... 13 Классификация задач теории графов................................................................................................................... 13 ТЕМА 1.2 АЛГОРИТМЫ НА ГРАФАХ .............................................................................................................................. 14 Задача о минимальном остовном дереве.............................................................................................................. 14 Задача о кратчайшем пути................................................................................................................................... 15 ТЕМА 1.3 ТРАНСПОРТНЫЕ СЕТИ. ПОСТРОЕНИЕ МАКСИМАЛЬНОГО ПОТОКА............................................................... 21 Основные определения............................................................................................................................................ 21 Теорема Форда-Фалкерсона. ................................................................................................................................. 23 Алгоритм построения максимального потока.................................................................................................... 24 РАЗДЕЛ 2 ЛИНЕЙНО- РЕГРЕССИОННЫЙ АНАЛИЗ ...................................................................................... 29 ТЕМА 2.1 МЕТОД НАИМЕНЬШИХ КВАДРАТОВ ............................................................................................................. 30 ТЕМА 2.2. ОЦЕНКА ЗНАЧИМОСТИ УРАВНЕНИЯ РЕГРЕССИИ ......................................................................................... 35 4. ЗАДАНИЯ НА КОНТРОЛЬНЫЕ РАБОТЫ........................................................................................................ 40 ЗАДАНИЕ НА КОНТРОЛЬНУЮ РАБОТУ №1. ................................................................................................................... 40 ЗАДАНИЕ НА КОНТРОЛЬНУЮ РАБОТУ №2. ................................................................................................................... 43 ПРИЛОЖЕНИЯ .............................................................................................................................................................. 45
Редактор И. Н. Садчикова Сводный темплан 2004 г.
Лицензия ЛР № 020308 от 14.02.97 Санитарно-эпидемиологическое заключение № 78.01 07.953.П.005641.11.03 от 21.11.2003 г.
Подписано в печать Б. кн.-журн. П.л. Тираж
. Формат 60x84 1/16 . Б.л. . РТП РИО СЗТУ. 168 экз. Заказ
______________________________________________________________________________________
Северо-Западный государственный заочный технический университет
РИО СЗТУ, член Издательско-полиграфическои ассоциации вузов Санкт-Петербурга 191186 Санкт-Петербург, ул. Миллионная, д.5