МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)
Под редакцией А. В. Гасникова
Допущено Учебно-методическим объединением высших учебных заведений Российской Федерации по образованию в области прикладных математики и физики в качестве учебного пособия для студентов вузов по направлению «Прикладные математика и физика»
М ОСКВ А
МФТИ 2010
УДК 519.1:519.2:519.6:519.8(075) ББК 22.1я73 В24 Рецензенты: Лаборатория волновых процессов, механико-математического факультета МГУ им. М.В. Ломоносова (зав. лаб. проф. Н. Н. Смирнов – зам. декана мехмата МГУ) к. ф.-м. н. В. И. Швецов (Институт системного анализа РАН)
Научный консультант академик А. А. Петров
А в т о р ы: А.В. Гасников, С.Л. Кленов, Е.А. Нурминский, Я.А. Холодов, Н.Б. Шамрай; Приложения: М.Л. Бланк, Е.В. Гасникова, А.А. Замятин и В.А. Малышев, А.В. Колесников, А.М. Райгородский Введение в математическое моделирование транспортных потоков: учеб. пособие / Гасников А.В., Кленов С.Л., Нурминский Е.А., Холодов Я.А., Шамрай Н.Б.; Приложения: Бланк М.Л., Гасникова Е.В., Замятин А.А. и Малышев В.А., Колесников А.В., Райгородский А.М; Под ред. А.В. Гасникова. — М.: МФТИ, 2010. — 362 с.
ISBN 978-5-7417-0334-2 Излагается математический аппарат и некоторые физические концепции, которые могут пригодиться при создании (модернизации) комплексной интеллектуальной транспортной системы (КИТС). Предназначено для студентов старших курсов и аспирантов физико-математических специальностей (МФТИ, МГУ, Независимого московского университета). Рекомендуется научным работникам, интересующимся вопросами математического моделирования.
ISBN 978-5-7417-0334-2
© Гасников А.В., Кленов С.Л., Нурминский Е.А., Холодов Я.А., Шамрай Н.Б., Приложения: Бланк М.Л., Гасникова Е.В., Замятин А.А. и Малышев В.А., Колесников А.В., Райгородский А.М., 2010 © Государственное образовательное учреждение высшего профессионального образования «Московский физико-технический институт (государственный университет)», 2010
2
Оглавление Предисловие………………………………………………...4 Введение………………………………………..…………..11 Глава 1. Моделирование транспортных потоков на основе теории равновесия………………………...….17 Глава 2. Математические модели транспортных потоков……………………………………...……………...69 Глава 3. Теория Кернера трех фаз в транспортном потоке – новый теоретический базис для интеллектуальных транспортных технологий…..…..168 Приложение М. Л. Бланка. Процессы с запретами в моделях транспортных потоков……………………..203 Приложение Е. В. Гасниковой. О возможной динамике в модели расчета матрицы корреспонденций…….....225 Приложение А. А. Замятина, В. А. Малышева. Введение в стохастические модели транспортных потоков…...247 Приложение А. В. Колесникова. Транспортная задача и концентрация.…………………………..……………...288 Приложение А. М. Райгородского. Модели случайных графов и их применения………………………………..300 Задачи………………………...…………………………...326 Используемые сокращения…………………….……....361
3
Предисловие Идея написания этого пособия принадлежит декану факультета управления и прикладной математики (ФУПМ) МФТИ проф. Александру Алексеевичу Шананину. Более двух лет назад он предложил начать читать на Физтехе курс по выбору «Введение в математическое моделирование транспортных потоков», некоторые детали которого (глава 2) к тому моменту уже обсуждались в течение нескольких лет на семинаре «Квазилинейные уравнения и обратные задачи» в ВЦ РАН под его руководством.1 Основная цель курса заключалась в том, чтобы познакомить заинтересованных студентов старшекурсников и аспирантов физико-математических специальностей с математикой, необходимой для решения, например, таких задач: эволюция затора (как будет распространяться информация о заторе по транспортному потоку), задача о светофоре (при каких условиях перед светофором не будет скапливаться очередь), задача о выборе оптимальной топологии транспортной сети (где и какую дорогу «лучше» строить), расчет матрицы корреспонденций и распределения потоков, задача о надежности графа транспортной сети. Курс содержал дополнительные главы следующих дисциплин: уравнений математической физики (обобщенные решения законов сохранения, групповой анализ, автомодельная редукция, принципы максимума для квазилинейных параболических уравнений); теории вероятностей и случайных процессов (аппарат производящих функций, системы массового обслуживания, концентрация меры, исследование асимптотик с помощью метода перевала); Здесь также хотелось бы обратить внимание на ту огромную роль, которую сыграл зав. каф. вычислительной математики МФТИ чл.-корр. РАН А. С. Холодов во внедрении этой тематики в образовательный процесс на Физтехе. За несколько лет до того, как был поставлен упомянутый курс, Александр Сергеевич уже читал лекцию по гидродинамическим моделям транспортного потока в рамках своего семестрового курса для студентов ФУПМ МФТИ «Нелинейные вычислительные процессы». Энтузиазм Александра Сергеевича «зажег» тогда многих (и не только студентов). Отметим также, что с 2005 года В. И. Швецов ведѐт курс «Математические модели транспортных потоков» для студентов ФУПМ МФТИ на базовой кафедре Института системного анализа РАН. 1
4
функционального анализа (сжимающие отображения, монотонные операторы, конусные методы); теории динамических систем (методы функционалов Ляпунова) и эргодической теории (концентрация инвариантной меры, элементы статистической физики); кинетической теории (уравнения Колмогорова, социодинамика, динамика систем с мотивацией, самоорганизация); теории игр (эволюционные игры: равновесие Нэша как устойчивое положение равновесия динамической системы локального «нащупывания» наилучших ответов); оптимизации в конечномерных и бесконечномерных пространствах (принцип Лагранжа, двойственность, отделимость, принцип Беллмана, элементы теории управления); дискретной математики (задачи на графах и эффективные (приближенные, вероятностные) алгоритмы их решения); численных методов выпуклой оптимизации (полиномиальные алгоритмы внутренней точки Нестерова–Немировского, стохастические квазиградиентные методы для задач огромной размерности). Настоящее пособие представляет собой попытку связно преподнести как материалы прочитанных курсов, так и в целом математический аппарат и некоторые «физические концепции», которые могут пригодиться при создании (модернизации) комплексной интеллектуальной транспортной системы (КИТС). О важности такой системы в «борьбе с пробками» (в Москве) было много сказано за последнее время. По сути, речь идет о том, как оптимальным образом использовать имеющуюся информацию. Например, в Москве сейчас установлено (в основном на крупных перекрестках) в общей сложности более 500 видеокамер. Порядка 104 105 автомобилей,2 курсирующих по Москве и области, оснащены GPS-навигаторами, что позволяет получать треки (пути следования) автомобилей, с информацией о скоростях движения вдоль этих треков. Заметим, что всего в Москве ежедневно бывает более 3 106 автомобилей. Создание КИТС на основе имеющихся данных предполагает выполнение следующих действий.
Если говорить о сечении по времени, то таких автомобилей на дорогах будет на порядок меньше.
2
5
Выработку адекватной (имеющимся данным 3) математической модели, описывающей транспортный поток. Например, можно в неплохом приближении уподоблять транспортный поток сжимаемой жидкости с мотивацией и использовать гидродинамические модели (или модели клеточных автоматов). Калибровка таких моделей на прямолинейных участках дороги (ребрах графа транспортной сети) довольно просто осуществляется исходя из исторической информации. Для постановки начально-краевых условий: описание характеристик источников и стоков автомобилей, узлов графа транспортной сети (перекрестки, въезды, съезды и т.п.) – также требуется работа с историческими данными. В результате такой работы получается матрица корреспонденций, на основе этой матрицы рассчитываются распределения потоков, а затем и матрицы перемешивания в узлах графа транспортной сети. На наш взгляд, адекватная постановка начально-краевых условий – это одна из самых сложных текущих задач. И наметки приведенного здесь пути – далеко не единственный способ получения краевых условий. Откалиброванная модель может использоваться для локального (по времени) управления на основе текущей информации, например, светофорной сигнализацией (въездами на крупные магистрали). Возникающие здесь задачи связаны с управлением сложными (гибридными) динамическими системами в условиях неопределенности. Такое локальное управление позволит несколько разгрузить складывающуюся на дорогах в данный момент ситуацию (правильным образом распределяя ресурсы транспортной сети между ее пользователями). Например, в Калифорнии коллектив, работающий в Беркли и возглавляемый П. Варайя и А. Б. Куржанским, предложил несколько лет назад способ локального управления въездами на основные магистрали. Это привело к тому, что в результате управления время в пути среднестатистического водителя уменьшилось на 30%. Помимо задач локального управления имеются задачи долгосрочного управления. Где и какую дорогу следует построить при заданных бюджетных ограничениях? Каким образом (в каком размере) взимать плату за проезд с трасс в центре Москвы?4 На каких трассах Важно подобрать модель, адекватную имеющимся данным, дабы «не забивать микроскопом гвозди». 4 Нужна некая «золотая середина», с одной стороны, плата за проезд должна разгрузить эти трассы, с другой желательно, чтобы пропускные ресурсы трасс использовались по максимуму. 3
6
стоит в первую очередь увеличивать число полос? Где стоит в первую очередь переделывать развязки – делать новые (в частности, решать вопрос: а выгодно ли увеличивать степень непланарности графа транспортной сети)? Эти задачи так же, как и задачи предыдущего пункта, должны решаться для всей сети в целом (не локально по пространству!). Иначе говоря, сумматорные функционалы качества критериев должны в себя включать всех участников дорожного движения. Понятно, что для решения этих задач достаточно просматривать различные сценарии (в том числе предложенные руководством города) с помощью выработанной и откалиброванной модели на предмет их состоятельности. Путем (разумного) перебора выбирать лучшие предложения по разгрузке ситуации на дорогах.
Рис. 1. Транспортный затор на одной из улиц Москвы
Некоторые рассмотренные в пособии задачи имеют также и коммерческий выход. Например, актуальной в последнее время задачей5 является задача маршрутизации: выбор оптимального (кратчайшего) маршрута следования. Понятно, что если считать веса ребер графа транспортной сети известными и не меняющимися со временем, то эта задача довольно эффективно решается. Но на практике далеко не всегда все нужные веса ребер бывают известными. В зависимости от времени суток ситуация на дорогах может кардинально меняться, поэтому воз5 Решение которой может быть интересно, например, НИС ГЛОНАСС, ЗАО «Российские навигационные технологии», различным интернет-службам, следящим за пробками на дорогах, и компаниям, производящим КПК-навигаторы (с выходом в интернет) для автомобилей.
7
никает необходимость прогнозирования загрузки элементов сети. Примером таких изменений служит образование заторов в «часы пик» – за короткий промежуток времени движение может быть практически парализовано даже на многополосных магистралях (рис. 1). Несмотря на отмеченную актуальность приведенных выше задач, еще раз подчеркнем, что в пособии изложен в основном лишь математический аппарат и некоторые физические концепции, которые могут пригодиться для их решения. Важно также заметить, что формат пособия не предполагал включения технически сложных вещей, обремененных большим количеством деталей. Тем не менее по возможности мы старались хотя бы на концептуальном уровне разъяснять практически все основные нюансы. Как следствие, пособие вобрало в себя довольно много материала (который не удавалось рассказать студентам меньше чем за год), и в ходе его подготовки было использовано более 500 литературных источников, многие из которых впоследствии было решено привести в пособии. Последнее обстоятельство также не характерно для учебных пособий, но при выбранном уровне детализации и объеме излагаемого материала вполне уместно. Во многом определяющим моментом в создании этого пособия стало принятие (в начале 2010 года) приглашения участвовать в его написании рядом ведущих специалистов в своих областях. Так, глава 1 пособия написана проф. Е. А. Нурминским и доц. Н. Б. Шамрай (ИАПУ ДВО РАН) и посвящена применению теории бескоалиционного равновесия для расчета транспортной сети при условии стационарности потоков и моделям построения матрицы корреспонденций. В написании главы 2, посвященной математическим моделям транспортных потоков, приняли также участие доц. С. Л. Кленов (кафедра общей физики МФТИ) и доц. Я. А. Холодов (кафедра вычислительной математики МФТИ). Глава 3, посвященная теории трех фаз Кернера транспортного потока, всецело написана С. Л. Кленовым (коллегой Б. С. Кернера) и содержит как упомянутые выше физические концепции, так и примеры эмпирических (измеренных) пространственно-временных структур плотного потока на скоростных автомагистралях. Как показала обратная связь от студентов, слушавших упомянутый выше курс по выбору, востребованными оказались «стохастические» приложения доц. А. А. Замятина и проф. В. А. Малышева (кафедра теории вероятностей мехмата МГУ) и проф. А. М. Райгородского (кафедра математической статистики и случайных процессов мехмата МГУ, кафедра анализа данных Яндекс МФТИ). Важную роль в пособии играют эргодические приложения проф. М. Л. Бланка (лаборатория Р. Л. Добрушина ИППИ РАН), асп.
8
Е. В. Гасниковой (кафедра анализа систем и решений ФУПМ МФТИ) и приложение д.ф.-м.н. А. В. Колесникова (Высшая школа экономики), посвященное связи задачи Монжа–Канторовича о перемещении масс и явления концентрации меры. Эти три приложения, помимо того что представляют самостоятельную ценность, также завязывают (математически) между собой многие темы этого пособия. Другими словами, знакомство с ними желательно для формирования целостного восприятия. В конце учебного пособия приведены задачи, часть из которых в разное время предлагалась студентам. При подготовке задач большую помощь оказали молодые ученые, работающие в близких направлениях. В пособии имеется целый раздел задач (написанный асс. кафедры МОУ ФУПМ МФТИ Е. Г. Молчановым), посвященный задачам на графах и, по сути, восполняющий нехватку в пособии раздела «Транспортные потоки и Computer Science». В этом же разделе приводится довольно интересная задача, пришедшая из практических приложений от службы Яндекс-пробки. Конечно, представленный в пособии материал далеко не полон и не может рассматриваться как state of the art рассматриваемой области знаний. Причина проста – колоссальный объем накопившегося на данный момент материала, посвященного транспортной проблематике. Достаточно сказать, что сейчас в мире существуют десятки реферируемых научных журналов, в которых регулярно публикуются материалы на транспортную тематику. Упомянем лишь некоторые из них: Transportation Research B, Physical Review E, Review of modern physics, Transportation Science. Не говоря уже об электронных ресурсах, таких, например, как http://arxiv.org/. Раз в два года проводится крупнейшая в транспортном сообществе конференция по математическому моделированию транспортных потоков и смежным вопросам: «Traffic and granular flow», труды которой публикует известное немецкое издательство Springer. Кстати, в 2011 г. эта конференция впервые пройдет в Москве. В Москве ежемесячно проводится семинар «Научно-практические задачи развития автомобильно-дорожного комплекса в России» под руководством вицепрезидента РАН акад. В. В. Козлова. На приводимых ниже электронных ресурсах http://kozlov-traffic-ras.ru/, http://wtran.dvo.ru/ можно познакомиться с работами участников этого семинара. Более того, четвертый номер журнала Труды МФТИ (ФУПМ) за 2010 г. под ред. В. В. Козлова всецело посвящен транспортной проблематике. Однако, несмотря на вышесказанное, мы все же постарались собрать, поскольку считаем это полезным для читателя, наиболее базовые (математически) вещи и привести соответствующий (математический) state of the art.
9
В заключение хотелось бы выразить благодарность проф. А. А. Шананину, акад. В. В. Козлову, акад. А. А. Петрову, чл.-корр. А. С. Холодову. Общение и участие в мероприятиях, к которым они имели отношения, всегда доставляло большое удовольствие и иногда вдохновляло на улучшение материала данной книги. Ценную обратную связь при подготовке этого пособия получал от проф. А. П. Буслаева и доц. О. С. Розановой, а также от всех коллег, принимавших участие в его написании. Много полезных замечаний по всему тексту сделал самый активный слушатель курса – Ю. В. Дорн (студент 6-го курса ФАКИ МФТИ). Ряд ценных замечаний по темам, изложенным в пособии, сделали: В. И. Аркин, Л. Г. Афанасьева, П. П. Бобрик, А. С. Бугаев, В. В. Веденяпин, И. Е. Виноградов, К. А. Волосов, А. И. Голиков, А. Н. Дарьин, К. Дафермос, А. В. Дмитрук, В. А. Дружинина, В. Г. Жадан, А. В. Казейкина, Б. С. Кернер, В. Ф. Колчин, Н. С. Кукушкин, А. Г. Куликовский, Г. Л. Литвинов, И. А. Лубашевский, И. С. Меньшиков, В. Д. Мильман, И. И. Морозов, А. И. Назаров, Е. Ю. Панов, Н. С. Петросян, С. А. Пирогов, В. М. Полтерович, Ю. С. Попков, И. Г. Поспелов, В. В. Пухначѐв, В. Н. Разжевайкин, И. В. Рублев, В. Ж. Сакбаев, А. Ю. Семѐнов, Д. Серр, Н. Н. Смирнов, А. Н. Соболевский, Е. О. Степанов, Н. Н. Субботина, В. Н. Тарасов, С. П. Тарасов, Г. М. Хенкин, Б. Н. Четверушкин, А. П. Чугайнова, С. В. Чуканов, А. Х. Шень, В. И. Швецов, М. В. Яшина. Ценным было общение с акад. А. Б. Куржанским. Особо хотелось бы поблагодарить зав. кафедрой математических основ управления (МОУ) МФТИ доц. С. А. Гуза и зам. зав. каф. МОУ доц. О. С. Федько, создавших идеальные условия как для проведения занятий, так и для создания пособия, регулярно стимулировавших весь процесс написания и внимательно относившихся ко всем особенностям работы. Работа над книгой была проведена в рамках реализации ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009–2013 годы (мероприятие 1.2.1, НК-15П, П949; мероприятие 1.3.1, НК-215П, П1490; НОЦ № 14.740.11.0397) и частично поддержана грантами РФФИ № 08-07-00158-а, 10-07-00620-а, РГНФ № 08-02-00347, ПФИ ОМН РАН № 3, ПФИ Президиум РАН П-14. А. В. Гасников (
[email protected]) доц. кафедры МОУ ФУПМ МФТИ 12 ноября 2010 г.
10
Введение6 В 50-е годы прошлого века, в связи с исследованиями процессов, возникающих при взрыве бомбы, наблюдалось бурное развитие газовой динамики (обобщенные решения законов сохранения, устойчивые разностные схемы расчета решений). Тогда же появились первые макроскопические (гидродинамические) модели, в которых транспортный поток уподобляется потоку «мотивированной» сжимаемой жидкости (М. Лайтхилл и Дж. Уизем, П. Ричардс), и первые микроскопические модели (следования за лидером), в которых явно выписывается уравнение движения каждого автомобиля (А. Рѐшель, Л. Пайпс и др.). В модели Лайтхилла–Уизема (–Ричардса) (1955) транспортный поток уподобляется потоку сжимаемой жидкости и описывается законом сохранения количества (погонной плотности) автомобилей. При этом в модели постулируется существование функциональной зависимости (уравнения состояния) между величиной потока автомобилей (= скорость плотность) и плотностью. Эту зависимость часто называют фундаментальной диаграммой (как правило, вогнутая функция). Собственно, в эту зависимость и «зашита» мотивация в простейших моделях. В последующие годы класс микро- и макромоделей был значительно расширен. В современном макроскопическом подходе (А. Эу и М. Раскль, 2000) транспортный поток часто описывается нелинейной системой гиперболических уравнений (для плотности и скорости потока) с диффузией (Х. Пэйн, Р. Кюне, Б. Кернер и П. Конхойзер). При этом уравнение состояния «зашивается» во второе уравнение этой системы, как стремление водителей двигаться с желаемой скоростью. В современном микроскопическом подходе преобладают модели типа «разумного водителя», в которых ускорение автомобиля описывается некоторой функцией от скорости этого автомобиля, расстояния до впереди идущего автомобиля (лидера) и скорости относительно лидера (М. Трайбер, 1999). При этом в таких моделях и время может течь дискретно, и сама динамика движения автомобилей может быть стохастической (марковской). Как правило, тогда такие модели называют моделями клеточных автоматов. В приложении М. Л. Бланка продемонстрирован один из способов того, как с помощью простейших моделей При написании настоящего введения, носящего обзорный характер, многое было заимствовано из текста введения акад. В. В. Козлова к специальному выпуску (№ 4, 2010 г.) журнала Труды МФТИ (ФУПМ).
6
11
клеточных автоматов можно получать (математически строго) правдоподобные макроскопические уравнения состояния транспортного потока (например, треугольную фундаментальную диаграмму). Продолжая аналогию с газовой динамикой, И. Пригожин полвека назад (а затем С. Павери-Фонтана, Д. Хельбинг и др.) предложил описывать транспортный поток кинетическим уравнением (типа Больцмана с «интегралом взаимодействия автомобилей» вместо «интеграла столкновения частиц газа»). При таком подходе макроскопическая модель получается из кинетической подобно тому, как система уравнений Эйлера получается из уравнения Больцмана. Отметим ввиду вышесказанного, что задача математически строгого обоснования кинетической модели, исходя из микроскопической, так же, как и задача обоснования макроскопической модели, исходя из кинетической, является открытой. Более того, в режимах, соответствующих «фазовому переходу» в транспортном потоке, такое обоснование, по-видимому, принципиально невозможно: нельзя осуществить соответствующий скейлинг, нельзя перейти к динамике средних, нельзя пользоваться эргодичностью системы (инвариантная мера не единственна), не ясно как обрывать (замыкать) моментную цепочку зацепляющихся уравнений. В таких режимах можно лишь нестрого говорить о похожести моделей. Несмотря на то, что с момента появления первых фундаментальных работ прошло более полувека, по мнению ряда известных специалистов в области математического моделирования дорожного движения (К. Нагель, Х. Махмасани, М. Шрекенберг и др.), проблема образования предзаторных и заторных ситуаций еще до конца не изучена (и сродни проблеме описания турбулентных течений). Используя терминологию, предложенную Б. С. Кернером, можно сказать, что на данный момент нет общепринятого подхода, описывающего поведение движения автотранспорта в области синхронизированного потока. Иначе говоря, если автомобильный поток уподобляется жидкости, то наиболее сложная для моделирования ситуация – это замерзающая жидкость. Подтверждением вышесказанному может служить тот факт, что разные коллективы, занимающиеся моделированием транспортных потоков, как правило, используют разные модели: начиная от модели Лайтхилла–Уизема (А. А. Куржанский и др.), заканчивая моделями, в которых каждый водитель характеризуется своим вариационным принципом (И. А. Лубашевский и др.). Отметим здесь главу 3, в которой приводится «эмпирический базис», т.е. даются свойства реальных пространственно-временных структур, возникающих в плотном транспортном потоке вблизи «узкого мес-
12
та»,7 для анализа различных подходов к описанию транспортного потока. Важным атрибутом многих современных зарубежных работ, в которых предлагаются математические модели транспортного потока, является проверка предложенных моделей на возможность описания ими трех фаз Кернера транспортного потока, наблюдаемых в многочисленных эмпирических (измеренных) данных. Математическая теория управления транспортными потоками, как уже упоминалось выше, сейчас активно развивается в работах калифорнийской школы, возглавляемой П. Варайя и А. Б. Куржанским. Исходя из модели клеточных автоматов К. Даганзо (1994) = схема Годунова + модель Лайтхилла–Уизема + треугольная фундаментальная диаграмма, предлагается способ оптимального управления светофорами и въездами на магистралях в Калифорнии. Здесь стоит обратить внимание на соизмеримость грубости выбранной модели, качества имеющихся данных http://pems.eecs.berkeley.edu и простоты работы с этой моделью. Поясним основную идею того, как следует управлять. Из фундаментальной диаграммы следует, что одному и тому же значению потока автомобилей соответствуют разные (как правило, две) плотности и, как следствие, разные скорости. Очевидно, что более выгодным режимом является режим с большей скоростью. Задача управления (скажем, светофорами или въездами на основные магистрали) заключается в том, чтобы большую часть времени среднестатистический водитель проводил именно в таких режимах. Подробнее об изложенном выше можно прочитать в главах 2 и 3. Из-за сильной неустойчивости решений уравнений (при достаточно больших плотностях), описывающих транспортные потоки, задача получения достоверного прогноза загрузки транспортной сети по имеющимся данным на час вперед сродни задаче получения достоверного прогноза погоды на неделю вперед. При этом вычислительные мощности современных высокопроизводительных кластеров (триллион и выше операций типа умножения чисел с плавающей точкой в секунду) позволяют просчитывать реальную ситуацию по Москве (в которой, напомним, порядка трех миллионов автомобилей) со значительным опережением реального времени. Другими словами, основной проблемой при моделировании транспортных потоков является не ограничение Заметим, что, как правило, исследователи ограничиваются изучением транспортного потока на отдельном прямолинейном участке транспортной сети с простейшими начально-краевыми условиями. В то время как причиной заторов (согласно К. Даганзо) часто являются «узкие места» (перекрестки, въезды). 7
13
по вычислительным мощностям (ресурсам памяти), а большая чувствительность описываемой реальной транспортной системы к входным данным (характеристики источников и стоков автомобилей) и невозможность собрать достаточно полную информацию о входных данных. Одним из возможных выходов из этого является рассмотрение в некотором смысле (например, в смысле теории систем массового обслуживания) усредненных показателей транспортной системы. Обгоны на многополосной дороге, очереди перед светофорами и многое другое можно описывать таким образом – о чем говорится в приложении А. А. Замятина и В. А. Малышева (в основе моделей этого приложения лежат эргодические марковские процессы). При таком подходе исследователь следит лишь за трендом и «не обращает внимание» на высокочастотные случайные колебания (флуктуации), возможно большой амплитуды, вокруг этого тренда. В связи с упоминанием словосочетания усредненные показатели отметим здесь также приложение А. М. Райгородского, в котором исследуются различные свойства случайных графов (транспортных графов, web-графов). Например, такое важное свойство, как надежность графа транспортной сети к случайным отказам ребер (отказ ребра означает, что на ребре образовалась пробка). В этих приложениях наблюдается плотная концентрация исследуемых макровеличин (макропоказателей) в маленьких окрестностях своих математических ожиданий. Однако если в приложении Замятина–Малышева мера, которая концентрируется, порождается (как финальная = стационарная) эргодической марковской динамикой, то в приложении А. М. Райгородского она задается непосредственно, скажем, из соображений независимости и однородности (модель случайного графа Эрдѐша–Реньи). В зависимости от того, какая конкретная задача поставлена, следует отдавать предпочтение тому или иному подходу или даже какомуто их сочетанию. Вернемся теперь к тому, как все-таки ставить начально-краевые условия для целостного описания транспортного потока на полном графе транспортной сети. Будем считать, что есть лишь информация о том, сколько людей живет в том или ином районе и сколько рабочих мест есть в том или ином районе. В главе 1 и приложении Е. В. Гасниковой приведены различные способы обоснования известной на практике энтропийной (гравитационной) модели А. Дж. Вильсона (1967) расчета (исходя из указанных выше данных) матрицы корреспонденций (сколько людей, проживающих в районе i, работают в районе j). По сути, матрица корреспонденций определяется как наиболее вероятное макросостояние, в окрестности которого и будет плотная концентрация, стацио-
14
нарной меры «разумной» эргодической марковской динамики, порождающей изучаемую макросистему. Точнее говоря, эргодическая марковская динамика приводит на больших временах к стационарной (инвариантной) пуассоновской (сложной) мере (прямое произведение распределений Пуассона) на пространстве макросостояний. Эта мера экспоненциально быстро концентрируется с ростом числа агентов в окрестности наиболее вероятного макросостояния, которое и принимается за положение равновесия макросистемы. Задача поиска наиболее вероятного макросостояния асимптотически (по числу агентов) эквивалентна задаче максимизации энтропийного функционала (воспользовались формулой Стирлинга) на множестве (как правило, аффинной структуры), заданном ограничениями – законами сохранения. Приятной особенностью такого класса задач является явная (легко выписываемая) зависимость решения прямой задачи через двойственные переменные. Поскольку число ограничений, как правило, на много порядков меньше числа прямых переменных, то эффективные численные методы базируются на решении двойственной задачи: минимизации выпуклой функции. Отметим, что описанная здесь задача энтропийно линейного программирования имеет много общего с обычной транспортной задачей. Далее, исходя из известных потребностей (корреспонденций), водители начинают «нащупывать» некую равновесную конфигурацию потоков (конкурентное равновесие, равновесие Нэша–Вардропа (1952)). Понятно, что корреспонденция не определяет, вообще говоря, однозначно путь следования. Скажем, из Физтеха можно добираться до МГУ разными способами. И если ситуация равновесная, то никому не должно быть выгодно менять свой путь следования – стратегию (ситуация равновесия по Нэшу). Это означает, что времена движения по всем путям, которые хоть кто-нибудь выбрал, соответствующим данной корреспонденции, должны быть одинаковыми. О том, как происходит «нащупывание» равновесия, какие есть обобщения у этой модели и какие есть численные способы решения возникающих по ходу задач оптимизации, написано в главе 1 и в задаче, предложенной Е. В. Гасниковой и Ю. В. Дорном (в конце пособия). К счастью, популярный сейчас формат данных о транспортной системе в виде GPS-треков автомобилей позволяет контролировать (и тем самым постоянно «подкручивать») выводы рассмотренных моделей и некоторых их важных обобщений. Имея информацию о том, как распределяются потоки, уже можно получать оценки матриц перемешивания в узлах графа транспортной сети, тем самым замыкать целостную модель. К сожалению, такой спо-
15
соб крайне чувствителен к точности (полноте) входных (обучающих) данных. В приложении А. В. Колесникова рассматривается задача Монжа–Канторовича о перемещении масс8 (эквивалентная, при весьма общих условиях, задаче Монжа). Оптимальный план перевозок (точнее потенциал этого отображения) удовлетворяет уравнению (в частных производных) Монжа–Ампера и порождает метрику Канторовича (–Рубинштейна). С помощью этой метрики устанавливаются довольно тонкие функциональные неравенства о концентрации меры (М. Громов, М. Талагран, К. Мартон, М. Леду и др.). Сам термин концентрации меры, по-видимому, был впервые предложен В. Д. Мильманом, внесшим значительный вклад в эту область. Геометрически этот принцип можно довольно просто пояснить задачей из конца пособия (Пуанкаре–Леви): площадь многомерной сферы (с выделенным северным и южным полюсом) практически полностью сосредоточена в маленькой полоске вокруг экватора. Этот принцип нашел широкие применения, например, в теории вероятностей (нелинейные законы больших чисел – концентрация значений липшицевых функций в окрестности медианы), асимптотической комбинаторике (например, при исследовании плотной концентрации различных функций, типа числа независимости, на случайных графах; см. приложение А. М. Райгородского). В понимании ряда материалов пособия явление концентрации меры играет немаловажную роль: концепция равновесия макросистем (модель расчета матрицы корреспонденций), исследования надежности графа транспортной сети (по модели Эрдѐша–Реньи), оценка скорости сходимости к равновесию (неравенства Пуанкаре, Чигера) и др.
Сильно связанная с транспортной задачей, о которой написано в главе 1, приложении Е. В. Гасниковой, и фигурирующей также в задачах, приведенных в конце пособия. 8
16
Глава 1. Моделирование транспортных потоков на основе теории равновесия1
1.1. Задача транспортного равновесия..................................... 1.1.1. Моделирование транспортных потоков как задача принятия решений ...................................... 1.1.2. Постановка задачи .................................................. 1.1.3. Сведение к вариационному неравенству ............... 1.1.4. Построение функций транспортных затрат .......... 1.1.5. Численные методы решения задач транспортного равновесия...................................... 1.1.6. Соотношение между системным оптимумом и конкурентным равновесием.................................... 1.2. Построение матрицы корреспонденций............................. 1.2.1. Гравитационная модель.......................................... 1.2.2. Энтропийная модель............................................... 1.2.3. Связь между гравитационной и энтропийной моделями ..................................................................... 1.3. Парадоксы транспортного равновесия.............................. 1.3.1. Парадокс Брайеса ................................................... 1.3.2. Транспортно-экологические парадоксы................. 1.4. Практическая работа ......................................................... Литература..................................................................................
1 Эта
глава написана Е. А. Нурминским и Н. Б. Шамрай.
17
18 18 20 22 30 33 36 44 44 46 51 53 53 56 61 65
1.1.
Задача транспортного равновесия
Моделирование и исследование транспортных потоков часто проводится с помощью теории конкурентного бескоалиционного равновесия, описывающего достаточно адекватный механизм функционирования автомобильных улично-дорожных сетей (УДС). Рассматриваемые модели позволяют получить прогнозные оценки по загрузке элементов транспортной сети. Подобные задачи интересны в частности тем, что являются одним из инструментов для объективной оценки эффективности проектов по модификации УДС с точки зрения разгрузки наиболее проблемных участков дорог и уменьшения общих затрат на передвижение пользователей сети. 1.1.1.
Моделирование транспортных потоков как задача принятия решений
Для определения объемов загрузки УДС в первую очередь необходимо выявить правила, по которым водители выбирают тот или иной маршрут следования. Поведенческие принципы пользователей транспортной сети окончательно были сформулированы в работе [48], где постулировались следующие две возможные ситуации. 1. Пользователи сети независимо друг от друга выбирают маршруты следования, соответствующие их минимальным транспортным расходам. 2. Пользователи сети выбирают маршруты следования исходя из минимизации общих транспортных расходов в сети. С тех пор в транспортной науке приведенные поведенческие принципы получили названия соответственно первого и второго принципов Вардропа. Распределение транспортных потоков согласно первому принципу Вардропа соответствует конкурентному бескоалиционному равновесию, предполагающему совершенный эгоизм участников дорожного движения — каждый стремится достигнуть конечного пункта своей поездки как можно быстрее и из имеющихся возможных вариантов следования выбирает тот маршрут, по которому будет нести минимальные затраты (временные, финансовые, моральные и т.п.) на проезд. Поэтому данный принцип также называют оптимизацией пользователей (user optimization). 18
Стоит отдельно отметить, что первый поведенческий принцип предполагает определенные допущения. Во-первых, это совершенная информированность участников движения о ситуации на дорогах — каждый знает затраты на передвижения по тем или иным маршрутам. Конечно, на данный момент такое предположение выглядит изрядной идеализацией, но развитие автоматизированных автонавигаторов и интеллектуальных транспортных систем приближает нас к такой ситуации. Во-вторых, предполагается ничтожно малое влияние отдельного участника движения на затраты по всем маршрутам. Хотя такое предположение и заведомо неверно для крупногабаритных транспортных средств, для легковых автомобилей оно представляется достаточно разумным, исключая случаи аварийных ситуаций или неопытных водителей за рулем. Второй принцип Вардропа предполагает централизованное управление движением в сети. Соответствующее ему распределение транспортных потоков называют системным оптимумом (system optimization). Примером пользователей, передвигающихся согласно второму принципу, служат водители маршрутизированного транспорта. Несмотря на то, что принципы потокового равновесия широко цитируются как принципы Вардропа, на самом деле чуть ранее их сформулировали Ф. Найт [36] и А. Пигу [45], утверждая, что все участники движения, направляющиеся из некоторого узла сети в другой, распределяются по различным маршрутам таким образом, чтобы удельная (в расчете на один автомобиль) стоимость поездки была одна и та же для всех. В ситуации массовой автомобилизации, имеющей место практически во всех странах, подавляющее большинство участников дорожного движения любого города составляют легковые автомобили и миниавтобусы, совершающие преимущественно маятниковые поездки: место проживания – место работы и обратно. Именно такие поездки создают пиковые нагрузки на УДС, вызывают основные потери времени и других ресурсов, повышают аварийность и усложняют социально-экономическую ситуацию. Поэтому при исследовании загрузки сети рассмотрим транспортные потоки, порождаемые именно легковым частным транспортом. Как правило, водители такого транспорта преследуют исключительно личные цели и стремятся выбрать путь следования с наименьшими затратами. Такое поведение явно соответствует первому принципу Вардропа. 19
Все результаты настоящей главы получены в конечномерном евклидовом Rn со скалярным произведением xy и нормой √ пространстве n kxk = xx, x, y ∈ R . Элементами пространства являются векторыстолбцы, однако знак транспонирования и дополнительные скобки при скалярном умножении будем опускать, чтобы не загромождать запись формул. 1.1.2.
Постановка задачи
Исходя из приведенных соображений, построим экономикоматематическую модель транспортных потоков в УДС, соответствующую первому поведенческому принципу Вардропа. Транспортную сеть опишем в виде ориентированного графа Γ(V, E) , где V — множество вершин, E — множество дуг сети. Каждая дуга соответствует реальному участку автодороги без перекрестков. Каждая вершина представляет узел, разделяющий участки дорог. Направление дуги определяет ход следования автотранспорта. Магистрали с двусторонним движением соответственно имеют парные противоположно ориентированные дуги. При исследовании потокообразующих факторов в множестве вершин V выделим два подмножества: первое S ⊆ V содержит пункты, порождающие потоки, элементы множества S назовем источниками; второе D ⊆ V содержит пункты, поглощающие потоки, элементы множества D назовем стоками. Применительно к задаче моделирования потоков, порождаемых ежедневной трудовой миграцией для утренних часов пик, источниками являются спальные районы и пригороды, стоками — деловые районы города. Множество всех потокообразующих пар представим в виде декартова произведения: W = {w = (i, j) : i ∈ S, j ∈ D}. Каждой паре источник–сток w = (i, j) ∈ W соответствует свой спрос на перевозку ρw — общий объем пользователей, которые из пункта i должны прибыть в пункт j. Набор {ρw : w ∈ W } называется матрицей корреспонденций. Объемы корреспонденций ρw могут иметь фиксированные значения или являться функциями от затрат на передвижения в сети, то есть ρw = ρ(uw ), где uw — минимальные транспортные затраты на проезд для пары w, зависящие в свою очередь от загрузки сети. В первом случае говорят о задаче транспорт-
20
ного равновесия с фиксированным спросом, во втором — о задаче с эластичным спросом. Путем (маршрутом) в сети Γ, соединяющим вершины i и j, назовем последовательность дуг e1 = (i → k1 ), e2 = (k1 → k2 ), . . . , el = (kl−1 → kl ), el+1 = (kl → j), где et ∈ E при всех t = 1, . . . , l + 1. Предполагается отсутствие петель и циклов в маршрутах. Обозначим через Pw множество альтернативных маршрутов, следуя которым для каждой пары w = (i, j) ∈ W исходящий из источника i поток достигаетSстока j. Совокупность всех путей в сети Γ обозначим через P = w∈W Pw . Пусть xp — это величина потока, идущего по пути p ∈ P . Традиционно для транспортных задач потоковые переменные должны быть неотрицательными и удовлетворять балансовым ограничениям. Поэтому для каждой пары w потоки xp , p ∈ Pw , должны принадлежать множеству X xp = ρw }. Xw = {xp ≥ 0 : p ∈ Pw , p∈Pw
Объединим величины xp в вектор x = (xp : p ∈ P ). Тогда допустимой областью для вектора x является множество, образованное как декартово произведение всех Xw : Y X X= Xw = {x ≥ 0 : xp = ρw , w ∈ W }. (1) w∈W
p∈Pw
Преодоление каждого из путей p ∈ P сопровождается некоторыми затратами (время, топливо, деньги, амортизация автомобиля, износ дороги и т.п.). Количественная характеристика таких затрат зависит от интенсивности и плотности движения в сети. Как правило, в моделях рассматриваются временные или финансовые затраты. Обозначим через Gp удельные затраты пользователей на проезд по пути p. Поскольку на затраты по одному маршруту может влиять загрузка других путей УДС, то в общем случае Gp представляют собой функции от загрузки всей сети, то есть Gp = Gp (x). Во введенных обозначениях первый принцип Вардропа можно формализовать следующим образом. Водители выбирают путь с наименьшими транспортными расходами, поэтому если по пути p ∈ Pw для пары w идет ненулевой поток, то затраты по этому пути мини-
21
мальны, то есть если x†p > 0, то Gp (x† ) = min Gq (x† ) = uw (x† ), q∈Pw
(2)
где uw (x† ) — минимальные транспортные затраты по маршрутам, соединяющим пару w ∈ W , при загрузке сети, определяемой вектором x† . Потоки x† ∈ X, удовлетворяющие условию (2), называются равновесными. Проблема поиска равновесных потоков x† ∈ X называется задачей транспортного (потокового) равновесия. 1.1.3.
Сведение к вариационному неравенству
Основной подход к решению задачи транспортного равновесия состоит в сведении условия (2) к вариационному неравенству или задаче дополнительности [17, 30, 38, 40], а в частном случае — к оптимизационной задаче [3, 16, 20, 26], и дальнейшем применении существующих численных методов. Для компактности последующего изложения объединим компоненты Gp (x) в вектор-функцию G(x) = (Gp (x) : p ∈ P ). Отдельно рассмотрим случаи эластичного и неэластичного спроса. 1.1.3.1.
Транспортная задача с фиксированным спросом
Пусть для каждой пары w ∈ W объемы корреспонденций ρw заданы и имеют фиксированные значения. Справедлив следующий результат. Теорема 1. Вектор x† ∈ X удовлетворяет условию равновесия (2) тогда и только тогда, когда является решением вариационного неравенства G(x† )(x − x† ) ≥ 0, ∀x ∈ X. (3)
Доказательство. Пусть вектор x† = (x†p : p ∈ P ) ∈ X является решением вариационного неравенства (3). Покажем, что в x† выполнено условие (2). Предположим противное, а именно, что для пары w существует путь p¯ ∈ Pw , такой, что x†p¯ > 0 и Gp¯(x† ) > Gq¯(x† ) для некоторого q¯ ∈ Pw , q¯ 6= p¯. Рассмотрим вектор xε = (xεp : p ∈ P ), такой, что † p 6= p¯, p 6= q¯, xp , xεp = x†p¯ − ε, p = p¯, † xq¯ + ε, p = q¯, 22
где ε > 0 достаточно мало и не нарушает условия неотрицательности xε ≥ 0. Нетрудно видеть, что xε ∈ X, при этом G(x† )(xε − x† ) = Gp¯(x† )(xεp¯ − x†p¯) + Gq¯(x† )(xεq¯ − x†q¯) = = ε(Gq¯(x† ) − Gp¯(x† )) < 0,
что противоречит тому, что x† — решение вариационного неравенства (3). Следовательно, в точке x† условие (2) всегда выполнено. Пусть вектор x† ∈ X удовлетворяет условию (2). При этом для всех p ∈ Pw и w ∈ W выполнено Gp (x† ) − uw (x† ) ≥ 0,
(Gp (x† ) − uw (x† ))x†p = 0,
(Gp (x† ) − uw (x† ))xp ≥ 0,
∀x ∈ X,
следовательно, имеет место оценка X X 0≤ (Gp (x† ) − uw (x† ))(xp − x†p ) = X X
w∈W p∈Pw Gp (x† )(xp
X X − x†p ) − uw (x† )(xp − x†p ) = w∈W p∈Pw w Xw∈W p∈PX X † † † uw (x ) xp − x†p = G(x† )(x − x† ), = G(x )(x − x ) − =
w∈W
p∈Pw
p∈Pw
то есть x† — решение вариационного неравенства (3).
К настоящему времени теория и методы решения вариационных неравенств уже достаточно хорошо разработаны (см., например, монографии [32, 37, 38, 40]). Одним из наиболее известных является проективный метод и его модификации, по мнению авторов, особенно подходящие для решения транспортных задач. В связи с этим далее понадобятся следующие результаты. Определение 1. Проекцией точки y ∈ Rn на множество X ⊂ Rn называется точка πX (y) = argmin{ky − xk : x ∈ X}. Критерием проверки, является ли вектор p проекцией точки y ∈ Rn на множество X, служит выполнение условия (p − y)(x − p) ≥ 0,
∀x ∈ X.
(4)
Решение вариационного неравенства (3) тесно связано с поиском неподвижных точек проективного отображения H(x) = πX (x − −λG(x)), где λ > 0 — некоторое фиксированное число. 23
Утверждение 1. Множество решений X † ⊆ X вариационного неравенства (3) совпадает с множеством неподвижных точек отображения H(x), то есть X † = {x† ∈ X : x† = H(x† )}. Доказательство. Пусть x† ∈ X † и λ > 0, тогда выполнено неравенство (x† − (x† − λG(x† ))(x − x† ) ≥ 0, ∀x ∈ X,
следовательно, в силу свойства (4) имеем x† = πX (x† − λG(x† ) = = H(x† ). Пусть x† = H(x† ), тогда по свойству (4) для любого x ∈ X выполнено условие 0 ≤ (x − x† )(x† − (x† − λG(x† )) = G(x† )(x − x† ), то есть x† ∈ X † .
Теорема 2. Пусть вектор-функция G непрерывна по каждой компоненте, множество X непусто, выпукло и замкнуто. Если X ограничено, то вариационное неравенство (3) разрешимо. Доказательство. Для выпуклого множества X отображение H(x) : X → X является непрерывным и однозначным. Множество X по условию теоремы компактно, следовательно, по теореме Брауэра (см., например, [1, 8, 18]) у H(x) существует неподвижная точка x† = H(x† ), которая в силу утверждения 1 одновременно является решением вариационного неравенства (3). Нетрудно видеть, что при фиксированных неотрицательных корреспонденциях ρw допустимая область X, определенная в (1), является непустым полиэдральным ограниченным множеством. Следовательно, если затраты на передвижение Gp (x) являются непрерывными функциями от потоков x ∈ X, то задача транспортного равновесия с фиксированным спросом всегда разрешима. Единственность решения гарантирует свойство строгой монотонности векторафункции G(x). Определение 2. Вектор-функция G : X → Rn называется строго монотонной на X, если для любых x, y ∈ X, таких, что x 6= y, выполнено (G(x) − G(y))(x − y) > 0. Теорема 3. Если вектор-функция G(x) строго монотонна, то вариационное неравенство (3) может иметь не более одного решения. 24
Доказательство. Предположим противное, а именно, что существуют два различных решения x1 , x2 ∈ X, x1 6= x2 , задачи (3). Очевидно, при этом выполнены неравенства G(x1 )(x2 − x1 ) ≥ 0,
G(x2 )(x1 − x2 ) ≥ 0,
складывая которые, получаем (G(x1 ) − G(x2 )(x2 − x1 ) ≥ 0, что противоречит свойству строгой монотонности G(x).
С точки зрения задачи транспортного равновесия утверждение теоремы 3 означает, что если транспортные затраты возрастают с увеличением загрузки сети, а это весьма естественное предположение, то существует единственное равновесное распределение транспортных потоков. 1.1.3.2.
Транспортное равновесие с эластичным спросом
Рассмотрим случай, когда спрос на перевозки зависит от транспортных затрат, то есть ρw = ρw (uw ). Предположим, что для каждого маршрута p ∈ P транспортные затраты Gp (x) строго положительны, а для всех пар w ∈ W функция спроса ρw (uw ) принимает только неотрицательные значения. Объединим величины uw в вектор u = (uw : w ∈ W ), функции ρw (uw ) — в вектор ρ(u) = (ρw (uw ) : w ∈ W ). Построим векторы ! ! G(x) − Ξu x z= , F (z) = , u ΞT x − ρ(u) где Ξ = (ξpw : p ∈ P, w ∈ W ) — матрица инцидентности путей и пар источник–сток: 1, если путь p соединяет пару w, ξpw = 0 — в противном случае. Допустимым множеством для вектора z будет неотрицательный ортант Z = {z : z ≥ 0}.
25
Утверждение 2. Вектор z † = (x† , u† ) ≥ 0 является решением вариационного неравенства F (z † )(z − z † ) ≥ 0,
∀z ∈ Z,
(5)
тогда и только тогда, когда x† — решение вариационного неравенства (3) с допустимой областью X = X(u† ) = {x ≥ 0 : ΞT x = = ρ(u† )}. Доказательство. Пусть x† ∈ X — решение вариационного неравенства (3) и u† = (uw (x† ) : w ∈ W ), где uw (x† ) = min Gq (x† ) > 0. q∈Pw
Тогда для любых x ≥ 0 и u ≥ 0 выполнены условия (G(x† ) − Ξu† )x† = 0,
(ΞT x† − ρ(u† ))u† = 0,
(G(x† ) − Ξu† )x ≥ 0,
(ΞT x† − ρ(u† ))u = 0.
Откуда следует, что 0 ≤ (G(x† ) − Ξu† )(x − x† ) + (ΞT x† − ρ(u† ))(u − u† ) = F (z † )(z − z † ). Покажем обратное. Пусть z † = (x† , u† ) ≥ 0 — решение вариационного неравенства (5), то есть для любых z ≥ 0 выполнено F (z † )z † ≤ F (z † )z. Рассмотрим точки z σ = σz † ≥ 0 для всех σ ≥ 0. Имеем при σ = 0, ≤0 F (z † )z † † † ≥ F (z )z → 0 при σ → +∞. σ
Следовательно, F (z † )z † = 0 и F (z † )z ≥ 0. Если предположить существование индекса l, такого, что соответствующий ему элемент вектора F (z † ) отрицательный, Fl (z † ) < 0, то, выбирая zl → +∞, получаем нарушение неравенства F (z † )z ≥ 0. Отсюда F (z † ) ≥ 0. Таким образом, точка z † = (x† , u† ) ≥ 0 удовлетворяет системе F (z † ) ≥ 0,
z † ≥ 0,
F (z † )z † = 0,
(6)
известной в литературе как нелинейная задача дополнительности (см., например, [17, 32]). 26
Перепишем условия (6) в виде G(x† ) − Ξu† ≥ 0,
ΞT x† − ρ(u† ) ≥ 0,
x† ≥ 0, u† ≥ 0,
(G(x† ) − Ξu† )x† = 0,
(ΞT x† − ρ(u† ))u† = 0.
(7) (8)
†
Система (7) показывает, что вектор u соответствует минимальным транспортным затратам в сети при загрузке, определяемой потоками x† . При условии положительности транспортных затрат из (8) следует, что ΞT x† − ρ(u† ) = 0, тогда неравенство (5) можно переписать в виде G(x† )(x − x† ) ≥ u† (ΞT x − ρ(u† )) = 0,
∀x ∈ X(u† ).
Из утверждения 2 следует, что решение задачи транспортного равновесия с эластичным спросом сводится к решению вариационного неравенства (5), которое в свою очередь эквивалентно нелинейной задаче дополнительности (6). Допустимая область Z вариационного неравенства (5) неограничена, поэтому для существования решения z † помимо непрерывности необходимы дополнительные предположения о свойствах вектора-функции F (z). В случаях неограниченного допустимого множества вводят дополнительные предположения о свойствах задачи, например, ограниченность потенциального множества решений, коэрцитивность, монотонность и прочие. Общая идея выявления таких свойств состоит в следующем. Выберем радиус R > 0, такой, что пересечение замкнутого шара B = {z : kzk ≤ R} с выпуклым замкнутым множеством Z непусто, положим ZR = Z ∩ B 6= ∅. По теореме 2 существует точка † zR ∈ ZR , такая, что † † F (zR )(z − zR ) ≥ 0,
∀z ∈ ZR .
(9)
Теорема 4. Пусть вектор-функция F непрерывна по каждой компоненте, множество Z непусто, выпукло и замкнуто. Если суще† ствует радиус R > 0, такой, что ZR 6= ∅, и решение zR ∈ ZR † вариационного неравенства (9) удовлетворяет условию kzR k < R, то вариационное неравенство (3) разрешимо. Доказательство. Для произвольного z ∈ Z выберем λ ∈ (0, 1], † † ) ∈ ZR . Имеем + λ(z − zR такое, что точка z¯ = zR † † † † † † † † 0 ≤ F (zR )(¯ z − zR ) = F (zR )(zR + λ(z − zR ) − zR ) = λF (zR )(z − zR ),
27
† то есть zR одновременно является решением вариационного неравенства (3).
Из теоремы 4 выводится ряд следствий (см., например, [17]). Следствие 1. Пусть вектор-функция F непрерывна по каждой компоненте, множество Z непусто, выпукло и замкнуто. Если вектор-функция F (z) коэрцитивна относительно Z, то есть lim
kzk→∞, z∈Z
F (z)(z − z¯) →∞ kzk
для некоторого z¯ ∈ Z,
(10)
то вариационное неравенство (5) разрешимо. Доказательство. Условие коэрцитивности (10) позволяет для каждого фиксированного C > 0 подобрать достаточно большое RC > 0, такое, что F (z)(z − z¯) ≥ Ckzk,
∀z ∈ Z,
kzk = RC ,
для какого-то z¯ ∈ ZRC , не зависящего от C и RC . В силу теоремы 2 разрешимо вариационное неравенство † † )(z − zR ) ≥ 0, F (zR C C
∀z ∈ ZRC .
† † является решением Если kzC k < RC , то по теореме 4 точка zR C исходного вариационного неравенства (5). † Если kzR k = RC , то получаем C † † † k = −CR < 0, ) ≤ −CkzR F (zR )(¯ z − zR C C C † что противоречит определению zR . C
В случае разрешимости вариационного неравенства (5) строгая монотонность вектор-функции F (z) гарантирует существование не более одного решения (теорема 3). 1.1.3.3.
Симметричные задачи транспортного равновесия
Из теории оптимизации известно, что условие ∇f (x† )(x − x† ) ≥ 0, 28
∀x ∈ X,
(11)
представляет необходимый критерий оптимальности в задаче f (x) → min,
x ∈ X,
(12)
с дифференцируемой целевой функцией f (x) и выпуклым замкнутым допустимым множеством X. В самом деле, пусть x† = argmin{f (x) : x ∈ X}. Рассмотрим точку xλ = x† + λ(x − x† ) ∈ X, где λ ∈ (0, 1) достаточно мало. Имеет место следующая оценка: 0≤
f (x† ) + λ∇f (x† )(x − x† ) + o(λ) − f (x† ) f (xλ ) − f (x† ) = . λ λ
Переходя к пределу при λ → 0, получаем (11). Таким образом, если предположить существование дифференцируемой функция f : X → R, такой, что ∇f (x) = G(x) (векторфункция G в таком случае называется потенциальной), то вариационное неравенство (3) эквивалентно оптимизационной задаче (12). В общем случае считается, что решить оптимизационную задачу намного проще, чем вариационное неравенство [42]. Теория методов оптимизации богата разнообразными алгоритмами. Кроме того, существует множество программных пакетов для решения этого класса задач, чего нельзя сказать о вариационных неравенствах. Однако основная трудность состоит в построении функции f (x). Для потенциальных отображений такую функцию можно построить проведя следующие рассуждения. Рассмотрим кривую L, зафиксируем на ней точку x0 и вычислим интеграл G(x) вдоль этой кривой до некоторой точки x ∈ L. Пусть кривая L задана параметрически L = {x(t) : t ∈ [0, 1]}, где x(t) — гладкая вектор-функция, при этом x(0) = x0 , x(1) = x. Имеем I=
Ix
x0
=
Z1 0
G(x(t))d(x(t)) =
Z1
G(x(t))x′t (t)dt
0
=
Z1 0
∇f (x(t))x′t (t)dt =
1 df (x(t)) = f (x(t)) = f (x(1)) − f (x(0)) = f (x) − f (x0 ). 0
Видим, что значение интеграла I не зависит от параметрического задания кривой L. Рассмотрим простейший пример такого задания: 29
x(t) = x0 + t(x − x0 ), тогда при G(x) = ∇f (x) вариационное неравенство (3) эквивалентно следующей оптимизационной задаче: 0
f (x) = f (x ) +
Z1 0
G(x0 + t(x − x0 ))(x − x0 )dt → min, x ∈ X.
(13)
Отметим, что признаком потенциальности вектор-функции G : X → Rn является симметричность матрицы Якоби ∂G (x) p ∇G(x) = : p, q ∈ P для всех x ∈ X. Поэтому задачи транс∂xq портного равновесия (2), которые можно свести к оптимизационной задаче (13), называют симметричными. На практике для получения численных значений равновесного распределения потоков в сети предварительно необходимо решить ряд проблем, связанных с получением исходных данных задачи, чему и посвящены следующие разделы. К таким проблемам относятся: построение функций транспортных затрат Gp (x), формирование множеств всех возможных маршрутов Pw , определение объемов корреспонденций ρw . 1.1.4.
Построение функций транспортных затрат
Сложность численного решения задачи транспортного равновесия во многом зависит от аналитического задания функций Gp (x). Интуитивно вполне очевидно, что на транспортные затраты при проезде из источника в сток в первую очередь влияют издержки на дугах, составляющих маршрут следования. В литературе, посвященной изучению проблем моделирования транспортных потоков, рассматриваются разные формы такой зависимости. Обозначим через ye величину потока по дуге e ∈ E. Зная распределение потоков по путям, можно рассчитать загрузку каждой дуги по следующей формуле: X 1, если путь p проходит через дугу a; ye = θep xp , где θep = 0 — в противном случае. p∈P
(14) Определим Θ = (θep : e ∈ E, p ∈ P ) — матрицу инцидентности дуг и путей, y = (ye : e ∈ E) — вектор, описывающий загрузку дуг 30
сети Γ. В матричной форме взаимосвязь потоков по путям и дугам описывается уравнением y = Θx. В ряде случаев рассматриваются транспортные задачи в терминах только потоковых переменных по дугам. Отметим, что в множестве X, определенном в (1), от потоковых переменных по путям x можно легко перейти к вектору y, обратный переход неоднозначен. Удельные затраты на прохождение дуги e обозначим через τe . В общем случае значение τe зависит не только от величины потока ye , но и от потоков по другим дугам сети. Характерным примером тому служат нерегулируемые перекрестки, где порядок движения определяет приоритетность дорог, регулируемые перекрестки с дополнительной стрелкой сигнала светофора — движение в так называемом режиме «просачивания» и т.п. Поэтому правильно предположить, что τe = τe (y). Сформируем вектор-функцию τ (y) = (τe (y) : e ∈ E). Самым распространенным и простым предположением о свойствах функций транспортных затрат является аддитивная зависимость G(x) от τ (y), означающая, что транспортные затраты на прохождение каждого пути p ∈ P складываются только из затрат на проезд по дугам, составляющим этот путь [29, 30, 40]: X Gp (x) = θep τe (y). (15) e∈E
В результате вектор-функция G(x) вариационного неравенства (3) имеет вид G(x) = ΘT τ (y), y = Θx. (16) Рассмотрим частный случай, когда затраты на проезд по дуге τe (y) зависят только от объема идущего по ней потока ye , то есть τe (y) ≡ τe (ye ). В этом случае для любых p, q ∈ P , p 6= q, имеем X X ∂τe ∂ye ∂τe ∂Gq ∂Gp = θep = θep θeq = . ∂xq ∂ye ∂xq ∂ye ∂xp e∈E
e∈E
Следовательно, матрица Якоби ∇G(x) симметрична для любых x ∈ X, то есть вектор-функция G(x) потенциальна и равновесные транспортные потоки можно определить как решение оптимизационной задачи (13). Учитывая соотношения (16), вид целевой функции
31
f (x) определяется как f (x) = = =
R1 P
Z1 X 0 p∈P
(
P
0 p∈P e∈E Z1
XX
0 p∈P e∈E
= =
R1 P
0 e∈E Z1
0 e∈E
= =
θep τe (ye0 + t(ye − ye0 )))(xp − x0p )dt = θep (xp − x0p )τe (ye0 + t(ye − ye0 ))dt =
τe (ye0 + t(ye − ye0 ))
X
R1 P
Gp (x0 + t(x − x0 ))(xp − x0p )dt =
P
p∈P
θep (xp − x0p )dt =
τe (ye0 + t(ye − ye0 ))(ye − ye0 )dt =
τe (ye0 + t(ye − ye0 ))d(ye0 + t(ye − ye0 )) =
0 e∈E P Rye
τe (z)dz.
e∈E ye0
Таким образом, при τe (y) ≡ τe (ye ) задача (13) перепишется в виде ye
XZ
e∈E 0
τe (z)dz → min,
y = Θx, x ∈ X.
(17)
Одной из широко использующихся форм функции затрат τe (y) является так называемая BPR-функция (Bureau of Public Road), описывающая временные затраты на проезд: τe (y) = τe0 (1 + µ(ye /ce )n ), где τe0 — задержки на передвижение по пустой дуге e, ce — пропускная способность дуги e, µ и n — некоторые положительные константы. При использовании BPR-функции задача транспортного равновесия сводится к оптимизационной задаче (17). В общем случае построение функции затрат τe (y) является задачей, требующей отдельных исследований. Здесь окажутся полезными как натурные замеры потоков и соответствующих им задержек 32
в реальных УДС, так и результаты компьютерного моделирования, например, при помощи специальных программ для агентного моделирования, так активно развивающихся в последние годы. Существуют ситуации, когда предположение об аддитивности функций Gp (x) не подходит для описания транспортных затрат. Стремление к более адекватному моделированию автомобильных потоков привело к новым формам аналитического описания затрат [23, 34, 39]. Неаддитивные транспортные затраты возникают, например, в случаях, когда при моделировании одновременно учитываются и временные, и финансовые расходы. Так, в работе [34] предложена функция, характеризующая финансовые затраты, на которые в свою очередь влияют временные задержки: ! X X Gp (x) = Φp θep τe (y) + Ψp (x) + η θep τe (y), e∈E
e∈E
где τe (·) — время, потраченное на прохождение дуги e, Φp (·) — функция, преобразующая временные задержки для пути p в финансовые затраты, Ψp (·) — финансовые затраты, характеризующие маршрут p, которые могут меняться в зависимости от загрузки сети, η > 0 — эксплуатационные расходы в единицу времени. В работе [23] предложен более общий вид неаддитивной функции затрат: ! X Gp (x) = Uw θep τe (y) + gp (Ψp ) , p ∈ Pw , e∈E
где Ψp — фиксированные финансовые затраты, характеризующие маршрут p, gp (·) — функция, преобразующая финансовые затраты во временные задержки, Uw (·) — функция потерь (отрицательной полезности) для пары w ∈ W . С одной стороны, неаддитивные затраты более реалистично могут описать функционирование транспортной системы, с другой — вариационное неравенство (3) (а тем более (5)) при сложных функциях Gp (x) весьма сложно для анализа и решения. 1.1.5.
Численные методы решения задач транспортного равновесия
Эквивалентность задачи транспортного равновесия вариационному неравенству, а в частном случае — оптимизационной задаче, позволя33
ет адаптировать численные методы решения последних для поиска равновесных потоков. К настоящему времени можно выделить два основных подхода к построению алгоритмических схем. В первом случае задачу транспортного равновесия моделируют только через потоковые переменные по дугам и, соответственно, поиск равновесия ведется по дугам сети (дуговые алгоритмы). Во втором — основной переменной задачи является поток по пути, соответственно, итерирование ведется по допустимым маршрутам (маршрутные алгоритмы). И в первом, и во втором случаях основная трудность при численных расчетах состоит в большой размерности решаемых задач, особенно на реальных транспортных сетях. Богатый практический опыт накоплен для частного случая, когда транспортное равновесие ищется как решение оптимизационной задачи (17). Наиболее распространенным дуговым алгоритмом является метод Франка—Вульфа [33], несмотря на то, что этот алгоритм имеет довольно медленную сходимость, существенно замедляющуюся при приближении к равновесию и весьма чувствительному к размерности задачи. Причиной такого поведения является как практически неизбежно вырождающийся характер вспомогательной задачи линейного программирования, так и неравномерная сходимость потоков к равновесным значениям или так называемый эффект «застревающих потоков» [21, 28, 35] — в процессе решения формируется некоторый набор дуг, по которым потоки сильно отличаются от равновесных, и такая ситуация не меняется при последующем итерировании. Маршрутные алгоритмы распределяют корреспонденции непосредственно по множеству альтернативных путей, причем это множество, как правило, формируется в процессе решения [25, 44]. Перераспределение потоков не по дугам, а сразу по маршрутам, позволяет своевременно уйти от «застревающих потоков», поэтому алгоритмы данного класса не обладают отмеченным недостатком метода Франка—Вульфа и сходятся равномерно, однако и здесь есть свои проблемы. Основная идея алгоритмов состоит в последовательной балансировке потоков между альтернативными маршрутами для каждой пары источник–сток. Поскольку перераспределение одного потока между маршрутами изменяет транспортные затраты во всей сети и тем самым влияет на распределение других корреспонденций, 34
то возникает необходимость многократного просмотра всех потокообразующих пар и повторения перераспределения потоков. Отсутствие необходимости априорного задания всех допустимых маршрутов для каждой пары источник–сток, с одной стороны, делает алгоритмы поиска равновесия по путям привлекательными для использования, с другой, — как показала вычислительная практика [21, 25], такие алгоритмы сводят к минимуму количество используемых путей, то есть теряется возможность равномерного расщепления корреспонденции по множеству привлекательных маршрутов. Поиск транспортного равновесия как решения вариационного неравенства (3) исследован в основном теоретически, несмотря на то, что более адекватное моделирование транспортных потоков все-таки требует рассмотрения общего случая непотенциальной и/или неаддитивной функции затрат G(x) = (Gp (x) : p ∈ P ). В целом алгоритмический аппарат для вариационных неравенств разработан достаточно хорошо, о чем свидетельствуют монографии [32, 37], но большое количество переменных и сложное описание вектор-функции G(x) на практике делают задачу (3) труднорешаемой. Среди существующих методов решения вариационных неравенств отдельно можно выделить проективные методы, отличающиеся простотой своих итерационных схем: xk+1 = πX (xk − λk G(xk )),
λk > 0, k = 0, 1, 2, . . . ,
(18)
где πX (y) = argmin{||y − x|| : x ∈ X} — проекция точки y на множество X. Для простых множеств (гиперплоскость, полупространство, шар, брус и т.п.) операция проектирования вычисляется аналитически, в общем случае требуется решать задачу квадратичного программирования, что P значительно усложняет общий процесс. При выборе шага λk → 0, λk = ∞, проективный метод сходится к равновесному распределению при весьма общих предположениях о свойствах задачи, однако на практике такой выбор ведет к очень медленной скорости сходимости. Для декомпозиции и ускорения сходимости процесса (18) предполагается применить подходы, основанные на теории фейеровских процессов с малыми возмущениями [9, 10] с использованием адаптивной регулировки шага [11]. Основная идея этого подхода заключается в следующем. Допустимое множество X из (1) можно представить в виде пересечения конечного числа гиперплоскостей Hw и
35
неотрицательного ортанта H + : \ \ X= Hw H +, w∈W
где Hw = {xp : p∈Pw xp = ρw }, H + = {xp ≥ 0 : p ∈ P }. Объединим супермножества Hw и H + в семейство множеств H = {H + , Hw : w ∈ W } = {Hl : l = 1, 2, . . . |W | + 1}. Операция проектирования πHl (·) для любого элемента Hl вычисляется аналитически. Поэтому для численных расчетов транспортных потоков использовалась следующая модификация процесса (18), получившая название метода последовательных проекций [15]: P
xk+1 = xk + λk v k ,
v k = (πHl (¯ xk ) − xk )/λk ,
Hl ∈ H, x ¯k = xk − λk G(xk ) ∈ / Hl ,
λk > 0, k = 0, 1, 2, . . . .
(19)
Значительного ускорения сходимости процесса (19) к равновесному решению удается достичь за счет адаптивного выбора шагового множителя λk . Обозначим V (k, m) = conv{v k , v k+1 , . . . , v m } — выпуклую оболочку векторов v k , v k+1 , . . . , v m через B = {x : ||x|| ≤ 1} — единичный шар. Для заданной последовательности θt → +0 при t → ∞ определим последовательность индексов {kt }. Шаговые множители λk определялись по следующим правилам. 1. При t = 0 полагается kt = 0, λ0 > 0 — произвольное, q ∈ (0, 1). 2. Для данных t и kt определяется индекс kt+1 , такой, что 0∈ / V (kt , s) + θt B, λs = λkt , kt ≤ s < kt+1 , 0 ∈ V (kt , kt+1 ) + θt B. 3. Положить λkt+1 = qλkt . 4. Увеличить номер итерации t = t + 1 и повторить вычисление (19) для текущего значения λk . Другими словами, по условию п. 2 первый переход к шагу kt+1 после kt осуществляется тогда, когда 0 ∈ conv{v kt , v kt +1 , . . . , v kt+1 }+θt B, при этом шаговый множитель уменьшается в q < 1 раз (п. 3). 1.1.6.
Соотношение между системным оптимумом и конкурентным равновесием
Очевидно, что общие затраты при системной оптимизации не могут превышать общих затрат при пользовательской оптимизации. По36
τ1(y1) = 1
A
B τ2(y2) = y2
Рис. 1. Пример транспортной сети Пигу
этому разность между совокупными транспортными затратами, которые несут пользователи сети, перемещаясь согласно либо только первому, либо только второму поведенческим принципам Вардропа, можно рассматривать как цену анархии, и существуют примеры, когда эта цена составляет существенную долю от общих расходов. На принципиальную разницу между конкурентным транспортным равновесием и системным оптимумом одним из первых обратил внимание А. Пигу [45], рассмотрев простейшую транспортную сеть, состоящую из двух дуг, соединяющих два пункта, скажем, спальный район A и бизнес-зону B (см. рис. 1). Жители пункта A вольны выбирать, по какой из двух дорог им лучше добираться до работы. Обозначим через y1 и y2 доли общего объема трудового потока, едущего по первой и второй дорогам соответственно. Дороги в рассматриваемой сети неравноценны. Первая представляет магистральное шоссе, которое способно принять весь поток автомобилей из пункта A в пункт B без всякого замедления движения. Однако эта дорога достаточно длинная и проезд по ней требует определенного времени τ1 , которое будем считать равным, например, одному часу, то есть τ1 (y1 ) = 1. По второй дороге путь существенно короче, но это дорога узкая и движение сильно замедляется при наличии на ней потока автомобилей. Чтобы подчеркнуть суть примера, будем считать, что время проезда по второй дороге τ2 линейно зависит от потока по этой дороге y2 и задается соотношением τ2 (y2 ) = y2 . Тогда в соответствии с первым принципом Вардропа (Пигу—Найта—Вардропа) равновесному состоянию будет соответствовать такое распределение потоков (y1† , y2† ), что τ1 (y1† ) = τ2 (y2† ),
y1† + y2† = 1, 37
y1† , y2† ≥ 0,
откуда немедленно следует, что y1† = 0, y2† = 1, при этом системные затраты c(y1† , y2† ) = 1 · y1† + y2† · y2† = 1. Распределение потоков в соответствии со вторым принципом Вардропа (системный оптимум) определяется как решение оптимизационной задачи: min y1 + y22 ,
y1 + y2 = 1,
y1 , y2 ≥ 0,
(20)
минимум которой достигается в точке y1⋆ = y2⋆ = 0.5, минимальные затраты c(y1⋆ , y2⋆ ) = 0.75, что на 25% уменьшает системные издержки в сети. Приведенный пример Пигу показывает, что суммарные затраты в конкурентном равновесии могут составлять 4/3 от суммарных затрат системного оптимума. Оказывается, это соотношение представляет собой неулучшаемую оценку сверху для конкурентного потокового равновесия с аффинными функциями затрат и не зависит от топологии сети. Для подробного изложения этого результата установим некоторые полезные соотношения, характеризующие равновесные и оптимальные потоки. Условие равновесия (2) для вектора x† ∈ X можно переписать следующим образом: для каждой пары источник–сток w ∈ W в сети Γ выполнены условия: если x†p > 0, то Gp (x† ) = u†w ≤ Gq (x† ) для всех q ∈ Pw . Отсюда, очевидно, следует, что если x†p > 0 и x†q > 0 для путей p, q ∈ Pw , то Gp (x† ) = Gq (x† ) = u†w , что, собственно говоря, и представляет собой математическую запись первого поведенческого принципа Вардропа. Поскольку вклад в суммарные системные затраты (обозначим их c(x† )) при равновесном распределении x† вносят только ненулевые потоки x†p > 0, а для них все удельные затраты в пределах одной пары w одинаковы и равны u†w , то значение c(x† ) можно рассчитать следующим образом: X X X Gp (x† )x†p = Gp (x† )x†p = c(x† ) = =
p∈PX u†w w∈W p∈Pw
X
x†p
Xw∈W p∈Pw = u†w ρw . w∈W
38
(21)
Распределение потоков по второму принципу Вардропа x⋆ и системный оптимум c(x⋆ ) соответствуют решению оптимизационной задачи: X c(x) = Gp (x)xp → min, x ∈ X. (22) p∈P
Положим cp (x) = Gp (x)xp и будем предполагать, что для всех p ∈ P функции cp (x) являются выпуклыми и непрерывно дифференцируемыми. Справедлива следующая теорема.
Теорема 5. Пусть x⋆ — решения задачи (22), то есть оптимальное распределение потоков в сети. Тогда для всякой пары w ∈ W , ∂c(x⋆ ) ∂c(x⋆ ) ≤ для всех q ∈ Pw . если x⋆p > 0, p ∈ Pw , то ∂xp ∂xq Доказательство. Предположим противное, а именно, что для ∂c(x⋆ ) ∂c(x⋆ ) пары w существует путь p¯ ∈ Pw , такой, что x⋆p¯ > 0 и > ∂xp ∂xq для некоторого q¯ ∈ Pw , q¯ 6= p¯. Рассмотрим вектор xε = (xεp : p ∈ P ), такой, что ⋆ p 6= p¯, p 6= q¯, xp , x⋆p¯ − ε, p = p¯, xεp = ⋆ xq¯ + ε, p = q¯, где ε > 0 достаточно мало и не нарушает условия неотрицательности xε ≥ 0. Нетрудно видеть, что xε ∈ X, при этом в силу выпуклости функции c(x) имеем оценку ∂c(xε ) ∂c(xε ) ε ⋆ ε ε ⋆ − < 0, c(x ) − c(x ) ≤ ∇c(x )(x − x ) = ε ∂xq ∂xp что противоречит оптимальности x⋆ . В частном случае, когда Gp (x) ≡ Gp (xp ), из теоремы 5 непосредственно следует, что в оптимальном распределении потоков x⋆ для ∂cp (x⋆ ) ∂cq (x⋆ ) всякой пары w ∈ W , если x⋆p > 0, p ∈ Pw , то ≤ для ∂xp ∂xq всех q ∈ Pw . При этом, как и в случае равновесных потоков, для оп∂cp (x⋆ ) ∂cq (x⋆ ) тимальных потоков справедливы равенства = для ∂xp ∂xq ⋆ ⋆ тех p, q ∈ Pw , для которых xp > 0, xq > 0. Эти условия известны также как условия Гиббса (см., например, [7]). 39
Рассмотрим случай, когда транспортные затраты на прохождение каждого пути p ∈ P складываются только из затрат на проезд по дугам, составляющим этот путь, то есть Gp (x) определяются по формуле (15), при этом затраты по дугам τe (y) описываются аффинными функциями τe (y) = ae ye + be , где ae и be — неотрицательные коэффициенты для всех e ∈ E. При этом функция системных затрат и ее частные производные определяются как c(x) =
XX
θep τe (y)xp =
p∈P e∈E
X
τe (y)ye =
e∈E ∂c(x) ∂xp
=
X
X
(ae ye2 + be ye ),
e∈E
θep (2ae ye + be ).
e∈E
Обозначим через y † = (ye† : e ∈ E) и y ⋆ = (ye⋆ : e ∈ E) — загрузку дуг сети, порожденную потоками x† и x⋆ соответственно. Опираясь на приведенные выше результаты для равновесных x† и оптимальных x⋆ потоков, выполнены следующие условия: равновесие: если x†p > 0, p ∈ Pw , то для любого q ∈ Pw выполнено X
e∈E
θep (ae ye† + be ) ≤
X
θeq (ae ye† + be );
(23)
e∈E
оптимальность: если x⋆p > 0, p ∈ Pw , то для любого q ∈ Pw выполнено X X θep (2ae ye⋆ + be ) ≤ θeq (2ae ye⋆ + be ). (24) e∈E
e∈E
Любопытно, что при линейных функциях задержек τe (y) = ae ye из неравенств (23) и (24) следует совпадение равновесных и оптимальных потоков. Следуя работе [46], через тройку [Γ, ρ, G(x)] обозначим транспортную модель, определенную на сети Γ, с матрицей корреспонденций ρ = (ρw : w ∈ W ) и затратами G(x) = (Gp (x) : p ∈ P ). Везде далее будем полагать X X Gp (x) = θep τe (y) = θep (ae ye + be ). (25) e∈E
e∈E
Имеет место следующий результат. 40
Лемма 1. Пусть x† — решение задачи транспортного равновесия для модели [Γ, ρ, G(x)]. Тогда вектор 12 x† является решением оптимизационной задачи для модели [Γ, 12 ρ, G(x)]. Доказательство. Если x† является допустимым решением равновесной модели [Γ, ρ, G(x)], то, очевидно, 12 x† — допустимое решение оптимизационной модели [Γ, 12 ρ, G(x)], при этом неравенства (24) для 1 † 2 x переходят в (23). Более того, для каждого маршрута p ∈ Pw , такого, что x†p > 0, выполнено X ∂c( 12 x† ) = θep {ae ye† + be } = uw (x† ). ∂xp e∈E
⋆
Лемма 2. Пусть x — оптимальное распределение потоков, отвечающее транспортной модели [(Γ, ρ, G(x)]. Тогда для любого допустимого потока xδ в модели [Γ, (1 + δ)ρ, G(x)] справедлива оценка X c(xδ ) ≥ c(x⋆ ) + δ vw (x⋆ )ρw , (26) w∈W
где δ ≥ 0, vw (x⋆ ) = min
p∈Pw
∂c(x⋆ ) . ∂xp
Доказательство. Рассмотрим допустимые относительно модели [Γ, (1+δ)ρ, G(x)] потоки xδ . При затратах Gp (x), определенных в (25), где все коэффициенты ae ≥ 0, функция c(x) выпукла, отсюда X ∂c(x⋆ ) ∂c(x⋆ ) δ (x − x⋆ ) = c(x⋆ ) + (xδp − x⋆p ) = ∂xp ∂xp p∈P X X ∂c(x⋆ ) ⋆ δ = c(x ) + (xp − x⋆p ) = ∂xp w∈W p∈Pw X X ∂c(x⋆ ) X ∂c(x⋆ ) ⋆ = c(x ) + xδp − x⋆ . ∂xp ∂xp p
c(xδ ) ≥ c(x⋆ ) +
w∈W
p∈Pw
p∈Pw
Поскольку для p, таких, что x⋆p > 0, производная минимальное значение: ∂c(x⋆ ) ∂c(x⋆ ) = min = vw (x⋆ ), q∈Pw ∂xq ∂xp 41
∂c(x⋆ ) принимает ∂xp
то
X ∂c(x⋆ ) X x⋆p = vw (x⋆ )x⋆p . ∂xp
p∈PW
p∈Pw
Следовательно, продолжая оценку снизу для c(xδ ), получаем X X X c(xδ ) ≥ c(x⋆ ) + ( vw (x⋆ )xδp − vw (x⋆ )x⋆p ) = w∈W p∈Pw
⋆
= c(x ) +
X
p∈Pw
⋆
vw (x )(
w∈W ⋆
= c(x ) +
X
w∈W
⋆
X
p∈Pw
xδp
−
X
x⋆p ) =
p∈Pw
vw (x )((1 + δ)ρw − ρw ) = c(x⋆ ) + δ
X
vw (x⋆ )ρw .
w∈W
Итоговый результат текущего раздела устанавливает следующая теорема. Теорема 6. Для транспортной модели [Γ, ρ, G(x)] с аффинными функциями задержек (25) для оптимального x⋆ и равновесного x† распределений потоков выполняется соотношение c(x† )/c(x⋆ ) ≤ 4/3. Доказательство. Cогласно (21) системные затраты для равновесного распределения x† рассчитываются как X c(x† ) = uw (x† )ρw , w∈W
по лемме 1 поток 12 x† оптимален для транспортной модели [Γ, 21 ρ, G(x)], при этом vw ( 12 x† ) = uw (x† ). Положим δ = 1 в оценке (26). Тогда для произвольного потока x, допустимого в модели [Γ, 2 12 ρ, G(x)] = [Γ, ρ, G(x)], имеем X 1 1 x† + vw x† ρw = 2 2 2 w∈W 1 1 X 1 1 = c x† + uw (x† )ρw = c x† + c(x† ). 2 2 2 2 c(x) ≥ c
1
w∈W
42
(27)
Осталось получить оценку снизу c( 12 x† ) в терминах c(x† ), что легко сделать, учитывая вид функций задержки: c
X 1 1 1X 1 x† = ye† ae ye† + be ≥ ye† (ae ye† + be ) = c(x† ), 2 2 2 4 4
1
e∈E
e∈E
где для промежуточных вычислений использовались потоки по дугам (ye† , e ∈ E), индуцированные равновесными потоками по маршрутам x† . Очевидно, что при этом потоки 12 x† будут индуцировать загрузку дуг ( 21 ye† , e ∈ E). В результате, продолжая оценку (27), получим c(x) ≥
1 3 1 c(x† ) + c(x† ) = c(x† ). 4 2 4
Вычисляя в последнем неравенстве минимум левой части по всем x, допустимым в модели [Γ, ρ, G(x)], получаем c(x† )/c(x⋆ ) ≤ 4/3.
43
1.2.
Построение матрицы корреспонденций
В задаче транспортного равновесия с фиксированным спросом корреспонденция ρw , w = (i, j) рассматривается как средний поток пользователей, который из источника i ∈ S должен прибыть в сток j ∈ D. В данном разделе вместо ρw будем использовать обозначение ρij , чтобы выделять характеристики источников i и стоков j. Существуют разные методики для вычисления элементов матрицы ρ = (ρij : i ∈ S, j ∈ D), в том числе с применением математических моделей. Рассмотрим наиболее часто используемые, а именно, гравитационную и энтропийную модели построения матрицы корреспонденций. Описание указанных моделей для транспортных сетей можно найти, например, в работах [3–5; 13, 14, 20, 31]. 1.2.1.
Гравитационная модель
Идею к построению гравитационной модели дал всемирный закон тяготения, утверждающий, что все тела притягиваются друг к другу с силой, прямо пропорциональной произведению масс этих тел и обратно пропорциональной квадрату расстояния между ними. Применительно к транспортной системе в качестве тел выступают пункты, порождающие/поглощающие потоки, за массу тела принимается суммарный объем выезжающего/въезжающего потока, физическое расстояние можно заменить на любые другие затраты, связанные с передвижением. В самом простой форме гравитационная модель имеет вид s i dj (28) ρij = κ 2 , i ∈ S, j ∈ D. cij где si — общий объем выезжающих из пункта i ∈ S, dj — общий объем въезжающих в пункт j ∈ D, cij — удельные затраты на передвижение из i в j, κ > 0 — калибровочный коэффициент. Система (28) обладает существенным недостатком. Нетрудно видеть, что при увеличении объемов si и dj , например, в два раза, модель (28) приведет к увеличению корреспонденции ρij в четыре раза, что совершенно нелогично. Поэтому вместо классической гравитационной модели (28) на практике используют ее модификацию, в которой к условию (28) добавляют дополнительные условия, например, балансовые ограничения на выезд и въезд. Кроме того, квадрат расстояния (затрат) c2ij заменяют на так называемую функцию тя44
готения f (cij ), характеризующую предпочтения индивидуумов при выборе пары источник–сток (i, j) для передвижения. В результате модифицированная гравитационная модель имеет вид ρij =
n X
s i dj , f (cij )
m X
ρij = si ,
j=1
ρij = dj ,
i=1
ρij ≥ 0,
i ∈ S, j ∈ D,
или, что то же: ρij = αi βj si dj f (cij ),
i ∈ S, j ∈ D,
(29)
где калибровочные коэффициенты αi и βj определяются из системы
αi =
X
j∈D
−1
βj dj f (cij )
,
βj =
"
X
αi si f (cij )
i∈S
#−1
.
(30)
Очевидно, что система будет совместной только тогда, X X когда суммарные объемы по выезду и въезду равны si = dj . i∈S
j∈D
Выбор функции тяготения f осуществляется либо в процессе калибровки модели на основе сопоставления расчетных данных по модели и эмпирических наблюдений, либо на основе некоторых соображений о предпочтениях при выборе пары источник–сток. Одна из аппроксимаций функции имеет следующий вид: f (cij ) = exp(−γcθij ), где при расчете корреспонденций трудовых миграций полагают γ ≈ 0.065, θ ≈ 1 (см., например, [20] и ссылки там). Важно отметить, что величины αi и βj зависят от всего набора si и dj , а следовательно, и объемы корреспонденций ρij зависят от загрузки всей системы. Численные значения αi и βj определяют по специальной итеративной процедуре. В отечественной литературе такая процедура известна как метод балансировки Шацкого—Шелейховского [19, 22]. В зарубежной литературе метод балансировки имеет свою независимую историю развития. Например, в работе [24] описана следующая процедура: начиная с матрицы ρ0ij
= si dj f (cij )
"
X
l∈D
45
dl f (cil )
#−1
,
каждая итерация метода состоит из последовательности операций: hX i−1 X ρk dj ρkij , если ρkij > dj , ij k ̺ij = i∈S i∈S k ρij — в противном случае X X qi = s i − ̺kij , rj = dj − ̺kij ; (31) j∈D
i∈S
ρk+1 = ̺kij + qi rj f (cij ) ij
"
X
l∈D
rl f (cil )
#−1
.
Вычислительные эксперименты по расчету трудовых корреспонденций на примере УДС г. Владивостока [12] (строилась матрица размерности 638 × 638) показали высокую скорость сходимости процесса (31) к искомой матрице корреспонденций — сбалансированная матрица была получена всего за 4 итерации. 1.2.2.
Энтропийная модель
Как и в случае гравитационного подхода, идею построения энтропийной модели подсказала физика, а именно второй закон термодинамики, утверждающий, что любая замкнутая физическая система стремится достичь устойчивого равновесного состояния, которое характеризуется максимумом энтропии этой системы. Впервые концепция энтропии для определения матрицы корреспонденций была использована в работе [47]. Транспортную систему как систему передвижения индивидуумов по УДС города объединяет с физической наличие очень большого числа неуправляемых элементов. При определенных допущениях, например, таких как неизменность затрат на проезд по маршрутам, неизменность топологии УДС (исключаются реконструкция, введение новых, закрытие старых дорог) и т.п., транспортную систему можно считать замкнутой. Таким образом, проблему определения корреспонденций ρij можно ставить как задачу максимизации энтропии в транспортной системе. Пусть задано фиксированное пространственное распределение населения по зонам, порождающим потоки, как и ранее, назовем такие зоны источниками и объединим их в множество S, и по зонам, поглощающим потоки, назовем их стоками и объединим в множество
46
D. Источниками, например, могут служить районы жилых массивов, стоками — места приложения труда. Индивидуумы в транспортной системе перемещаются от источников к стокам. Предположим, что все индивидуумы имеют уникальный идентификатор, например, номер паспорта. Состояние транспортной системы определяется распределением «помеченных» индивидуумов между парами источник– сток. При определении объемов корреспонденций значимым является только общее количество индивидуумов без детализации по составу их идентификаторов. Поэтому каждой паре источник–сток соответствует величина корреспонденции ρij — количество индивидуумов, выезжающих из источника i ∈ S и прибывающих в сток j ∈ D. Очевидно, что существует множество состояний, приводящих к одной и той же матрице корреспонденций ρ = {ρij : i ∈ S, j ∈ D}. Следуя принципу максимизации энтропии, будем искать значения ρij , доставляющие максимум функции P (ρ), определяющей вероятность реализации состояния системы, соответствующего матрице корреспонденций ρ. Обозначим через ν(ρ) — вероятность каждой реализации матрицы ρ, через Q(ρ) — количество состояний системы, соответствующих ρ. Тогда P (ρ) = ν(ρ)Q(ρ). (32) Пусть в системе имеется n источников и m стоков. Обозначим n X m X через R = ρij — общее количество индивидуумов в системе, i=1 j=1
через νij > 0 — вероятность выбора индивидуумом коммуникации ρij . По аналогии со схемой Бернулли значение ν(ρ) определяется формулой m Y n Y ρ ρ11 ρ12 ρnm ν(ρ) = ν11 · ν12 · . . . · νnm νijij . = i=1 j=1
Вычислим количество состояний Q(ρ). Если объем корреспонденции из источника 1 в сток 1 равен ρ11 , то количество способов достиρ11 жения этого объема равно CR . Далее, из оставшейся части индивидуумов количество способов достижения объема корреспонденции ρ12 ρ13 ρ12 равно CR−ρ , корреспонденции ρ13 равно CR−ρ и так далее. 11 11 −ρ12
47
В итоге получаем следующую формулу для Q(ρ): ρ11 ρ12 ρ13 ρnm Pm−1 Pn−1 Q(ρ) = CR · CR−ρ · CR−ρ · . . . · CR− = 11 11 −ρ12 ρ i=1
=
R! (R−ρ11 )!ρ11 !
·
(R−ρ11 −ρ12 )! (R−ρ11 −ρ12 −ρ13 )!ρ13 !
=
j=1
ij
(R−ρ11 )! (R−ρ11 −ρ12 )!ρ12 ! ·
R−
· ... · R!
m Y n Y
m−1 X n−1 X i=1 j=1 ρmn !
ρij !
=
. ρij !
i=1 j=1
Очевидно, что результат не зависит от того, в каком порядке берутся корреспонденции ρij для вычисления количества способов распределения индивидуумов в системе. Подставив рассчитанные значения ν(ρ) и Q(ρ) в формулу (32), получаем критерий выбора наиболее вероятного состояния системы: ρ m Y n Y νijij → max . P (ρ) = R! ρ ! i=1 j=1 ij
(33)
Помимо требования максимизации вероятности P (ρ) на значения ρij , как правило, накладываются дополнительные условия. Самыми естественными из них являются балансовые ограничения и условия неотрицательности. Пусть в каждой зоне–источнике i ∈ S задан общий объем выезжающих si , в каждой зоне–стоке j ∈ D — общий объем въезжающих dj . Рассмотрим только те корреспонденции ρij , которые удовлетворяют следующим условиям: n X j=1
ρij = si ,
m X
ρij = dj ,
i=1
ρij ≥ 0,
i ∈ S, j ∈ D.
(34)
Очевидно, для совместности системы суммарный объем выезжающих должен быть равен суммарному объему въезжающих: m X i=1
si =
n X j=1
48
dj = R.
(35)
Дополнительно к условиям баланса (34) введем ограничение на общие затраты при проезде: m X n X
(36)
cij ρij = C,
i=1 j=1
где cij — удельные затраты на передвижения из источника i в сток j, C — полные затраты в транспортной системе. Таким образом, проблема построения матрицы корреспонденции ρ = (ρij : i ∈ S, j ∈ D) сводится к задаче условной оптимизации (33), (34), (36). Нет сомнений, что в заданной форме (33) функция P (ρ) весьма неприятна для оптимизации. Для удобства максимизации можно воздействовать на P (ρ) любым монотонным оператором, например, прологарифмировать P (ρ) и вместо (33) использовать критерий ln P (ρ) = ln R! +
m X n X i=1 j=1
(ρij ln νij − ln ρij !) → max .
(37)
Проводя параллель между физической и транспортной системами, было отмечено наличие большого количества неуправляемых элементов, что позволяет предположить, что значения ρij достаточно велики. Поэтому вполне правомерно для дальнейшего преобразования критерия (37) использовать формулу Стирлинга ln z! = = z ln z − z, которая справедлива при больших z. Имеем ln P (ρ) ≈ R ln R +
m X n X
ρij ln
i=1 j=1
νij . ρij
При фиксированных объемах выездов si и въездов dj и выполнении равенства (35) величина R ln R постоянна и может быть исключена из критерия. В результате проведенных преобразований наиболее вероятное состояние транспортной системы будет соответствовать такой матрице корреспонденций ρ, элементы которой удовлетворяют условиям (34), (36) и критерию m X n X i=1 j=1
ρij ln
νij → max . ρij
49
(38)
При построении энтропийной модели (34), (36), (38) предполагалось, что известна априорная информация о предпочтении индивидуумом одной коммуникации другой. Если же любое состояние система принимает с равной вероятностью, то есть для любых пар 1 , то вместо (i, j) значение νij постоянно и определяется как νij = mn критерия (38) рассматривают m X n X i=1 j=1
ρij ln
1 → max . ρij
(39)
Допустимая область, задаваемая условиями (34), (36), образует полиэдральное множество. Целевая функция критерия (38) на допустимой области является строго вогнутой. В самом деле, матрица Гессе для (38) имеет вид диагональной матрицы размерности mn × mn c элементами на главной диагонали {− x1ij }. Такая матрица отрицательно определена для любых m, n и xij ≥ 0. Таким образом, задача (34), (36), (38) относится к классу задач выпуклой гладкой оптимизации. Строгая вогнутость целевой функции гарантирует единственность ее решения. Несмотря на свои хорошие свойства, для реальных транспортных сетей задача (34), (36), (38) имеет большую размерность, что в свою очередь серьезно усложняет применение на практике стандартных для этого класса задач численных методов. Так, например, для расчета трудовых корреспонденций в УДС г. Владивостока [12] территория города была поделена на зоны 800 × 800 метров. В результате получилась сетка 22 × 29 квадратов, каждый из которых одновременно являлся зоной–источником и зоной–стоком, при этом размерность задачи (34), (36), (38) составила 407 044 переменных, 1277 ограничений равенств (34), (36). Для решения задачи (34), (36), (38) разработана простая итерационная схема [19, 22]: начиная с матрицы {ρij = iνij } на каждой итерации метода попеременно достигается выполнение балансовых ограничений для выездов и въездов: −1 #−1 " X X k+1 k k k k k ρij , ρij = ̺ij dj ̺ij . (40) ̺ij = ρij si j∈D
i∈S
В работе [2] доказана сходимость процесса (40) к оптимальному решению задачи (34), (36), (38). Существуют и другие подходы к решению энтропийных моделей (см., например, [6, 31]). 50
Подробнее генезис и феноменология энтропийных моделей для поиска равновесного состояния макросистем, в том числе транспортных, рассмотрена а приложении Е. В. Гасниковой настоящего пособия. Особый интерес тут представляет связь энтропийного критерия с динамикой достижения равновесного состояния. 1.2.3.
Связь между гравитационной и энтропийной моделями
Количество переменных в задаче (34), (36), (38), как правило, во много раз превышает число ограничений. Традиционно в такой ситуации вместо исходной решается двойственная задача, которая в данном случае заключается в максимизации функции Лагранжа: " m X n X νij + λi (si − ρij )+ L(ρ, λ, µ, γ) = ρij ln ρ ij i=1 j=1 # +µj (dj − ρij ) + γ(C − cij ρij ) ,
где λ = (λi : i ∈ S) — вектор двойственных переменных, соответствующих балансовым ограничениям (34) для источников, µ = (µj : j ∈ D) — вектор двойственных переменных, соответствующих балансовым ограничениям (34) для стоков, γ — двойственная переменная, соответствующая ограничению по затратам (36). Точка максимума для L(ρ, λ, µ, γ) должна удовлетворять условиям (34), (36) и системе уравнений ln
νij − 1 − λi − µj − γcij = 0, ρij
i ∈ S, j ∈ D.
(41)
Из системы (41) можно выразить корреспонденции ρij = νij exp(−1 − λi − µj − γcij ).
(42)
Видим, что для νij ≥ 0 условие неотрицательности корреспонденций ρij выполнено автоматически, поэтому может не учитываться при построении двойственной задачи и применении к ней численных методов. Однако заметим, что случай, когда νij = 0 означает отсутствие корреспонденции между парой (i, j), следовательно, ρij = 0 и 51
максимизация функции Лагранжа должна рассматриваться в пространстве меньшей размерности. Введем обозначения αi =
exp(−1 − λi ) , si
exp(−µ) . dj
βj =
Тогда выражение (42) перепишется в виде ρij = αi βj si dj νij exp(−γcij ).
(43)
При подстановке (43) в балансовые ограничения (34) определяются параметры αi и βj :
αi =
X
j∈D
−1
βj dj νij exp(−γcij )
,
βj =
"
X i∈S
αi si νij exp(−γcij )
#−1
.
Отметим, что величина C на практике, как правило, не известна, поэтому лагранжевый множитель γ нельзя определить из решения уравнения (36). Значение γ определяется обычными методами калибровки. Сравнивая выражение (43) с гравитационной моделью (29), видим, что отличие между ними состоит только в аналитическом задании функции тяготения f (cij ). При f (cij ) = νij exp(−γcij ) гравитационная (29) и энтропийная (34), (36), (38) модели эквивалентны. Таким образом, при однородной цели поездок, при заданных объемах выездов si , въездов dj , затратах на передвижение cij , при фиксированных полных затратах C существует наиболее вероятное распределение поездок между зонами (i, j) и это распределение совпадает с тем, которое задается гравитационной моделью с экспоненциальной функцией притяжения.
52
1.3.
Парадоксы транспортного равновесия
В данном разделе рассматривается ряд антиинтуитивных примеров транспортных ситуаций, в которых применение принципа равновесия приводит к неожиданным решениям. 1.3.1.
Парадокс Брайеса
Пример Пигу (см. раздел 1.1.6) заставляет усомниться в эффективности «невидимой руки рынка» Адама Смита, которая, направляя эгоистичные действия пользователей сети, позволяет достичь общественного блага. Последующий пример Брайеса показывает, что конкурентное бескоалиционное равновесие может не только отклоняться от системного оптимума, но и ухудшать ситуацию для всех участников движения. Рассмотрим появление парадокса Брайеса в результате последовательных весьма вероятных трансформаций транспортной сети окрестностей г. Владивостока, которые представлены в серии рис. 2. Будем рассматривать ситуацию с точки зрения перевозок Аэропорт – Владивосток, с общей потребностью в перевозках 6 условных единиц. На рис. 2 изображены воображаемые этапы изменения участка транспортной сети в окрестности Владивостока, которые могут быть связаны с созданием игровой зоны на мысе Черепахи. Начальное состояние а): Аэропорт и Владивосток соединены двумя дорогами, одна из которых проходит через г. Артем, а другая через мыс Черепахи — место, где будет построена игровая зона Геймланд. В начальный момент обе дороги невысокого качества и, как показано на рис. 2 а), время проезда по ним сильно зависит от нагрузки y. Очевидно, что в силу симметрии равновесные потоки распределятся поровну между двумя маршрутами Аэропорт – м. Черепахи – Владивосток и Аэропорт – Артем – Владивосток с соответствующими потоками y = 3. Пользовательские затраты на проезд — 90, системные — 540. Построено шоссе Аэропорт – Игровая зона б): Снизилась зависимость времени проезда из Аэропорта в Геймланд, в затратах на
53
м. Черепахи (Геймланд)
+
y
y
y
y
20
10
10
50
Геймланд
y
Аэропорт
20
y
y
20
10
y
Аэропорт
Владивосток
Владивосток
10
а) Исходное состояние сети
б) Строительство шоссе Аэропорт – Игровая зона
Геймланд
Геймланд
+ y
50
y + 10
Аэропорт
y
y
y
y
+
50
10
10
+
Владивосток
Владивосток
Аэропорт
y
y
y
+
10
10
50
г. Артем
50
г. Артем
г. Артем
г. Артем
в) Строительство шоссе Артем – Владивосток
г) Строительство шоссе Артем – Игровая зона
Рис. 2. Парадокс Брайеса
54
проезд появилась постоянная составляющая, которая может представлять собой время проезда по пустой дороге. Часть равновесного трафика переместилась на направление Аэропорт – м. Черепахи – Владивосток (3.17), соответственно поток по другому маршруту Аэропорт – Артем – Владивосток упал до 2.83. Пользовательские затраты на проезд составили 84.88, системные — 84.88 · 6 = 509.28. Построено шоссе Артем – Владивосток в): Полученные доходы от игорного бизнеса позволили модернизировать часть одного из маршрутов Владивосток – Артем – Аэропорт, в результате чего равновесные потоки снова стали симметричными и затраты пользователей составили 83, а системные — 498, дальнейшее снижение. Построено шоссе Артем – Игровая зона г): Поскольку игорная зона обслуживается в основном жителями Артема, был поставлен и положительно решен вопрос о строительстве дороги Артем – Игровая зона. Затраты на проезд соответствовали классу уже построенных дорог, а постоянное слагаемое уменьшилось в силу территориальной близости. Равновесные потоки теперь распределятся по трем маршрутам: Владивосток – Геймланд – Артем – Аэропорт, Владивосток – Геймланд – Аэропорт, Владивосток – Артем – Аэропорт, причем нагрузка на каждый из них будет составлять 2 единицы трафика, а пользовательские затраты на проезд неожиданно возросли до 92, а системные — до 552 ! В результате как системные, так и личные затраты превзошли даже первоначальный уровень a) несмотря на то, что на каждом предыдущем этапе мы улучшали транспортную ситуацию как с пользовательской, так и с системной точки зрения. Причиной этого эффекта является то, что постройка на этапе г) шоссе Артем – Игровая зона создала оппортунистическую возможность проехать по маршруту Аэропорт – Артем – Игровая зона Геймланд – Владивосток. При нулевом потоке на маршруте Артем – Игровая зона Геймланд временные затраты составляют 70 и провоцируют водителей на выбор именно этого маршрута. Однако когда эта идея овладеет массами, то поток по сегменту Артем – Игровая зона Геймланд будет уже ненулевой, что увеличит соответствующие общие затраты. Равновесная ситуация установится при одинаковых
55
затратах (временах) по всем маршрутам, что и приводит к этому парадоксальному результату. 1.3.2.
Транспортно-экологические парадоксы
Существует ряд парадоксов [41], связанных с транспортными ситуациями, в которых помимо времени проезда учитываются и дополнительные критерии. Одним из таких критериев, важных в настоящее время, является загрязнение окружающей среды (ЗОС). ЗОС является сложным многокомпонентным понятием, включающим различные виды ущерба для окружающей среды: газовое и тепловое загрязнение, разрушение сложившихся природных ландшафтов, мест обитания редких животных и пр. В данном случае будем все же считать, что ЗОС измеряется некоторым универсальным показателем, связанным с данным участком дороги и зависящим, вообще говоря, от потока транспорта по этой дороге. ЗОС от различных участков дороги суммируются, образуя итоговый ЗОС либо от маршрутов, либо от всей транспортной сети в целом. 1.3.2.1.
Экологический парадокс Брайеса
В своей схематической форме сеть, реализующая парадокс Брайеса, представлена на рис. 3, где на каждом ребре показаны как временные затраты τ (y), так и экологический ущерб e(y) как функции потоков по этим ребрам y. Взяв для предполагаемого потока те же данные, что в предыдущем примере, оценим ЗОС до и после строительства новой дороги. Для исходного состояния сети ЗОС оценивается как E = 2 · 3 · (0.2 + 0.1) = 1.8 . После строительства новой дороги с нулевым экологическим ущербом ЗОС становится равным E = 4 · 0.2 + 2 · 0.1 + 2 · 0 + 4 · 0.2 + 2 · 0.1 = 2! Как нетрудно понять, в данном случае парадокс вызван тем, что в результате перераспределения потоков увеличились потоки именно по тем дугам, которые имеют максимальные удельные приращения ЗОС.
56
e(y) = 0
B
y 10 = 0. 1y y) τ ( y) =
y) τ(
e(
e(
e(
y 10 = 0. 1y y) τ ( y) = e(
y) = y = + 0 . 50 2y
A
τ( y) y) = y = + 0 . 50 2y
B
τ (y) = y + 10
e(
e(
A
y 10 = 0. 2y y) τ ( y) = e(
y 10 = 0. 2y y) τ ( y) = e(
τ( y) y) = y = + 0 . 50 1y
U
τ( y) y) = y = + 0 . 50 1y
U
D
D
а) Исходное состояние сети
б) После строительства новой дороги
Рис. 3. Парадокс Брайеса
1.3.2.2.
Экологический треугольник
Рассмотрим теперь еще более простую транспортную сеть, представленную на рис. 4. Так же, как и ранее, на дугах этой сети приC
e (y
τ (y
)= y )= +1 0
4 y+ ) = .01y τ (y = 0 ) e(y
A
e(y) = 0.5y τ (y) = y + 1
B
Рис. 4. Уменьшение перевозок вызывает увеличение ЗОС
ведены формулы, описывающие временные затраты τ (y) и экологический ущерб e(y) как функции потока y по этой дуге. Пусть требуется перевезти 2 единицы груза из C в B и одну единицу из C в A. Очевидно, что достаточно рассмотреть 3 маршрута: p1 = C → A, p2 = C → A → B и p3 = C → B. Условия равновесия совмест57
но с условиями удовлетворения спроса на перевозки дают систему уравнений (x1 + x2 ) + 1 + x2 + 1 = x3 + 4, x2 + x3 = 2, x1 = 1, где xi , i = 1, 2, 3 — это потоки по маршрутам pi , i = 1, 2, 3. Решение этой системы дает равновесные потоки x†1 = x†2 = x†3 = 1 с общим экологическим ущербом E = 0.51. Теперь предположим, что спрос на перевозки по маршруту C → → A упал до 1/2. Тогда решение аналогичной системы дает x†1 = 1/2, x†2 = 7/6 > 1, x†3 = 5/6 < 1 с общим экологическим ущербом E = 0.5 · 7/6 + 0.01 · 5/6 ≈ 0.591 > 0.51. Заметим, что увеличение экологического ущерба в этом случае вызвано уменьшением нагрузки на экологически чистую дугу сети. С одной стороны, это вызвало переход части трафика с маршрута p3 , не проходящего через дугу C → A на маршрут p2 , проходящий через эту дугу, однако, с другой стороны, это вызвало увеличение трафика по дуге A → B с высоким экологическим ущербом и суммарный эффект оказался негативным. 1.3.2.3.
Рокадная экология
Последующий пример показывает, как такая популярная мера, как строительство рокадной дороги улучшенного качества, может на самом деле ухудшить экологическую ситуацию. Рассмотрим дорожную сеть, изображенную на рис. 5, часть а). Предположим, что эта сеть предназначена для перемещения автомоτ (y) = y1 + 10
τ (y) = y1 + 10
e(y) = 0.1y1
e(y) = 0.1y1
A
B
A
τ (y) = 3(y1 + y2 )
τ (y) = y + 11 e(y) = 0
B
τ (y) = 3(y1 + y2 )
e(y) = 0.5y2
e(y) = 0.5y2
а) Исходная сеть
б) Построена рокадная дорога
Рис. 5. Новая рокадная дорога вызывает увеличение ЗОС
бильного трафика в объеме 5 условных единиц из точки A в точку 58
τ (y) = y + 5
τ (y) = y + 10
e(y) = 0.2y
e(y) = 0.4y
A
B
C
D
τ (y) = f + 5
τ (y) = y + 5
e(y) = 0.2y
e(y) = 0.1y
Рис. 6. Сети автомобильных дорог и трамвайных линий
B по двум дублирующим дорогам различного качества, временные затраты по которым задаются соотношениями на соответствующих дугах. В этих соотношениях y1 означает поток по верхней дуге, y2 — по нижней. Зависимость времени проезда по нижней дуге от потока по верхней может быть вызвана указанием приоритета на соответствующем перекрестке. Определяющая система уравнений для равновесных потоков имеет вид y1 + y2 = 5, y1 + 10 = 3(y1 + y2 ), откуда y1† = 5, y2† = 0. Затраты пользователей на проезд составляют при этом τ † = 15, а экологический ущерб составляет 0.5. Если, как показано на правой части рис. 5, построена новая дорога с нулевым ущербом для окружающей среды и временными характеристиками τ (y) = y +11, то новая определяющая система будет иметь вид y1 + y2 + y = 5, y1 + 10 = 3(y1 + y2 ) = y + 11, и ее решение: y1† = y2† = 2, y † = 1. Затраты пользователей на проезд при этом уменьшились до τ† = 12, а экологический ущерб возрос до 1.2 ! 1.3.2.4.
Перераспределение спроса
Еще один пример показывает, что перенос части пассажиров с транспортного средства экологически более вредного (скажем автобус) на менее вредный (например, трамвай) может в действительности увеличить ЗОС. В этой модели рассматривается сеть, состоящая 59
из двух компонент, отражающих различные виды транспорта. В этих компонентах необходимо перевезти 10 единиц потока из A в B и 5 единиц потока из C в D. Пункты отправления A и C, а также пункты прибытия C и B будем считать близкими, так что между ними возможен обмен перевозками. В такой транспортной схеме появляются 4 маршрута, каждый из которых состоит из одной дуги, которые мы будем считать пронумерованными сверху вниз. Затраты на перевозку по маршрутам совпадают, конечно, с затратами по дугам и обозначены на рисунке. При этих начальных данных решение задачи равновесия имеет вид: Автомобильная сеть. В силу симметрии потоки равны и составляют y1† = y2† = 5. Экологический ущерб E = 2. Трамвайная сеть. y3† = 0, y4† = 5. Экологический ущерб E = 0.5. Суммарный экологический ущерб составляет 2.5. Предположим теперь, что 2.5 единицы трафика перенесены из сильно загрязняющей автомобильной сети в менее загрязняющую трамвайную с целью уменьшить суммарный ЗОС. Новое равновесное решение будет иметь вид: Автомобильная сеть. В силу симметрии потоки равны и составляют y1† = y2† = 3.75. Экологический ущерб E = 1.5. Трамвайная сеть. y3† = 0, y4† = 5. Экологический ущерб E = 1.125. Суммарный экологический ущерб составляет 2.625, что превосходит (!) ущерб в предыдущем варианте распределения нагрузки для двух видов трафика. То, что перенос трафика осуществляется в размере 2.5 единиц на самом деле несущественно, любое уменьшение объема перевозок по автомобильной сети вызывает появление ненулевого объема перевозок по экологически затратной дуге 3 в трамвайной сети, что не компенсируется уменьшением объемов перевозок по дугам 1, 2. Увеличение объемов перевозок по автомобильной сети также не приводит к уменьшению ЗОС, так как вызывает в два раза больший экологический ущерб, чем уменьшение ЗОС от трамвайного трафика, который будет продолжать концентрироваться на дуге 4.
60
1.4.
Практическая работа
Упражнение 1. На входе в Великий Федеральный Университет есть две двери, через которые входят и выходят студенты. При подходе к ним перед каждым студентом возникает проблема, какой дверью воспользоваться, если он заинтересован в скорейшем входе или выходе. Найти равновесное распределение потоков в двух случаях: 1) задержка в дверях одинакова для входящих и выходящих и пропорциональна произведению интенсивностей входящего и выходящего потоков; 2) задержка в дверях пропорциональна интенсивности потока студентов, двигающихся в том же направлении плюс задержка, пропорциональная произведению интенсивностей входящего и выходящего потоков. Общее количество входящих и выходящих за единицу времени студентов считать одинаковым.
Упражнение 2. Рассматривается транспортная сеть Γ = (V, E) (пример сети взят из работы [27]), состоящая из 25 вершин (|V | = 25) и 40 ориентированных дуг (|E| = 40). Топология сети с направлением дуг представлена на рис. 7. Дороги (дуги) транспортной сети Γ поделены на четыре категории: 1) магистрали Eh = {(6 → 7), (8 → 9), (10 → 11), (12 → 13), (14 → 15), (17 → 18), (19 → 20), (21 → 22), (23 → 24), (25 → 16)}; 2) выезды Eex = {(16 → 1), (15 → 1), (24 → 2), (7 → 2), (22 → 3), (9 → 3), (20 → 4), (11 → 4), (18 → 5), (13 → 5)}; 3) въезды Een = {(1 → 6), (1 → 17), (2 → 25), (2 → 8), (3 → 23), (3 → 10), (4 → 21), (4 → 12), (5 → 19), (5 → 14)}; 4) второстепенные дороги Es = {(15 → 6), (7 → 8), (9 → 10), (11 → 12), (13 → 14), (16 → 17).(18 → 19), (20 → 21), (22 → 23), (24 → 25)}. 61
15
1
6
14
17
5
13
18
16
19
7
12 25
20
24
2
21 23
4
22
8
11
9
10
3
Рис. 7. Транспортная сеть Γ = (V, E)
Пропускная способность магистралей равна 100 единицам потока, остальных дуг — 50 ед. Категория дороги влияет на затраты при передвижении. Минимальные транспортные затраты τe0 по каждому из участков e ∈ E определяются по формуле τe0 = κe le , где le — длина дуги e, данные приведены в таблице 1, κe > 0 — коэффициент, зависящий от категории, которой принадлежит дуга e: 0.011, e ∈ Eh , 0.025, e ∈ Eex ∪ Een , κe = 0.033, e ∈ Es .
В сети Γ выделено пять вершин–источников S = {1, 2, 3, 4, 5} с заданными объемами выходящего трафика s = (69, 90, 10, 100, 53) и пять вершин–стоков D = {17, 19, 21, 23, 25} с заданными объемами входящего трафиков d = (128, 59, 34, 61, 40). Используя аппарат математического моделирования и численные методы, рассчитать объемы корреспонденций ρw для всех пар источник–сток w ∈ W = S × D. 62
Таблица 1. Длины дуг сети Γ = (V, E)
Дуга 6→7 8→9 10 → 11 12 → 13 14 → 15 17 → 18 19 → 20 21 → 22 23 → 24 25 → 16 15 → 6 11 → 12 18 → 19 24 → 25
Длина 4 10 3 3 5 1 2 6 9 2 1 3 4 1
Дуга 16 → 1 15 → 1 24 → 2 7→2 22 → 3 9→3 20 → 4 11 → 4 18 → 5 13 → 5 7→8 13 → 14 20 → 21
Длина 6 9 3 8 5 1 10 8 5 3 6 9 6
Дуга 1→6 1 → 17 2 → 25 2→8 3 → 23 3 → 10 4 → 21 4 → 12 5 → 19 5 → 14 9 → 10 16 → 17 22 → 23
Длина 3 7 6 2 6 5 6 8 7 4 4 10 10
При моделировании необходимо учесть, что предпочтения при выборе пары w определяются функцией f (cw ) = exp(−0.065cw ), где cw — минимальные транспортные затраты на передвижение для пары w. Предполагается, что величина cw характеризует длину кратчайшего пути для каждой пары w и определяется из соотношений: cw = 0.05, если источник и сток совпадают, в противном случае если путь p проходит X 1, через дугу e; cw = min θep τe0 , θep = p∈Pw 0, в противном случае, e∈E
где через Pw обозначено множество всех допустимых маршрутов передвижения для пары w. Для рассчитанных корреспонденций сравнить загрузку транспортной сети, индивидуальные и общие транспортные затраты при нормативном и дескриптивном распределении потоков. Под нормативным распределением понимается централизованное управление движением, имеющее своей целью минимизацию совокупных транспортных затрат (второй поведенческий принцип Вардропа). Под дескриптивным — отсутствие централизованного управления, каждый 63
пользователь выбирает маршрут следования исходя из минимизации собственных транспортных затрат (первый поведенческий принцип Вардропа). Удельные транспортные затраты для каждой пары источник– сток w складываются из затрат по дугам τe , входящим в маршрут следования из источника в сток. В свою очередь на значение τe влияет величина потока, проходящего по дуге e ∈ E, такая зависимость описывается функцией τe (ye ) = τe0 (1 + (ye /ce )4 ), где ce — пропускная способность дуги e.
64
Литература 1. Ашманов С. А. Математические модели и методы в экономике. М.: Изд-во МГУ, 1980. 2. Брэгман Л. Д. Доказательство сходимости метода Шелейховского для задачи с транспортными ограничениями // ЖВМ и МФ. 1967. № 1. C. 147–156. 3. Васильева Е. М., Левит Б. Ю., Лившиц В. Н. Нелинейные транспортные задачи на сетях. М.: Финансы и статистика, 1981. 4. Васильева Е. М., Игудин Р. В., Лившиц В. Н. Оптимизация планирования и управления транспортными системами. М.: Транспорт, 1987. 5. Вильсон А. Дж. Энтропийные методы моделирования сложных систем. М.: Наука, 1978. 6. Гасникова Е. В. Двойственные мультипликативные алгоритмы для задачи энтропийно-линейного программирования // ЖВМ и МФ. 2009. Т. 49. № 3. C. 453–464. 7. Данскин Дж. Теория максимина и ее приложение к задачам распределения вооружений М.: Сов. радио, 1970. 8. Никайдо Х. Выпуклые структуры и математическая экономика. М.: Мир, 1972. 9. Нурминский Е. А. Использование дополнительных малых воздействий в фейеровских моделях итеративных алгоритмов // ЖВМ и МФ. 2008. Т. 48. № 12. С. 2121–2128. 10. Нурминский Е. А. Фейеровские процессы c малыми возмущениями // Доклады АН. 2008. Т. 422. № 5. С. 601–605. 11. Nurminski E. A. Envelope stepsize control for iterative algorithms based on Fejer processes with attractants // Optimization Methods and Software. 2010. V. 25. № 1. P. 97-108. 12. Нурминский Е. А., Шамрай Н. Б. Моделирование транспортных потоков г. Владивостока на основе теории равновесия // Sisteme de transport si logistica: Materialele Conf. Int., 65
Chisinau, 22-23 octombrie 2009; red. Resp. Dumitru Solomon; Acad. de Transporturi, Informatica si Comunicatii. Ch.: Evrica, 2009. P. 334–348. 13. Попков Ю. С., Посохин М. В., Гутнов А. Э., Шмульян Б. Л. Системный анализ и проблемы развития городов. М.: Наука, 1983. 14. Попков Ю. С. Макросистемные модели пространственной экономики. М.: КомКнига, 2008. 15. Шамрай Н. Б. Решение задач транспортного равновесия с декомпозицией по ограничениям // Труды всероссийской конференции "Равновесные модели в экономике и энергетике". – Иркутск: Изд-во ИСЭМ СО РАН. 2008. C. 618-624. 16. Стенбринк П. А. Оптимизация транспортных сетей. М.: Транспорт, 1961. 17. Попов Л. Д. Введение в теорию, методы и экономические приложения задач о дополнительности. Екатеринбург: Изд-во Урал. ун-та, 2001. 18. Тодд М. Дж. Вычисление неподвижных точек и приложения к экономике. М.: Наука, 1983. 19. Шацкий Ю. А. Расчет схемы расселения и трудовых корреспонденций при разработке генерального плана города // Развитие системы городского транспорта. Киев. 1971. № 4. С. 3–14. 20. Швецов В. И. Математическое моделирование транспортных потоков // Автоматика и телемеханика. 2003. № 11. С. 3–46. 21. Швецов В. И. Алгоритмы распределения транспортных потоков // Автоматика и телемеханика. 2009. № 10. С. 148–157. 22. Шелейховский Г. В. Транспортные основания композиции городского плана. Л., 1936. 23. Agdeppa R. P., Yamashita N., Fukushima M. The traffic equilibrium problem with nonadditive costs and its monotone mixed complementarity problem formulation // Transportation Research Part B. 2007. № 41. P. 862–874.
66
24. Arrowsmith G. A. A behavioural approach to obtaining a doubly constrained trip distribution model // Operational Research Quarterly. 1973. V. 24. № 1. P. 101–111. 25. Bar-Gera H. Origin-based algorithm for the traffic assignment problem // Transportation Science. 2002. V. 36. № 4. P. 398–417. 26. Beckmann M., McGuire C. B., Winsten C. B. Studies in the economics of transportation. RM-1488. Santa Monica: RAND Corporation, 1955. 27. Bertsekas D., Gafni E. Projection methods for variational inequalities with application to the traffic assignment problem // Mathematical Programming Study. 1982. № 17. P. 139-159. 28. Boyce D., Ralevic-Dekic B., Bar-Gera H. Convergence of traffic assignments: how much is enough? // Journal Transport Engineer. 2004. V. 130. № 1. P. 49–55. 29. Chen M., Bernstein D. H., Chien S. I. J., Mouskos K. Simplified formulation of toll design problem // Transportation Reseach Record. 1999. № 1667. P. 88–95. 30. Dafermos S. Traffic equilibrium and variational inequalities // Transportation Science. 1980. V. 14. № 1. P. 42-54. 31. Fang S.-C., Rajasekera J. R., Tsao H.-S.J. Entropy optimization and mathematical programming. Kluwer Academic Publisher, 1997. 32. Facchinei F., Pang J.-S. Finite-Dimensional Variational Inequalities and Complementarity Problems (V. I, II). Springer, 2003. 33. Frank M., Wolfe P. An algorithm for quadratic programming // Naval Research Logistics Quarterly. 1956. V. 3. P. 95–110. 34. Gabriel S. A., Bernstein D. The traffic equilibrium problem with nonadditive path costs // Transportation Science. 1997. V. 31. № 4. P. 337–348. 35. Janson B., Zozaya-Gorostiza C. The problem of cyclic flows in traffic assignment // Transportation Research Part B. 1987. V. 21. № 4. P. 299–310.
67
36. Knight F. H. Some fallacies in the interpretation of social cost // The Quarterly Journal of Economics. 1924. V. 38. № 4. P. 582–606. 37. Konnov I. V. Combined relaxation methods for variational inequalities. Berlin: Springer, 2001. 38. Konnov I. V. Equilibrium Models and Variational Inequalities. Elsevier Science, 2007. 39. Lo H. K., Chen A. Traffic equlibrium problem with rout-specific costs: formulation and algorithms // Transportation Research Part B. 2000. V. 34. № 6. P. 493–513. 40. Nagurney A. Network Economics: A Variational Inequality Approach. Dordrecht: Kluwer Academic Publishers, 1999. 41. Nagurney A., Dong J. Paradoxes in networks with zero emission links: implications for telecommunications versus transportation // Transportation Research Part D. 2001. V. 6. № 4. P. 283–296. 42. Nemerovsky A., Yudin D. Informational complexity and efficient methods for solution of convex extremal problems. N.Y.: Wiley, 1983. 43. Nesterov Y., de Palma A. Stationary dynamic solutions in congested transportation networks: summary and perspectives // Networks and spatial economics. 2003. № 3. P. 371–395. 44. Patriksson M. The traffic assignment problem — models and methods. Utrecht, Netherlands: VSP. 1994. 45. Piugou A. C. The economics of welfare, London: MacMillan, 1932, 4-th edition. (Русский перевод: Пигу А.С. Экономическая теория благосостояния Т. 1–2, Сер. Экономическая мысль Запада, М.: Прогресс, 1985). 46. Roughgarden T., Tardos E. How bad is selfish routing? // Journal of the ACM. 2002. V. 49. № 2. P. 236–259. 47. Wilson A. G. A statistical theory of spatial distribution models // Transportation Research. 1967. V. 1. P. 253–270. 48. Wardrop J. Some Theoretical Aspects of Road Traffic Research // Proceedings of the Institute of Civil Engineers, 1952.
68
Глава 2. Математические модели транспортных потоков1 2.1. Макроскопические модели .......................................................... 70 2.1.1. Модель Лайтхилла–Уизема–Ричардса (LWR)................ 70 2.1.2. Модель Танака ................................................................ 82 2.1.3. Модель Уизема ............................................................... 83 2.1.4. Модель Пэйна и еѐ обобщения ....................................... 92 2.1.5. Кинетические модели ..................................................... 97 2.1.6. Практические приложения моделей ............................... 99 2.2. Микроскопические модели ....................................................... 102 2.2.1. Модель оптимальной скорости Ньюэлла ..................... 102 2.2.2. Модель следования за лидером Дженерал Моторс ...... 107 2.2.3. Модель «разумного водителя» Трайбера ..................... 109 2.2.4. Модели клеточных автоматов ...................................... 112 2.3. Модельные задачи ..................................................................... 119 2.3.1. Эволюции глобального затора в транспортном потоке, описываемом моделями LWR и Уизема ................................ 119 2.3.2. Эволюции локального затора в транспортном потоке, описываемом моделями LWR и Уизема ................................ 136 2.3.3. Задача о светофоре (при каких условиях перед светофором не будет скапливаться очередь) ......................... 143 2.4. Теория Кернера–Конхойзера движущихся локальных кластеров в моделях Дженерал Моторс класса ................................................ 146 2.4.1. Фундаментальные эмпирические свойства перехода от свободного транспортного потока к плотному и модели транспортного потока ............................................................. 147 2.4.2. Характеристические параметры широкого движущегося кластера .................................................................................. 151 2.4.3 Линия J Кернера ............................................................. 154 Литература........................................................................................ 157
Глава 2 написана А. В. Гасниковым при участии С. Л. Кленова и Я. А. Холодова. Огромную помощь в написании оказал А. А. Шананин – по сути, идейный вдохновитель этой
1
69
2.1. МАКРОСКОПИЧЕСКИЕ МОДЕЛИ В пункте 2.1 приводятся основные (с исторической точки зрения, и с точки зрения возможных приложений) макроскопические модели транспортных потоков. Много внимания уделяется гидродинамическим аналогиям. Транспортный поток уподобляется сжимаемой жидкости с мотивацией, которая присутствует, например, в уравнении состояния транспортного потока (зависимости скорости потока от плотности). Ключевым понятием этого пункта является обобщенное решение начальной задачи Коши для закона сохранения, описывающего транспортный поток. Так, например, разрывы обобщенного решения интерпретируются как границы заторов (переход от свободного движения к заторному). Equation Section 1 2.1.1. Модель Лайтхилла–Уизема–Ричардса (LWR) Во второй половине 40-х годов и в 50-е годы ХХ века в СССР и США интенсивно занимались исследованием процессов, возникающих при взрыве бомбы (см., например, монографии [1, 2]). В частности, большое внимание было уделено изучению начально-краевых задач для уравнения (и систем таких уравнений) типа закона сохранения. В это же время наблюдался и рост приложений, в которых встречаются схожие уравнения [3, 4]. Так в 1955 г. независимо в работах [5, 6] (см. также [7]) была предложена, по-видимому, первая макроскопическая (гидродинамическая) модель однополосного2 транспортного потока, названая впоследствии моделью Лайтхилла–Уизема (Уитема)–Ричардса (LWR), в которой поток АТС (вместо термина «автомобиль» и тем более «машина» в транспортной литературе принято использовать АТС) рассматривается как поток одномерной сжимаемой жидкости (часто эту модель называют моделью Лайтхилла–Уизема). В модели LWR предполагается, что 1) существует взаимно-однозначная зависимость (уравнение состояния) между скоростью v t , x и плотностью (погонной)
t , x потока; 2) выполняется закон сохранения массы (количества АТС). Полоса бесконечная в обе стороны, движение происходит слева направо (для определенности), нет источников и стоков автомобильных транспортных (автотранспортных), средств (АТС).
2
70
Запись t , x обозначает число АТС на единицу длины в момент времени t в окрестности точки трассы с координатой x . Аналогично, v t , x – скорость АТС (автотранспортных средств) в момент времени t в окрестности точки трассы с координатой x . Везде в дальнейшем предполагается, что пространственные масштабы, на которых транспортный поток описывается макроскопическими (гидродинамическими) моделями, значительно превышают характерный размер АТС (т.е. составляют не менее сотни метров). В таком предположении мы будем интерпретировать t , x , v t , x не как некоторые, должным образом усредненные, величины (см., например, [5, 8]), а как функции3, получающиеся при переходе от микроскопического описания (в том числе и описания с помощью клеточных автоматов (см. п. 2.2)) к макроскопическому. Иначе говоря, мы считаем что транспортный поток подчиняется некоторой микроскопической модели, в которой детально описывается поведение АТС в зависимости от обстановки впереди, и эта модель является разностным или дифференциально-разностным аналогом рассматриваемой нами макроскопической модели. Таким образом, корректность, предложенного здесь подхода к определению t , x , v t , x основывается на устойчивой аппроксимации макроскопической модели микроскопической. При этом необходимость рассмотрения макроскопических моделей обусловлена в первую очередь более простой техникой их исследования и большей наглядностью (ввиду гидродинамических параллелей). Первое предположение выразим условием: v t, x V t, x .
(1)
Относительно функции V делается следующее предположение: V 0 .
Обозначим
(2)
Q V
3 Отметим в связи с употреблением здесь слова «функция», что В. И. Арнольд неоднакратно во время различных выступлений делал докладчикам следующее замечание: «Запись f x означает не функцию, а значение функции в точке x , а функцию следует обо-
значать просто f ». Тем не менее, здесь и далее в этой главе было решено оставить более привычную для студентов запись.
71
– интенсивность потока АТС (количество АТС, проходящих в единицу времени через заданное сечение). Зависимость Q часто называют фундаментальной (или основной) диаграммой. Отметим также, что и зависимость V иногда называют фундаментальной диаграммой (см., например, приложение М. Л. Бланка). Для однополосного потока принято считать [7]: Q 0 . Это условие можно понимать следующим образом: движение по двум одинаковым и независимым полосам с разными плотностями менее «эффективно», чем движение по этим полосам с одинаковой плотностью, равной среднему арифметическому первоначальных плотностей. Однако если агрегировать несколько полос в одну (иначе говоря, заменить несколько полос одной агрегированной, на которой уже использовать рассматриваемую модель), то, как показывают наблюдения за реальными транспортными потоками, от вогнутости функции Q , вообще говоря, придется отказаться.
Рис. 1. Уравнение состояния транспортного потока
Так на рис. 1, 2 отображены экспериментальные данные «Центра исследования транспортной инфраструктуры» г. Москвы, собранные (в 72
течение одного дня в 2005 г.) по четырем полосам на участке третьего транспортного кольца от Автозаводской улицы до Варшавского шоссе, и сагрегированные на одну полосу. Заметим, что в действительности измерялась зависимость V Q .
Рис. 2. Фундаментальная диаграмма
Объяснить небольшой провал интенсивности потока Q при плотностях 60 115 АТС/км можно, по-видимому, тем, что при этих плотностях существенное влияние на интенсивность потока оказывают перемещения АТС с одной полосы на другую. Перестраивания АТС из одной полосы в другую полосу при этих плотностях, снижают интенсивность потока. С одной стороны, за счет перемещения из полосы в полосу можно двигаться быстрее (так оно и происходит при плотностях 30 50 АТС/км), но, с другой стороны, в среднем такие перемещения при 50 120 АТС/км приводят к дополнительным затратам на само перестраивание, и замедление тех АТС, перед которыми встраивается новое АТС [9]. Другое объяснение этого наблюдения имеется в главе 3 (см. также [10]) и связано с тем, что при 50 120 АТС/км само понятие «фундаментальная диаграмма» не совсем корректно. Иначе говоря, при этих плотностях нет четкой зависимости величины потока (скорости) от плотности. Одному 73
значению плотности соответствует целый промежуток возможных значений потока (скорости). Второе предположение выразим законом сохранения b
b
a
a
t , x dx t , x dx t t Q , b d Q , a d . t t Отсюда следует, что для любого прямоугольного контура в полуплоскости t 0 , x , со сторонами параллельными осям (легко показать, что это соотношение справедливо для произвольного кусочногладкого контура ), выполняется: (3) t, x dx Q t , x dt 0 .
В точках гладкости t , x : v V , t x t x
т.е.
Q (4) 0. t x Поставим начальное условие вида (условие типа Римана) x x , , (5) 0, x 0 x , x x x , , x x . Задача Коши (4), (5) возникает, например, при описании распространения затора (пробки): пусть
0 x 0 , max , где max – максимально возможная плотность (ситуация «бампер к бамперу»). Требуется определить, как по транспортному потоку будет распространяться информация о заторе впереди. Решение этой задачи позволит ответить, например, на следующий вопрос: если движение АТС с утра на Дмитровском шоссе в сторону Москвы «встало» в районе г. Долгопрудный, то через какое время затор дойдет до г. Дмитрова? Ряд интересных модельных задач (задача о светофоре, об эволюции локаль74
ного затора и др.) для закона сохранения (4) рассмотрен во 2-й и 3-й главе книги [7] (см. также п. 2.3). Вернемся к соотношению (3). Обратим внимание, что это соотношение может быть выполнено и для разрывной функции плотности t , x . Причем разрыв функции t , x есть резкое увеличение плотности, что соответствует границе затора. Пусть в момент времени t разрыв находится в точке с координатой x , и t , x 0 , t , x 0 . Предположим, что на плоскости
t; x
этому разрыву соответствует
кривая L . Возьмем в окрестности точки t , x L прямоугольный контур (для определенности, зададим ориентацию по часовой стрелке) так, как показано на рис. 3. Будем считать, что ширина контура Г настолько мала по сравнению с длиной, что интегралом по участкам контура Г , поперечным к L , можно пренебречь (см. рис. 3).
Рис. 3. RRH-условие на разрыве
Тогда из (3) следует, что
0 t, x dx Q t, x dt
75
c Q t c Q t o t ,
где c dx dt соответствует наклону касательной к L в точке t , x , t – длина проекции контура на ось t . При t 0 это равенство переходит в следующее условие (частный случай, условия Стокса (1848)) для скорости движения разрыва c , которое называется (во всяком случае, должно называться согласно П. Лаксу [11]) условием Римана–Ранкина– Гюгонио: Q Q (RRH). c , Оказывается, что уравнение (4) всегда имеет слабое (удовлетворяющее соотношению (3) и начальному условию (5) в слабом смысле) решение (см. [12]), но, как показывает следующий пример, оно может иметь бесконечно много решений, т.е. нет единственности. Пример (О. А. Олейник [13]). Рассмотрим уравнение Хопфа (см. [14]): 0 t x и начальное условие Римана: 1, x 0, 0, x 1, x 0. О важности (исторической, и не только) именно этого уравнения для моделирования транспортных потоков см. в п. 2.1.3. Линейной заменой переменных и неизвестной функции к уравнению Хопфа можно свести довольно популярный частный случай модели LWR, в котором Q – вогнутая парабола (фундаментальная диаграмма Гриншилдса). При любом q 1 определенная в точках полуплоскости t 0 функция 1 q x t, 1, 2 q, 1 q t x 0, 2 q t , x q 1 q, 0 x t, 2 q 1 1, tx 2 76
удовлетворяет при t 0 уравнению (4) в смысле (3) (достаточно проверить, что на разрывах выполняется условие RRH) и начальному условию (5) (см. рис. 4). ■
Рис. 4. Пример О. А. Оленйик (1957)
Единственное решение выбирает условие отбора, по-видимому, впервые предложенное О. А. Олейник в 1958 г. [15, 16] (в частном случае – выпуклой (вогнутой) функции Q см. О. А. Олейник (1957) [13], а также П. Лакс (1957) [11]) и И. М. Гельфандом в 1959 г. [17]4 как условие устойчивости (допустимости) разрыва. На разрыве, помимо RRH-условия, также должно выполняться E-условие: , , , , если ; , , , , если . Это условие также называют энтропийным условием, энтропийным условием О. А. Олейник, E-условием О. А. Олейник. Объяснение (основанное на методе исчезающей вязкости, см. п. 2.1.3) того, откуда возникло E-условие (и RRH-условие) будет приведено в п. 2.3.1. Заметим также, что в классе кусочно-постоянных начальных условий (аппроксимируюРабота [17] представляет собой запись курса лекций, сыгравшего важную роль в популяризации теории квазилинейных уравнений и законов сохранения, которые И. М. Гельфанд читал на мехмате МГУ в 1957–1958 гг.
4
77
щих класс ограниченных измеримых начальных условий) добавление Е-условия как условия отбора возможных разрывов к соотношению (3) однозначно и конструктивно определяет динамику t , x (нужно также оговориться, что кусочно-гладкая функция Q не имеет точек сгущения нулей второй производной). Отмеченная конструктивность, активно использовалась в 70-х и 80-х годах XX века, например, при исследовании модельных задач п. 2.3. Е-условие имеет наглядную (см. рис. 5) геометрическую интерпретацию (для определенности считаем ): график функции Q при , лежит не ниже прямой, проходящей через точки
, Q и
, Q . При этом скорость движения разрыва
c
равна наклону этой прямой. Для случая вогнутой функции Q разрыв устойчив тогда и только тогда, когда дав точкам разрыва двигаться вдоль характеристик, мы сразу же получим многозначное решение [11; 17–19] (разрыв будет опрокидываться подобно морской волне).
Рис. 5. E-условие
Пример (см. [18]). Снова возьмем уравнение Хопфа и начальное условие 78
1, x 0, 1, x 0. Возможны следующие слабые решения задачи Коши (4), (5): 1, x t , x 1, x 0, 2 t , x 1 t , x , t x t , 1, x 0. t 1, x t ,
0, x
«Размазывая» разрыв начальных данных в точке x 0 , т.е. вводя 0, x – монотонно возрастающую непрерывную функцию, совпадающую вне отрезка x с 0, x , мы увидим (используя, например, классический метод характеристик (см. рис. 6), работоспособность которого в данной ситуации обеспечивается отсутствием пересечений у характеристик), что lim (t , x) 1 t , x . 0
Рис. 6
Т.е. неклассическое решение 2 t , x не является устойчивым решением. Несложно проверить, что на разрыве решения 2 t , x не выполня79
ется E-условие, поэтому 2 t , x не является решением. Если посмотреть на поведение характеристик системы, то можно заметить, что для решения 2 t , x разрыв надуман – он не вызван пересечением характеристик. Вместо того чтобы пересекаться на разрыве, характеристики «расходятся» от разрыва. В заключение этого примера заметим, что уравнения семейства характеристик на плоскости t; x имеют вид dx Q t , x . dt Поэтому полная производная по времени от функции t , x вдоль характеристики есть d dx Q Q 0, dt t x dt t x t x т.е. t , x const вдоль характеристики. ■ Отметим, что классический метод характеристик для решения уравнений в частных производных первого порядка может использоваться лишь локально для уравнения (4), т.к. по прошествии некоторого времени характеристики могут начать пересекаться и возникнет неоднозначность: одной точке t , x будут соответствовать несколько, вообще
говоря, разных значений («принесенных» по характеристикам). Собственно, там, где характеристики начинают пересекаться, и возникает разрыв у решения уравнения (5) [19]. Метод характеристик вкупе с условиями на разрыве был одним из первых методов исследования задачи Коши (4), (5). Заметим также, что процесс, описываемый разрывным решением (4), необратим во времени (см., например, [18, 19] и п. 2.3.2). Причем условие разрывности процесса существенно для необратимости. Так в примере О. А. Олейник q t , x при q 1 является разрывным решением (4), (5), для которого выполняется E-условие (как строгое неравенство). Если решать (4), (5) в попятном времени, то неравенство в Е-условии поменяется на противоположное, поэтому если функция q t , x при q 1 удовлетворяла «прямому» Е-условию, то она точно не может удовлетворять «попятному» Е-условию. Заметим, однако, что уравнение (4) выглядит симметричным относительно обращения времени ( t t ), поскольку при попятном течении времени величина потока 80
Q изменяет знак на противоположный. Однако, как уже отмечалось, уравнение (4), понимаемое в слабом смысле, определяет эволюцию системы, вообще говоря, не единственным образом. Выделение единственного решения является необратимой по времени процедурой. Приведем в заключение еще один пример, показывающий отличие закона сохранения (4) от уравнений, описывающих только гладкие решения. Пример (И. М. Гельфанда [17]). Снова возьмем уравнение Хопфа, и запишем его в двух дивергентных формах (задав 0, x 0 , мы
можем быть уверены в том, что везде в дальнейшем t , x 0 ): 2 2 0, t x
2 2
3 3
0. t x Второе уравнение получается умножением уравнения Хопфа на 0 и приведением полученного уравнения к дивергентному виду. Написав для каждого из этих уравнений условие типа RRH на разрыве: ? 2 2 2 2 1 C1 2
2 2 2 3 3 3 3 2 C2 , 3 2 2 2 легко убеждаемся в неэквивалентности этих дивергентных форм (если рассматривать обобщенные решения). Мы написали «условие типа RRH», потому что пользуемся обобщением этого условия: q q c на разрыве решения уравнения q 0, t x с 0 . ■ Замечание (см. [20]). Пусть Q 0 ( Q 0 ). ?
Тогда для любого k : 81
Q k Q ( Q k Q )
существует такая положительная гладкая функция , что уравнение (4), умноженное на , будет иметь скорость разрыва k .
2.1.2. Модель Танака Приведем один из способов определения зависимости V , предложенный в 1963 г. Танака и др. [8, 21] (по-видимому, этот способ был известен значительно раньше). Рассматривается однополосный поток АТС. Пусть скорость АТС не может превышать v max . Плотность
v
1 , d v
где
d v L c1v c2 v2 – среднее (безопасное) расстояние между АТС при заданной скорости v движения потока,5 L – средняя длина АТС, c1 – время, характеризующее реакцию водителей, c2 – коэффициент пропорциональности
тормозному пути (см. также п. 2.2.3). Из зависимости d v можно получить зависимость (1) V , удовлетворяющую условию (2).
Коэффициент c2 , вообще говоря, зависит от дорожных условий. Так при нормальных условиях [21]: d v м 5,7 м 0,504 с v м с 0,0285 с2 м v2 м2 с2 , для мокрого асфальта [22] d v м 5,7 м 0,504 с v м с 0,0570 с2 м v2 м2 с2 , а для обледенелой дороги [22] d v м 5,7 м 0,504 с v м с 0,1650 с2 м v2 м2 с2 . 5
d v также называют динамическим габаритом или дистанцией видимости, и понима-
ют под d v часть полосы, содержащую АТС вместе с дистанцией экстренного торможения.
82
Моделью Танака называют LWR модель, в которой уравнение состояния V определяется так, как описано выше. Несмотря на свою простоту, модель Танака играет очень важную роль в современных исследованиях транспортных потоков [8].
2.1.3. Модель Уизема Следующим шагом (упомянутым еще в 1955 г. и окончательно предложенным в 1974 г. Дж. Уиземом [7]) был учет «дальнозоркости» водителей: D t , x t , x v t, x V t, x , D 0 . t, x x Откуда, с учѐтом закона сохранения количества АТС: v 0, t x получим уравнение типа Бюргерса (закон сохранения с нелинейной дивергентной диффузией): Q (6) D . t x x x Появившиеся в правых частях новые (по сравнению с (1) и (4)) диффузионные слагаемые соответствуют тому факту, что водители снижают скорость при увеличении плотности потока АТС впереди и увеличивают при уменьшении. Гидродинамическая (макроскопическая) модель (2), (5), (6) называется моделью Уизема. В случае (Б. Гриншилдс (1934)), когда Q – парабола (вогнутая), D ( 0 ) можно показать, что уравнение (4) сводится с помощью линейной замены переменных и неизвестной функции: t t , x x , к уравнению (Бэйтмена–) Бюргерса (играющему важную роль в гидродинамике (см., например, работы Х. Бэйтмена (1915), Ж. Лерэ (1934), Дж. Бюргерса (1940), Э. Хопфа (1950))): 2 2 , 0. t x x
83
С помощью замены (Форсайта–) Флорина–Хопфа–Коула [4, 7, 19] (см. также замечание в конце этого пункта): w 2 ln w 2 x ; x w задача (4), (5) (для уравнения Бюргерса) сводится к задаче Коши для уравнения теплопроводности: 6 1 x w 2 w 2 , w 0, x exp 0, d . 2 t x 0 Используя этот факт, Э. Хопф в 1950 г. изучал поведение решения начальной задачи Коши для уравнения Бюргерса [7, 14]. Так, например, им был обоснован предельный переход (получивший название метода исчезающей вязкости7) при 0 от уравнения Бюргерса к уравнению Хопфа: 0. t x В связи с вышесказанным напомним, что для нелинейного закона сохранения (4) гладкое решение задачи Коши (4), (5) существует, как правило, только в малой окрестности линии, где заданы начальные условия. По разрывным начальным условиям решение задачи Коши для нелинейных уравнений, вообще говоря, не определяется однозначно даже в сколь угодно малой окрестности линии, где заданы начальные условия. Для того чтобы задача Коши для нелинейных уравнений с гладкими или разрывными начальными условиями была однозначно разрешима в бόльшей области, необходимо рассматривать разрывные решения уравнения и по-новому ставить задачу Коши. Казалось бы, что достаточно (следуя идеям Н. М. Гюнтера, С. Л. Соболева, Л. Шварца в линейном случае) равенства (4), (5) понимать в слабом смысле (понимать (4) в смысле соотношения (3)). Однако (см. пример О. А. Олейник из п. 2.1.1) такое определение решения не обеспечивает его единствен6
Причина, по которой уравнение Бюргерса линеаризуется, объясняется в [23] и связана с тем, что уравнение Бюргерса достаточно симметрично (допускает бесконечномерную алгебру Ли (группу преобразований)). Интересно заметить, что есть определенная техника, позволяющая по заданному эволюционному уравнению определять, линеаризуется ли оно или нет. Для более подробного ознакомления с групповым анализом дифференциальных уравнений можно рекомендовать монографии [24] и [25]. Заметим также, что при определенных (специально подобранных) начальных условиях могут быть получены точные формулы для решений ряда важных в приложениях существенно нелинейных уравнений параболического (и не только) типа (см. работы К. А. Волосова и его учеников [26]). 7 Хотя в рассматриваемом нами случае речь идет скорее о диффузии, чем о вязкости.
84
ности. Корректный способ заключается в том, чтобы понимать решения задачи Коши (4), (5) t , x как предел (почти всюду по x при любом фиксированном значении t 0 ) при8 0 , D : D , D 0 решений задач Коши (6), (5) t , x :
t , t ,
L1
t (оценка Н. Н. Кузнецова (1975)).
При этом t , x – ограниченная измеримая функция, не зависящая от D 0 , слабо удовлетворяющая закону сохранения (4) и начальному условию (5). Так определѐнную функцию t , x часто называют энтропийным решением задачи Коши (4), (5) (см. также замечание в конце п. 2.3.2). Это представляется естественным. Ведь оба уравнения (4) и (6) возникли (на разных уровнях детализации) при описании одного явления. Обоснованием метода исчезающей вязкости интенсивно занимались в 50-е годы XX века (Э. Хопф, О. А. Олейник, А. Н. Тихонов и А. А. Самарский, П. Лакс, О. А. Ладыженская, И. М. Гельфанд и др.). Наиболее общие результаты получил С. Н. Кружков в конце 1960-х гг. (подробности см. в [11; 27–36], а также в конце п. 2.3.2). Заметим, что уравнение (6) параболического типа, следовательно, решение можно понимать в обычном (классическом) смысле даже при разрывных начальных условиях. Для таких нелинейных уравнений развит достаточно эффективный аппарат. Прежде всего это различные варианты принципа максимума и основанные на них методы априорных оценок старших производных [37, 38] (С. Н. Бернштейн, И. Г. Петровский, О. А. Олейник, О. А. Ладыженская и др.), позволяющие довольно тонко исследовать различные свойства решений начально-краевых заПодчеркнем, что независимость предела от вида диффузионного слагаемого обусловлена тем, что диффузия входит дивергентным образом в правую часть уравнения (6). Если бы, скажем, уравнение (6) имело вид Q 2 D 2 , t x x то предел, вообще говоря, уже зависел бы от вида D . В чем легко убедиться, рас8
смотрев пример И. М. Гельфанда (см. п. 2.1.1). Отметим тем не менее, что если в пределе при D 1 получается функция без разрывов, то предел по-прежнему не будет зависеть от D 0 .
85
дач для уравнений параболического типа. Напомним, в чем заключается принцип максимума: решение уравнения параболического типа достигает максимального и минимального значений на параболической границе (основание и боковые стороны) области, в которой рассматривается это решение (вместо уравнений можно рассматривать и неравенства). Так, например, решение начальной задачи Коши для уравнения параболического типа ограничено теми же постоянными, что и начальное условие. Установив различные свойства решения задачи Коши (6), (5) и осуществив предельный переход при 0 , можно получать разнообразные свойства решения задачи Коши (4), (5). Посредством «хорошего» уравнения (6) попытаемся теперь установить связь между законом сохранения и уравнением Гамильтона– Якоби (Г–Я). Для этого рассмотрим две приводимые ниже задачи Коши: Q 2 (7) x x 2 , t 0, x 0, x U 2U U Q , x x 2 t (8) x U 0, x 0, y dy. 0 Как уже отмечалось, для следующей задачи Коши (в частности, для задачи Коши (7)): Q D , D 0 , t x x x
0, x 0, x существует почти всюду по x при любом фиксированном значении t 0: lim t , x t , x . 0
Используя схожую технику, можно показать, что lim U t , x U t , x 0
равномерно на любом компакте в полуплоскости t 0 , x . Причѐм U t , x – ограниченная непрерывная функция, которая слабо удовлетворяет уравнению Г–Я:
86
U U Q 0 t x
(9)
и начальному условию x
U 0, x U 0 x 0, y dy .
(10)
0
Так определенную функцию U t , x называют вязкостным решением (Крэндалла–Лионса) задачи Коши (9), (10).9 Поскольку решения задач (7) и (8) классические, то имеет место следующая формула: U t , x . t , x x Из того, что почти всюду по x при любом фиксированном значении t 0: lim t , x t , x 0
следует, что почти всюду по x при любом фиксированном значении t 0: U t , x lim t, x . 0 x Рассмотрим следующую каноническую задачу (Лагранжа) оптимального управления понтрягинского типа (см., например, [39, 40]): 9
t
J t , x; u L , x , u d t0 , x0 , t0
x f , x , u , u , x t x . Положим «функцию цены» U t , x равной
U t , x inf J t , x; u , U t0 , x t0 , x . u
Тогда с некоторыми оговорками справедлива следующая теорема (см., например, [41, 42]). Теорема (принцип Беллмана). U t , x является вязкостным решением начальной задачи Коши для прямого уравнения Гамильтона–Якоби–Беллмана (Г–Я–Б): U U U U sup , f t , x, u L t , x, u Q 0 , U t0 , x t0 , x . t u x x t Приведенная основная теорема динамического программирования наряду с принципом максимума Понтрягина является базой теории оптимального управления. Причѐм из этой теоремы мы получаем управление в форме синтеза u t , x , а не в программном виде
u , как в принципе максимума, что более ценно для приложений. Отметим также, что динамическим программированием, как правило, пользуются лишь при небольших размерностях фазового пространства управляемой динамической системы.
87
В случае выпуклой (вогнутой) функции Q или U 0 x установлено, что почти всюду по x при любом фиксированном t 0 : U t , x U t , x (11) lim t, x . 0 x x Используя теорему о дифференцировании (по направлению) под знаком супремума10, можно проверить, что для вязкостного решения U t , x справедливы следующие формулы, встречавшиеся в работах Э. Хопфа (1965), которые принято называть формулами Хопфа (–Лакса):11 1) Пусть U 0 x – выпуклая функция, тогда U t , x sup sx Q s t U 0* s , s
где
U 0* s sup sx U 0 x ; x
2) Пусть Q – вогнутая функция, тогда U t , x inf U 0 x tf Q* f t , f
где Q* f sup Q s sf . s
Аналогичные формулы можно выписать и для выпуклой функции Q или вогнутой функции U 0 x . Проверим, например, формулу из 1). Для этого сразу заметим (ввиду выпуклости U 0 x ), что
См. [43, 44] (формулы Хопфа см. там же [44]). Необходимые для понимания факты выпуклого анализа имеются, например, в книгах [45, 46]. Теорему о дифференцировании (по направлению) под знаком супремума иногда называют теоремой Демьянова–Данскина, поскольку оба автора независимо пришли к аналогичному утверждению в конце 60-х годов XX века [43]. Однако эта теорема была известна и раньше. Так, в середине 60-х годов XX века А. Я. Дубовицкий и А. А. Милютин при получении принципа максимума для задач с фазовыми ограничениями доказали и фактически уже использовали теорему о дифференцировании (по направлению) под знаком супремума [39, 47]. 11 Аналогичные формулы возникали ранее, например, в работах О. А. Олейник и П. Лакса; приблизительно в то же время, что и в работах Э. Хопфа, эти формулы использовал С. Н. Кружков; близкие идеи ―о сведении решения задачи Коши для обыкновенного нелинейного дифференциального уравнения или для нелинейного уравнения в частных производных к решению задачи(-ач) оптимизации‖ предлагались в 1965 г. (и ранее) Р. Беллманом и Р. Калабой [48]. Упомянем здесь также работу Б. Н. Пшеничного и М. И. Сагайдака [49]. 10
88
U 0, x U 0** x U 0 x (теорема Фенхеля–Моро [45]). По теореме о дифференцировании (по направлению) под знаком супремума U t , x t Q s t , x , U t, x x t, x s t, x ,
где s t , x = arg sup sx Q s t U 0* s s
– точка как функция параметров t , x , в которой достигается максимум по s выражения sx Q s t U 0* s . Отсюда следует, что U t , x
U t , x Q Q s t , x Q s t , x 0 . t x Для наглядности считаем, что супремум достигается в одной единственной точке (поэтому написано arg , а не Arg ). Можно показать, что супремум достигается не в одной точке тогда и только тогда, когда в этой точке функция t, x s t, x терпит разрыв. Собственно, формула t , x s t , x Arg sup sx Q s t U 0* s s
дает энтропийное решение задачи (4), (5) в случае неубывающей начальной функции 0, x , если под t , x договориться понимать многозначную функцию, которая принимает в точках разрыва всевозможные значения из отрезка, соответствующего скачку разрыва. Используя далее теорему о дифференцировании под знаком супремума и соотношение (11), можно также получить и формулы для энтропийного решения задачи Коши (4), (5) t , x (заметим, что формула, полученная из пункта 2), называется формулой Лакса–Олейник [11, 42]). Упомянутые здесь формулы использовались, например, при исследованиях задач п. 2.3. В частности, С. Н. Кружков и Н. С. Петросян в 1982 г. получили доказательство утверждения, очень близкого к теореме 1 п. 2.3.1, исходя из формулы 1). Замечание (идемпотентный принцип соответствия Литвинова–Маслова [50–52]). Рассмотрим уравнение теплопроводности w 2 w t x 2 89
и уравнение Гамильтона–Якоби–Хопфа: U 1 U 2U . t 2 x x 2 Несложно проверить, что замена (схожую замену также делал Э. Шредингер) U 2 ln w переводит одно уравнение в другое. Таким образом, кстати сказать, и была получена замена Флорина–Хопфа–Коула русским механиком В. А. Флориным в 1948 г. (на два года раньше Э. Хопфа и на три года раньше С. Коула). Используя при 0 замену w 2 ln w U , т.е. 2
def
def
lim w w lim 2 ln w U ,
0
0
В. П. Маслов и В. П. Белавкин [50] в конце 80-х годов XX века предложили ввести идемпотентное (также говорят, тропическое) полуполе (от обычного поля полуполе отличается тем, что в нем отсутствует операция, обратная сложению (вычитание)) с операциями сложения и умножения , , которые определяются следующим образом: w1 U 1 , w2 U 2 ; e , lim 2 ln e
w1 w2 lim 2 ln eU
0
min lim 2 ln eU 0
1
2
1
2
U 2 2
U 2 2
0
min U 1 ,U 2 U 1 U 2 ; def
w1 w2 lim 2 ln eU 0
lim 2 ln eU 0
1
2
1
2
eU
2
2
lim 2 ln e 0
def
U 2 2
U 1 U 2 U 1 U 2 . Далее строился функциональный анализ над идемпотентным полуполем подобно тому, как строился обычный функциональный анализ над полем действительных или комплексных чисел. Построение такого анализа выявляет много связей (иногда называемых принципами соответствия (Литвинова–Маслова)) между классическими понятиями. Скажем, идемпотентным аналогом преобразования Фурье будет преобразование Юнга–Фенхеля–Лежандра [45], а вариационные принципы
90
механики – это идемпотентный вариант фейнмановского подхода к квантовой механике через интегралы по траекториям. Кстати сказать, все это тесно связано с формулами типа Лакса–Олейник. Однако здесь мы хотим обратить внимание прежде всего на то, что для некоторых нелинейных уравнений (Г–Я, Г–Я–Б) справедлив принцип суперпозиции (В. П. Маслова), правда, не над обычными полями действительных или комплексных чисел, а над идемпотентным полуполем: если U 1 , U 2 – решения, то для любых действительных чисел 1 , 2 U 1 U 1 2 U 2 также является решением. В заключение этого пункта, в котором мы пояснили, что понимается под решением задачи Коши (4), (5), приведем, следуя монографии [33], оценку устойчивости решения t , x; 0, x , Q задачи Коши для закона сохранения (4) с начальной функцией 0, x и с функцией потока Q по 0, и Q :
t , ; 1 0, x , Q1 t , ; 2 0, x , Q2 1 0, 2 0,
L1
L1
t min T.V. 1 0, , T.V. 2 0, Q1 Q2
Lip
,
где T.V. – total variation (полная вариация), а def Q Q2 Q1 Q2 Lip sup 1 . Отметим, что приводимая выше оценка при Q1 Q2 следует из аналогичной оценки устойчивости по начальным данным решения задачи Коши для уравнения (6), которая в свою очередь является следствием принципа максимума для параболических уравнений. Заметим, что эта оценка (для уравнения (6)) обеспечивает единственность (с точностью до почти всюду по x при любом значении t 0 ) энтропийного решения задачи Коши (4), (5). Обратим также внимание на равномерность по времени оценки устойчивости по начальным данным (для уравнений (4) и (6)).
91
2.1.4. Модель Пэйна и еѐ обобщения12 Следующим важным шагом стала модель Пэйна (1971) [7, 53] (модель Пэйна–Уизема (см. п. 2.1.3)). Эту модель можно понимать как закон сохранения v 0, t x в котором уже не предполагается зависимость скорости от плотности (уже не предполагается, что желаемая скорость устанавливается мгновенно). А для скорости выписывается уравнение13 D d v v 1 v v v V dt t x x стремления реальной скорости v к желаемой скорости D , V x причѐм ( 1 с) характеризует скорость стремления (в электротехнической терминологии – время релаксации; если же уподоблять транспортный поток сжимаемой неньютоновской (максвелловской) жидкости, то параметр характереризует максвелловское затухание [54]). Полученную систему уравнений запишем в виде 1 0 v (12) , t v D v x v V v из которого легко следует строгая гиперболичность этой системы (матрица при x имеет различные вещественные собственные значения). Интересно заметить следующий, достаточно общий, факт: основное отличие гидродинамических моделей транспортных потоков от соответствующих гидродинамических аналогов заключается в правых частях, возникающих, как правило, гиперболических (строго) систем уравнений и их диффузионных аналогов. Действительно, первое уравнение системы Пэйна есть просто «закон сохранения массы» (в дивергентной форме), а второе уравнение – «закон сохранения (изменения) импульса», приведенное к дивергентной форме, имеет вид
12 13
Этот пункт написан совместно с Я. А. Холодовым. В литературе принято называть моделью Пэйна частный случай описанной модели:
D c02 0 .
92
v t
v2 P x
1
v V ,
где «давление» P
1
D d . 0 Отмеченное обстоятельство представляется естественным. Ведь «транспортная жидкость» – это жидкость с мотивацией (стремление двигаться с желаемой скоростью), которая и присутствует в правой части. Это замечание позволяет использовать в расчетах по гидродинамическим моделям транспортных потоков хорошо разработанные более чем за полвека вычислительные алгоритмы (например, схемы П. Лакса, С. К. Годунова, сеточно-характеристический метод (Магомедова– Холодова) и др.), см., например, [4, 11, 18, 33; 54–56] и цитированную там литературу. 14 Хорошим тестом на устойчивость выбранной разностной схемы является разложение конечных разностей по пространственной переменной в ряд Тейлора до второго порядка включительно и исследование матрицы при вторых производных (аппроксимационной вязкости) на положительную определенность [54, 55]. Напомним также вкратце (нам это понадобится в п. 2.2.4), следуя книге П. Лакса [11] (см. также [54, 55]), в чѐм заключается метод численного решения начально-краевой задачи для закона сохранения, предложенный С. К. Годуновым в конце 50-х годов XX века. Начальное условие 0, x аппроксимируется кусочно-постоянной функцией 14
0, x k , k x k 1 , где – шаг по пространству, а k – среднее от 0, x на промежутке k , k 1 , т.е.
k
1
k 1
0, x dx .
k
Задача с начальными данными 0, x может быть решена точно. В каждой точке k мы должны решить задачу Римана о распаде разрыва (см. п. 2.3.1). «Волны», выходящие из двух соседних точек разрыва k и k 1 , не пересекаются, пока t cmax 2 , где
cmax max Q – максимальная скорость распространения возмущения. Итак, объединив решения задач Римана, можно получить точное решение. В момент времени 2cmax – шаг по времени (такой выбор шага иногда называют условием Лакса, причем автоматически выполняется необходимое условие Куранта–Фридрихса–Леви [2]
cmax
1
сходимости разностных схем при численном решении гиперболических
уравнений), мы опять заменим это точное решение приближенной кусочно-постоянной функцией и повторим процесс. Численные эксперименты говорят о том, что метод Годунова дает хорошее приближение точных решений уравнений LWR и систем типа Пэйна.
93
Заметим также [19, 29], что уже для системы двух законов сохранения (система Х. Пэйна (12) как раз представляет пример такой системы, причѐм имеется ещѐ и нелинейная правая часть) в общем случае неизвестно, как корректно определять глобальное по времени обобщенное решение. Метод исчезающей вязкости для систем оказывается уже чувствительным к выбору положительно определѐнной матрицы D в правой части (проблема неединственности решения) [18]. Тем не менее для строго гиперболической системы законов сохранения с одной пространственной переменной за последние 15 лет был достигнут определѐнный прогресс (см. [11; 29–36]): в общем случае построена глобальная теория существования, единственности и устойчивости по начальным данным.15 Отметим, что теория была построена разными способами, в том числе и c помощью метода исчезающей вязкости (так построенное обощенное решение часто называют энтропийным): 0 , D : I , где I diag 1, ..., 1 Тем не менее строгое доказательство устойчивости схемы Годунова имеется, насколько нам известно, лишь для конкретных систем. Но (поскольку всего одна пространственная переменная) если схема Годунова сходится, то непременно к энтропийному решению [34] (см. следующий абзац основного текста). Отметим сильную «качественную» связь (которую, впрочем, можно обосновать и теоретически) между описанной схемой Годунова, схемами бегущего счета, схемой потенциального сглаживания [18] и сеточно– характеристическмим методом [57]. Отметим также в чѐм-то схожий «front tracking» метод [33, 34], в котором не решение аппроксимируется (кусочно-постоянной функцией), а вектор-функция потока (в скалярном случае Q ) аппроксимируется кусочно-линейной функцией. С помощью этого метода (так же как в свое время с помощью метода Годунова) недавно были получены продвижения в вопросах корректности начальной задачи Коши для системы законов сохранения [33, 34]. В заключение заметим, что схема Годунова для LWR модели может быть содержательно проинтерпретирована (см. п. 2.2.4). Другими словами, можно было ничего не знать про LWR-модель и из естественных соображений «напрямую» прийти к разностной схеме С. К. Годунова (в транспортной литературе принято разностные схемы называть моделями клеточных автоматов (см. п. 2.2)). Как показывает практика, очень важно (при гидродинамическом описании транспортного потока, по сути, «дискретного» объекта) выбирать разностную схему таким образом, чтобы она могла быть самостоятельно содержательно проинтерпретирована. 15 Особо отметим в этой связи работу Д. Глимма (1965) [11, 34], предложившего стохастическую модификацию метода Годунова ( k 0, k , где R 0,1 – равномерно распределенная на отрезке 0,1 случайная величина), с помощью которой была установлена теорема существования для начальных данных, близких к константе (имеющих малую полную вариацию). Отметим также в этой связи, что в методе Годунова «закон(-ы) сохранения» выполняется(-ются) точно (и эта «консервативность» очень важна, как отмечал в 2004 г. во время доклада в МИАН РАН С. К. Годунов, иначе довольно быстро могут накапливаться ошибки), а в методе Глимма точно «в среднем». Выступление С. К. Годунова можно посмотреть здесь http://www.mathnet.ru/php/presentation.phtml?option_lang=rus.
94
– единичная матрица (с единицами на диагонали и нулями на других позициях). Желание «размазать разрывы решений» привело от модели LWR к модели Уизема. Это же желание мотивировало и введение в модель Пэйна диффузионные поправки. Заметим, что, вводя в правую часть системы диффузионные (дисперсионные) поправки, мы, как правило, решаем вопрос о том, что мы понимаем под решением [54]. Иначе говоря, для корректной (и адекватной «физике процесса») постановки начальной (начально-краевой) задачи Коши для системы законов сохранения важно знать, как эта система «была приготовлена». Откуда и как она возникла: что огрубили, чем пренебрегли и т.д. На таком пути получаются новые модели: Р. Кюна (1993), Кернера–Конхойзера (1994) (см. п. 2.4) и др. В [58] приведен достаточно подробный обзор работ (более 100 моделей). Здесь мы также упомянем некоторые подходы российских ученых (в которых обобщается подход Х. Пэйна): Н. Н. Смирнова, А. Б. Киселѐва и др. (МГУ) [59–61]; А. С. Холодов и др. (МФТИ) [62]. Несколько недостатков модели Пэйна (и многих впоследствии предложенных моделей, в том числе с диффузионными поправками) были указаны К. Даганзо (Даганцо) (1995) [56, 58, 63] (см. также критику Б. С. Кернера в [10], отчасти приведенную в п. 2.4 и главе 3). В частности, было показано, что при сильных пространственных неоднородностях начальных условий могут возникать отрицательные значения скоростей (затор «рассасывается назад» как результат действия вязкости). При определенных значениях параметров могут возникать плотности, превышающие максимально допустимые («бампер к бамперу»). Также, согласно этим моделям, на движение АТС заметное влияние оказывают АТС, находящиеся сзади, что в случае одной полосы вряд ли возможно в реальном транспортном потоке. В начале XXI века А. Эу и М. Раскль [64], Дж. М. Гринберг [65], Х. М. Чзан [66] показали, как можно устранить недостатки, отмеченные К. Даганзо. Основная идея заключается в изменении второго уравнения в системе Пэйна: v p v p d v p v 0. dt t x При этом требуется, чтобы p 0 . В частности, для «давления» p были предложены следующие формулы:
p , 0
А. Эу и М. Раскль (2000)
p V
Дж. М. Гринберг (2001), Х. М. Чзан (2002) 95
В конце статьи [64] указано, что можно оставить релаксационное слагаемое в правой части второго уравнения системы типа Пэйна: d 1 v p v V . dt При этом все положительные приобретения сохраняются, но добавляются и новые. За последние десять лет появилось большое количество статей (А. Эу, А. Клар, П. Гоатэн, Р. Коломбо, М. Гаравелло, Б. Пикколи, Ф. Сиебель и В. Маузер, Д. Хельбинг (Хельбин) и др., см. сайт http://arxiv.org/), в которых модель Эу–Раскля обобщалась в различных направлениях. Например, в [67], для того, чтобы объяснить экспериментально обнаруженные Б. С. Кернером (1996) [10] три фазы транспортного потока (см. также главу 3): «газ, жидкость (свободное движение) – жидкость, замерзающая жидкость (синхронизированный режим движения) – замерзающая жидкость, лед (широко движущиеся кластеры)». Эти исследования, по-видимому, мотивированы желанием так обобщить (в классе систем из двух уравнений гиперболического типа) гидродинамическую модель Эу–Раскля, чтобы предложенная модель объясняла все основные наблюдаемые свойства транспортного потока. Естественно теперь задаться вопросом: «переходят» ли модели типа Пэйна при 0 (предел нулевой релаксации) в модель Уизема или модель LWR? Интуиция подсказывает, что должны переходить (так же, как и в п. 2.1.3, можно ссылаться на то, что описывается одно и то же явление на разных уровнях детализации). Однако в общем случае, насколько нам известно, нет строгого обоснования такого перехода. Ссылки на различные успешно исследованные случаи имеются, например, в работах [30, 64]. В заключение этого пункта упомянем модель третьего порядка Хельбинга–Эйлера–Навье–Стокса (1995) [58, 68], в которой к системе уравнений Пэйна добавляется третье уравнение («закон сохранения энергии») для вариации (дисперсии) скорости (характеризующей «разброс скоростей» относительно среднего значения). При этом во второе уравнение (которое понимается как уравнение для среднего значения скорости) вводится дополнительное слагаемое, зависящее от . Заметим при этом, что для системы уравнений Навье–Стокса, описывающей движение вязкой ньютоновской жидкости, не известно в общем случае, как поставить начальную (начально-краевую) задачу Коши, чтобы глобальное решение (определенное при всех значениях времени) было единственным. За решение этой проблемы математический институт Клея в 2000 г. назначил премию в один миллион долларов. Естест96
венно считать, что если уравнение описывает реальный процесс, то оно обязано решаться (притом единственным образом). Однако выбранные уравнения – это лишь некоторая модель описываемого явления (возможно не всегда вполне адекватная), и «механизм», выбирающий единственное решение, мог быть «огрублен» при выводе уравнений. Особенно, если описываемый процесс чувствителен к малейшим возмущениям, флуктуациям. Интересные взгляды на проблему имеются в статьях О. А. Ладыженской [69] и В. И. Юдовича [70]. Так, в статье [69] проблема единственности переформулирована следующим образом: «Дают ли уравнения Навье–Стокса с начальными и краевыми условиями детерминистское описание динамики несжимаемой жидкости или не дают?» Сложности, возникающие при описании транспортного потока, во многом схожи со сложностями, возникающими при описании турбулентного движения жидкостей (см. статью А. Майда в сборнике [30], а также [71]). 2.1.5. Кинетические модели Продолжая аналогию с газовой динамикой, будущий нобелевский лауреат по химии И. Пригожин (при участии Ф. Эндрюса и Р. Хермана) в 1960 г. предложил описывать транспортный поток кинетическим уравнением (типа Больцмана с «интегралом взаимодействия АТС» вместо «интеграла столкновения частиц газа») [56, 58, 72]. Подход И. Пригожина был впоследствии развит в работах С. ПавериФонтана (1975), Д. Хельбинга (1995) и др. [56, 58]. Из кинетических моделей транспортного потока (в основном многополосного) можно получать макроскопические (гидродинамические) модели подобно тому, как в кинетической теории получаются уравнения газовой динамики (гидродинамики), т.е. с помощью умножения на различные функции от скорости и последующего интегрирования по скоростям кинетического уравнения для плотности в расширенном (на скорости) фазовом пространстве t; x; v . При этом, вообще говоря, будет получаться цепочка зацепляющихся уравнений.16 Так, если Заметим, что современное понимание классической неравновесной статистической м еханики основывается на во многом схожей теории цепочек уравнений Боголюбова– Борна–Грина–Кирквуда–Ивона (ББГКИ) [73]. Впрочем, в последнее время появился новый интересный подход (см. работы В. В. Козлова с коллегами [74]), восходящий к работам А. Пуанкаре и Дж. Гиббса. Много интересных идей и разнообразных связей собрано в записях курса лекций В. В. Веденяпина, прочитанного несколько лет назад студентам МФТИ и МГОУ и посвященного кинетической теории [75].
16
97
умножить кинетическое уравнение на единицу и проинтегрировать, получим уравнение для плотности («закон сохранения массы»), в которое будет входить средняя скорость. Если умножить кинетическое уравнение на скорость и проинтегрировать, получим уравнение для средней скорости («закон сохранения (изменения) импульса»), в которое будет входить вариация скорости (по сути, определяющаяся средним значением квадрата скорости). Если умножить кинетическое уравнение на квадрат скорости и проинтегрировать, получим уравнение для среднего значения квадрата скорости (откуда можно получить уравнение для вариации скорости), в которое будет входить среднее значение куба скорости, и т.д. Приходится в какой-то момент обрывать (замыкать) цепочку, привлекая, как правило, дополнительные «физические» соображения (гипотезы). Например, постулировать (на основе экспериментов или другим способом) для замыкания моментной цепочки некоторые соотношения (так называемые определяющие уравнения) между величинами, входящими в эти уравнения. Так, для газа в зависимости от этих соотношений получается модель идеального газа или модель Навье– Стокса–Фурье (вязкий теплопроводный газ) [36]. В связи с вышесказанным уместно заметить, что классической задачей статистической физики, восходящей к работам Максвелла [36], [75], является исследование перехода от уравнения Больцмана к уравнениям газодинамики (гидродинамики). Центральным местом здесь является проблема замыкания моментной цепочки для решения уравнения Больцмана. Однако не менее важным является изучение перехода от стохастической марковской динамики (например, транспортных потоков), лежащей в основе движения (см. п. 2.2.4), к кинетической динамике. При этом стохастическая марковская динамика (заданная, как правило, линейной полугруппой) порождает за счет скейлинга или перехода к «динамике средних» нелинейные кинетические уравнения (например, типа Больцмана–Пригожина), которые в свою очередь порождают нелинейные гидродинамические уравнения. Важно заметить, что без понимания этих «переходов» невозможно, на наш взгляд, правильно объяснить экспериментальные данные: три фазы транспортного потока. В заключение отметим, что имеются также модели, промежуточные между кинетическими и гидродинамическими моделями, так называемые мезоскопические. Такой моделью двухполосного движения пользуется, например, коллектив, возглавляемый Б. Н. Четверушкиным (см. [76, 77]).
98
2.1.6. Практические приложения моделей Несмотря на элементарность, модель LWR (а также ее дифференциально-разностные и разностные аналоги) достаточно популярна в прикладных расчетах. Во многом это связано с недостаточным объемом данных для использования моделей более высокого уровня (поправки, привносимые более тонкими моделями, нивелируются неточностью данных). Ряд современных коллективов исследователей сосредотачивается на решении начально-краевых задач для уравнения (4) на графе транспортной сети. Основные сложности при этом возникают при постановке краевых условий в узлах графа транспортной сети (см., например, [78, 79]). Модель LWR (точнее ее разностные аналоги) хорошо подходит и для управления транспортными потоками. В подтверждение этих слов приведем некоторые идеи, использованные, например, в подходе Берклиевской группы (А. Б. Куржанский, А. А. Куржанский, П. Варайя, Р. Хоровитц и др. [80, 81]) к управлению дорожным движением.
Рис. 7
99
Из фундаментальной диаграммы следует, что одному и тому же значению потока АТС соответствуют разные (как правило, две) плотности и, как следствие, разные скорости. 17 Очевидно, что более выгодным режимом является режим с большей скоростью (см. рис. 7): потоки будут удовлетворены в том же количестве, однако среднее время движения снизится, поскольку движение будет проходить при больших скоростях (и, как следствие, с меньшими плотностями).
Рис. 8. Треугольная фундаментальная диаграмма
Задача управления (скажем, светофорами или въездами на основные магистрали) заключается в том, чтобы как можно большую часть времени среднестатистический водитель проводил именно в таких режимах. Исходя из модели клеточных автоматов [82, 83] (CTM – Cell Transmission Model, см. п. 2.2.4) К. Даганзо = схема Годунова (1959) для (4) + треугольная фундаментальная диаграмма18 (см. рис. 8), был предложен Это обстоятельство является также причиной сложностей, возникающих при постановке краевых условий в узлах (вершинах) графа транспортной сети [34, 78, 79]. Знание характеристик источников и стоков и матриц перемешивания в узлах (матриц, характеризующих расщепление потоков в узлах) недостаточно для корректной постановки начальнокраевой задачи. 18 Также часто используется трапецеидальная фундаментальная диаграмма. Например, диаграмму на рис. 2 более естественно аппроксимировать именно трапецеидальной диаграммой, а не треугольной. 17
100
способ «оптимального управления» светофорами и въездами на магистрали, а также способ «оптимального разрыхления» однородного потока АТС на магистрали (с помощью светофоров) с целью уменьшения среднего времени в пути [80, 81]. Несмотря на то, что с момента появления первых фундаментальных работ прошло более полувека, по мнению ряда ведущих специалистов в области математического моделирования дорожного движения (К. Нагель, Х. Махмасани, М. Шрекенберг и др.), проблема образования предзаторных и заторных ситуаций еще до конца не изучена. Используя терминологию, предложенную Б. С. Кернером [10] (см. также главу 3), можно сказать, что на текущий момент нет общепринятого подхода, описывающего поведение АТС в области «синхронизированного потока». Иначе говоря, если поток АТС уподобляется жидкости, то наиболее сложная для моделирования ситуация – это «замерзающая жидкость». Подтверждением вышесказанному может служить тот факт, что разные коллективы, занимающиеся моделированием транспортных потоков, как правило, используют разные модели: начиная от модели LWR (М. Гаравелло и Б. Пикколи [34, 78]; А. А. Куржанский и др. [80, 81]), заканчивая моделями, в которых каждый водитель описывается своим вариационным принципом (И. А. Лубашевский и др. [86, 87]). Отметим также, что большое количество исследований сосредотачивается на изучении транспортного потока на отдельном прямолинейном участке транспортной сети с простейшими начально-краевыми условиями. В то время как причиной заторов (согласно К. Даганзо [63]) часто являются «узкие места» (перекрестки, въезды). Поэтому особенно важно (для приложений) создать целостную модель транспортных потоков, адекватную имеющимся данным, включающую описание источников, стоков АТС и поведение АТС в вершинах графа транспортной сети (перекрестки, въезды, выезды и т.п.).
101
2.2. МИКРОСКОПИЧЕСКИЕ МОДЕЛИ В пункте 2.2 будет рассказано о некоторых подходах к микроскопическому моделированию движения в основном однополосных транспортных потоков. В основе подходов лежит концепция «о желании придерживаться при движении безопасной дистанции до лидера». Также будет рассказано о связях, имеющихся между микроскопическими и макроскопическими моделями. Прежде всего будут описаны модели оптимальной скорости и следования за лидером. Также будет описана одна из наиболее популярных моделей (за последние десять лет) – модель разумного водителя Трайбера. В заключение этого пункта будут приведены модели клеточных автоматов (которые часто являются, по сути, разностными аналогами определенных макроскопических моделей), в том числе востребованные в приложениях. 2.2.1. Модель оптимальной скорости Ньюэлла Пусть АТС в однополосном потоке пронумерованы слева направо. Обозначим через sn t – координату центра n-го АТС в момент времени t 0 . Положим hn t sn 1 t sn t , vn t sn t .
Рис. 9. Микроскопическая модель
В микроскопической модели Ньюэлла (эта модель была предложена в 1961 г. и является одной из первых нелинейных моделей оптимальной
102
скорости [7, 88]) постулируется, что (для каждого водителя существует «безопасная» скорость движения, зависящая от дистанции до лидера): vn t V 1 hn t , где – время, характеризующее реакцию водителей, и V 0 . Заметим, что по зависимости интенсивности потока Q V от плотности в окрестности max (максимально возможное значение плотности также часто обозначается как j (см., например, [7])) можно определить , если известна средняя длина АТС L [7] ( L 5,7 м): L Q max ( 0, 4 с для рис. 2). Действительно, путь V , пройденный АТС за время , не должен превышать расстояния до впереди идущего АТС 1 L . Поэтому поведение потока (уравнение состояния) вблизи точки max 1 L можно описать следующим образом: 1 L . V
Откуда имеем в левой окрестности точки max Q
L
max . Иногда в этих формулах вместо средней длины АТС L фигурирует среднее расстояние между соседними АТС в заторе d 7,5 м (из рис. 2 следует, что d 6,5 м). Приведенные в этом абзаце формулы активно используются при исследовании роста затора [10] (см. также п. 2.4). Отметим также, что если известна средняя длина АТС, время, характеризующее реакцию водителей, и желаемая скорость свободного потока (определяет наклон левой ветви фундаментальной диаграммы), то треугольная фундаментальная диаграмма однозначно строится (рис. 8). Вернемся к модели. Введѐм функции двух переменных h t , x , t , x 1 h t , x , v t , x , задав их значения в полуплоскости t 0 , x , на счѐтном наборе кривых согласно формулам 103
s t sn 1 t h t, n hn t , v t , sn t vn t . 2
Считая hn t и малыми величинами и учитывая, что
v t , sn t V t , sn t 1 2 hn t , d h t , sn t 1 2 hn t v t , sn 1 t v t , sn t , dt
получим
v t , sn t vt t , sn t v t , sn t v x t , sn t
V t , sn t V t , sn t x t , sn t 1 2 h t , sn t , ht t , sn t v t , sn t hx t , sn t v x t , sn t h t , sn t .
Умножая второе уравнение на 2 и опуская у функций аргументы (продолжая «по непрерывности» t , x и v t , x со счетного набора близких кривых на полуплоскость t 0 ), придем к системе V v vt vv x V x , 2
t v x 0 . Таким образом, мы «вывели», следуя [7], модель Пэйна, получив новую интерпретацию для и D V 2 . Если бы мы с самого начала полагали 0 , то в результате выполнения указанных выше операций пришли бы к модели Уизема. А если бы еще пренебрегли слагаемым 1 2 V x h в сравнении с V (напомним, что мы считаем h – малым), то получили бы модель LWR. Использованный выше прием называют автомодельной редукцией. Хорошим примером автомодельной редукции является вывод Д’Аламбером (1780) волнового уравнения исходя из модели колебания струны (с закрепленными концами), состоящей из множества одинаковых шариков (известной массы), соединенных одинаковыми пружинками (известной длины и жесткости), имеющими нулевую
104
массу. Поведение каждого шарика описывается вторым законом Ньютона (для отклонения шарика от положения равновесия u (см. рис. 10)) и зависит (посредством закона Гука) только от положений соседних шариков.
Рис. 10. Колебания струны, Д’Аламбер (1780)
Таким образом, получается система обыкновенных дифференциальных уравнений, из которой с помощью предельного перехода (шарики выбираются все меньше и меньше, пружинки, соединяющие шарики, становятся все меньше и меньше) получается одно уравнение в частных производных – волновое уравнение, описывающее колебание струны. Другой, более современный (середина 50-х годов XX века), пример автомодельной редукции: задача Ферми–Паста–Улама (вывод уравнения Кортевега–де Фриза (1895)) – см. [89] и цитированную там литературу. Следует заметить, что приѐм автомодельной редукции (достаточно популярный в математической физике) является эвристическим (для приведенных выше выкладок это особенно очевидно, если вспомнить, что, например, плотность может терпеть разрывы – и ни о каких оценках малости отбрасываемых членов ряда Тейлора не может идти и речи). В данной задаче при 0 частичная обоснованность (схожесть, причѐм в некотором смысле равномерная по времени, в поведении решений (начальных задач), полученных по исходной модели Ньюэлла, и по моделям LWR и Уизема) автомодельной редукции следует из результатов [18, 33; 90–111] (см. также п. 2.3.1). Пусть поток АТС однороден и стационарен: t, x , v t, x V . 105
Приведем, следуя [7], условие устойчивости в линейном приближении этого режима движения, считая, что транспортный поток описывается 1) моделью Ньюэлла; 2) моделью Пэйна19 с D V 2 . В обоих случаях ответ одинаков: 2 2 V 1 .
19
Рассмотрим систему Пэйна. Будем искать решение в виде t , x r t , x , v t, x V w t , x ,
считая r t , x , w t , x вместе с частными производными, входящими в систему, малыми. Линеаризуем систему Пэйна: разложим нелинейные функции в ряды Тейлора (до первого порядка включительно) по степеням r и w . Оставим в полученной системе только те слагаемые, которые содержат только первые степени r t , x , w t , x и их производных (так, например, слагаемые, содержащие rx r или rw , будут отброшены). Будем далее искать решение линеаризованной системы Пэйна в виде z exp ikx it . Подставляя этого кандидата в линеаризованную систему Пэйна, получим систему двух линейных уравнений A k , z exp ikx it 0 . Из условия разрешимости системы
det A k , 0
получим дисперсионное соотношение (используя аналогию с распространением электромагнитных волн в дисперсионных средах, можно сказать: ―получим зависимость частоты от волнового числа k 2 (или длины волны )‖):
: V k i Q k D k 2 0 . 2
С некоторыми оговорками любое решение начальной задачи Коши для линеаризованной системы может быть представлено в виде интеграла по многообразию k , (теорема Эренпрайса–Паламодова) z k , exp ikx it d k , ,
где k , и z k , Ker A k , подбираются так, чтобы выполнялось начальное условие (см., например, фундаментальный труд Л. Хѐрмандера [112]). Из такого представления следует, что для устойчивости стационарного решения (возмущения стационарного решения со временем затухают) достаточно (а с незначительными уточнениями и необходимо) потребовать, чтобы многообразие , которое можно представить в виде двух кривых (корней квадратного уравнения – дисперсионного соотношения): 1 k , 2 k , k , лежало в полупространстве Im 0 . Приходим к выписанному далее условию устойчивости.
106
Эта формула объясняет экспериментально установленный факт: при больших значениях плотности поток АТС становится неустойчивым. По этой причине его трудно адекватно описывать. Обратим также внимание на одно интересное обстоятельство. Оказывается, модель Ньюэлла при 0 соответствует хорошо известной экономистам (и подробно изученной) модели Полтеровича– Хенкина, описывающей распространение новых технологий [97–101; 104–106]. Для обнаружения соответствия достаточно выписать, исходя из модели Ньюэлла, цепочку дифференциальных уравнений для скоростей v n t . Если интерпретировать скорость v n t как функцию распределения Fk t предприятий в отрасли производства по уровням эффективности k n , то получим цепочку уравнений Полтеровича– Хенкина. Заметим, что модель Ньюэлла тесно связана со схемами бегущего счѐта и дивергентными схемами С. К. Годунова (см., например, [18, 33, 54, 55], а также п. 2.1.4). Но в отличие от разностных схем в модели Ньюэлла время течѐт непрерывно. Если же дискретизировать время по схеме Эйлера в этой модели, то получится разностная схема, принадлежащая упомянутым выше классам разностных схем, устойчиво аппроксимирующая закон сохранения. Заметим также, что модель Ньюэлла с 0 тесно связана с моделью Танака (см. п. 2.1.2). Для того чтобы установить связь, нужно разрешить (и выбрать физически осмысленное решение) относительно v n t следующее уравнение:
sn 1 t sn t L c1vn t c2 vn t . 2
2.2.2. Модель следования за лидером Дженерал Моторс Другим важным классом микроскопических моделей (наряду с моделями оптимальной скорости) являются модели следования за лидером [8, 10, 56, 58, 113]. В 1959 г. сотрудники концерна Дженерал Моторс Д. Газис, Р. Херман, Р. Потс [58, 113] предложили одну из первых (первыми, повидимому, были модели А. Рѐшеля (1950) и Л. Пайпса (1953)) нетривиальных микроскопических моделей однополосного транспортного потока (обозначения те же, что и выше), с помощью которой можно
107
получить фундаментальную диаграмму. Простейшим предложенной модели является следующая модель: s t sn t sn t n 1 , 0. sn 1 t sn t
вариантом
Ускорение n-го АТС sn t прямо пропорционально разности скоростей: vn t sn 1 t sn t
(если vn t 0 , то sn t 0 – ускорение n-го АТС; vn t 0 – торможение; vn t 0 – стационарный режим (ускорение равно нулю)) с коэффициентом пропорциональности (чувствительности) обратно пропорциональным расстоянию до впереди идущего АТС: hn t sn 1 t sn t . Перепишем эту модель следующим образом: dvn t d ln hn t , dt dt или h t vn t vn ln n . hn 0 Положим vn 0 , hn 0 1 max . Тогда (в обозначениях предыдущего пункта) 1 V ln max , . L Эта зависимость была экспериментально обнаружена Х. Гринбергом также в 1959 г. по данным для туннеля Линкольна в Нью-Йорке. В 1961 г. Д. Газис, Р. Херман и Р. Розэри предложили следующую модель [56, 113]: sn t
s t
m1
n
s t s t n 1
m2
s
t sn t , 0 ,
n 1
n
где m1 1 , m2 1 – эмпирически подбираемые константы ( m1 0,8 ,
m2 2,8 ). Исходя из этой микроскопической модели (путѐм интегрирования), несложно получить уравнение состояния транспортного потока: 108
1
m2 1 1 m1 0 , V V 1 max
где V 0 – скорость свободного движения (желаемая скорость, максимально возможная скорость). При m1 0 , m2 2 получим уравнение Гриншилдса состояния транспортного потока (см. п. 2.1.3). Заметим, что время реакции 0 вводится в модели следования за лидером по той же причине, что и в модель Ньюэлла: для неустойчивости в линейном приближении стационарного режима движения при больших значениях плотности.
2.2.3. Модель «разумного водителя» Трайбера Модели оптимальной скорости и следования за лидером можно объединить в одну общую микроскопическую модель разумного водителя (Intelligent Driver Model (IDM)): sn t F sn 1 t sn t , sn 1 t sn t , sn t .
Как показали численные эксперименты, наиболее «удачной» моделью этого класса является20 модель М. Трайбера (Трайба) (1999) [10, 56, 58, 114, 115]: 2 * sn t d n sn t , sn 1 t sn t sn t an 1 0 . sn 1 t sn t Vn Первое слагаемое s t an 1 n 0 Vn в правой части этого соотношения описывает динамику ускорения АТС на свободной дороге, в то время как второе слагаемое описывает торможение из-за взаимодействия с лидером (впереди идущим АТС). Собственно модель
Калибровка и численные эксперименты с этой моделью показали, что ее свойства устойчивы к вариации параметров; модель демонстрирует реалистическое поведение при разгоне и торможении и воспроизводит основные наблюдаемые свойства однополосн ого транспортного потока.
20
109
s t sn t an 1 n 0 Vn даже более естественно называть моделью оптимальной скорости, чем, скажем, модель Ньюэлла, которая, скорее, ближе к моделям следования за лидером, а модель 2 * d s t , s t s t n 1 n n n sn t an 1 sn 1 t sn t естественно называть моделью следования за лидером. Очевидно, что параметр отвечает за поведение при разгоне (при 1 имеет место экспоненциальный по времени разгон, в пределе при разгон происходит с постоянным «комфортным» ускорением an вплоть до достижения желаемой скорости Vn0 ). Тормозящий член
определяется отношением желаемой дистанции d n* (безопасным расстоянием) к фактической дистанции: hn t sn 1 t sn t , причем желаемая дистанция определяется следующим образом: sn t sn 1 t sn t , d n* sn t , sn 1 t sn t d n Tn sn t 2 an bn
где d n – расстояние между АТС ( n -м и n 1 -м) в заторе (естественно, что d n L , где L 5,7 м – средняя длина АТС, и, действительно, принято считать, что dn 7,5 м), bn – ускорение «комфортного» торможения ( an bn 2 м с2 ), Tn – аналог времени реакции водителя. Поясним предложенную для безопасного расстояния формулу. Пока водитель n-го АТС среагирует на изменение ситуации впереди, он проедет путь Tn sn t . Потом, «поняв, что надо, скажем, тормозить» ( sn 1 t sn t ), он успеет выровнять свою скорость со скоростью впереди идущего АТС (двигаясь с ускорением торможения bn ) до момента,
когда достигнет n 1 -е АТС, только если расстояние в момент, когда «пришло понимание» между n-м и n 1 -м АТС, было не меньше 110
sn t sn 1 t sn t
.
2 an bn
Ситуация, когда надо ускоряться ( sn 1 t sn t ), рассматривается аналогичным образом. Собственно, из-за желания охватить «одной формулой» две довольно разные ситуации (ускорение и торможение) и возник знаменатель 2 an bn . Заметим, что в правилах дорожного движения (ПДД) некоторых стран величина Tn достаточно жестко регламентирована (ограничена снизу ПДД). Так, например, в США от водителя требуют увеличивать безопасное расстояние (считается, что впереди идущее АТС имеет ту же скорость) на длину АТС L при увеличении скорости на 5 м/с (т.е. на 18 км/ч). Таким образом, Tn 5,7 [м] 5 м с 1,1 с, что хорошо согласуется с оценками этой величины, приведенными (см. п. 2.1.4) и полученными (см. п. 2.2.1) ранее. В равновесном потоке одинаковых АТС, когда sn t 0 , sn 1 t sn t 0 , sn t V : 1 2
d V sn 1 t sn t d * V ,0 1 V V 0 . Из этого соотношения (считая, что v 1 d V ) можно сначала построить уравнение состояния транспортного потока – зависимость V , а потом фундаментальную диаграмму Q . В пределе при def
так построенная фундаментальная диаграмма будет стремиться к треугольной (см. рис. 8): 1 d Q min V 0 , . T В этой формуле (а также и в других формулах этого пункта) вместо среднего расстояния между соседними АТС в заторе d 7,5 м пишут также среднюю длину АТС L 5,7 м (см., например, п. 2.2.1). В частном случае, когда 1 , d n 0 м (отметим, что в этом случае адекватность модели в значительной степени сохраняется), можно найти и аналитическое выражение для равновесной скорости V .
111
2.2.4. Модели клеточных автоматов21 В моделях клеточных автоматов (Cellular Automata (CA)) дорога разбивается на клетки, дискретным считается и время. Часто (но далеко не всегда [80–83], см. также ниже в этом пункте) считается, что в клетке может находиться не больше одного АТС. Таким образом, получаются разностные аналоги рассматриваемых ранее макроскопических уравнений. Заметим также, что часто и множество возможных значений скорости АТС считают дискретным в таких моделях. Концепция клеточных автоматов была введена Дж. фон Нейманом (Нойманом) в 50-е годы ХХ века [116] в связи с разработкой теории самовоспроизводящихся машин. Применять клеточные автоматы для моделирования транспортных потоков предлагалось в работе [117]. Однако активное использование этой концепции началось только после работы К. Нагеля и М. Шрекенберга [118] (подробности см. в обзорах [119, 120]). Опишем вкратце модель Нагеля–Шрекенберга (1992). В CA-модели на каждом шаге m m 1 состояние всех АТС в системе обновляется в соответствии со следующими правилами. Шаг 1. Ускорение (отражает тенденцию двигаться как можно быстрее, не превышая максимально допустимую скорость): vn m 1 min vn m 1, vmax . Шаг 2. Торможение (гарантирует отсутствие столкновений с впереди идущими АТС): vn m 1 min vn m , sn 1 m sn m d , где d 7,5 м (см. п. 2.2.3). Шаг 3. Случайные возмущения (учитывают различия в поведении АТС): max vn m 1, 0 , p, v n m 1 v n m , 1 p. Шаг 4. Движение: sn m 1 sn m vn m . Все четыре приведенных шага необходимы для воспроизведения основных свойств транспортного потока. Так, например, шаг 3 обуслав-
21
Этот пункт написан совместно с Я. А. Холодовым.
112
ливает неустойчивость транспортного потока при достаточно больших плотностях. В работах [121, 122] описан переход от моделей типа Нагеля– Шрекенберга к гидродинамическим моделям (типа Бюргерса, Хопфа) – гидродинамический предельный переход. А в работе [123] описан обратный переход – ультраметрический предельный переход. Продемонстрируем, следуя М. Л. Бланку [124–126] (см. также приложение М. Л. Бланка и цитированную там литературу), один из способов вывода уравнения состояния V , исходя из довольно простой CA-модели. Рассмотрим кольцевую дорогу, состоящую из n ячеек (клеток). В каждой ячейке может находиться не более одного АТС. Длины всех ячеек одинаковы и равны (условной) единице. Будем также считать, что n достаточно большое. Если брать не кольцевую топологию, а, скажем, бесконечную прямолинейную дорогу (полосу), то по n необходимо будет сделать «термодинамический предельный переход» (это понятие пришло из статистической физики, см., например, [127] и цитированную там литературу) – устремить n к бесконечности, «сохраняя пропорции». Пусть в начальный момент времени в некоторые из ячеек поместили АТС. Обозначим через 0 1 долю занятых ячеек. Будем считать, что сначала все АТС «смотрят» в следующую по ходу движения ячейку, а потом те из АТС, для которых эти ячейки оказались свободными, независимо от остальных двигаются в свободную ячейку с вероятностью 0 p 1 . И так происходит на каждом шаге по времени. Определим среднюю пространственную скорость: def 1 n V S m Vi m . n i 1 Тогда по эргодической теореме для марковских процессов (см. приложение Е. В. Гасниковой) при 0 p 1 средняя временная скорость каждого АТС (при p 1 см. [124]) п.в. п.в. 1 N Vi m V lim Vi S m . N N m m 1 Зависимость «средней» скорости V от плотности изображена на рис. 11, из которого становится ясно, что фундаментальная диаграмма, соответствующая рис. 11, будет треугольного типа. Ввиду простоты модели несложно качественно объяснить приведенную на рис. 11 зависимость. def
Vi T lim
113
Рис. 11. «Фазовый переход» при 1 2
Для дальнейшего знакомства с CA-моделями см. [128]. Оказывается, что простые модификации рассматриваемых здесь моделей демонстрируют [119, 126, 128], что одной плотности соответствует целый набор средних скоростей, или последнее понятие может не быть корректно определено. С точки зрения фазовых переходов описанное поведение соответствует возникновению новой «гистерезисной» фазы, которая, по-видимому, соответствует режиму синхронизированного движения (см. [10] или главу 3). Интересные идеи исследования многополосности (которые также объясняют экспериментальную «размазанность» фундаментальной диаграммы) недавно были предложены А. П. Буслаевым и др. (кафедра высшей математики МАДИ) [129–131]. Для описания транспортного потока использовалась модель Танака (см. п. 2.1.2), в которую помимо плотности и скорости еще вводился «параметр регулярности», с помощью которого ―часть водителей АТС «разрыхляет регулярное движение» для того, чтобы осуществить относительное перемещение внутри потока‖. Отметим также, что с помощью моделей такого типа удалось теоретически объяснить невогнутость фундаментальной диаграммы (рис. 2) в случае многополосного движения. Перейдем теперь к другому типу клеточных моделей, которые, по сути, являются разностными аналогами рассматриваемых ранее уравне114
ний. В п. 2.1.6 мы уже упоминали одну из таких моделей (CTM модель). Приведем схему, в которую «ложатся» многие модели этого класса. Ограничимся ситуацией магистрали (вообще говоря, многополосной) с въездами и выездами. Разобьем магистраль на клетки (ячейки) – прямолинейные участки дороги длиной не менее сотни метров. Будем считать (не ограничивая общности), что в каждую клетку имеется только один въезд и из каждой клетки имеется только один выезд (см. рис. 12). Тогда ni m 1 ni m ri m qi 1 m si m qi m , si m i qi m , где ni m – число АТС в i-й клетке в момент времени m .
Рис. 12
Так, в работах [84, 85] (рассматривалась кольцевая топология транспортной сети без въездов и выездов) полагали qi m 1 i Qi ni m 1
– аналог схемы бегущего счета для модели LWR. Очевидным недостатком этой схемы является возможность следующих «неправдоподобных» ситуаций (считаем i 0 и ri m 0 ). Предположим, что есть две клетки (без въездов и выездов). Первая клетка полностью загружена (в ней максимальная плотность АТС – «стоячая пробка»), а следующая по ходу движения клетка полностью свободна (в ней нет АТС). Тогда согласно выбранному способу описания потока АТС ничего происходить не будет, т.е. ситуация со временем меняться не будет. В то время как из опыта известно, что АТС начнут «перетекать» в свободную клетку. Предположим теперь, что первая клетка загружена, например, наполовину, а в следующей по ходу движения клетки – стоячая пробка. Тогда qi m 0 , а модель говорит об обратном. Тем не менее исследование
115
«до критических режимов» – «левая (возрастающая) ветка» фундаментальной диаграммы с помощью этой модели вполне корректно. В работах [80–83] (рассматривался случай треугольной фундаментальной диаграммы (см. рис. 8), «вершина» которой имеет координаты ni , Qimax ) полагали
max qi m min 1 i vi ni m , Qimax , Qimax 1 , ni 1 ni 1 m wi 1
– аналог схемы Годунова (см. п. 2.1.4) для модели LWR с треугольной фундаментальной диаграммой (CTM-модель К. Даганзо (1994)). Поясним обозначения: Q max – скорость свободного потока, vi i ni Qimax 1 – скорость волны от перегрузки, n ni 1 т.е. скорость роста затора. Другими словами, если перекрыть дорогу (при условии, что движение было достаточно плотным ni 1 m ni 1 ), wi 1
max i 1
то образовавшийся затор будет расти со скоростью wi 1 – длина затора через время t после перекрытия будет равна wi 1t . Теперь должно становиться ясно, в чем преимущество схемы Годунова, например, над схемой бегущего счета. В заключение заметим, что для длинных участков дороги, включающих довольно много клеток, координаты ni , Qimax не зависят от индекса i . Можно обобщить CTM-модель на графы транспортной сети более сложной топологии, чем кольцевая или линейная магистраль. Правда, для этого потребуется знать матрицу перемешивания в каждом узле графа транспортной сети. Кроме того, нужно дополнительно (по сравнению с магистральной топологией) прописать разрешение «конфликтных ситуаций» (знания матрицы перемешивания может оказаться не достаточно). Например, таких, как следующая: пусть имеется перекресток. Две трети водителей с входящей в перекресток дороги A хотят повернуть на выходящую с перекрестка дорогу C, и две трети водителей с входящей дороги B также хотят повернуть на дорогу C. Будем считать, что двухполосная дорога C может пропустить 4000 АТС/час (максимальная пропускная способность). Дороги A и B также двухполосные, и на обеих из них поток АТС, входящий в перекресток, по 4000 АТС/км. Очевидно, что ситуация не доопределена. Для понимания того, что бу116
дет происходить, необходимо еще знать, например, режим работы светофора в этом перекрестке (в случае его наличия). Таким образом, реальное расщепление потоков зависит не только от матрицы перемешивания, но и, например, от режима работы светофора. Зная матрицу перемешивания и «беря на вооружение» правило работы светофора, можно получить упомянутое обобщение рассмотренных моделей на графы транспортной сети общего вида. Аналогично можно рассмотреть и более сложные развязки. Здесь также можно упомянуть, что еще в 1936 году молодой профессор Московского университета А. Н. Колмогоров в письме в журнал «Строительство Москвы», по сути, обсуждал вопрос, связанный с правильной организацией перекрестка [132]. Кстати сказать, проходившее в августе 2010 года обследование различных развязок г. Москвы специалистами из Японии, приглашенными руководством г. Москвы, показало «не оптимальность» ряда важных развязок. Как уже отмечалось, несмотря на свою относительную простоту, CTM-модель является одной из наиболее востребованных в приложениях (см., например, [80–83] и цитированную там литературу). Что касается изучения аналитических свойств этих моделей (полученных с помощью разностных схем для LWR-модели), то, повидимому, проще исследовать все-таки дифференциально-разностные аналоги LWR-моделей, т.е. считать, что время течет непрерывно [84, 85]. Разностные схемы (в том числе и упомянутые выше) очевидным образом переделываются в дифференциально-разностные, при этом необходимое условие Куранта–Фридрихса–Леви (см. п. 2.1.4) корректности схемы, аппроксимирующей уравнение LWR (шаг по времени достаточно мал по сравнению с шагом по пространственной переменной), выполняется автоматически. В связи со всем вышесказанным возникает задача: исследовать положения равновесия – стационарные режимы (а также бассейны их притяжения, отталкивания) динамической системы на графе транспортной сети общего вида, полученной с помощью дифференциальноразностной схемы Годунова из LWR-модели (с треугольной или параболической фундаментальной диаграммой). В 2004 г. для схемы бегущего счета исследования в этом направлении были предприняты А. П. Буслаевым и др. [84] для графов специальной структуры (кольцевой, «цветочной» и т.п.). В 2006 г. А. И. Назаров обобщил результаты статьи [85] на графы общего вида. Однако, как уже отмечалось выше, схема бегущего счета – не самый подходящий вариант для описания транспортного потока во всевозможных состояниях. В диссертации 2007 г. А. А. Куржанского [80] исследовалась асимптотическая устойчивость (глобаль117
ная) положений равновесия (образующих многообразие с довольно простой и полностью описанной линейной структурой) для CTM-модели (схема Годунова + треугольная фундаментальная диаграмма) транспортных потоков на магистрали (т.е. с простой топологией графа транспортной сети). Выпишем систему обыкновенных дифференциальных уравнений (СОДУ) на графе транспортной сети,22 используя лишенную деталей модификацию правила «пропорциональных приоритетов» [81, 83]: d i min i j min j v j , Q max , min imax i wi , Qimax j dt j: j i
max max min k k wk , Qk min i vi , Q min 1, , kl min l vl , Qlmax k : i k l: l k здесь каждое ребро ориентированного графа транспортной сети пронумеровано, i – плотность потока на i-м ребре, i j – доля потока АТС на ребре j , ответвляющаяся на ребро i . Обратим внимание, что в общем случае следует считать i j t , . Причем если учитывать задержки в узлах графа транспортной сети, связанные, например, с наличием све тофоров, то, вообще говоря, ki t , 1 . Имеются и другие «правиi k
max i
k : i k
ла обработки» узлов графа транспортной сети (см., например, [34, 78, 79]). Упражнение ** (мотивированное работами [80, 84, 85]). Для каждой замкнутой транспортной сети (можно обобщить и на открытые сети) стационарный режим будет устойчивым, если значения стационарных плотностей «лежат» на левых (возрастающих) ветках соответствующих треугольных фундаментальных диаграмм.
Для простоты считаем, что нет источников и стоков АТС, в противном случае их следовало бы учитывать, например, подобно тому, как это было сделано выше.
22
118
2.3. МОДЕЛЬНЫЕ ЗАДАЧИ В пункте 2.3 будут приведены решения ряда модельных задач. Основная задача – это задача об эволюции затора (локального, глобального) в предположении, что транспортный поток описывается моделью LWR, моделью Уизема, моделью Ньюэлла, моделью Пэйна. Будет определена скорость распространения затора. Заметим, что, как будет показано в этом пункте, информация о заторе, вообще говоря, может распространяться по транспортному потоку не только в виде одной (бегущей, ударной) волны, но и в виде системы таких волн, в которую могут также входить и волны разрежения. В заключение будет рассмотрена (путем решения ряда модельных задач об эволюции затора по модели LWR) задача Лайтхилла–Уизема о светофоре: при каком соотношении между временами горения красного и зеленого сигналов светофора перед ним не будет скапливаться очередь? 2.3.1. Эволюции глобального затора в транспортном потоке, описываемом моделями LWR и Уизема Для простоты изложения будем везде в дальнейшем в этом пункте считать, что Q – кусочно-гладкая функция, имеющая кусочно-гладкие производные до четвертого порядка включительно и не имеющая точек сгущения нулей второй производной. Напомним необходимые соотношения (по модели LWR): Q (13) 0, t x , x 0 0, x (начальное условие Римана), (14) , x 0 , x x 0, x 0 x , x x x (начальное условие типа Римана), (15) , x x
где 0 x – ограниченная измеримая функция (см. рис. 13, 14). Для определенности будем считать в формулах (14), (15) . Случай рассматривается аналогично и может быть заменой
119
сведен к случаю (с Q : Q ). Задача Коши (13), (14) называется задачей (Римана) о распаде (произвольного) разрыва.
Рис. 13. Начальное условие Римана
Рис. 14. Начальное условие типа Римана
120
Рис. 15 Ударная волна
Рис. 16. Волна разрежения
121
Для того чтобы понять, какое решение будет иметь задача Коши (13), (14) (впрочем, частично ответ на этот вопрос мы уже можем дать, основываясь на примерах, разобранных в п. 2.1.1), заметим сначала, что: закон сохранения (13) имеет однопараметрическое ( x0 – параметр) семейство автомодельных решений вида ударной волны (см. рис. 15): , ,
x ct
x x0 ct , x x0 ct
тогда и только тогда, когда на разрыве этой ударной волны выполняется RRH-условие и E-условие; закон сохранения (13) имеет двухпараметрическое ( t t ; x x a ) семейство автомодельных решений вида волны разрежения (см. рис. 16): x Q t , , x x g Q1 , Q t x Q t , (16) t t , x Q t ( Q1 означает обратную функцию к функции Q )
тогда и только тогда, когда Q 0 при , , за исключением, быть может, конечного числа точек, в которых имеет место равенство (напомним, что ). Замечание. По поводу автомодельных решений см., например, [1, 133, 134], а также более ранние книги этих авторов. Грубо говоря, автомодельные решения – это решения рассматриваемого уравнения в частных производных, которые могут быть представлены как функции (в данном случае) одного аргумента, зависящего от пространственных и временных переменных (т.е. от t и x ). Групповой анализ указывает на то, что если автомодельные решения существуют, то прежде всего их следует искать в виде неизвестной функции от инвариантов (сконструированных из аргументов неизвестной функции (т.е. от t и x )) группы преобразований, допускаемой рассматриваемым уравнением. Поясним сказанное немного подробнее. Хорошо известно, что сфера, например, допускает группу ортогональных преобразований (всевозможных поворотов), т.е. сфера будет переходить сама в себя при таких преобразова122
ниях. С другой стороны, на сферу можно смотреть, как на многообразие, заданное хорошо известным уравнением. Групповой анализ предлагает смотреть на уравнение в частных производных, как на многообразие, заданное этим уравнением в продолженном (на различные частные производные) пространстве. Правда, в отличие от обычных многообразий, на класс возможных групп преобразований налагается условие, по сути, определяющее действие группы на продолженных переменных, через действие группы на неизвестную функцию и еѐ аргументы. В качестве примера укажем, что закон сохранения (13) допускает группу трансляций по времени и по координате, группу подобных преобразований временной и пространственной переменной. Это означает, что вид уравнения (13) не поменяется при заменах: t t ; x x a ; t kt , x kx . Отсюда, поскольку x ct (при любом c ) является инвариантом группы трансляций: t t , x x c , а x t является инвариантом группы растяжений: t kt , x kx , в частности, следует, что решение уравнения (13) прежде всего следует попробовать искать в виде x x ct и g . t Роль автомодельных решений (параметрических семейств таких решений) в теории эволюционных (эволюция по времени) уравнений в частных производных часто аналогична роли неподвижных точек в теории обыкновенных дифференциальных уравнений [1; 89–97; 100– 111; 133–144]. Параметрическое семейство автомодельных решений (или семейство, полученное путем «склеивания» автомодельных решений) часто является, например, притягивающим (другие решения) семейством (см. теоремы 1, 2 в п. 2.3.1). Зная приведенный выше (в этом пункте) материал и тот материал, который был изложен в п. 2.1.1, И. М. Гельфанд построил в конце 50-х годов ХХ века (см. [17, 28]) решение задачи о распаде произвольного разрыва, т.е. решение задачи Коши (13), (14). Можно было также добавить (см. п. 2.1.3): «построил с помощью метода исчезающей вязкости». Поскольку, как будет показано ниже в этом пункте, выполнение RRH-условия и E-условия на разрывах обобщенных решений уравнения (13) есть прямое следствие этого метода.
123
Приведем способ построения решения. Строгое обоснование см. в оригинальных, и отчасти монографических, записях курса лекций [28], которые С. Н. Кружков читал в конце 60-х и начале 70-х годов XX века на мехмате МГУ. Для этого введем функцию Q F ** , F Q I , , 0, , , I , , , ,
где F * x sup xy F y y
– функция, сопряженная (по Юнгу–Фенхелю–Лежандру) к F y [45]. Таким образом, Q – нижняя граница выпуклой оболочки множества
, q :
, , q Q .
Будем искать автомодельное решение уравнения Q 0 t x вида
(17)
x
t , x : t (заметим, что x t является инвариантом группы растяжений: x kx , t kt , допускаемой законом сохранения (17)), удовлетворяющее начальному условию (14). Подстановка x t в (17) приводит к обыкновенному дифференциальному уравнению Q 0 .
Откуда с учетом начального условия (14) следует, что x t , x Q 1 ( Q 1 – обратная функция к Q ). t Для уточнений и большей наглядности представим решение немного в другом виде. Положим (см. рис. 17) , : Q Q , , ... , ,
0
124
0
1
1
n
n
c0 Q 0 Q 0 , cn Q n Q n ,
ck Q k Q k (очевидно, что ck 1 ck ), k 1, ..., n 1 ,
где 0 0 1 1 2 ... n1 n n .
Рис. 17. Построение И. М. Гельфанда (1958)
И будем считать (для простоты и наглядности формулировок), что выполняются условия «отсутствия прилипания» [106]: Q 0 при k , k 1 , k 0, ..., n 1 ; Q 0 0 , если 0 0 и Q 0 c0 ; Q n 0 , если n n и Q n cn .
Тогда (см. рис. 18 с d k 0 ) , x c0t , (18) t , x Q1 x t , ck 1t x ck t , k 1, ..., n, , x c t. n Заметим, что по построению мы можем быть уверены лишь в нестрогих неравенствах:
125
Q 0 при k , k 1 , k 0, ..., n 1 ;
Q 0 0 , если 0 0 и Q 0 c0 ; Q n 0 , если n n и Q n cn .
Рис. 18. Система волн
Если же условия «отсутствия прилипания» не выполняются, то все приводимые ниже результаты остаются в принципе верными (с некоторыми несущественными для приложений оговорками), но оценки будут менее точными (см. [110, 111] и цитированную там литературу). Заметим также, что t , x определяется с точностью до почти всюду по x при любом фиксированном значении t 0 (см. п. 2.1.3). Поэтому в формуле (18) можно не доопределять значения t , x на разрывах. Естественно называть разрывы решения (18) ударными волнами, а Q1 x t , ck 1t x ck t , k 1, ..., n – волнами разрежения (волна разрежения исчезает, если ck 1 ck , поскольку в этом случае k 1 k ). 126
Естественно ожидать, что если немного «размазать разрыв» в начальных условиях (14), то решение уравнения (13) будет иметь схожий вид. Иначе говоря, мы ожидаем, что решение задачи Коши (13), (15) будет структурно похоже на (18). Действительно, имеет место следующий факт [14, 90; 93–96; 106, 111] (см. рис. 18). Теорема 1. Существует такой набор
dk k 0 n
(причем если
ck 1 ck , то dk 1 dk ), что решение задачи Коши (13), (15) сходится
при t в L1 x к системе волн
, x c0 t d 0 , t , x; d k k 0 Q1 x t , ck 1t d k 1 x ck t d k , k 1, ..., n, (19) , x c t d . n n Заметим, что в работах [90, 95, 96] также были найдены формулы для расчета d k . Рассмотрим теперь модель Уизема:
n
Q (20) D , D 0 , 0 . t x x x «Построим» решение задачи Коши (20), (15). Поскольку задачи Коши (13), (15) и (20), (15) описывают одно и то же явление (на разных уровнях детализации) – эволюцию («размазанного») глобального затора в транспортном потоке, то мы вправе ожидать, что решение задачи Коши (20), (15) будет структурно похоже на решение задачи Коши (13), (15) и, стало быть, будет вести себя на больших временах подобно системе волн (19). Действуя по тому же плану, что и при исследовании асимптотики (по времени) задачи Коши (13), (15), найдем сначала автомодельные решения уравнения (20). Согласно работам [17, 90]: закон сохранения с диффузией (20) имеет однопараметрическое ( x0 – параметр) семейство автомодельных
решений вида бегущей волны (см. рис. 19): x ct x0 , таких, что
lim s , lim s ,
s
s
тогда и только тогда, когда выполняется RRH-условие
127
c
Q Q
и строгое E-условие (напомним, что )
, , , ;
закон сохранения с диффузией (20) имеет двухпараметрическое семейство асимптотически автомодельных решений (при подстановке такого автомодельного «решения» в уравнение (20) почти всюду возникает невязка (в нашем случае 1 t 2 ), которая стремится к нулю с ростом времени) вида волны разрежения (16) тогда и только тогда, когда Q 0 при , , за исключением, быть может, конечного числа точек, в которых имеет место равенство.
Рис. 19. Бегущая волна
Заметим, что для доказательства всех приведенных утверждений относительно бегущей волны достаточно рассмотреть краевую задачу для обыкновенного дифференциального уравнения с разделяющимися переменными, которое получается при подстановке x ct x0 128
в (20) и интегрировании возникшего уравнения с учетом одного из краевых условий lim s : d s
s
Q s c s Q c D s . ds Заметим также, что RRH-условие получается из оставшегося краевого условия lim s .
s
А строгое E-условие равносильно требованию отсутствия (за исключением s ) особых точек (точек, в которых s 0 ) у этого обыкновенного дифференциального уравнения, что в свою очередь равносильно условию s 0 (поскольку ). Если же допустить существование особой точки s* , , то интеграл
Q c Q c
1
d
будет иметь неинтегрируемую особенность в точке s* . Отсюда следует, что s* или s* . Пришли к противоречию с предположением s* , . Теперь можно объяснить уже анонсированную возможность обоснования RRH-условия и E-условия на разрывах обобщенных решений уравнения (13) с помощью метода исчезающей вязкости: , x ct x0 , x ct x0 x ct x0 1 0 x ct x0 .
Упражнение* (см. [19, 28]). Почему строгое E-условие «переходит в пределе» при 0 просто в E-условие? Замечание (модель Лайтхилла–Уизема–Кортевега–де Фриза– Бюргерса). Если, подобно модели Уизема (см. п. 2.1.3), положить
129
v t, x V t, x
где V t , x
2 t, x 1 t , x , t, x x x 2
– желаемая скорость при данной плотности, а
выражение в скобке описывает «дальнозоркость» водителей (поэтому 0 , 0 ), то получим, с учѐтом закона сохранения количества АТС: v 0, t x уравнение типа Кортевега–де Фриза (Вриза)–Бюргерса (КдФБ): Q 2 3 (21) 2 3 . t x x x Поскольку предложенная модель описывает то же самое явление, что и модель Уизема, то мы вправе надеяться на структурную схожесть автомодельных решений уравнений (20) и (21). Действительно, предположим, что выполняется строгое E-условие, а скорость c определяется формулой RRH. Тогда (см. [138]) если23 Q Q 2 4 sup c , , то существует однопараметрическое семейство строго возрастающих автомодельных решений уравнения (21) вида бегущей волны , x ct x0 . Легко показать, что уравнение (21) при Q 0 ,
, имеет и асимптотическое автомодельное решение вида волны разрежения (16). Интересно при этом заметить, что в отличие от уравнения типа Бюргерса для уравнения типа КдФБ обоснование метода исчезающей вязкости и дисперсии – по-прежнему открытая задача (см. статью П. Лакса в сборнике [30], а также [34, 36]). Имеет место следующий факт (для простоты формулировки (общий случай изложен в статье [110]) также считаем, что ck 1 ck , Если это условие нарушается, то сначала (когда не сильно нарушается) теряется свойство монотонности бегущей волны (возникают затухающие осцилляции типа sin x x при
23
стремлении решения к предельным значениям на краях), а затем автомодельные решения вида бегущей волны вообще перестают существовать. Численное подтверждение этих фактов имеется в работах А. Г. Куликовского с коллегами (см., например, [54, 145] и цитированную там литературу). Аналитические исследования, подтверждающие сказанное выше, были недавно проведены А. В Казейкиной (Вестник МГУ, серия 15. Вычислительная математика и математическая кибернетика. 2011. № 1 (в печати)).
130
k 1, ..., n (или, что то же самое, k 1 k , k 1,..., n )) [14, 90, 92; 102– 110] (см. рис. 20).
Рис. 20. Система волн
Теорема 2. Существует такой набор функций
d t
n
k
k 0
ln t 1 ,
что решение задачи Коши (20),(15) сходится при t в L x (равномерно по x ) к системе волн , x c0 t t , k x ck t d k t , ck t t x ck t t , k 0,..., n, n t , x; d k t k 0 1 Q x t , ck 1t t x ck t t , k 1,..., n, , x c t t , n
131
где k x ck t – решение уравнения (20) вида бегущей волны с lim k s k , lim k s k .
s
s
Замечание (А. М. Ильин, О. А. Олейник (1960)). Можно показать (см. [90, 91, 107, 110]), что если 0 0 и Q 0 c0 , Q 0 c0 , то lim d0 t d0 , t
где d 0 находится из первого интеграла (20) (при t 0 ): I t; d0
t, x x c t d dx 0 . 0
0
0
Полезной находкой А. М. Ильина и О. А. Олейник стало введение функции w t, x
x
t , s s c t d ds , 0
0
0
которая так же, как и t , x , удовлетворяет уравнению параболического типа, но при этом lim w t , x 0 . x
Замечание, аналогичное замечанию Ильина–Олейник, имеет место и для теоремы 1. Замечание (Г. М. Хенкин, А. А. Шананин (2004)). Можно показать (см. [104–106]), что асимптотические оценки сдвигов фаз
d t
n
k
k 0
ln t 1
«разумно» определять из предложенных в работе [104] «локализованных законов сохранения (первых интегралов)»: I k t; dk t
ck t t
t , x x c t d t dx 0 . k
k
k
ck t t
Если приравнять нулю полную производную по времени от I k t; d k t , используя уравнение (20), то получим оценку d k t (приняв априорно за гипотезу, которую апостериорно проверим, что d k t t 1 2 ). Точность оценки определяется значениями разностей: t , ck t t k t d k t и x t , ck t t xk t d k t .
132
Эти значения в свою очередь определяются исходя из исследования сходимости решения к системе волн на участках, соответствующих поведению «волна разрежения». Оказывается, что выбор зависимости t в определении системы волн и в определении локализованных законов сохранения даѐт наилучшую по точности оценку сдвигов фаз, исходя из имеющихся способов оценки разностей. В заключение отметим, что при D 1 в работах [103; 105–106] были найдены первые (логарифмические) члены асимптотических рядов для сдвигов фаз. Недавно Г. М. Хенкиным была высказана гипотеза о том, что следующие члены асимптотических рядов будут ограниченными функциями. Пока, насколько нам известно, не удалось ни доказать, ни опровергнуть эту гипотезу. Замечание. Можно показать (см. [108–110]), что в теореме 2 ско-
рость сходимости есть24 1
3
t , т.е.
1
t , x t , x; d k t k 0 3 . n
t В теореме 1 (см. [35, 90, 95, 96]) скорость сходимости в равномерной норме (за вычетом сколь угодно малых, но фиксированных на момент
рассмотрения окрестностей ударных волн решения) есть 1
t , при-
чѐм эта оценка неулучшаема [90] и достигается на асимптотике вида волны разрежения. Упражнение** (см. п. 2.1.3). При каких условиях уравнение (20) линеаризуется? Попробуйте построить асимптотические ряды для d k t в этих (частных) случаях. Подобно тому, как это было сделано в работе [14] (см. также [7]) для уравнения Бюргерса (в случае общих начальных условий см. [103]). Замечание. Ввиду замечания, касающегося модели Лайтхилла– Уизема–Кортевега–де Фриза–Бюргерса (см. выше), можно ожидать, что результат, аналогичный теореме 2, имеет место и для задачи Коши (21), (15), если только 2 достаточно мало (насколько мало, зависит как от функции Q , так и от начального условия (15)). Для случая, когда 24
Несложно показать (см. [90]), рассмотрев случай сходимости к одной волне разрежения,
что имеет место сходимость не быстрее 1 t . Однако пока в общем случае (при отсутствии прилипания) не доказано (и не опровергнуто), что скорость сходимости в теореме 2
оценивается как 1
t .
133
Q – вогнутая парабола, локальная сходимость к одному из представителей однопараметрического семейства бегущих волн (параметр – сдвиг фазы, определяется аналогично замечанию Ильина–Олейник) была установлена П. И. Наумкиным и И. А. Шишмарѐвым (1991) [139, 140]. Этот результат недавно был перенесен А. В. Казейкиной (при участии А. А. Шананина) на произвольную вогнутую функцию [141]. Для случая, когда Q – выпуклая функция, глобальная сходимость к волне разрежения была установлена Р. Дуанем и Х. Чжао (2007) [142]. Замечание. Интересно также заметить, что все сказанное выше относительно модели Уизема в точности (та же структура асимптотики, те же самые скорости бегущих волн, та же асимптотика у сдвигов фаз dk t ln t ) переносится и на модель Ньюэлла (подробности см. в [97–107]). Для модели Пэйна получено (см., например, [7]) условие существования автомодельного решения вида «бегущей – ударной волны». Оказывается, что скорость такой волны будет удовлетворять формуле RRH. Замечание (Т.-П. Лю и др. (1997)). Результаты о сходимости к бегущей волне и волне разрежения решения начальной задачи Коши (20), (15) могут быть «перенесены» на начально-краевую задачу для уравнения (20) (подробности см., например, в [143, 144]). Приведем в заключение этого пункта схему доказательства теорем 1, 2 и аналогичного утверждения для модели Ньюэлла. Доказательство основывается на следствиях из принципа максимума для линейных параболических уравнений (с коэффициентами, зависящими от t , x ) [37, 38, 136]: на принципе сравнения 1 0, x 2 0, x 1 t , x 2 t , x , t 0
и на принципе сравнения на фазовой плоскости
0, x 0, x 0, x 0, x , x x t , x t , x t , x t , x , x x , t 0 . 1
2
1
2
1
2
1
2
Эти принципы переносятся и на нелинейные параболические уравнения, а также на некоторые их дифференциально-разностные (и просто разностные) аналоги. Идея такого перенесения достаточно простая (и широко используется в теории параболических уравнений [37, 38], например, для оценки старших производных неизвестной функции) – нелинейные коэффициенты при частных производных объявляются некоторыми функциями независимых переменных (в нашем случае 134
t и x ). Далее делаются «априорные» предположения относительно неизвестной функции (как правило, предположения равномерной ограниченности неизвестной функции или(и) существования у нее (равномерно ограниченных) производных). В этих предположениях коэффициенты при частных производных оказываются «настолько хорошими» функциями, что к возникшему уравнению (в котором нелинейные коэффициенты, зависящие от неизвестной функции, интерпретируются просто как некоторые функции независимых переменных) применимы принципы сравнения. Затем, уже с помощью этих принципов, проверяется, что сделанные априорно предположения выполняются. В этой связи также заметим, что иногда априорные предположения выбирают единственное решение из множества возможных. Так, для обычного уравнения теплопроводности априорное предположение, «что решение начальной задачи Коши (с равномерно ограниченной начальной функцией) будем искать в классе равномерно ограниченных функций», приводит начальную задачу Коши в класс корректных (по Адамару), т.е. имеющих и притом единственное решение, устойчивое по начальным данным. Но, как показывает пример А. Н. Тихонова, если не накладывать ограничение на рост решения с увеличением времени, то построенное решение уже не будет единственным [146]. Приведенные принципы сравнения также переносятся и на некоторые уравнения (например, на закон сохранения), которые получаются путем предельного перехода (например, с помощью метода исчезающей вязкости) из нелинейных параболических уравнений. В доказательстве часто в качестве сравниваемых функций выбираются: решение рассматриваемой задачи и специальным образом подобранное автомодельное решение (асимптотически автомодельное решение) либо специальным образом «склеенная» функция из таких решений. При этом значения на x (а также ординаты «склеек», в случае если таковые имелись) у таких автомодельных решений выбираются из множества точек 0 , 0 ,1 ,..., n1 ,n , n
либо из малых окрестностей этих точек, а сдвиги фаз подбираются так, чтобы в начальный момент времени выполнялись условия используемого варианта принципа сравнения. Заметим, что основные идеи описанного подхода к доказательству теорем 1, 2 применялись ранее для исследования асимптотики (по времени) решения начальной задачи Коши для уравнения теплопровод135
ности с нелинейным источником (такого рода уравнения возникают, например, при описании распространения генных волн и пламени). Так, еще в 1937 г. в пионерской работе А. Н. Колмогорова, И. Г. Петровского, Н. С. Пискунова [137] была исследована сходимость к одной бегущей волне. Современное состояние дел отражено в работах [136, 138] и цитированной там литературе. Следуя монографии [136], можно называть сходимость в теореме 2 сходимостью по форме. А согласно терминологии работы [133], системы волн, возникающие в теоремах 1, 2, следует называть промежуточными асимптотиками (заметим (см. теорему 2), что промежуточная асимптотика (система волн), в общем случае сама не обязана являться решением уравнения). 2.3.2. Эволюции локального затора в транспортном потоке, описываемом моделями LWR и Уизема Предположим, что в однородном стационарном транспортном потоке (одна бесконечная полоса без въездов и выездов) образовалось локальное увеличение плотности (локальный затор). Проследим (не строго!) за эволюцией этого «бугорка» (за тем, как будет рассасываться это локальное увеличение плотности). Для этого введем h t АТС/км – «высоту» бугорка и l t км – «длину» бугорка в момент времени t (см. рис. 21). Поскольку площадь бугорка сохраняется (что как раз и отражает закон сохранения количества АТС), то h t l t 2S 0 , где S0 – площадь (размерность площади – АТС) под бугорком. Здесь стоит приближенное равенство из-за того, что бугорок, вообще говоря, не будет в точности иметь вид прямоугольного треугольника (гипотенуза, в общем случае, будет кривой линией и лишь на больших временах достаточно хорошо приближается прямой). Сам факт, превращения (с ростом времени) произвольного бугорка в криволинейный прямоугольный треугольник (так же, как на рис. 7, считаем, что Q 0 0 ) несложно устанавливается с помощью метода характеристик. Перейдем теперь в систему координат, движущуюся со скоростью c0 Q 0 ,
136
где 0 – значение плотности вдали от бугорка. В этой системе координат «скорость разбегания бугорка» можно посчитать по формуле RRH: Q t Q 0 1 l t c0 Q 0 h t , t 0 2 где
t 0 h t – максимальное значение плотности в момент времени t . Таким образом, Q 0 S0 2 S0 1 l t . l t 2 Q 0 S0 t h t l t Q 0 t Сделанные качественные выводы неплохо согласуются с практикой.
Рис. 21. Эволюция локального затора
Приведенные выше рассуждения являются частным случаем более общего и более точного утверждения «об асимптотике вида N-волны» (см. работы П. Лакса, Т.-П. Лю, Р. Ди Перна, К. Дафермоса, С. Н. Кружкова и Н. С. Петросян [2, 7, 11, 35, 93, 96]). Упражнение (см. [35, 42, 96]). Пусть, как и в приведенных выше рассуждениях, Q 0 .
137
Используя формулу Лакса–Олейник (см. п. 2.1.3), строго обоснуйте приведенный выше результат. Выкладки будут особенно простыми, если дополнительно известно, что зависимость Q – параболическая. Для того чтобы описать поведение локального затора согласно модели Уизема, умножим уравнение (20) на t , x 0 L1 x L x и проинтегрируем (по частям)25 по x от до : t , x 2 d 1 t , x 0 dx D t , x dx dt 2 x 2
t , x x dx 0 , 2
Dmin
где
Dmin min D2 0 . 0, max
Полученное неравенство, которое обычно называют энергетическим неравенством [19, 107], отражает тот факт, что процесс эволюции локального затора происходит с диссипацией «энергии». Иначе говоря, «энергия» 2 1 V t , t , x 0 dx 2 есть функционал Ляпунова [135] для уравнения (20) на многообразии таких решений t , x , что t , x 0 L1 x L x . Действительно, L2 x d d V t , 0 при t , x 0 и V 0 0 ; dt dt L2 x
V t , 0 при t , x 0 и V 0 0 .
Кроме того, из энергетического неравенства и из неравенства Харди– Литлвуда–Полиа (частный случай неравенства для производных колмоЗаметим, что при интегрировании по частям мы пользовались различными следствиями из принципа максимума (см. пп. 2.1.3, 2.3.1). В частности, следующими двумя: lim 0, x t 0 lim t , x ; 25
x
x
частные производные t , x , входящие в уравнение (20), равномерно ограничены.
Причѐм последнее свойство, как правило, используется вместе с неравенствами для производных колмогоровского типа (см. замечание ниже).
138
горовского типа с n 2 , k 1 , p q r 2 (см. замечание ниже)) следует существование такой константы K 0 , что dV t , dt
2 K V t ,
1 2V t , . t Немного более аккуратные рассуждения (см, например, [107, 110]) позволяют установить также сходимость в L1 (сходимость в сред-
t , 0
L2
нем)26 и в L (равномерную сходимость), причѐм так же, как и для модели LWR: 1 t , 0 L . t Замечание. Неравенствами для производных колмогоровского типа будем называть неравенства следующего вида:27 Из сходимости в среднем следует, что площадь бугорка (см. рис. 21) со временем уменьшается и стремится к нулю. 27 Такого рода неравенства возникали в исследованиях А. Н. Колмогорова конца 30-х годов XX века. Для отыскания не улучшаемых значений K приходилось решать, например, задачи вариационного исчисления, оптимального управления (в том числе и с фазовыми ограничениями). В то время как из приложений (в основном военных, и связанных с движением ракет) задачи оптимального управления активно стали приходить в 40-е годы прошлого века. Общие же способы решения задач оптимального управления (без смешанных ограничений) появились только в середине 1950-х годов в школах Л. С. Понтрягина (принцип максимума Понтрягина) и Р. Беллмана (принцип динамического программирования). В цикле работ, начавшихся в 1960-е годы, А. Я. Дубовицкий и А. А. Милютин предложили наиболее общую (из известных на данный момент) схему получения необходимых условий экстремума [39, 47], которая в задачах оптимального управления (в том числе и со смешанными ограничениями) позволяет получить принцип максимума (не путать с принципами максимума для решений уравнений параболического типа). В основе схемы лежит простая идея: пересечение конуса направлений убывания, если задача на минимум, и возрастания, если на максимум, функционала с конусами возможных (допустимых) направлений ограничений должно быть пустым в точке оптимума. В предположении выпуклости рассматриваемых, конусов это условие представляется как уравнение Эйлера– Лагранжа: существует нетривиальный набор элементов из сопряженных конусов, сумма которых равняется нулю. Другой подход (см., например, [45]) состоит в использовании «гладко-выпуклой» структуры задачи. При этом для «борьбы» с гладкой частью задачи (для получения необходимых условий локальной оптимальности) используется принцип Ферма (оптимум следует искать среди экстремальных значений функционала), а для «борьбы» с выпуклой частью – принцип Лагранжа (возможность «перенесения» ограничений (необязательно всех) задачи оптимизации в функционал с должным образом определенными множителями Лагранжа). Для того чтобы была понятна связь принципа Ла26
139
K 0 : z x Wpn, r z
k
L K z L q
p
z
n
L , r
где 0 k n – целые числа, 0 p, q, r , , 0 , Wpn, r – пространство таких функций z x Lp , у которых n 1 -я производная локально абсолютно непрерывна на и n-я производная z n x Lr . Константа K зависит от пяти параметров n , k , p , q , r . Величины и однозначно ими определяются: n k 1 r 1 q , 1 . n 1 r 1 p В работах В. Н. Габушина [147, 148] было показано, что если q p при k 0 , то
K n, k , p, q, r n k p k r n q , r 1 . Более подробно о тех случаях, в которых удалось вычислить наилучшие (точные) значения константы K , написано, например, в работах [45, 149]. В п. 2.1.3 обобщенные энтропийные решения уравнения LWR получались как пределы решений соответствующих уравнений Уизема. Поэтому можно ожидать, что и на предельных решениях уравнений Уизема энергия также убывает. И действительно, если предельное (энтропийное) решение имеет разрывы (и только в этом случае), то на каждом гранжа с выпуклостью задачи, заметим, что этот принцип есть, по сути, теорема об отд елимости (одно из следствий теоремы Хана–Банаха): в вещественном векторном пространстве граничные точки «телесного» (имеющего внутренние точки) выпуклого множества отделимы гиперплоскостью от самого множества, т.е. найдется такая гиперплоскость, проходящая через выбранную граничную точку, что рассматриваемое выпуклое множество будет «лежать» в одном из двух полупространств, на которые гиперплоскость делит пространство. Множители Лагранжа как раз и задают уравнение этой гиперплоскости. При этом выпуклое множество строится по самой задаче (функционалу и каждому ограничению, которое хотим «внести» в функционал, соответствуют свои «компоненты»), а точка, которую нужно отделять, соответствует решению задачи оптимизации. Как следствие, множители Лагранжа являются элементами (алгебраически) сопряженных пространств к пространствам, в которых «живут» ограничения. Элементы сопряженного пространства для некоторых важных пространств (например, таких, как пространство измеримых ограниченных функций) довольно трудно описать. Это является, пожалуй, одним из основных сдерживающих факторов в развитии необходимых условий оптимальн ости. Обратим внимание на то, что для получения принципов максимума в задачах оптимальн ого управления со смешанными ограничениями очень сложно (если вообще возможно) напрямую использовать описанный выше гладко-выпуклый формализм. В основном при получении необходимых условий оптимальности в таких задачах удобно использовать схему Дубовицкого–Милютина.
140
разрыве (ударной волне) происходит потеря энергии в соответствии с формулой (для определенности ): Q Q d V t, Q t , x dx 0 . dt 2
Этот интересный и довольно простой факт доказан, например, в пособии [19]. Таким образом, мы получили еще одно объяснение необратимости по времени процесса, описываемого моделью LWR (при наличии ударных волн в решении) как свойство, «унаследованное» от модели более высокого уровня – модели Уизема. Замечание (С. Н. Кружков, Е. Ю. Панов (1969, 1989, 1994)). Пусть – произвольная дважды гладкая выпуклая функция, f t , x 0 – произвольная дважды гладкая финитная в полуплоскости
t , x : t 0, x пробная функция. Умножим теперь уравнение (20) на t , x f t , x и проинтегрируем в , перебрасывая производные на пробную функцию (для упрощения выкладок будем считать D 1 (в общем случае см., например, [20, 35])):
2 0 t , x x t , x f t , x dt dx f t t , x d k f x t , x Q d f xx t , x t , x dtdx , k где k – произвольное действительное число. Устремив 0 , получим f t , x d f t , x x t k k Q d dtdx 0 ,
которое справедливо для любого k . Заметим, что в случае, когда – линейная функция, вместо неравенства можно писать равенство. Введѐм обозначения:
d – энтропия, k
141
q Q d – поток энтропии. k
Полученное неравенство можно переписать как энтропийное неравенство (перебрасывая обратно производные с пробной функции) [29, 35]: q 0, t x которое следует понимать в слабом смысле (причѐм с неотрицательной финитной пробной функцией). Энтропийные неравенства для уравнений газовой динамики, по-видимому, впервые рассматривал Э. Жуге в начале XX века (см., например, [29, 54]). Напомним (см. примеры О. А. Олейник и И. М. Гельфанда из п. 2.1.1), что начальная задача Коши для уравнения (13), понимаемого в слабом смысле, имеет, вообще говоря, не единственное решение и что закон сохранения (13) и закон сохранения (13), умноженный, скажем, на 0 , вообще говоря, имеют разные решения. Однако было подмечено [150], что если к закону сохранения (13) добавить энтропийное неравенство28, то оно может отобрать единственное решение. В конце 1960-х С. Н. Кружков с помощью энтропийных неравенств построил (по сути, используя метод исчезающей вязкости (см. п. 2.1.3)) вполне законченную теорию обобщенных решений начальной задачи Коши для закона сохранения (13) [27].29 В начале Функция, удовлетворяющая (в слабом смысле) уравнению (13) и энтпропийному неравенству, полученному исходя из функции , называют -решением.
28
Основная идея заключалась в следующем. Назовѐм энтропийным решением функцию, которая является -решением, для любой дважды гладкой выпуклой функции . По
29
построению, решение, полученное с помощью метода исчезающей вязкости, необходимо является энтропийным решением. Причѐм в качестве функций можно брать лишь всевозможные линенйые функции и функции вида
k
k
, поскольку любая дважды
гладкая выпуклая функция раскладывается по этому «базису». Оказывается, что энтропийное решение всегда единственно. Для того чтобы это понять, заметим, что энтропийное решение в точках гладкости удовлетворяет соотношению (13) в классическом смысле, а в точках разрыва удовлетворяет RRH-условию и E-условию (простое доказательство этих фактов имеется, например, в пособии [19]). В конце 1980-х, в контексте вышенаписанного, С. Н. Кружковым был поставлен вопрос [151]: когда -решение единственно? Ответ на этот вопрос был получен Е. Ю. Пановым в работе [152]. Оказывается, что в случае, когда Q – строго вогнутая (выпуклая) функция, -решение единственно ( – произвольная дважды гладкая строго выпуклая функция). Если Q не является строго вогнутой (выпуклой) функцией, то -решение задачи Коши при подходящем выборе начальных данных не единственно [152].
142
1970-х годов исследованием энтропийных неравенств (для систем уравнений) занимался П. Лакс [11, 29, 35]. 2.3.3. Задача о светофоре (при каких условиях перед светофором не будет скапливаться очередь) В 1955 г. в работе [5] (см. также [7]) М. Лайтхиллом и Дж. Уиземом была поставлена и решена (на основе модели LWR) следующая задача: Найти такое число k 0 , что перед светофором (работающим в двух режимах: зеленый и красный) не будет скапливаться очередь, если Tзел Tкр k . Считать, что транспортный поток вдали от светофора имеет плотность i m (значение потока qi ), где m – плотность, при которой значение потока максимально. Пусть загорелся красный цвет (рис. 22). Тогда от светофора навстречу транспортному потоку пойдет ударная волна со скоростью 30 Q max Q i qi c . max i max i «Излишек» АТС, скопившихся перед светофором за время горения красного цвета, равен qi T qiTкр . max i max i кр Пусть теперь загорелся зеленый цвет (рис. 23, 24). Тогда до тех пор, пока весь излишек не пройдет через светофор, поток АТС через светофор будет максимальным и равным qm . Это не очень очевидное утверждение может быть установлено с помощью решения соответствующей задачи о распаде произвольного разрыва (см. п. 2.3.1). Таким образом, перед светофором не будет скапливаться очередь, если q qm qi Tзел qiTкр k i . qm qi
30
Возникшую краевую задачу удобно понимать, как начальную, если договориться считать, что за светофором плотность АТС максимальная max , т.е. за светофором движения
нет.
143
Рис. 22. Момент окончания горения красного цвета
Рис. 23
144
Рис. 24. Горит зеленый цвет
Заметим, что полученное соотношение достаточно хорошо согласуется с интуитивными представлениями. Действительно, если принять, что когда горит красный цвет, тогда поток АТС через светофор равен нулю, а когда горит зеленый, тогда поток максимальный (в течение всего времени горения зеленого), то получим условие: излишек АТС, скопившийся за время горения красного qiTкр , должен быть не больше, чем та «добавка», которую получаем за время горения зеленого: qm qi Tзел . «Добавка» же в свою очередь обусловлена тем, что при наличии светофора интенсивность потока АТС через светофор во время горения зеленого qm превышает интенсивность потока АТС, подъезжающих к светофору qi .
145
2.4. ТЕОРИЯ КЕРНЕРА–КОНХОЙЗЕРА ДВИЖУЩИХСЯ ЛОКАЛЬНЫХ КЛАСТЕРОВ В МОДЕЛЯХ ДЖЕНЕРАЛ МОТОРС 31
КЛАССА
В пунктах 2.1–2.3 были рассмотрены в основном модели транспортного потока, в которых стационарные состояния (в стационарных состояниях АТС движутся с постоянной скоростью и плотностью) «отвечают» фундаментальной диаграмме транспортного потока. С точки зрения образования пространственно-временных структур плотного потока детальная классификация этих моделей была дана, например, в главе 10 книги [10]. Там же имеется и критическое сравнение этих модельных решений с фундаментальными эмпирическими свойствами перехода к плотному транспортному потоку [153]. В этом пункте мы рассматриваем нелинейное решение, которое возникает в результате неустойчивости в моделях Дженерал Моторс (ДМ) класса. Чтобы понять термин нелинейное решение, нужно напомнить сначала смысл термина неустойчивость исходно однородного состояния транспортного потока в этих моделях. Неустойчивость означает нарастание во времени очень малых неоднородных возмущений. Окончательный результат этого нарастания приводит к структурам транспортного потока конечной и в некоторых случаях очень большой амплитуды. В последнем случае для нахождения и математического описания этих нелинейных решений уже нельзя пользоваться математическим аппаратом анализа неустойчивостей модели, который для множества моделей ДМ-класса детально рассмотрен в обзорах [58, 119]. Именно рассмотрение нелинейных пространственно-временных решений большой амплитуды, впервые найденных в 1994 г. Б. С. Кернером и П. Конхойзером [157, 158] в моделях ДМ-класса, и посвящен этот пункт данной главы. Однако прежде чем мы рассмотрим эти нелинейные решения в п. 2.4.2, необходимо коротко изложить фундаментальные эмпирические свойства перехода от свободного к плотному транспортному потоку и выяснить, могут ли модели транспортного потока, рассмотренные выше, показать эти эмпирические свойства. Более подробно об этом будет написано в главе 3.
Этот пункт написан С. Л. Клѐновым. Автор выражает благодарность Б. С. Кернеру за предоставление оригинальных рисунков из его книг.
31
146
2.4.1. Фундаментальные эмпирические свойства перехода от свободного транспортного потока к плотному и модели транспортного потока Основные эмпирические свойства перехода к плотному транспортному потоку следующие [153]: 1. Переход к плотному транспортному потоку (traffic breakdown) является F→S переходом (буква F соответствует «free flow», т.е. свободному потоку, буква S обозначает фазу синхронизованного потока, в английской литературе «synchronized flow»). 2. Вероятность спонтанного F→S перехода является растущей функцией величины потока АТС. 3. Может быть как спонтанный, так и индуцированный (т.е. вызванный внешним возмущением большой амплитуды) F→S переход около одного и того же узкого места на дороге (bottleneck в англоязычной литературе). Как показано в главе 10 книги [10], с точки зрения перехода к плотному транспортному потоку многие модели пп. 2.1–2.3 можно разделить на два больших класса: (а) Модели типа Лайтхилла–Уизема–Ричардса (LWR), в которых переход к плотному транспортному потоку возникает не в результате неустойчивости, а за счет существования точки, в которой достигается максимум функции потока на фундаментальной диаграмме. (б) Модели Дженерал Моторс класса (ДМ), в которых переход к плотному потоку связан с неустойчивостью модельных решений начиная с некоторой критической плотности транспортного потока. Модели LWR–типа (теория кинематических и ударных волн в транспортном потоке) не могут описывать пункты 2 и 3 фундаментальных эмпирических свойств перехода к плотному транспортному потоку. Теория, основанная на моделях типа ДМ, не может описывать никаких фундаментальных эмпирических свойств перехода к плотному транспортному потоку (пункты 1–3). Тем не менее эти модели представляют большой интерес для анализа. Одна из причин такого вывода рассматривается в этом пункте, в котором показано, что модели ДМ-класса описывают характеристические параметры стационарного движения широкого движущегося кластера по дороге, наблюдаемого в эмпирических данных.
147
Неустойчивость однородного свободного транспортного потока в моделях ДМ-класса32 детально рассмотрена в огромном количестве работ, обзор которых можно найти в статьях Д. Кроудери с соавторами [119] и Д. Хельбинга [58]. Однако нарастание неоднородных возмущений в этих моделях, происходящее в результате упомянутой неустойчивости, приводило к волнам нереалистично большой амплитуды (в макроскопических моделях) или к столкновению АТС (в микроскопических моделях).
Рис. 25. Эффект «бумеранга» для нарастающего возмущения в свободном потоке, метастабильном относительно возникновения широких движущихся кластеров. Плотность АТС в пространстве и времени. Расчет на основе макроскопической модели Пэйн-класса (22), (23). (а) Однородная автодорога, (б) автодорога с въездом. Взято из [10]
Какие же типы структур плотного транспортного потока возникают в результате такой неустойчивости в этих и других моделях ДМ-класса? Ответ на этот вопрос был дан Б. С. Кернером и П. Конхойзером в 1993–1994 годах [157, 158] на основе численного расчета (рис. 25 и 26) и версии модели Пэйна (см. п. 2.1.4): v (22) 0, t x v v V v c02 2 v v , (23) t x x x 2 К моделям этого класса относятся, например, модель Пэйна [53], оптимальной скорости Ньюэлла [88], Бандо [154], разумного водителя Трайбера [58, 115], клеточных автоматов Нагеля–Шрекенберга [118, 155], модели Видемана [156] и многие другие модели [10] (см. также главу 2).
32
148
где , c0 и являются константами. По сути, по сравнению с обычной моделью Пэйна произошло всего одно изменение: добавление диффузионного слагаемого 2 v x 2 в правую часть уравнения (23). Чтобы найти реалистичные решения большой амплитуды, возникающие в результате неустойчивости, Б. С. Кернер и П. Конхойзер использовали при расчетах в модели типа Пэйна специальную форму фундаментальной диаграммы (рис. 26 (а)). Особенность этой фундаментальной диаграммы состоит в том, что, начиная уже с не очень больших плотностей, скорость АТС на фундаментальной диаграмме экспоненциально стремилась к нулю. Это искусственная форма фундаментальной диаграммы, с помощью которой удалось в рамках макроскопической a модели смоделировать задержку водителей del , jam при их ускорении один за другим из состояния с нулевой скоростью на заднем фронте широкого движущегося кластера (см. ниже). Эта задержка отличается от задержки реакции водителя в других ситуациях, которая дается величиной в формуле (23). Идея Кернера–Конхойзера моделирования задержки при ускорении из состояния с нулевой скоростью с помощью формы фундаментальной диаграммы математически равносильна правилу slow-to-start в микроскопическом моделировании (см. работы группы М. Шрекенберга в 1998 г. [155]). В статьях [157, 158] было получено, что в результате неустойчивости в моделях ДМ-класса образуется широкий движущийся кластер большой амплитуды (локальный движущийся затор), внутри которого плотность АТС высока, а скорость их движения близка к нулю, в то время как впереди и позади такого кластера существует свободный поток малой плотности. В англоязычной литературе для обозначения такого рода неоднородных локальных состояний большой плотности используется название «wide moving jam» (в дальнейшем широкий движущийся кластер большой амплитуды будет обозначаться буквой J). Могут возникать как отдельные движущиеся кластеры, так и последовательности таких кластеров (рис. 25 и 26). Фазовый переход в моделях с неустойчивостью однородного состояния, по-видимому, является фазовым переходом первого рода от свободного однородного потока к широкому движущемуся кластеру (jam) и обозначается как F→J переход (напомним, что буква F соответствует «free flow», т.е. свободному потоку, а буква J соответствует «wide moving jam»). Последующие исследования показали (см. ссылки в обзоре Д. Хельбинга [58]), что этот результат является общим для всех моделей ДМ-класса, рассмотренных выше в пп. 2.1.3, 2.1.4, 2.2. 149
Рис. 26. Возникновение плотного потока на автодороге с въездом в моделях ДМ-класса, показывающих неустойчивость свободного потока при повышении плотности: возникновение широких движущихся кластеров в макроскопической модели (10), (11) Пэйн-класса (а–в), в модели клеточных автоматов Нагеля– Шрекенберга (г–е), и в модели Видемана (ж–з). (а, г) Фундаментальная диаграмма в макроскопической модели Пэйн-класса (а) и в модели Нагеля– Шрекенберга (г); пунктирная часть диаграмм отвечает неустойчивым состояниям. (б, в, д–з) Средняя скорость АТС в пространстве и времени. Взято из [10]
150
Позже Б. С. Кернеру стало ясно, что этот результат,33 относящийся ко всем моделям ДМ-класса, противоречит фундаментальным эмпирическим свойствам, перечисленным в пунктах 1–3 выше (см. также главу 3 о теории трех фаз Кернера). Как уже было указано в пункте 1, переход от свободного к плотному транспортному потоку в эмпирических данных связан не с F→J, а с F→S переходом (напомним, что буква S обозначает фазу синхронизованного потока, в английской литературе «synchronized flow»). Хотя неустойчивость свободного потока в моделях ДМ-класса неправильно описывает переход от свободного к плотному потоку в реальном транспортном потоке, тем не менее результат нелинейного решения моделей ДМ-класса [158] (рис. 25 и 26) – стационарное движение широкого кластера по дороге – полностью соответствует эмпирическим данным и, следовательно, является важным результатом этих моделей, который остается также и в теории трех фаз Кернера (см. главу 3). Как объяснено выше, под результатом нелинейного решения здесь понимается конечное пространственно-временное распределение параметров потока, возникающее в результате неустойчивости исходно однородного решения модели транспортного потока. Стационарное движение кластеров обладает определенными нелинейными свойствами, которые Б. С. Кернер и П. Конхойзер назвали характеристическими свойствами движения широких кластеров [158]. В дальнейшем эти характеристические свойства движения широкого кластера были подтверждены при исследовании всех других моделей класса ДМ [58]. Эти характеристические свойства движения широкого кластера рассмотрены в следующем пункте.
2.4.2. Характеристические параметры широкого движущегося кластера Свойства стационарного движения широких кластеров состоят в следующем [158]: существуют характеристические параметры широкого движущегося кластера, которые при заданных внешних условиях движения транспорта (погода, день недели, процент грузовых АТС и т.п.) не зависят от параметров потока впереди широкого кластера и остаются неизменными в процессе движения кластера по дороге. Характеристические параметры являются одинаковыми для различных широСостоящий в том, что переход от свободного к плотному потоку связан с F J переходом. 33
151
ких движущихся кластеров. Такими характеристическими параметрами широкого движущегося кластера являются: 1) Средняя скорость движения заднего (по направлению потока) фронта движущегося кластера, обозначаемая как vg . 2) Величина потока qout , плотность min и средняя скорость АТС vmax в выходном потоке из широкого движущегося кластера. Эти величины являются характеристическими параметрами только при условии, что выходной поток из широкого движущегося кластера отвечает свободному потоку. 3) Средняя плотность АТС внутри широкого движущегося кластера обозначается как max . Здесь и далее max совсем необязательно совпадает с максимально возможной плотностью («бампер к бамперу»). Характеристические параметры широкого движущегося кластера качественно проиллюстрированы на рис. 27, на котором для заданного момента времени приведены распределения скорости, потока и плотности вдоль дороги, связанные с распространением широкого движущегося кластера в исходно однородном транспортном потоке. Поток qh и плотность h в исходно однородном свободном потоке выбраны больше, а соответственно скорость vh меньше, чем соответствующие характеристические параметры в выходном потоке широкого движущегося кластера: qh qout , h min , vh vmax . Ясно, что впереди от широкого движущегося кластера остается исходный однородный транспортный поток. Однако этого не происходит позади широкого движущегося кластера из-за того, что по мере движения широкого кластера АТС, покидающие задний (в направлении движения) фронт кластера, формируют новый свободный поток с величиной потока qout , плотностью min и средней скоростью vmax . Чтобы пояснить термин выходной поток из широкого движущегося кластера, давайте более детально посмотрим на рис. 27. Внутри широкого кластера скорость АТС равна нулю, а плотность равна max . На переднем фронте широкого кластера АТС должны резко тормозить вплоть до их остановки. На заднем фронте широкого кластера АТС ускоряются. В результате ускорения АТС из широкого кластера на его заднем фронте образуется выходной транспортный поток. Это объясняет термин выходной поток из широкого кластера, использованный вы152
ше. В случае, когда этот поток отвечает свободному потоку, он обозначен буквой qout и показан на рис. 27.
Рис. 27. Качественная иллюстрация характеристических параметров широкого движущегося кластера. Схематическое представление кластера в фиксированный момент времени. Пространственные распределения скорости АТС v, потока q, и плотности в широком движущемся кластере, который распространяется в исходно однородном свободном потоке, имеющем скорость vh , величину потока qh , и плотность h . Взято из [10]
153
Кроме многочисленных численных исследований характеристического движения широких кластеров, опубликованных в огромном количестве работ различных авторов, существует асимптотическая теория движущихся широких кластеров [159], основанная на математической теории сингулярных возмущений. Заинтересованный читатель может найти обзор численных исследований широких кластеров в обзоре [58], а асимптотическая теория широких кластеров подробно разбирается в оригинальной статье [159]. В остальной части этого пункта будет рассмотрено одно из важнейших характеристических свойств движущегося широкого кластера – линия J.
2.4.3 Линия J Кернера Характеристические параметры широкого движущегося кластера могут быть проиллюстрированы линией на плоскости поток–плотность (рис. 28). Эта линия использовалась Б.С. Кернером и была названа им линией J [10, 153]. Необходимо подчеркнуть, что линия J Кернера не имеет никакого отношения к линии для плотного потока на треугольной диаграмме Даганзо 1994 г. [82] (или же к любым другим фундаментальным диаграммам плотного транспортного потока). Действительно, наклон линии J Кернера определяется средней скоростью заднего фронта широкого кластера, а левая координата этой линии отвечает потоку, вытекающему из широкого кластера. Другими словами, линия J – это характеристика не плотного потока, а равномерного распространения заднего фронта широкого кластера. Эта линия фактически соединяет две точки на плоскости поток–плотность: одну точку, отвечающую потоку и плотности внутри широкого движущегося кластера, и вторую точку, отвечающую потоку и плотности в выходном потоке после широкого кластера. Поясним этот важный вопрос более подробно. Каждая точка на линии для плотного потока в треугольной фундаментальной диаграмме Даганзо [82] отвечает соотношению между плотностью и величиной потока в однородном плотном потоке. В то же время линия J описывает стационарное распространение заднего фронта широкого кластера, а не зависимость потока от плотности, которая отвечает фундаментальной диаграмме плотного потока. Чтобы понять это важное качество линии J и ее отличие от фундаментальной диаграммы плотного потока, можно дополнительно обратиться к рис. 9 в главе 3. На этом рисунке можно видеть, что плотный поток в теории трех фаз Кернера отвечает не какой-то кривой или линии на плоскости поток–плотность, а двумерной 154
области. При этом линия J разбивает эту двумерную область на две части. Таким образом, в теории трех фаз Кернера вместо прямой линии треугольной фундаментальной диаграммы Даганзо [82] для плотного потока постулируется двумерная область состояний, т.е. одному значению плотности отвечает не одно значение потока, как в диаграмме Даганзо, а бесконечное количество значений потока. В свою очередь линия J не описывает связь между потоком и плотностью в плотном потоке АТС, а как уже отмечалось, линия J – это характеристика равномерного распространения заднего фронта широкого кластера. Чтобы объяснить линию J, рассмотрим среднюю скорость движения заднего фронта широкого кластера, где происходит ускорение АТС одного за другим. Каждое АТС, стоящее в кластере, может начать ускоряться на заднем фронте этого кластера, только если выполнены следующие условия: предыдущее АТС уже начало двигаться из кластера; в результате движения предыдущего АТС спустя некоторое время дистанция между двумя АТС превысила некоторое безопасное расстояние, которое удовлетворяет условию безопасного ускорения. Таким образом, существует некоторая временная задержка в ускорении АТС на заднем фронте широкого движущегося кластера. Среднее время этой задержки ускорения АТС на заднем фронте широкого движущегоa ся кластера обозначим как del , jam . Согласно эмпирическим данным, a del , jam 1.5 2 с. Движение заднего фронта широкого движущегося кластера связано с последовательным ускорением АТС, стоящих внутри кластера, на заднем фронте этого кластера. Поскольку среднее расстояние между АТС внутри кластера, включая среднюю длину АТС, равно 1 max , средняя скорость заднего фронта широкого движущегося кластера равна
vg
1
. (24) a max del , jam В эмпирических данных характеристическая средняя скорость заднего фронта широкого движущегося кластера по порядку величины дается формулой v g 15 км/ч. Наклон линии J равен характеристической скорости v g . В случае, когда свободный транспортный поток формируется после кластера, характеристические величины потока qout и плот-
155
ности min определяют левую координату min , qout линии J. Правая координата max , 0 линии J отвечает плотности и потоку внутри широкого движущегося кластера; на рис. 28 предполагается, что средняя скорость и, следовательно, поток АТС внутри кластера равны нулю. В результате величина выходного потока qout из широкого движущегося кластера равна qout v g max min , или, используя соотношение (24): qout
1 a
del , jam
min 1 max
.
Рис. 28. Качественное представление фундаментальной диаграммы свободного потока (F) вместе с линией J Кернера, наклон которой равен средней скорости движения v g заднего фронта широкого движущегося кластера. Взято из [10]
Необходимо еще раз подчеркнуть, что, несмотря на важность моделей ДМ-класса, переход от свободного к плотному потоку в этих моделях связан с переходом к широким движущимся кластерам (F→J переход). Напротив, во всех реальных данных этот переход связан с переходом к синхронизованному потоку, т.е. с F→S переходом [153]. Последний вопрос более подробно разбирается в главе 3 о теории трех фаз Кернера.
156
ЛИТЕРАТУРА 1. 2. 3. 4. 5.
6. 7. 8.
9.
10. 11. 12.
13. 14. 15.
16.
Зельдович Я. Б., Райзер Ю. П. Физика ударных волн и высокотемпературных гидродинамических явлений. М.: Физматлит, 2008. Курант Г., Фридрихс К. Сверхзвуковое течение и ударные волны. М.: Издательство иностранной литературы, 1950. Крайко А. Н. Краткий курс теоретической газовой динамики. М.: МФТИ, 2007. Гордин В. А. Математика, компьютер, прогноз погоды и другие сценарии математической физики. М.: Физматлит, 2010. Lighthill M. J., Whitham G. B. On kinematic waves: II. Theory of traffic flow on long crowded roads // Proc. R. Soc. London, Ser. A. 1955. V. 229. P. 281–345. Richards P. I. Shock Waves on the Highway // Oper. Res. 1956. V. 4. P. 42–51. Уизем Дж. Линейные и нелинейные волны. М.: Мир, 1977. Traffic flow theory: A state-of-the-art report. Editors N.H. Gartner, C. J. Messer, A. K. Rathi. Washington DC: Transportation Research Board, 2001. Луканин В. Н., Буслаев А. П., Трофимов Ю. В., Яшина М. В. Автотранспортные потоки и окружающая среда. М.: ИНФРА-М, Ч. 1, 2. 1998, 2001. Kerner B. S. Introduction to modern traffic flow theory and control. The long road to three – phase traffic theory. Springer, 2009. Лакс П. Д. Гиперболические дифференциальные уравнения в частных производных. М.–Ижевск: НИЦ «РХД», ИКИ, 2010. Ballou D. P. Solution to nonlinear hyperbolic Cauchy problems without convexity condition // Trans. Amer. Math. Soc. 1970. V. 152. № 2. P. 441–460. Олейник О. А. Разрывные решения нелинейных дифференциальных уравнений// УМН. 1957. Т. 12. № 3(75). С. 3–73. Hopf Е. The partial differential equation ut u ux uxx // Comm. Pure Appl. Math. 1950. V. 3. № 3. P. 201–230. Олейник О. А. Об одном классе разрывных решений квазилинейных уравнений первого порядка // Научные доклада высшей школы. Физико-математические науки. 1958. № 3. С. 91–98. Олейник О. А. О единственности и устойчивости обобщенного решения задачи Коши для квазилинейного уравнения // УМН. 1959. Т. 14. № 2(86). С. 165–170. 157
17. Гельфанд И. М. Некоторые задачи теории квазилинейных уравнений // УМН. 1959. Т. 14. № 2(86). С. 87–158. 18. Рождественский Б. Л., Яненко Н. Н. Системы квазилинейных уравнений и их приложения к газовой динамике. М.: Наука, 1978. 19. Горицкий А. Ю., Кружков С. Н., Чечкин Г. А. Уравнения с частными производными первого порядка: учебное пособие. М.: Изд-во ЦПИ при механико–математическом факультете МГУ, 1999. 20. Гасников А. В. Сравнение определений обобщенного решения задачи Коши для квазилинейного уравнения. М.: ВЦ РАН, 2006. 21. Иносэ Х., Хамада Т. Управление дорожным движением. М.: Транспорт, 1983. 22. Бабков В. Ф. Дорожные условия и безопасность дорожного движения. М.: Транспорт, 1982. 23. Kumei S., Bluman G. W. When nonlinear differential equations are equivalent to linear differential equations // SIAM J. Appl. Math. 1982. V. 42. № 5. P. 1157–1173. 24. Олвер П. Приложения групп Ли к дифференциальным уравнениям. М.: Мир, 1989. 25. Овсянников Л. В. Групповой анализ дифференциальных уравнений. М.: Наука, 1993. 26. Волосов К. А., Вдовина Е. К., Волосова А. К. Новые точные решения уравнений с частными производными параболического типа: учебное пособие. М.: МИИТ, 2010. 27. Кружков С. Н. Квазилинейные уравнения первого порядка со многими независимыми переменными // Матем. сб. 1970. Т. 81(123). № 2. С. 228–255. 28. Кружков С. Н. Нелинейные уравнения с частными производными (Лекции). Ч. 2. Уравнения первого порядка. М.: Изд-во МГУ, 1970. 29. Serre D. System of conservation laws: A challenge for the XXIst century, in: B. Enquist, W. Schmid (Eds.), Mathematics Unlimited – 2001 and Beyond. Berlin, New York: Springer-Verlag, 2001. P. 1061–1080. 30. Лионс П.-Л. (Lions P.-L.) О некоторых интригующих проблемах нелинейных уравнений в частных производных, в книге: «Математика: границы и перспективы». М.: ФАЗИС, 2005. С. 193–211. 31. Тупчиев В. А. Обобщенные решения законов сохранения. М.: Наука, 2006. 32. Эванс Л. К. Методы слабой сходимости для нелинейных уравнений с частными производными. Новосибирск: Тамара Рожковская (Белая серия в математике и физике; Т. 2), 2006.
158
33. Holden H., Risebro N. H. Front tracking for hyperbolic conservation laws. Springer, 2007. 34. Nonlinear conservation laws and applications. University of Minnesota, July 13–31, 2009. http://www.ima.umn.edu/2008-2009/SP7.13-31.09/index.html#schedule 35. Dafermos C. M. Hyperbolic conservation laws in continuum physics. Springer, 2010. (в издательстве РХД готовится перевод этой книги на русский язык) 36. Галкин В. А. Анализ математических моделей: системы законов сохранения, уравнения Больцмана и Смолуховского. М.: БИНОМ. Лаборатория знаний, 2009. 37. Ладыженская О. А., Солонников В. А., Уральцева Н. Н. Линейные и квазилинейные уравнения параболического типа. М.: Наука, 1967. 38. Крылов Н. В. Лекции по эллиптическим и параболическим уравнениях в пространствах Гѐльдера: учебное пособие. Новосибирск: Научная книга (Университетская серия; Т. 2), 1998. 39. Милютин А. А., Дмитрук А. В., Осмоловский Н. П. Принцип максимума в оптимальном управлении. М.: Изд-во ЦПИ при механико– математическом факультете МГУ, 2004. http://www.milyutin.ru/papers.html 40. Оптимальное управление / под ред. Н. П. Осмоловского и В. М. Тихомирова. М.: МЦНМО, 2009. 41. Красовский Н. Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 42. Эванс Л. К. Уравнения с частными производными. Новосибирск: Рожковская (Университетская серия; Т. 7), 2003. 43. Демьянов В. Ф. Минимакс, дифференцируемость по направлениям. Л.: Изд-во ЛГУ, 1974. 44. Субботин А. И. Обобщенные решения уравнений в частных производных. Перспективы динамической оптимизации. М.-Ижевск: НИЦ «РХД», ИКИ, 2003. 45. Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. М.: УРСС, 2003. 46. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980. 47. Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при наличии ограничений // ЖВМ и МФ. 1965. Т. 5. № 3. С. 395–453. http://www.milyutin.ru/papers.html 48. Беллман Р., Калаба Р. Квазилинеаризация и нелинейные краевые задачи. М.: Мир, 1968. 159
49. Пшеничный Б. Н., Сагайдак М. И. О диффернциальных играх с фиксированным временем // Кибернетика. 1970. Т. 2. С. 54–63. 50. Maslov V. P., Belavkin V. P. Design of the optimal Dynamic Analyzer: Mathematical Aspects of Sound and Visual Pattern Recognition, in Mathematical Aspects of Computer Engineering. Edited by V. P. Maslov, K. A. Volosov. M.: MIR, 1988. P. 146–237. 51. Kolokoltsov V. N., Maslov V. P. Idempotent analysis and applications. Dordrecht: Kluwer Acad. Publ., 1997. (имеется схожая книга тех же авторов на русском языке (1994)) 52. Litvinov G. L. Tropical mathematics, idempotent analysis, classical mechanics and geometry. AMS, Contemp. Math., 2010. arXiv:1005.1247v1 (Семинар «Глобус», 2009. вып. 4) 53. Payne H. J. Models of freeway traffic and control, in: Simulation Council Proc. 28, Mathematical Models of Public Systems. Edited by G. A. Bekey. 1971. V. 1. P. 51–61. 54. Куликовский А. Г., Погорелов Н. В., Семенов А. Ю. Математические вопросы численного решения гиперболических систем уравнений. М.: Физматлит, 2001. 55. Петров И. Б., Лобанов А. И. Лекции по вычислительной математике. М.: Бином, 2006. 56. Швецов В. И. Математическое моделирование транспортных потоков // Автоматика и телемеханика. 2003. № 11. С. 3–46. 57. Чарахчьян А. А. Об алгоритмах расчета распада разрыва для схемы С. К. Годунова // ЖВМ и МФ. 2000. Т. 40. № 5. С. 782–796. 58. Helbing D. Traffic and related self-driven many particle systems // Reviews of modern physics. 2001. V. 73. № 4. P. 1067–1141. arXiv:cond-mat/0012229 59. Смирнов Н. Н., Киселѐв А. Б., Никитин В. Ф., Юмашев М. В. Неустановившиеся движения автотранспорта на кольцевой магистрали // Прикладная математика и механика. 2000. Т. 64. № 4. С. 651–658. 60. Смирнов Н. Н., Киселев А. Б., Никитин В. Ф., Юмашев М. В. Математическое моделирование автомобильных потоков на магистралях // Вестник Московского университета. Математика. Механика. 2000. № 4. С. 39–44. 61. Киселев А. Б., Кокорева А. В., Никитин В. Ф., Смирнов Н. Н. Математическое моделирование автотранспортных потоков на регулируемых дорогах // Прикладная математика и механика. 2004. Т. 68. № 6. С. 1047–1054. 62. Холодов Я. А., Холодов А. С., Гасников А. В., Морозов И. И., Тарасов В. Н. Моделирование транспортных потоков – актуальные пробле160
63. 64. 65. 66. 67. 68. 69.
70.
71. 72. 73. 74. 75. 76.
77.
78.
мы и пути их решения // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). С. 152–162. Daganzo C. F. Fundamentals of transportation and traffic operations. New-York: Elsevier Science inc., 1997. Aw A., Rascle M. Resurrection of ―second order‖ models of traffic flow // SIAM Journal of Applied Mathematics. 2000. V. 60. P. 916–938. Greenberg J. M. Extensions and amplifications of a traffic model of Aw and Rascle // SIAM J. Appl. Math. 2001. V. 62. № 3. P. 729–745. Zhang H. M. A non-equilibrium traffic model devoid of gas-like behavior // Transp. Res. B. 2002. V. 36. P. 275–290. Siebel F., Mauser W. Synchronized flow and wide moving jams from balanced vehicular traffic // e-print arXiv:physics/0509124v2, 2006. Helbing D. Improved fluid–dynamic model for vehicular traffic // Phys. Rev. E. 1995. V. 51. P. 3163–3169. Ладыженская О. А. Шестая проблема тысячелетия: уравнение Навье–Стокса, существование и гладкость // УМН. 2003. Т. 58. № 2(350). С. 45–78. Юдович В.И. Глобальная разрешимость — против коллапса в динамике несжимаемой жидкости, в книге: «Математические события XX века». М.: Фазис, 2003. С. 519–548. Проблемы турбулентности. Сборник работ. М.–Ижевск: НИЦ «РХД», ИКИ, 2006. Prigogine I., Herman R. Kinetic theory of vehicular traffic. N.Y.: Elsevier, 1971. Кац М. Вероятность и смежные вопросы в физике. М.: Мир, 1965. Козлов В. В. Ансамбли Гиббса и неравновесная статистическая механика. М.–Ижевск: НИЦ «РХД», ИКИ, 2008. Веденяпин В. В. Кинетическая теория по Максвеллу, Больцману и Власову. М.: Изд-во МГОУ, 2005. Карамзин Ю. Н., Трапезникова М. А., Четверушкин Б. Н., Чубарова Н. Г. Двумерная модель автомобильных потоков // Матем. мод. 2006. Т. 18. № 6. С. 85–95. Сухинова А. Б., Трапезникова М. А., Четверушкин Б. Н., Чубарова Н. Г. Двумерная макроскопическая модель транспортных потоков // Матем. мод. 2009. Т. 21. № 2. С. 118–126. Garavello M., Piccoli B. Traffic Flow on Networks. Volume 1 of AIMS Series on Applied Mathematics. AIMS, 2006.
161
79. Göttlich S., Klar A. Model hierarchies and optimization for dynamic flows on networks. Modeling and optimization of flows on networks. Cetaro (CS), June 15–19, 2009. C.I.M.E. Courses, 2009. http://php.math.unifi.it/users/cime/Courses/2009/01/200914-Notes.pdf 80. Kurzhanskiy A. A. Modeling and software tools for freeway operational planning. PhD thesis, Berkeley: University of California, 2007; (see also Xiaotian Sun, PhD thesis, Berkeley: University of California, 2005; Gabriel Clemente Gomes Parisca, PhD thesis, Berkeley: University of California, 2004.) http://lihodeev.com/pubs.html http://www.eecs.berkeley.edu/Pubs/TechRpts/2007/EECS-2007-148.pdf; 81. Куржанский А. А., Куржанский А. Б., Варайя П. Роль макромоделирования в активном управлении транспортной сетью // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). С. 100–118. 82. Daganzo C. F. The cell transmission model: A dynamic representation of highway traffic consistent with the hydrodynamic theory // Transp. Res. B. 1994. V. 28. № 4. P. 269–287. 83. Daganzo C. F. The cell transmission model, Part II: Network traffic // Transp. Res. B. 1995. V. 29. № 2. P. 79–93. 84. Буслаев А. П., Таташев А. Г., Яшина М. В. О свойствах решений одного класса систем нелинейных дифференциальных уравнений на графах // Владикавказкий матем. жур., ВНЦ РАН. 2004. Т. 6. № 4. С. 4–18. 85. Назаров А. И. Об устойчивости стационарных режимов в одной системе ОДУ, возникающей при моделировании автотранспортных потоков // Вестник СПбГУ. Серия 1. Математика. Механика. Астрономия. 2006. № 3. С. 35–43. 86. Lubashevsky I., Kalenkov S., Mahnke R. Towards a variational principle for motivated vehicle motion // Phys. Rev. E. 2002. V. 65. P. 1–5. 87. Lubashevsky I., Wagner P., Mahnke R. Towards the fundamentals of car following theory // e-print arXiv:cond-mat/0212382v2, 2003. 88. Newell G. F. Nonlinear effects in the dynamics of car – following // Oper. Res. 1961. V. 9. P. 209–229. 89. Новокшенов В. Ю. Введение в теорию солитонов. М.–Ижевск: НИЦ «РХД», ИКИ, 2002. 90. Ильин А. М., Олейник О. А. Асимптотическое поведение решений задачи Коши для некоторых квазилинейных уравнений при больших значениях времени // Матем. сб. 1960. Т. 51(93). № 2. С. 191– 216. 162
1
91. Osher S., Ralston J. L stability of traveling waves with application to convective porous media flow // Comm. Pure Appl. Math. 1982. V. 35. P. 737–749. 92. Weinberger H. F. Long-time behavior for regularized scalar conservation law in absence of genuine nonlinearity // Ann. Inst. H. Poincaré, Anal. Non Linéaire. V. 7. 1990. P. 407–425. 93. Liu T.-P. Admissible solutions of hyperbolic conservation laws // Mem. Amer. Math. Soc. 1981. V. 30. № 240. P. 1–78. 94. Cheng K.-S. Asymptotic behavior of solution of a conservation law without convexity condition // J. Diff. Equat. 1981. V. 40. № 3. P. 343– 376. 95. Петросян Н. С. Об асимптотике решения задачи Коши для квазилинейного уравнения первого порядка с невыпуклой функцией состояния // УМН. 1983. Т. 38. № 2(230). С. 213–214. 96. Кружков С. Н., Петросян Н. С. Асимптотическое поведение решений задачи Коши для нелинейных уравнений первого порядка // УМН. 1987. Т. 42. № 5(257). С. 3–40. 97. Jennings G. Discrete shocks // Comm. Pure Appl. Math. 1974. V. 27. P. 25–37. 98. Harten A., Hyman J. M., Lax P.D. On finite-difference approximations and entropy conditions for shocks // Comm. Pure Appl. Math. 1976. V. 29. P. 297–322. 99. Engquist B., Osher S. One-sided difference approximations for nonlinear conservation laws // Math. Comp. 1981. V. 36. P. 321–351. 100. Henkin G. M., Polterovich V. M. Shumpetrian dynamics as non-linear wave theory // J. Math. Econom. 1991. V. 20. P. 551–590. 101. Henkin G. M., Polterovich V. M. A difference-differential analogue of the Burgers equation and some models of economic development // Discrete and continuous dynamic systems. 1999. V. 5. № 4. P. 697–728. 102. Mejai M., Volpert Vit. Convergence to systems of waves for viscous scalar conservation laws // Asymptotic Analysis. 1999. V. 20. P. 351–366. 103. Engelberg S., Schochet S. Nonintegrable perturbation of scalar viscous shock profiles // Asymptotic Analysis. 2006. V. 48. P. 121–140. 104. Henkin G. M., Shananin A. A. Asymptotic behavior of solutions of the Cauchy problem for Burgers type equations // J. Math. Purés Appl. 2004. V. 83. P. 1457–1500. 105. Henkin G. M., Shananin A. A., Tumanov A. E. Estimates for solution of Burgers type equations and some applications // J. Math. Purés Appl. 2005. V. 84. P. 717–752. 163
106. Henkin G. M. Asymptotic structure for solutions of the Cauchy problem for Burgers type equations // J. fixed point theory appl. 2007. V. 1. № 2. P. 239–291. 107. Serre D. L1 stability of shock waves in scalar conservation laws, in: Evolutionary Equations // Handbook of Differential Equations, NorthHolland, Amsterdam. 2004. V. 1. P. 473–553. 108. Гасников А. В. О промежуточной асимптотике решения задачи Коши для квазилинейного уравнения параболического типа с монотонным начальным условием // Известия РАН. Теория и системы управления. 2008. № 3. С. 154–163. 109. Гасников А. В. Сходимость по форме решения задачи Коши для квазилинейного уравнения параболического типа с монотонным начальным условием к системе волн // ЖВМ и МФ. 2008. Т. 48. № 8. С. 1458–1487. 110. Гасников А. В. Асимптотическое по времени поведение решения начальной задачи Коши для закона сохранения с нелинейной дивергентной вязкостью // Известия РАН. Серия математическая. Т. 76. 2009. № 6. С. 39–76. 111. Гасников А. В. Асимптотика по времени решения задачи о распаде ―размазанного разрыва‖ для закона сохранения // Труды МФТИ (специальный выпуск, посвященный юбилею ФУПМа). 2009. Т. 1. № 4. С. 120–125. http://mipt.ru/nauka/trudy/N4.html 112. Хѐрмандер Л. Анализ линейных дифференциальных операторов с частными производными. Т. 1 – Т. 4. М.: Мир, 1986–1988. 113. Gazis D. C. Traffic science. N.Y.: Wiley, 1974. 114. Treiber M., Helbing D. Explanation of observed features of selforganization in traffic flow // e-print arXiv:cond-mat/9901239, 1999. 115. Treiber M., Hennecke A., Helbing D. Congested traffic states in empirical observations and microscopic simulation // Phys. Rev. E. 2000. V. 62. P. 1805–1824. 116. Фон Нейман Дж. Теория самовоспроизводящихся автоматов. М.: УРСС, 2010. 117. Cremer M., Ludwig J. A fast simulation model for traffic flow on the basis of Boolean operations // Math. Comp. Simul. 1986. V. 28. P. 297– 303. 118. Nagel K., Schreckenberg M. A cellular automation model for freeway traffic // Phys. I France. 1992. V. 2. P. 2221–2229. 119. Chowdhury D., Santen L., Schadschneider A. Statistical physics of vehicular traffic and some related systems // Phys. Rep. 2000. V. 329. P. 199–329. arXiv:cond-mat/0007053v1 164
120. Nagatani T. The physics of traffic jams // Reports on Progress in Physics. 2002. V. 65. P. 1331–1386. 121. Benassi A., Fouque J.-P. Hydrodynamic limit for the asymmetric simple exclusion process // Ann. of Probability, V. 15. № 2. 1987. P. 546–560. 122. Kipnis C., Olla S., Varadhan S. R. S. Hydrodynamics and large deviation for simple exclusion processes // Comm. on Pure and Applied Mathematics. 1989. V. 42. P. 115–137. 123. Nishinari K., Matsukidaira J., Takahashi D. Two-dimensional Burgers cellular automaton // e-print arXiv:nlin/0102027v1, 2001. 124. Бланк М. Л. Точный анализ динамических систем, возникающих в моделях транспортных потоков // УМН. 2000. Т. 55(333). № 3. С. 167–168. 125. Blank M. Ergodic properties of a simple deterministic traffic flow model // J. Stat. Phys. 2003. V. 111. № 3–4. P. 903–930. arXiv:math.DS/0206194 126. Blank M. Hysteresis phenomenon in deterministic traffic flows // J. Stat. Phys. 2005. V. 120. № 3–4. P. 627–658. arXiv:math.DS/0408240 127. Минлос Р. А. Введение в математическую статистическую физику. М.: МЦНМО, 2002. 128. Maerivoet S., De Moor B. Cellular automata models of road traffic // Physics Reports 2005. V. 419. № 1. P. 1–64. arXiv:physics/0509082 129. Буслаев А. П., Новиков А. В., Приходько В. М., Таташев А. Г., Яшина М. В. Вероятностные и имитационные подходы к оптимизации автодорожного движения. М.: Мир, 2003. 130. Buslaev A. P., Prikhodko V. M., Tatashev A. G., Yashina M. V. The deterministic – stochastic flow model // e-print arXiv:physics/0504139v1, 2005. 131. Buslaev A. P., Gasnikov A. V., Yashina M. V. Selected mathematical problems of traffic flow theory // International Journal of Computer Mathematics. Published By: Taylor & Francis. 2011. (in print) 132. Явление чрезвычайное. Книга о А. Н. Колмогорове. М.: ФАЗИС, МИРОС, 1999. С. 236–237. 133. Баренблатт Г. И. Автомодельные явления – анализ размерностей и скейлинг. Долгопрудный: Издательский дом «Интеллект», 2009. 134. Ибрагимов Н. Х. Практический курс дифференциальных уравнений и математического моделирования. Нижний Новгород: Издательство Нижегородского университета, 2007. 135. Шестаков А. А. Обобщенный прямой метод Ляпунова для систем с распределенными параметрами. М.: КомКнига, 2007.
165
136. Volpert A. I., Volpert Vit. A., Volpert Vl. A. Traveling waves solutions of parabolic system // Translations of Mathematical Monographs. 2000. V. 140. P. 1–455. 137. Колмогоров А. Н., Петровский И. Г., Пискунов Н. С. Исследование уравнения диффузии, соединенной с возрастанием количества вещества, и его применение к одной биологической проблеме // Бюл. МГУ. Математика и механика. 1937. № 6. Т. 1. С. 1–26. 138. Разжевайкин В. Н. Решения типа бегущей волны для уравнения реакции – нелинейной диффузии // Труды МФТИ (специальный выпуск, посвященный юбилею ФУПМа). 2009. Т. 1. № 4. С. 99–119. http://mipt.ru/nauka/trudy/N4.html 139. Наумкин П. И., Шишмарев И. А. Задача о распаде ступеньки для уравнения Кортевега–де Фриза–Бюргерса // Функц. анализ и его прил. 1991. Т. 25. № 1. С. 21–32. 140. Наумкин П. И., Шишмарев И. А. О распаде ступеньки для уравнения Кортевега–де Фриза–Бюргерса // Функц. анализ и его прил. 1991. Т. 26. № 2. С. 88–93. 141. Казейкина А. В. Устойчивость решения задачи Коши вида бегущей волны для уравнения Кортевега–де Фриза–Бюргерса // ЖВМ и МФ. 2010. Т. 50. № 4. С. 1–21. 142. Duan R., Zhao H. Global stability of strong rarefacion waves for the generalized KdV–Burgers equation // Nonlinear Anal. 2007. V. 66. P. 1100–1117. 143. Liu T.-P., Nishihara K. Asymptotic behavior for scalar viscous conservation laws with boundary effect // Journal of differential equations. 1997. V. 133. P. 296–320. 144. Liu T.-P., Matsumura A., Nishihara K. Behaviors of solutions for the Burgers equation with boundary corresponding to rarefaction waves // SIAM J. Math. Anal. 1998. V. 29. № 2. P. 293–308. 145. Куликовский А. Г., Чугайнова А. П. Классические и неклассические разрывы в решениях уравнений нелинейной теории упрогости // УМН. 2008. Т. 63. № 2(380). С. 85–152. http://www.mi.ras.ru/spm/pdf/007.pdf http://www.mi.ras.ru/noc/lectures/16kulikovskii.pdf 146. Шубин М. А. Лекции об уравнениях математической физики. М.: МЦНМО, 2003. 147. Габушин В. Н. Неравенства между производными в метриках L p при 0 p // Известия АН СССР. Серия математическая. 1976. Т. 40. № 4. С. 869–892. 166
148. Габушин В. Н. Неравенства для производных решений обыкновенных дифференциальных уравнений в метриках L p ( 0 p ) // Дифференциальные уравнения. 1988. Т. 24. № 10. С. 1662–1670. 149. Арестов В. В. Приближение неограниченных операторов ограниченными и родственные экстремальные задачи // УМН. 1996. Т. 51. № 6(312). С. 89–124. 150. Годунов С. К. Проблема обощенного решения в теории квазилиненйых уранвений и в газовой динамике // УМН. 1962. Т. 17. № 3(105). С. 147–158. 151. Арнольд В. И., Вишик М. И., Ильяшенко Ю. С., Калашников А. С., Кондратьев В. А., Кружков С. Н., Ландис Е. М., Миллионщиков В. М., Олейник О. А., Филиппов А. Ф., Шубин М. А. Некоторые нерешенные задачи теории дифференциальных уравнений и математической физики // УМН. 1989. Т. 44. № 4(268). С. 191–202. 152. Панов Е. Ю. О единственности решения задачи Коши для квазилинейного уравнения первого порядка с одной допустимой строго выпуклой энтропией // Матем. заметки. 1994. Т. 55. № 5. С. 116– 129. 153. Kerner B. S. The Physics of Traffic. Berlin: Springer, 2004. 154. Bando M., Hasebe K., Nakayama A., Shibata A., Sugiyama Y. Dynamical model of traffic congestion and numerical simulation // Phys. Rev. E. 1995. V. 51. P. 1035–1042. 155. Barlovic R., Santen L., Schadschneider A., Schreckenberg M. Metastable states in cellular automata for traffic flow // Eur. Phys. J. B. 1998. V. 5. P. 793. 156. Wiedemann R. Simulation des Verkehrsflusses. Karlsruhe: University of Karlsruhe, 1974. 157. Kerner B. S., Konhäuser P. Cluster effect in initially homogeneous traffic flow // Phys. Rev. E. 1993. V. 48. P. 2335–2338. 158. Kerner B. S., Konhäuser P. Structure and parameters of clusters in traffic flow // Phys. Rev. E. 1994. V. 50. P. 54–83. 159. Kerner B. S., Klenov S. L., Konhäuser P. Asymptotic theory of traffic jams // Phys. Rev. E. 1997. V. 56. P. 4200–4216.
167
Глава 3. Теория Кернера трех фаз в транспортном потоке – новый теоретический базис для интеллектуальных транспортных технологий1
3.1. Три фазы транспортного потока............................................ 171 3.2. Свободный транспортный поток – фаза F............................. 172 3.3. Плотный транспортный поток............................................... 172 3.4. Определение фаз J и S в плотном транспортном потоке ...... 173 3.5. Возникновение плотного потока (traffic breakdown) – F→S фазовый переход .......................................................................... 175 3.6. Бесконечное число пропускных способностей скоростной автомагистрали............................................................................. 180 3.7. Широкие движущиеся кластеры (локальные движущиеся заторы) – фаза J ............................................................................ 182 3.8. Синхронизованный транспортный поток – фаза S ............... 184 3.9. S→J фазовый переход ........................................................... 185 3.10. Неоднородные пространственно-временные структуры транспортного потока, состоящие из фаз S и J ............................ 186 3.11. Стохастическая модель в рамках теории трех фаз Кернера 188 3.12. Применение теории трех фаз Кернера для интеллектуальных транспортных технологий ............................. 197 Литература.................................................................................... 199
1
Эта глава написана С. Л. Клѐновым. Автор выражает благодарность Б. С. Кернеру за предоставление оригинальных рисунков из его книг.
168
В 1996–2002 годах Б. С. Кернер с сотрудниками концерна Даймлер провели детальные исследования эмпирических данных, измеренных с помощью датчиков на многочисленных скоростных автомагистралях мира (в Германии, Голландии, Англии, США). Главный результат этих исследований был сформулирован в предисловии к книге [1]: «Теории транспортного потока и математические модели, которые доминируют в настоящее время в научных журналах и учебных курсах большинства университетов, не могут объяснить ни сам переход от свободного к плотному потоку (traffic breakdown), ни основные свойства возникающих в результате этого перехода структур транспортного потока». По этой причине Б. С. Кернер предложил и разработал альтернативную теорию транспортных потоков, названную теорией трех фаз, которая может предсказать и объяснить эмпирические свойства перехода к плотному потоку (traffic breakdown) и результирующих пространственно-временных структур в транспортном потоке. Как достижения, так и критика предшествующих классических подходов к теории транспортных потоков представлены в главе 10 книги [1]. В настоящей главе кратко излагаются основные положения теории трех фаз Кернера в соответствии с [1, 2]. Цель этой главы состоит в том, чтобы дать читателю определенное представление об эмпирическом базисе и основных идеях теории трех фаз. Тем не менее эта глава не может заменить книг Б. С. Кернера, чтение которых необходимо тем, кто хочет разобраться в данной теории. По этой причине основное внимание уделяется не математическому обоснованию тех или иных положений теории трех фаз, а в основном качественному описанию. Единственное исключение составляет п. 3.11, в котором кратко описана стохастическая трехфазная модель в рамках теории трех фаз и некоторые ее решения. Для более подробного ознакомления с математическими результатами теории трех фаз Кернера рекомендуется прочитать главу 11 книги [1] и часть III книги [2]. Прежде чем перейти к изложению некоторых положений теории трех фаз Кернера, важно отметить имевшиеся на тот момент фундаментальные достижения (см. пп. 2.1–2.3) по математической формулировке моделей транспортного потока, а также многочисленных эффектов взаимодействия между водителями [3–25]. К ним относится, в первую очередь, введенная в моделях ДМ-класса задержка водителей [10–13], приводящая к переторможению как реакции на замедление АТС впереди [13, 19, 20]; формулировка задержки водителей через модельные флуктуации, введенные в моделях Нагеля–Шрекенберга и А. Шашнай169
дера (см. обзоры [19–22]); микроскопическое описание slow-to-start rule в работах группы М. Шрекенберга (см. обзоры [19–22]). Эти и другие математические формулировки в поведения водителя являются также важными элементами математических моделей трех фаз (см. главу 11 книги [1]). Несмотря на эти достижения, как было сказано выше, предшествующие модели не могут объяснить ни сам переход от свободного к плотному потоку, ни основные свойства возникающих пространственно-временных структур, наблюдаемых в эмпирических данных. Детальное объяснение этого «парадокса» дано в главе 10 книги [1]. Этот парадокс объясняется очень просто: анализ эмпирических данных, который позволил выявить фундаментальные эмпирические свойства перехода от свободного к плотному и основные свойства результирующих пространственно-временных структур, стал возможным только в конце 90-х годов, когда стало доступным огромное количество данных измерений со скоростных магистралей Германии и Голландии. Иными словами, выдающиеся ученые, которые создали многочисленные модели транспортного потока, перечисленные выше и многие другие, просто не могли знать, какими же реальными свойства обладает переход от свободного к плотному транспортному потоку. Эти фундаментальные эмпирические пространственно-временные свойства перехода от свободного к плотному потоку, а также другие фундаментальные эмпирические свойства фазовых переходов в транспортном потоке детально описаны в п. 2.4 и части II книги [2]. В рамках данной главы нет возможности остановиться на рассмотрении всех этих эмпирических свойств транспортного потока. Тем не менее повторим здесь еще раз фундаментальные эмпирические свойства перехода к плотному транспортному потоку и эмпирические свойства фазовых переходов в транспортном потоке (см. п. 2.4). Фундаментальные эмпирические свойства перехода к плотному транспортному потоку следующие: 1. Переход к плотному транспортному потоку (traffic breakdown) является F→S переходом (буква F соответствует free flow, т.е. свободному потоку, буква S обозначает фазу синхронизованного потока, в английской литературе synchronized flow). 2. Вероятность спонтанного F→S перехода является растущей функцией величины потока АТС. 3. Может быть как спонтанный, так и индуцированный F→S переход около одного и того же узкого места на дороге (bottleneck).
170
LWR-модель кинематических и ударных волн в транспортном потоке, дискретной версией которой является CTM-модель Даганзо [9], не могут описывать пункты 2 и 3, а модели, относящиеся к ДМ-классу, не могут описывать пункты 1–3 (см. главу 2). Фундаментальные эмпирические свойства фазовых переходов в транспортном потоке следующие: а) В соответствии со свойствами 1–3, указанными выше, переход от свободного к плотному транспортному потоку (traffic breakdown) является F→S фазовым переходом I рода. б) Широкие движущиеся кластеры (wide moving jams, обозначается ниже буквой J) возникают спонтанно только в синхронизованном потоке, т.е. в результате последовательности F→S→J фазовых переходов. в) S→J фазовый переход происходит позднее и часто совсем в другом месте, чем F→S фазовый переход. LWR-теория кинематических волн не может описывать пункты б) и в), а теория, основанная на моделях ДМ-класса, не может описывать пункты а)–в).
3.1. Три фазы транспортного потока Теория трех фаз фокусируется главным образом на физике плотного транспортного потока на скоростных автомагистралях. И описывает три фазы транспортного потока, в то время как классические теории, базирующиеся на фундаментальной диаграмме транспортного потока, рассматривают две фазы: свободный поток и так называемый плотный поток (congested traffic в английской терминологии). В плотном потоке выделяются две фазы, соответственно существуют три фазы транспортного потока: 1. Свободный поток – фаза F. 2. Синхронизованный поток – фаза S. 3. Широкий движущийся кластер (локальный движущийся затор, в английской литературе wide moving jam) – фаза J. Фаза определяется как некоторое состояние транспортного потока, рассматриваемое в пространстве и времени. Следует подчеркнуть, что в теории трех фаз разделение на свободный и плотный поток точно такое же, как и в классических теориях Лайтхилла–Уизема и Дженерал Моторс (см. п. 3.3 ниже). Фундаментальное отличие теории Б. С. Кернера состоит в том, что он 171
выделяет две фазы в плотном потоке на основе общих эмпирических пространственно-временных свойств транспортного потока, которые за все годы измерений остаются одни и те же на разных автодорогах мира. Другими словами, как определение фаз транспортного потока, так и остальные положения теории, приведенные в пп. 3.1–3.10, основаны исключительно на эмпирических данных.
3.2. Свободный транспортный поток – фаза F В свободном транспортном потоке достаточно малой плотности водители могут практически свободно установить желаемую для них скорость. Эмпирические данные, относящиеся к свободному потоку, показывают положительную корреляцию между величиной потока q, измеряемой в количестве АТС в единицу времени (проходящих через данное сечение дороги), и плотностью , измеряемой в количестве АТС на единицу длины дороги [14, 15]. Зависимость потока q от плотности для свободного потока ограничена максимальным значением величины потока q qmax и соответствующим критическим значением плотности crit (рис. 1), которые могут быть достигнуты в свободном потоке.
Рис. 1. Зависимость потока q от плотности АТС в свободном потоке [14, 20]
3.3. Плотный транспортный поток В плотном транспортном потоке, который определяется так же, как и в классических теориях Лайтхилла–Уизема и Дженерал Моторс (см. главу 2), скорость АТС меньше, чем минимально возможная ско172
рость АТС в свободном потоке. Это означает, что прямая с наклоном, равным минимальной скорости в транспортом потоке (штриховая линия на рис. 2), разделяет все эмпирические данные (точки) на плоскости поток–плотность на две области: слева от этой прямой находятся данные, относящиеся к свободному потоку, а справа – данные, относящиеся к плотному потоку.
Рис. 2. Зависимость потока от плотности АТС в свободном и плотном потоке [14, 20]
Как следует из данных измерений, возникновение плотного потока обычно происходит вблизи неоднородности на автомагистрали, вызванной въездом на автомагистраль, съездом с нее, изменением числа полос, сужением дороги, подъемом и т.п. Такого типа неоднородность, вблизи которой может происходить переход к плотному транспортному потоку, в дальнейшем будем называть узким местом или «бутылочным горлом» [14, 20].
3.4. Определение фаз J и S в плотном транспортном потоке Б. С. Кернер показал, что фундаментальная диаграмма и ее применения в том виде, как они используются в классических теориях транспортного потока, неадекватным образом описывают сложную динамику в плотном транспортном потоке. Он выделяет, таким образом, в плотном транспортном потоке фазу S синхронизованного потока, в англоязычной литературе «synchronized flow», и фазу J широкого движущегося кластера (локальный движущийся затор, «wide moving jam»). Определение фаз [J] и [S] в плотном потоке является результатом общих пространственно-временных свойств реальных данных, полученных в результате ежедневных измерений параметров транспортного потока во многих странах на различных скоростных автодорогах в течение многих лет. Б. С. Кернер определил фазы J и S следующим образом. 173
Рис. 3. Данные измерений скорости АТС в пространстве и времени (а) и их представление на координатно-временной плоскости (б). Взято из [1]
Определение фазы [J] широкого движущегося кластера: Задний по направлению движения фронт широкого движущегося кластера (локального движущегося затора), где АТС, выезжающие из кластера, ускоряются вплоть до свободного или до синхронизованного потока, движется против потока с постоянной средней скоростью vg , проходя через все узкие места на скоростной автомагистрали. Это характеристическое свойство широкого движущегося кластера. Определение фазы [S] синхронизованного потока: Задний по направлению движения фронт области синхронизированного потока, где АТС ускоряются вплоть до свободного потока, НЕ обладает характеристическим свойством широкого движущегося кла174
стера. В частности, задний фронт синхронизированного потока часто фиксирован вблизи узкого места на скоростной автомагистрали. Необходимо подчеркнуть, что определение фаз [J] и [S] вытекает из эмпирических пространственно-временных свойств плотного потока, т.е. исходно не имеет никакого отношения к какой-либо математике. Теоретический смысл этих определений можно понять, прочтя раздел 6.1 книги [1]. Данные измерений средней скорости АТС (рис. 3 (а)) иллюстрируют определения [J] и [S]. На рис. 3 (а) имеются две пространственновременные структуры плотного потока с низкой скоростью АТС. Одна из них распространяется против потока с почти постоянной скоростью заднего фронта через все узкие места на скоростной автомагистрали. Согласно определению [J], эта область плотного потока относится к фазе «широкого движущегося кластера». Напротив, задний фронт другой области плотного потока фиксирован вблизи места съезда с автомагистрали. Согласно определению [S], эта область плотного потока относится к фазе «синхронизированного потока» (рис. 3 (а) и (б)).
3.5. Возникновение плотного потока (traffic breakdown) – F→S фазовый переход Переход от свободного к плотному потоку в англоязычной литературе известен как traffic breakdown. В теории трех фаз такой переход объясняется возникновением фазы синхронизованного потока, т.е. F→S фазовым переходом. Такое объяснение основывается на имеющихся данных измерений, которые показывают, что после возникновения плотного потока вблизи узкого места на автомагистрали задний фронт возникшего плотного потока фиксирован вблизи этого узкого места. Таким образом, возникший плотный поток удовлетворяет определению [S] фазы синхронизованного потока. В самом деле, типичный пример перехода из свободного в синхронизованный поток вблизи въезда показан на рис. 4. Из рисунка видно, что в то время как скорость АТС резко уменьшается в процессе перехода (рис 4 (а)), поток меняется мало (рис. 4 (б)). Скачок скорости при мало меняющемся потоке особенно наглядно виден на рис. 4 (в). В течение всего времени после перехода задний фронт между плотным и свободным потоками фиксирован на въезде дороге. По этой причине плотный поток соответствует определению фазы синхронизованного потока, поэтому весь плотный поток относится к фазе синхронизованного потока. 175
Рис. 4. Эмпирический пример возникновения плотного потока и эффект гистерезиса у бутылочного горла из-за въезда на автодорогу. (а, б) Средняя скорость (а) и поток (б) на автодороге в пространстве и времени (увеличение потока после въезда на (б) связано с потоком въезжающих на дорогу АТС). (в) Эффект гистерезиса в плоскости поток-плотность, обозначенный двумя стрелками, показывающими переход к плотному потоку и обратный переход к свободному потоку. 1-минутные данные. Взято из [1]
Образование плотного потока примерно в 6:30 (показанное стрелкой слева направо на рис. 4 (в)) и его исчезновение примерно в 7:45 (показанное стрелкой справа налево на рис. 4 (в)) сопровождается гистерезисом, хорошо известным в теории фазовых переходов 1 рода, наблюдаемых в широком классе неравновесных физических, химических и биологических систем. Это свойство F→S фазового перехода является общим свойством реального (эмпирического) транспортного потока, который также представляет собой сложную сильно неравновесную систему. Второй эмпирический пример перехода к плотному потоку показан на рис. 5. На этом примере можно видеть, как в реальном транс176
портном потоке образуются широкие движущиеся кластеры (рис. 5 (б), координата дороги x 0 км). Как можно видеть, в результате перехода к плотному потоку на узком месте, связанным с въездом на скоростную магистраль, сначала образуется фаза S синхронизованного потока.
Рис. 5. Эмпирический пример возникновения широких движущихся кластеров в синхронизованном потоке: (а) Скорость АТС в пространстве и времени. (б) Скорость (слева) и поток (справа) на трех полосах дороги в области синхронизованного потока ( x 5.2 км) и в области широких движущихся кластеров ( x 0 км). Взято из [1]
177
Действительно, в течение всего времени существования плотного потока на этом узком месте задний фронт плотного потока, на котором АТС ускоряются из плотного потока до свободного потока, фиксирован на этом узком месте. Поэтому по определению фаз в теории Б. С. Кернера в результате перехода к плотному потоку образуется фаза синхронизованного потока. Другими словами, плотный поток образуется в результате F→S перехода. Напротив, широкие движущиеся кластеры возникают позднее уже внутри фазы синхронизованного потока. Этот S→J фазовый переход будет рассмотрен ниже в п. 3.9. Таким образом, переход от свободного к плотному потоку в эмпирических данных есть F→S переход первого рода. Это эмпирическое свойство есть общее свойство реальных транспортных потоков на скоростных магистралях. Напротив, в моделях ДМ-класса, как было объяснено в п. 2.4, переход от свободного к плотному потоку связан с возникновением широких движущихся кластеров. Исходя из эмпирических данных, был сделан вывод, что синхронизованный поток может возникать в свободном потоке спонтанно (спонтанный F→S переход) или индуцированным образом (индуцированный F→S переход). Спонтанный F→S переход означает, что переход к синхронизованному потоку происходит в случае, когда до момента перехода в окрестности узкого места существует свободный поток, а сам фазовый переход происходит в результате роста внутреннего возмущения транспортного потока. В противоположность этому индуцированный F→S переход происходит из-за возмущения транспортного потока, которое первоначально возникает на некотором удалении от положения узкого места, и затем по мере распространения достигает окрестности узкого места. Обычно индуцированный F→S переход связан с распространением в направлении против потока области синхронизованного потока или же широкого движущегося кластера, которые первоначально возникли вблизи следующего в направлении потока узкого места. Эмпирический пример индуцированного фазового перехода, приводящего к возникновению синхронизованного потока, показан на рис. 3: синхронизованный поток возникает благодаря распространению против потока широкого движущегося кластера. Природу F→S фазового перехода можно объяснить с помощью «соревнования» во времени и пространстве двух противоположных процессов: ускорения АТС при обгоне более медленного АТС впереди, названном «переускорением», и в случае, когда обгон невозможен, торможения АТС до скорости более медленного АТС, названном «адаптация скорости». «Переускорение» поддерживает дальнейшее существо178
вание свободного потока. Напротив, «адаптация скорости» ведет к синхронизованного потоку. Было постулировано, что вероятность обгона, которая совпадает с вероятностью «переускорения», является разрывной функцией плотности (рис. 6): при данной плотности АТС вероятность обгона в свободном потоке много больше, чем в синхронизованном потоке.
Рис. 6. Объяснение фазового перехода к плотному потоку (traffic breakdown) на основе Z-образной нелинейной функции вероятности обгона (вероятности «переускорения») в теории Б. С. Кернера. Пунктирная линия описывает критическое значение вероятности обгона как функцию плотности АТС (из [1])
Разрывная функция вероятности обгона является одной и той же как для спонтанного, так и для индуцированного F→S фазового перехода: термины спонтанный и индуцированный отличаются только источником возмущения, приводящего к F→S фазовому переходу. F→S переход происходит при условии, что вероятность обгона внутри возмущения в свободном потоке меньше, чем критическая вероятность. Эта критическая вероятность показана пунктирной линией на рис. 6. Другими словами, не имеет значения, будет ли это критическое значение вероятности обгона достигнуто благодаря возмущению в свободном потоке (спонтанный переход) или благодаря распространению до узкого места некоторого возмущения, возникшего ранее в другой области дороги (индуцированный переход). Отметим, что F→S фазовый переход и обратный S→F фазовый переход сопровождаются гистерезисом. Этот гистерезис не имеет никакого отношения к хорошо известному гистерезису в математических моделях ДМ-класса, по-видимому, впервые найденному в теории Кер-
179
нера–Конхойзера. Этот известный гистерезис, описанный в огромном количестве математических работ (смотри работы [19–22; 26, 27] и ссылки в них), описывает F→J и обратный J→F фазовый переход. Как уже несколько раз отмечалось, спонтанный F→J переход не наблюдается в реальном транспортном потоке.
3.6. Бесконечное число пропускных способностей скоростной автомагистрали Спонтанное образование плотного потока, т.е. спонтанный F→S фазовый переход может произойти в широком диапазоне значений величины потока q в свободном транспортном потоке. Основываясь на эмпирических данных измерений, был сделан вывод, что существует бесконечное число значений пропускной способности автомагистрали в свободном потоке. Это бесконечное число значений пропускной способности находится в диапазоне между минимальным qth и максимальным qmax значениями пропускной способности (см. рис. 7). Если величина потока близка к максимальному значению пропускной способности qmax , то уже достаточно малое возмущение в свободном потоке вблизи узкого места приведет к спонтанному F→S фазовому переходу. С другой стороны, если величина потока близка к минимальному значению пропускной способности qth , то только возмущение очень большой амплитуды способно привести к спонтанному F→S фазовому переходу.
Рис. 7. Максимум и минимум пропускной способности скоростной автомагистрали в теории трех фаз. Взято из [1]
180
Вероятность возникновения малых возмущений в свободном транспортном потоке много выше, чем вероятность возникновения возмущений большой амплитуды. По этой причине, чем выше величина потока q в свободном потоке вблизи узкого места, тем выше вероятность спонтанного F→S фазового перехода. Если величина потока q меньше, чем минимальная пропускная способность qth , то возникновение плотного потока (F→S переход) невозможно. Бесконечное число значений пропускной способности автомагистрали вблизи узкого места может быть объяснено тем, что свободный поток при значениях величины потока q в диапазоне qth q qmax является метастабильным. Это означает, что при возникновении малых возмущений свободный поток сохраняется, т.е. является устойчивым относительно малых возмущений. Однако для больших возмущений свободный поток оказывается неустойчивым и происходит F→S фазовый переход к синхронизованному потоку.
Рис. 8. Пояснение соревнования между переускорением и адаптацией скорости, которое объясняет бесконечное число значений пропускной способности автомагистрали. Взято из [1]
181
Как уже упоминалось в п. 3.5, природу F→S фазового перехода можно объяснить с помощью «соревнования» во времени и пространстве двух противоположных процессов: ускорения АТС при обгоне более медленного АТС впереди, названный «переускорением», и в случае, когда обгон невозможен, торможения АТС до скорости более медленного АТС, названном «адаптация скорости». На рис. 8 поясняется это соревнование более детально. На рис. 8 (а), который соответствует рис. 6, стрелочка вниз означает, что если в свободном потоке вблизи узкого места возникает локальное уменьшение скорости АТС, то вероятность обгона внутри этого возмущения падает. Если это уменьшение вероятности обгона становится меньше, чем критическая величина вероятности обгона, показанная пунктирной линией на рис. 8 (а), то F→S фазовый переход происходит внутри этого возмущения; в противоположном случае возмущение затухает и свободный поток остается на узком месте. Стрелочка вверх на рис. 8 (а) означает, что если исходное состояние отвечает фазе синхронизованного потока и в этом состоянии возникает случай локального увеличения скорости АТС, то внутри данного возмущения вероятность обгона возрастает. Если это возрастание вероятности обгона превышает критическое значение (как выше отмечалось, эта критическая вероятность обгона отвечает пунктирной кривой на рис. 8 (а)), то в области возмущения происходит S→F переход; в противоположном случае возмущение затухает и остается синхронизованный поток. Бесконечное число значений пропускной способности автомагистрали вблизи узкого места в теории трех фаз фундаментально противоречит классическим теориям транспортного потока (а также методам управления и автоматического регулирования транспортными потоками), которые предполагают существование в любой момент времени некоторой (фиксированной или случайной) пропускной способности.
3.7. Широкие движущиеся кластеры (локальные движущиеся заторы) – фаза J Широкий движущийся кластер может быть назван широким только при условии, что его ширина (вдоль дороги) заметно превышает ширину фронтов кластера. Средняя скорость движения АТС внутри широкого движущегося кластера много меньше, чем скорость АТС в свободном потоке. На заднем (в направлении потока) фронте кластера АТС могут ускоряться вплоть до свободного потока. На переднем
182
фронте кластера АТС, подъезжающие к фронту, должны сильно уменьшать свою скорость. Согласно определению [J], широкий движущийся кластер обычно сохраняет среднюю скорость заднего фронта vg , даже если кластер проходит через другие фазы транспортного потока и узкие места. Величина потока сильно падает внутри широкого движущегося кластера. Как отмечалось в п. 2.4, эмпирические результаты показывают, что характеристические параметры широких движущихся кластеров не зависят от величины потока на дороге и особенностей узкого места (где и когда кластер возник). Однако эти характеристические параметры зависят от погоды, дорожных условий, конструктивных характеристик АТС, процента длинных машин и т.п. Скорость заднего фронта широкого движущегося кластера vg в противоположном потоку направлении является характеристическим параметром, так же как и величина выходного потока qout из кластера в случае, когда свободный поток формируется после кластера (рис. 9).
Рис. 9. Три фазы транспортного потока в плоскости поток-плотность в теории трех фаз Кернера. Взято из [1]
Это означает, что разные широкие движущиеся кластеры имеют одинаковые параметры при одинаковых условиях. Благодаря этому эти параметры могут быть предсказаны. Движение заднего фронта широкого 183
движущегося кластера может быть показано на плоскости поток– плотность с помощью прямой, называемой линия J Кернера (рис. 9). Наклон линии J Кернера равен скорости заднего фронта vg , в то время как координата пересечения линии J Кернера с осью абсцисс (при нулевом потоке) отвечает плотности АТС max в широком движущемся кластере (о линии J Кернера более подробно смотри в п. 2.4.3). Подчеркнем, что минимум пропускной способности qth и величина выходного потока из широкого движущегося кластера qout описывают два качественно различных свойства свободного транспортного потока. Минимум пропускной способности qth характеризует F→S фазовый переход вблизи узкого места, т.е. возникновение плотного потока (traffic breakdown). В свою очередь величина выходного потока из широкого движущегося кластера qout характеризует условия существования таких кластеров, т.е. фазы J. В зависимости от внешних условий, таких как погода, процент длинных машин в потоке и т.п., а также от характеристик узкого места, вблизи которого может произойти F→S фазовый переход, минимум пропускной способности qth может быть как меньше (рис. 9), так и больше, чем величина выходного потока qout . Важно, что величина выходного потока из широкого движущегося кластера qout оказывается меньше, чем максимально возможный поток qmax в свободном потоке перед кластером. Это означает, что в свободном потоке водители могут выбирать более короткую временную дистанцию до АТС впереди, чем та дистанция, которую они принимают, ускоряясь на заднем фронте широкого движущегося кластера.
3.8. Синхронизованный транспортный поток – фаза S В отличие от широких движущихся кластеров в синхронизованном потоке как величина потока q, так и скорость АТС могут меняться заметным образом. Задний по направлению потока фронт синхронизованного потока часто фиксирован в пространстве (см. определение [S]), обычно вблизи расположения узкого места. Величина потока q в фазе синхронизованного потока может оставаться почти такой же, как и в свободном потоке, даже если скорость АТС сильно уменьшается. Поскольку синхронизованный поток не имеет характеристического свойства [J] фазы широкого движущегося кластера J, в теории
184
трех фаз предполагается, что гипотетические однородные состояния синхронизованного потока покрывают двумерную область в плоскости поток–плотность (см. заштрихованную область на рис. 9).
3.9. S→J фазовый переход Широкие движущиеся кластеры не возникают в свободном потоке, но они могут возникать в области синхронизованного потока. Этот фазовый переход называется S→J фазовый переход. Эмпирический пример S→J перехода показан на рис. 10. Таким образом, образование широких движущихся кластеров в свободном потоке наблюдается в результате каскада F→S→J фазовых переходов: сначала, область синхронизованного потока возникает внутри свободного потока.
Рис. 10. Двойная Z-характеристика в теории трех фаз, поясняющая каскад F→S→J фазовых переходов. Взято из [1]
Как было объяснено выше, такой F→S фазовый переход происходит в большинстве случаев вблизи узкого места. Далее внутри синхронизованного потока происходит «сжатие» потока, т.е. плотность АТС возрастает, в то время как их скорость падает. Это сжатие называется «пинч» эффект. В области синхронизованного потока, где происходит пинч эффект, возникают узкие движущиеся кластеры. Было пока185
зано, что частота возникновения узких движущихся кластеров тем выше, чем выше плотность в синхронизованном потоке. По мере того как эти узкие движущиеся кластеры нарастают, некоторые из них трансформируются в широкие движущиеся кластеры, другие же исчезают. Широкие движущиеся кластеры в дальнейшем распространяются против потока, проходя через все области синхронизованного потока и через все узкие места. Чтобы детальнее проиллюстрировать S→J фазовый переход, следует заметить, что в теории трех фаз линия J делит все однородные состояния синхронизованного потока на две области (рис. 9). Состояния выше линии J Кернера являются метастабильными относительно образования широких движущихся кластеров, в то время как состояния ниже линии J Кернера являются устойчивыми. Метастабильные состояния синхронизованного потока означают, что относительно малых возникающих возмущений состояние потока остается устойчивым, однако при больших возмущениях в синхронизованном потоке происходит S→J фазовый переход. Каскад F→S→J фазовых переходов можно пояснить на основе двойной Z характеристики в теории трех фаз (рис. 10). Пунктирная линия между фазой F и фазой S качественно соответствует критической скорости внутри локального возмущения свободного потока, при которой происходит F→S фазовый переход. Другими словами, F→S фазовый переход происходит внутри локального возмущения свободного потока, в котором скорость меньше, чем критическая скорость (символически этот фазовый переход показан стрелкой между фазой F и S на рис. 10). Пунктирная линия между фазой S и фазой J качественно соответствует критической скорости внутри локального возмущения синхронизованного потока, при которой происходит S→J фазовый переход. Другими словами, S→J фазовый переход происходит внутри локального возмущения синхронизованного потока, в котором скорость меньше, чем критическая скорость (символически этот фазовый переход показан стрелкой между фазой S и J на рис. 10).
3.10. Неоднородные пространственно-временные структуры транспортного потока, состоящие из фаз S и J В эмпирических данных можно наблюдать очень сложные пространственно-временные структуры в плотном транспортном потоке, образовавшиеся в результате F→S и S→J фазовых переходов. 186
Неоднородная пространственно-временная структура, которая состоит только из синхронизованного потока, называется структурой синхронизованного потока (СП). Когда задний фронт СП фиксирован вблизи узкого места на дороге, а передний фронт не распространяется против потока, такая СП называется локализованной структурой синхронизованного потока (ЛСП). Однако во многих случаях передний фронт структуры синхронизованного потока распространяется в направлении против потока. Если при этом задний фронт по-прежнему остается фиксированным вблизи узкого места, то ширина области синхронизованного потока увеличивается. Такая структура называется расширяющейся структурой синхронизованного потока (РСП). Возможна также ситуация, когда задний фронт синхронизованного потока уже не фиксирован вблизи узкого места, а оба фронта синхронизованного потока движутся в направлении против потока. Такая структура называется бегущей, или мигрирующей структурой синхронизованного потока (МСП). Разница между пространственно-временными структурами, состоящими из только синхронизованного потока, и широкими движущимися кластерами становится особенно ясной, когда РСП или МСП достигают следующего узкого места, расположенного вверх по течению транспортного потока. В этом случае структура синхронизованного потока «захватывается» на этом узком месте (так называемый «catcheffect» в английской терминологии), и возникает новая пространственно-временная структура в транспортном потоке. Напротив, широкий движущийся кластер не захватывается вблизи узкого места, а распространяется дальше против потока, т.е. пробегая через узкое место на дороге. Кроме того, в отличие от широкого движущегося кластера структура синхронизованного потока, даже если она распространяется в виде МСП, не имеет характеристических параметров. В результате скорость заднего фронта МСП может заметно меняться в процессе распространения, и эта скорость может быть разной у разных МСП. Данные особенности структур синхронизованного потока и широких движущихся кластеров вытекают из определения фаз [S] и [J]. Наиболее типичная пространственно-временная структура плотного транспортного потока состоит из обеих фаз S и J. Такая структура называется общей структурой плотного потока (ОП). На многих скоростных автомагистралях узкие места, связанные с въездами/выездами, располагаются очень близко друг к другу. Пространственно-временная структура, в которой синхронизованный поток охватывает два и более узких места, называется единой структурой плотного потока (ЕП). ЕП может состоять только из синхронизованно187
го потока, тогда она называется ЕСП (единая структура синхронизованного потока). Однако обычно широкие движущиеся кластеры возникают в синхронизованном потоке. В этом случае ЕП называется ЕОП (единая общая структура плотного потока) (см. рис. 11). В данной главе были рассмотрены основные качественные положения теории трех фаз Кернера. Эти качественные положения, начиная с 2002 года, были использованы как теоретический базис при создании целого ряда микроскопических и макроскопических трехфазных моделей транспортного потока (см. ссылки на оригинальные работы в главе 11 книги [1]). В следующем пункте этой главы дается краткий обзор стохастической микроскопической модели в рамках теории трех фаз и приведены некоторые результаты численных расчетов.
Рис. 11. ЕОП измеренная на магистрали с тремя узкими местами B1 , B2 , B3 . Взято из [1]
3.11. Стохастическая модель в рамках теории трех фаз Кернера Теория трех фаз Кернера является качественной теорией. Различные математические трехфазные модели транспортных потоков были разработаны в последние годы в рамках теории трех фаз. Впервые микроскопическая трехфазная модель, которая может воспроизводить эм188
пирические свойства перехода к плотному потоку (traffic breakdown) и результирующих пространственно-временных структур, была разработана Б. С. Кернером и С. Л. Кленовым в 2002 году [28]. Несколькими месяцами позже Б. С. Кернер, С. Л. Кленов и Д. Вольф предложили трехфазную модель на основе клеточных автоматов (ККВ-модель) [29]. Позднее были также разработаны другие модели транспортного потока в рамках теории трех фаз: Л. Дэвис [30], а также Б. С. Кернер и С. Л. Кленов [31] предложили детерминистические микроскопические модели трех фаз; Х. Ли и М. Шрекенберг с соавторами [32], Р. Янг и К. Ву [33] и К. Гао с соавторами [34] разработали различные трехфазные модели клеточных автоматов (КА); Дж. Лаваль [35] и С. Хугендорн с соавторами [36] разработали макроскопические модели трех фаз. Последние результаты моделирования транспортного потока, проведенные различными научными группами в США, Германии, Голландии, Китае, Южной Кореи и Японии в рамках теории трех фаз, можно найти в [37–60]. В данном пункте кратко рассматривается стохастическая микроскопическая трехфазная модель транспортного потока, предложенная Б. С. Кернером и С. Л. Кленовым в [28, 61]. В этой модели [61] использовалось дискретное время с шагом , в то время как перемещение в пространстве предполагалось непрерывным. Ниже будет рассмотрена дискретная версия модели [61], сформулированная в [58], в которой используется достаточно мелкая дискретизация пространства с шагом x (см. также формулировку дискретной версии модели в [59]). При этом в приведенных ниже формулах координата измеряется в единицах x , в то время как скорость АТС и ее ускорение измеряются соответственно в единицах v x / и a v / , где временной шаг 1 с. Уравнения движения АТС в дискретной версии [58, 59] стохастической трехфазной модели [61] транспортного потока на скоростной 2полосной автодороге в приближении идентичных АТС задаются следующими формулами: vn 1 max(0, min(v free , vn 1 n , vn a , vs , n )), xn 1 xn vn 1 , (1) vn 1 max(0, min(v free , vs ,n , vc,n )),
(2)
v n , vc , n n vn an ,
(3)
если g n Gn , если g n Gn ,
n max(bn , min(an , v,n vn )),
(4)
где индекс n отвечает дискретному времени t n , n 0, 1, 2, ...; xn и vn – координата и скорость АТС на временном шаге n ; v free – макси189
мальная скорость АТС в свободном потоке; gn x, n xn d – расстояние до АТС впереди, индекс относится ко всем переменным и функциям, описывающим АТС впереди, d – длина АТС, которая предполагается одинаковой и включает в себя также среднее расстояние между АТС, когда они стоят внутри широкого движущегося кластера; vn – величина скорости АТС без шумовой компоненты n ; vs , n – безопасная скорость, определенная ниже; an 0 и bn 0 ; a – максимальное ускорение; Gn – максимальное расстояние, на котором водитель синхронизует свою скорость со скоростью АТС впереди (так называемая дистанция «синхронизации скорости»); (5) Gn G(vn , v, n ), где функция (5): G(u, w) max 0, k u u w ua 1 , (6)
константа k 1 , z – означает целую часть действительного числа z .
Рис. 12. Стационарные однородные состояния и линия J Кернера в стохастической трехфазной модели: (а, б) свободный поток (F) и синхронизованный поток (заштрихованная двумерная область, обозначенная буквой S) на плоскости расстояние между АТС–скорость (а) и на плоскости поток–плотность (б). На (в) показано соответствие между линией J и однородными стационарными состояниями модели на плоскости поток–плотность, взятыми из (б)
190
Решения модели (1) – (6) при стационарном и однородном движении АТС (которое отвечает потоку, где АТС находятся на одинаковом расстоянии друг от друга и движутся с постоянной скоростью) показаны на рис. 12 (а) и (б). В соответствии с фундаментальной гипотезой теории трех фаз (рис. 9) фаза синхронизованного потока (буква S) как на плоскости расстояние–скорость (рис. 12 (а)), так и на плоскости поток– плотность (рис. 12 (б)) покрывает двумерную область (заштрихованная область на рис. 12). Для того чтобы пояснить смысл этой двумерной области для стационарных состояний синхронизованного потока, рассмотрим более подробно рисунок 12 (а). Видно, что при некоторой заданной величине скорости v v free в стационарном состоянии существует бесконечное количество расстояний между АТС в диапазоне g safe g G , где g – расстояние между АТС, G G v, v – дистанция синхронизации скорости (5), взятая при одинаковых скоростях АТС, g safe – безопасное расстояние между АТС, которое является решением
уравнения v vsafe g safe , где безопасная скорость vs в стационарном
однородном состоянии определяется как vs g g . Таким образом, стационарные однородные состояния стохастической трехфазной модели (рис. 12) принципиально отличаются от таких же состояний большинства предшествующих моделей, в которых заданной скорости отвечает одно единственное расстояние между АТС, соответствующее точке на фундаментальной диаграмме. Из рис. 12 (в) также можно видеть, что линия J Кернера не имеет никакого отношения к фундаментальной диаграмме стационарного однородного плотного потока в моделях, основанных на фундаментальной диаграмме. Действительно, в трехфазной стохастической модели линия J, которая находится из стационарного движения широкого кластера в этой модели, разделяет двумерную область стационарных однородных состояний синхронизованного потока на две части. Оказывается, что в соответствии с теорией трех фаз стационарные однородные состояния выше линии J являются метастабильными к образованию широких движущихся кластеров, а состояния ниже линии J являются устойчивыми к образованию широких кластеров. Чтобы моделировать случайное время задержки водителя как при ускорении, так и при замедлении в различных транспортных ситуациях величины an и bn в (4) и (5) задаются как случайные функции: an a ( P0 r1 ) , bn a ( P1 r1 ) , 191
p , если Sn 1, p , если Sn 1, P0 0 P1 1 1, если Sn 1, p2 , если Sn 1, где величины 1 P0 и 1 P1 представляют собой вероятности для времени задержки водителя соответственно при ускорении и при замедлении АТС; p0 (v) и p2 (v) являются функциями скорости АТС, p1 – кон-
станта; r1 rand (0,1) представляет собой случайную величину, равномерно распределенную в интервале от 0 до 1. Случайная компонента n в формуле (1) описывает случайное замедление или ускорение и применяется в зависимости от того, тормозит ли АТС, или ускоряется, или не меняет свою скорость: b , если Sn 1 1, n a , если Sn 1 1, 0 , если Sn 1 0, где S – это состояние движения АТС в отсутствие случайной компоненты n , 1, если vn 1 vn , Sn 1 1, если vn 1 vn , 0, если vn 1 vn , a , b являются случайными источниками соответственно для ускорения и замедления АТС: a a( a ) ( pa r ) , b a ( pb r ) , а случайный источник 1, если r p 0 , 0 a 0 1, если p 0 r 2 p 0 и vn 0, 0 в остальных случаях применяется в отсутствие ускорения или замедления и связан с невозможностью точно поддерживать заданную скорость. Величины pa и pb являются вероятностями соответственно случайного ускорения или торможения АТС, p (0) и a (0) – константы, r rand (0,1) , ступенчатая
функция (Хевисайда) ( z ) определяется как ( z ) 0 при z 0 и ( z) 1 при z 0 .
192
Безопасная скорость vs , n определяется следующим образом: g vs , n min vn( safe ) , v( a ) n , где
v a max 0, min v ,safe n , v , n , g , n a
– это так называемая «ожидаемая» (прогнозируемая) скорость АТС впереди, функция vn( safe ) v( safe ) ( gn , v, n ) задается безопасной скоростью v( safe) ( gn , v, n ) , которая была предложена в модели С. Краусса с соавторами [62] в 1997 году и которая в свою очередь является решением уравнения П. Гиппса [63]: v( safe) X d (v( safe) ) gn X d (v, n ),
где X d (u ) – тормозной путь, проходимый АТС, движущимся с первоначальной скоростью u и тормозящим с постоянным ускорением b вплоть до полной остановки. В модели с дискретным временем этот путь дается формулой X d (u) b 2 0.5 1 , и – соответственно целая и дробная части величины u / b . В рассматриваемой модели автодороги с двумя полосами смена полосы АТС происходит независимо от того, находятся ли эти АТС вдали или вблизи неоднородностей дороги, связанной с въездом– выездом. АТС меняет полосу, если некоторые необходимые условия для перехода с правой полосы на левую ( R L ) или с левой полосы на правую ( L R ) выполняются совместно с условиями безопасности при смене полосы. Необходимые для смены полосы условия имеют вид R L : vn v, n 1 и vn v, n , L R : vn v, n 1 или vn vn 1 . Условия безопасности при смене полосы имеют вид gn min(vn , Gn ), gn min(vn , Gn ), где n
n
n
n
(7)
G G(vn , v ), G G(v , vn ) , верхние индексы "+" и "–" относятся соответственно к АТС впереди и позади на соседней полосе. Если условия (7) не выполняются, то используются более жесткие условия для «вдавливания» АТС на соседнюю полосу: min min xn xn d g target vn d . , где g target (8)
193
В дополнение к (8) используется условие, что АТС проходит среднюю m точку xn xn xn 2 между двумя соседними АТС на соседней полосе, т.е. следующие условия выполняются: xn 1 xn( m1) и xn xn( m) или xn 1 xn( m1) и xn xn( m) . Если условия для смены полосы выполняются, АТС меняет полосу с вероятностью pc 1 на текущем шаге. После смены полосы скорость vn устанавливается равной
1 vˆn min vn , vn v , что описывает изменение скорости после манев-
ра по смене полосы. После смены полосы координата АТС не меняется, если выполнены условия (7), и она устанавливается равной xn xn m , если выполнены условия (8). Величины v(1) , pc , 1 и являются константами. Более подробно об использованных параметрах модели, условиях смены полос, и модели поведения водителя на въезде/выезде со скоростной автодороги можно прочитать в главе 11 книги [1]. На рис. 13 приведены результаты расчета пространственновременных структур, возникающих вблизи въезда на автодорогу и областей их существования (диаграммы) на плоскости с координатами поток по основной дороге qin , приведенный на одну из двух полос дороги, и поток со стороны въезда на дорогу qоn . На рис. 13 (а) показана диаграмма этих пространственно-временных структур. По оси абсцисс этой диаграммы откладывается поток АТС qоn , по оси ординат указан поток АТС по основной дороге qin . Граница FS B на этой диаграмме разделяет свободный поток влево от границы от структур плотного потока, возникающих вблизи въезда АТС. На границе FS B пространственновременные структуры плотного потока возникают спонтанно. Граница B S J разделяет структуры синхронизованного потока (СП) от общей структуры плотного потока (ОП). Это означает, что между границами B B FS и S J возникают различного типа СП. При больших qin и маленьких qоn возникает мигрирующая структура синхронизованного потока – МСП (рис. 13 (г)). При увеличении qоn МСП превращается в расширяющуюся структуру синхронизованного потока – РСП (рис. 13 (б)).
194
Рис. 13. Диаграмма пространственно-временных структур транспортного потока вблизи изолированного въезда (а) и соответствующие типы пространственно-временных структур (б–ж), относящиеся к диаграмме (а): СП (б–г) и ОП (д–ж). Взято из [2]
195
Если уменьшать qin и увеличивать qоn , то на границе, обозначенной буквой W, РСП превращается в локализованную структуру синхронизованного потока – ЛСП (рис. 13 (в)). Укажем еще некоторые особенности общей структуры плотного потока – ОП, которая возникает выше границы S J B на диаграмме (рис. 13 (а)). Существует граница, обозначенная буквой G внутри области структур ОП. Слева от этой границы, после того как широкий кластер возникает в синхронизованном потоке, новые широкие кластеры больше не формируются (рис. 13 (ж)), и возникает рассасывающаяся общая структура плотного потока (РОП). Правее от границы G возникает общая структура, в которой непрерывно рождаются новые кластеры внутри синхронизованного потока (рис. 13 (д)). Однако если уменьшать поток по дороге qin , оставаясь в области ОП, и перейти к значениям qin меньше, чем qout (смысл потока qout объяснен в п. 2.4.3), то широкие движущиеся кластеры, спонтанно возникающие в синхронизованном потоке ОП, постепенно рассасываются, распространяясь против течения. В результате возникает ОП, показанная на рис. 13 (е). Другая особенность общей структуры состоит в том, что если поток из въезда qоn дальше увеличивать, то возникает некоторый эффект насыщения, связанный с возникновением плотного потока на дороге, ведущей к въезду АТС. Этот эффект насыщения связан с тем, что поток внутри области синхронизованного потока в ОП достигает своего предельного pinch . минимального значения, обозначенного на рис. 13 (а) как qlim Распределение скорости и потока внутри ОП структуры на рис. 13 (д) как функция времени при разных координатах вдоль дороги показано на рис. 14. Можно видеть, что сначала на 16.5 км возникает F→S фазовый переход из свободного в синхронизованный поток. Через 2 км против течения ( x 14.5 км) можно видеть развивающиеся узкие кластеры внутри синхронизованного потока. По мере распространения этих кластеров против течения амплитуда кластеров увеличивается и их ширина возрастает. В результате нарастания кластеров возникает последовательность широких движущихся кластеров ( x 8 км), которые обладают характеристическими параметрами, описанными в п. 2.4.2. В частности, распространение заднего фронта этих кластеров соответствует линии J Кернера, описанной в п. 2.4.3. Более подробно свойства пространственно-временных структур, полученные в результате моделирования, рассматриваются в [1] и [2].
196
Рис. 14. Одноминутные данные виртуальных детекторов, отвечающие ОП на рис. 13 (д). Въезд на скоростную дорогу отвечает координате 16 км. Взято из [2]
3.12. Применение теории трех фаз Кернера для интеллектуальных транспортных технологий Б. С. Кернер с сотрудниками предложил и частично внедрил в эксплуатацию целый ряд новых методов интеллектуальных транспортных технологий. Одним из внедренных и уже установленных на скоростных автодорогах применений теории трех фаз является метод ASDA/FOTO. Метод ASDA/FOTO функционирует в работающей онлайн системе регулирования транспортных потоков, где на основе измерений выделяются фазы S и J в плотном транспортном потоке. Распознавание, отслеживание и прогнозирование положений фаз S и J осуществляется на основе методов теории трех фаз. Метод ASDA/FOTO реализован в компьютерной системе, способной быстро и эффективно обрабатывать большие объемы данных, измеренных датчиками в сети скоростных автомагистралей (см. примеры из трех стран на рис. 15).
197
Дальнейшее развитие приложений теории трех фаз Кернера связано с разработкой и усовершенствованием моделей для транспортных симуляторов, методов регулирования въездного потока на автомагистраль (ANCONA), методов коллективного регулирования транспортных потоков, системы автоматического ассистента водителя и методов детектирования состояния транспортного потока, описанных в монографиях [1, 2].
Рис. 15. Пространственно-временная структура транспортного потока, полученная методом ASDA/FOTO в трех странах. Взято из [1]
198
Литература 1. Kerner B. S. Introduction to Modern Traffic Flow Theory and Control. Berlin: Springer, 2009. 2. Kerner B. S. The Physics of Traffic. Berlin: Springer, 2004. 3. Lighthill M. J., Whitham G. B. On kinematic waves: II. Theory of traffic flow on long crowded roads // Proc. R. Soc. London, Ser. A. 1955. V. 229. P. 281–345. 4. Richards P. I. Shock Waves on the Highway // Oper. Res. 1956.V. 4. P. 42–51. 5. Уизем Дж. Линейные и нелинейные волны. М.: Мир, 1977. 6. Newell G. F. Applications of Queuing Theory. London: Chapman and Hall, 1982. 7. Newell G. F. Nonlinear effects in the dynamics of car-following // Oper. Res. 1961. V. 9. P. 209–229. 8. Newell G. F. A moving bottleneck // Transp. Res. B. 1998. V. 32. P. 531– 537. 9. Daganzo C. F. The cell transmission model: A dynamic representation of highway traffic consistent with the hydrodynamic theory // Transp. Res. B. 1994. V. 28. № 4. P. 269–287. 10. Herman R., Montroll E. W., Potts R. B., Rothery R. W. Traffic dynamics: studies in car following // Oper. Res. 1959. V. 7. P. 86–106. 11. Gazis D. C., Herman R., Potts R. B. Car following theory of steady state traffic flow // Oper. Res. 1959. V. 7. P. 499–505. 12. Gazis D. C., Herman R., Rothery R. W. Nonlinear follow the leader models of traffic flow // Oper. Res. 1961. V. 9. P. 545–567. 13. Gazis D. C. Traffic Theory. Berlin: Springer, 2002. 14. May A. D. Traffic Flow Fundamentals. Englewood Cliffs, NJ: PrenticeHall, 1990. 15. Leutzbach W. Introduction to the Theory of Traffic Flow. Berlin: Springer, 1988. 16. Daganzo C. F. Fundamentals of Transportation and Traffic Operations. New York: Elsevier Science Inc., 1997. 17. Muñoz J. C., Daganzo C. F. Traffic and Transportation Theory. Editor M. A. P. Taylor. Oxford: Pergamon, 2002. P. 441–462. 18. Gartner N. H., Messer C. J., Rathi A. (editors) Traffic Flow Theory. Washington, DC: Transportation Research Board, 2001.
199
19. Chowdhury D., Santen L., Schadschneider A. Statistical physics of vehicular traffic and some related systems // Phys. Rep. 2000. V. 329. P. 199– 329. 20. Helbing D. Traffic and related self-driven many particle systems // Rev. Mod. Phys. 2001. V. 73. P. 1067–1141. 21. Nagatani T. The physics of traffic jams //Rep. Prog. Phys. 2002. V. 65. P. 1331–1386. 22. Nagel K., Wagner P., Woesler R. Still flowing: Approaches to traffic flow and traffic jam modelling // Oper. Res., 2003. V. 51. P. 681–716. 23. Mahnke R., Kaupuźs J., Lubashevsky I. Probabilistic description of traffic flow // Phys. Rep. 2005. V. 408. P. 1–130. 24. Rakha H., Pasumarthy P., Adjerid S. A simplified behavioral vehicle longitudinal motion model // Transp. Lett. 2009. V. 1. P. 95–110. 25. Delitala M., Tosin A. Mathematical modelling of vehicular traffic: A discrete kinetic theory approach // Math. Models Methods Appl. Sci. 2007. V. 17. P. 901–932. 26. Blank M. Hysteresis phenomenon in deterministic traffic flows // J. Stat. Phys. 2005. V. 120. № 3-4. P. 627–658. 27. Maerivoet S., De Moor B. Cellular automata models of road traffic // Phys. Rep. 2005. V. 419. № 1. P. 1–64. 28. Kerner B. S., Klenov S. L. A microscopic model for phase transitions in traffic flow // J. Phys. A: Math. Gen. 2002. V. 35. P. L31–L43. 29. Kerner B. S., Klenov S. L., Wolf D. E. Cellular automata approach to three-phase traffic theory // J. Phys. A: Math. Gen. 2002. V. 35. P. 9971– 10013. 30. Davis L. C. Multilane simulations of traffic phases // Phys. Rev. E, 2004. V. 69. 016108. 31. Kerner B. S., Klenov S. L. Deterministic microscopic three-phase traffic flow models // J. Phys. A: Math. Gen. 2006. V. 39. P. 1775–1809. 32. Lee H. K., Barlović R., Schreckenberg M., Kim D. Mechanical Restriction versus Human Overreaction Triggering Congested Traffic States // Phys. Rev. Lett. 2004. V. 92. 238702. 33. Jiang R., Wu Q. S. Spatial–temporal patterns at an isolated on-ramp in a new cellular automata model based on three-phase traffic theory // J. Phys. A: Math. Gen. 2004. V. 37. P. 8197–8213. 34. Gao K., Jiang R., Hu S.-X., Wang B.-H., Wu Q. S. Cellular-automaton model with velocity adaptation in the framework of Kerner's three-phase traffic theory. Phys. Rev. E. 2007. V. 76. 026105.
200
35. Laval J. A. Linking synchronized flow and kinematic waves // In: Traffic and Granular Flow' 05. Editors A. Schadschneider, T. Pöschel, R. Kühne, M. Schreckenberg, D. E. Wolf. 2007. P. 521–526. 36. Hoogendoorn S., van Lint H., Knoop V. L. Macroscopic Modeling Framework Unifying Kinematic Wave Modeling and Three-Phase Traffic Theory // Trans. Res. Rec. 2008. V. 2088, P. 102–108. 37. Davis L. C. Controlling traffic flow near the transition to the synchronous flow phase // Physica A. 2006. V. 368. P. 541–550. 38. Davis L. C. Effect of cooperative merging on the synchronous flow phase of traffic // Physica A. 2006. V. 361. P. 606–618. 39. Davis L. C. Driver Choice Compared to Controlled Diversion for a Freeway Double On-Ramp in the Framework of Three-Phase Traffic Theory // Physica A. 2006. V. 379. P. 274–290. 40. Jiang R., Hua M.-B., Wang R., Wu Q.-S. Spatiotemporal congested traffic patterns in macroscopic version of the Kerner–Klenov speed adaptation model // Phys. Lett. A. 2007. V. 365. P. 6–9. 41. Jiang R., Wu Q.-S. Toward an improvement over Kerner–Klenov–Wolf three-phase cellular automaton model // Phys. Rev. E. 2005. V. 72. 067103. 42. Jiang R., Wu Q.-S. Dangerous situations in a synchronized flow model // Physica A. 2007. V. 377. P. 633–640. 43. Li X. G., Gao Z. Y., Li K. P., Zhao X. M. Relationship between microscopic dynamics in traffic flow and complexity in networks // Phys. Rev. E. 2007. V. 76. 016110. 44. Pottmeier A., Thiemann C., Schadschneider A., Schreckenberg M. Mechanical Restriction Versus Human Overreaction: Accident Avoidance and Two-Lane Traffic Simulations // In: Traffic and Granular Flow'05. Editors A. Schadschneider, T. Pöschel, R. Kühne, M. Schreckenberg, D. E. Wolf. Berlin: Springer, 2007. P. 503–508. 45. Siebel F., Mauser W. Synchronized flow and wide moving jams from balanced vehicular traffic // Phys. Rev. E. 2006. V. 73. 066108. 46. Wang R., Jiang R., Wu Q.-S., Liu M. Synchronized flow and phase separations in single-lane mixed traffic flow // Physica A. 2007. V. 378. P. 475–484. 47. Kerner B. S., Klenov S. L., Hiller A., Rehborn H. Microscopic features of moving traffic jams // Phys. Rev. E. 2007. V. 73. 046107. 48. Kerner B. S., Klenov S. L., Hiller A. Criterion for traffic phases in single vehicle data and empirical test of a microscopic three-phase traffic theory // J. Phys. A: Math. Gen. 2006. V. 39. P. 2001–2020.
201
49. Kerner B. S., Klenov S. L., Hiller A. Empirical test of a microscopic threephase traffic theory // Non. Dyn. 2007. V. 49. P. 525—553. 50. Kerner B. S. A theory of traffic congestion at heavy bottlenecks // J. Phys. A: Math. Theor. 2008. V. 41. 51. Davis L. C. Driver Choice Compared to Controlled Diversion for a Freeway Double On-Ramp in the Framework of Three-Phase Traffic Theory // Physica A. 2008. V. 387. P. 6395–6410. 52. Davis L. C. Realizing Wardrop equilibria with real-time traffic information // Physica A. 2009. V. 388. P. 4459–4474. 53. Davis L.C. Predicting travel time to limit congestion at a highway bottleneck // Physica A. 2010. V. 389. P. 3588–3599. 54. Gao K., Jiang R., Wang B.-H., Wu Q. S. Discontinuous transition from free flow to synchronized flow induced by short-range interaction between vehicles in a three-phase traffic flow model // Physica A. 2009. V. 388. P. 3233–3243. 55. Wu J. J., Sun H. J., Gao Z. Y. Long-range correlations of density fluctuations in the Kerner–Klenov–Wolf cellular automata three-phase traffic flow model // Phys. Rev. E. 2008. V. 78. 036103. 56. Jia B., Li X.-G., Chen T., Jiang R., Gao Z.-Y. Cellular automaton model with time gap dependent randomisation under Kerner's three-phase traffic theory // Transportmetrica. 2009. 1944–0987. DOI: 10.1080/ 18128600903312789. 57. Tian J.-F., Jia B., Li X.-G., Jiang R., Zhao X.-M., Gao Z.-Y. Synchronized traffic flow simulating with cellular automata model // Physica A. 2009. V. 388. P. 4827–4837. 58. Kerner B. S., Klenov S. L. Phase transitions in traffic flow on multi-lane roads // Phys. Rev. E. 2009. V. 80. 056101. 59. Kerner B. S., Klenov S. L. A theory of traffic congestion on moving bottlenecks // J. Phys. A: Math. Theor. 2010. V. 43. 42510. 60. Kokubo S., Tanimoto J., Hagishima A. A new cellular automata model including a decelerating damping effect to reproduce Kerner’s three-phase theory // Physica A. 2011. V. 390. P. 561–568. 61. Kerner B. S., Klenov S. L. Microscopic theory of spatial-temporal congested traffic patterns at highway bottlenecks // Phys. Rev. E. 2003. V. 68. 036130. 62. Krauß S., Wagner P., Gawron C. Metastable states in a microscopic model of traffic flow // Phys. Rev. E. 1997. V. 55. P. 5597–5602. 63. Gipps P. G. A behavioural car-following model for computer simulation // Transportation Research B. 1981. V. 15. P. 105–111.
202
М. Л. Бланк
Процессы с запретами в моделях транспортных потоков 1
Изучено несколько простых моделей транспортных потоков в виде процессов с запретами (как решеточных, так и с непрерывным пространством) и установлены явные формулы для некоторых связанных с ними статистик. В частности, получена так называемая фундаментальная диаграмма, выражающая зависимость средней скорости движения от плотности частиц.
1.
Введение
Одним из естественных способов математического моделирования транспортных потоков является их реализация в виде процессов с запретами (Exclusion Processes). Последние представляют собой системы частиц, совершающих случайные блуждания и взаимодействующих по закону «исключенного объема» (hard core). Впервые простейшую решеточную модель этого типа предложил Ф. Спитцер в 1970 г., и с тех пор подобные, на первый взгляд примитивные, модели нашли весьма широкое применение в самых различных областях, начиная с моделей транспортных потоков [2, 3, 10, 12, 16], синтеза протеинов и молекулярных моторов в биологии, роста случайных поверхностей в физике (см. [7, 17]) и до анализа диаграмм Юнга в теории представлений [9]. Качественно с точки зрения порядка взаимодействий частиц имеется два типа процессов с запретами: асинхронные и синхронные. В первом случае не более одной частицы может сдвинуться в данный момент времени, а во втором — все частицы двигаются одновременно. Последний вариант приводит к необходимости анализа кратных одновременных взаимодействий, однако с точки зрения приложений представляется более естественным. 1 Работа
была частично поддержана грантами РФФИ.
203
В работе будет изучено несколько простых моделей транспортных потоков этого типа (как решеточных, так и с непрерывным пространством) и установлены явные формулы для некоторых связанных с ними статистик. В частности, получена так называемая фундаментальная диаграмма, выражающая зависимость средней скорости движения от плотности частиц. Читатель может найти серьезные обзоры по «физическим» постановкам задач по этой тематике в [8, 12]. Мой собственный интерес к такого рода задачам возник в связи со следующим практическим наблюдением. Иногда быстрее идти против движения в медленно двигающейся толпе людей (например, в переходе метро), чем по движению. Стандартная вероятностная модель диффузии частицы по или против потока явно противоречит этому наблюдению, что указывает на специальную (неслучайную) внутреннюю структуру потока в рассматриваемом случае. Одной из целей настоящей работы является обсуждение того, как подобная структура возникает из произвольных (случайных) начальных конфигураций частиц. Мы начнем исследование с простейшей детерминированной модели на целочисленной решетке (описанной в разделе 2). Эта модель может быть полностью изучена элементарными средствами, и мы приводим ее в основном в педагогических целях. Однако даже в рамках такой модели отбрасывание условия регулярности начальной конфигурации частиц приводит к необходимости значительно более сложного математического анализа (см. [2, 3]). В дальнейшем оказалось, что с точки зрения математики проще изучать, на первый взгляд, значительно более сложную модель – процесс с запретами в непрерывном пространстве. В разделе 3 мы опишем эту модель и покажем, что ее ограничение на множество конфигураций, расположенных в целочисленных точках, инвариантно. Поэтому все полученные результаты применимы также к модели с дискретным пространством. Все известные подходы к анализу решеточных систем существенно используют комбинаторную структуру пространства конфигураций частиц (отметим, например, идею двойственности «частица– пустая позиция», используемую в разделе 2). Никаких аналогов подобных комбинаторных структур в непрерывном пространстве нет, что приводит к необходимости разработки фундаментально нового подхода. Процессы с запретами в непрерывном пространстве новы не толь204
ко как модели транспортных потоков, но и с чисто математической точки зрения. Первые результаты на эту тему получены недавно в [5], где была разработана оригинальная техника, позволяющая изучать эргодические (статистические) свойства таких процессов. Главной технической новинкой здесь является метод динамического каплинга (описанный в разделе 6). Отметим, что этот метод не только нов, но и используется нестандартно: вместо доказательства (обычного в теории каплинга) существования «успешного склеивания» (которого может и не быть в наших условиях) мы используем его наличие или отсутствие в качестве диагностического средства.
2.
Простейшая модель на целочисленной решетке
Начнем с простейшей одномерной модели транспортного потока, введенной в [16]. Эта модель описывается следующей динамической системой с дискретным временем и дискретным фазовым пространством – целочисленной решеткой Z, на которой расположены частицы. В следующий момент времени каждая частица либо передвигается вперед на одну позицию, если она свободна, либо остается на месте в противном случае. В случае конечной решетки с периодическими граничными условиями анализу (в основном численному) этой модели и некоторых ее обобщений в последнее время было посвящено большое число публикаций (см. [8; 10–12; 15, 16] и дальнейшие ссылки в них). Наиболее интересным явлением, обнаруженным в данных работах, является нетривиальная зависимость средней скорости движения частиц от их плотности V(ρ), равная 1 при ρ ∈ [0, 1/2] и ρ1 − 1 при ρ ∈ (1/2, 1]. Ниже мы выведем этот результат при помощи техники двойственных отображений для произвольных конечных и бесконечных решеток и начальных конфигураций. Кроме того, мы дадим полное описание предельных множеств (соответствующих стационарным транспортным потокам) и точную оценку длины переходного периода. Физическая интерпретация описанного результата – это наличие фазового перехода «газ–жидкость» от свободного движения частиц (при малой плотности) к постоянному наличию транспортных пробок (при большой плотности). С точки зрения теории динамических систем описанная выше модель может быть представлена следующим образом. Пусть 205
X = {0, 1}Z – множество всех возможных конфигураций – бинарных последовательностей x = x(i), i ∈ Z, единицы в которой соответствуют частицам, а нули – незанятым позициям на решетке. Рассмотрим отображение T : X → X: 1, если x(i) = 0, x(i − 1) = 1 или x(i) = x(i + 1) = 1, T x(i) := 0 — в остальных случаях. Группу из (более одной) последовательно стоящих частиц мы назовем кластером; а частицу в позиции i (т.е. x(i) = 1), позиция после которой не занята (т.е. x(i + 1) = 0), назовем свободной. Будем называть конфигурацию x ∈ X регулярной, если имеется число ρ = ρ(X) (плотность частиц) и монотонная функция ϕ(N ) → 0 при N → ∞, такие, что для любого N число частиц с координатами от n + 1 до n + N отличается от N ρ не более чем на N ϕ(N ) для любого n. Заметим, что конфигурация на конечной решетке длины n с периодическими граничными условиями соответствует n-периодической конфигурации на бесконечной решетке, которая удовлетворяет условию регулярности с ϕ(N ) = nρ(1 − ρ)/N . Под средней (по пространству) скоростью (частиц) V(x) понимается среднее значение (если оно корректно определено) перемещения частиц в конфигурации x во время следующей итерации отображения T . Отметим, что в разделе 4 будет введено и изучено более тонкое понятие средней скорости индивидуальной частицы. Теорема 2.1. Для любой регулярной начальной конфигурации x ∈ X с плотностью ρ 6= 1/2 через не более чем tc (x) = 21 ϕ−1 (| 12 − −ρ(x)|) итераций отображения T средняя скорость станет равна V = min(1, ρ1 − 1), и при любом t ≥ tc (x) выполняется следующая альтернатива: конфигурация T t x состоит либо только из свободных частиц, либо не имеет кластеров незанятых позиций. Более того, ∀n для n-периодических начальных конфигураций ограничение ρ 6= 1/2 снимается, для tc (x) справедлива лучшая оценка tc (x) = min(ρ(x)N, N − ρ(x)N ), и при t ≥ tc (x) последовательность {T t x}t становится n-периодической по t. Доказательство этой теоремы и ряда других результатов настоящей работы основано на идее введения двойственной динамической системы (T ∗ , X ∗ ), описывающей динамику незанятых позиций на решетке под действием основного отображения T . Здесь для конфигурации x ∈ X двойственная конфигурация x∗ определяется соот206
ношением x∗i = 1 − xi для всех i. Можно показать, что (T x)∗ = T ∗ x∗ при всех x ∈ X. Для рассматриваемой модели отображение T ∗ отличается от T только направлением движения частиц, что сводит анализ к конфигурациям низкой плотности ρ ∈ [0, 1/2], поскольку б´ольшая плотность соответствует плотности незанятых позиций меньшей 1/2. Это наблюдение резко упрощает задачу, поскольку динамика в случае высокой плотности частиц нетривиальна и трудно поддается непосредственному анализу. Далее показывая, что длина любого кластера частиц не может возрастать (т.е. в этой модели не могут возникать транспортные пробки), а число свободных частиц убывать, мы приходим к описанной в формулировке теоремы альтернативе, что и приводит к требуемым оценкам. Рассмотрим теперь модель движения со сверхбыстрыми частицами, отличающуюся от предыдущей тем, что на каждом шагу частица сдвигается вперед до следующей занятой позиции. Теорема 2.2. Для любой начальной конфигурации x, удовлетворяющей закону больших чисел с плотностью ρ(x) 6∈ {0, 1}, средняя 1 − 1. скорость частиц не зависит от времени и равна ρ(x) Качественно динамика этой модели богаче, чем в модели с медленными частицами, например, транспортные пробки типичны даже для конфигураций малой плотности. С другой стороны, несмотря на это, средняя скорость движения частиц V(ρ) для этой модели совпадает с предыдущим случаем при высокой плотности и аналитически продолжает ее при малой плотности. Сделаем несколько замечаний о простейших обобщениях и приложениях описанных моделей. Во-первых, часто рассматривается вероятностная постановка, при которой частица переходит на незанятую позицию с заданной вероятностью p (случай p = 1 возвращает нас к описанной детерминированной задаче). Как показывает численный анализ и качественные рассуждения (см. [8, 9, 15, 16]), результаты для детерминированного случая выглядят очень похоже и для стохастической версии при p достаточно близко к 1. Полный математический анализ здесь к настоящему времени проведен только для модели движения конечного набора частиц по окружности, а не бесконечной решетке (см. [11, 12]). Частичный ответ в общем случае получен также при анализе динамики в непрерывном пространстве (см. следующий раздел и [5]). Важным представляется вопрос о возможности описания мно207
гополосного движения в рамках процессов с запретами. Одной из возможностей здесь является изменение условия о том, что не более одной частицы может находиться в одной позиции на решетке, на условие о максимальном числе M > 1 частиц. В случае M = 2 эта модель в точности соответствует двухполосному движению, а при M > 2 представляет собой некоторое упрощение. Математический анализ детерминированной постановки данной задачи проведен в [2]. До сих пор мы обсуждали только модели, при которых оказывается справедливой точная зависимость между средней скоростью движения частиц и их плотностью. Как известно, экспериментальные данные показывают, что в общем случае одной плотности частиц может соответствовать целый набор средних скоростей или последнее понятие может не быть корректно определено. Оказывается, что простые модификации рассматриваемых нами моделей демонстрируют подобное поведение (см. [3–5; 8, 9, 15]). С точки зрения фазовых переходов описанное поведение соответствует возникновению новой «гистерезисной» фазы. Дадим теперь математическое описание наблюдения о движении пассивной быстрой частицы (имитирующей поведение спешащего прохожего) в медленном транспортном потоке, который мы сформулировали в начале данного раздела. Упрощая ситуацию, мы будем полагать (как обычно делают в гидродинамике), что движение нашей быстрой частицы не влияет на транспортный поток и описывается следующим образом. Положим τx+ (y) := min(i : y < i и x(i) = 1), τx− (y) := max(i : y > i и x(i) = 1). Тогда совместная динамика T± конфигурации частиц x ∈ X и положения быстрой частицы y ∈ Z определяется косым произведением отображения T и одного из отображений τ ± (знак соответствует движению по/против потока), т.е. T± (x, y) := (T x, τx± (y)). Под скоростью в момент t пассивной частицы будем понимать суммарное расстояние (со знаком), пройденное ею к этому моменту времени, деленное на t. Опираясь на полученное полное описание предельных множеств модели медленных частиц, мы получаем следующий результат. Теорема 2.3. Для любой регулярной начальной конфигурации с плотностью ρ(X) 6∈ {0, 1/2, 1} в случае неограниченной решетки средняя скорость быстрой частицы стремится (по t) к 1 при ρ ≤ 1/2 и движении вперед (по потоку), и к −max(1, 1/ρ(x) − 1) при движении назад (против потока). 208
vi r
∆i
xi
vi+1 r
xi+1
Рис. 1. Процесс с запретами в непрерывном пространстве
3.
Процессы с запретами в непрерывном пространстве
Перейдем теперь к изучению более общего класса процессов с запретами в непрерывном пространстве с синхронными взаимодействиями (т.е. все частицы пытаются двигаться одновременно). В непрерывном пространстве координатное представление конфигураций (принятое в предыдущем разделе) неудобно, и вместо этого предлагается следующее. Под конфигурацией частиц x := {xi }i∈Z будем понимать бесконечную (в обе стороны) последовательность действительных чисел xi ∈ R, которые можно интерпретировать как центры шаров заданного радиуса r ≥ 0 (см. рис. 1). Предполагается, что упорядочивание по индексу соответствует естественному порядку позиций центров шаров, т.е. . . . ≤ x−1 ≤ x0 ≤ x1 ≤ . . . Чтобы отметить зависимость от радиуса шара r ≥ 0, мы используем обозначение x(r) и только в предельном случае r = 0 не отмечаем этой зависимости, т.е. x ≡ x(0). Будем говорить, что конфигурация x(r) допустима, если xi (r) + r ≤ xi+1 (r) − r ∀i ∈ Z (соответствующие шары не пересекаются и могут только касаться), и обозначим через X(r) пространство допустимых конфигураций. Динамика в пространстве конфигураций определяется следующим образом. Начнем с тривиальной конфигурации, состоящей из единственной частицы, находящейся в момент времени t ≥ 0 в точке xt0 ∈ R (т.е. xt ≡ {xt0 }). В этом случае полагаем xt+1 := xt0 + v0t , 0 где {v0t } – заданная последовательность (случайных) величин. Значения v0t естественно рассматривать как локальные скорости частицы в момент времени t. Таким образом, полученный процесс – это 209
простое случайное блуждание в R. Обобщая эту тривиальную постановку на случай бесконечной конфигурации x(r) ∈ X и вновь интерпретируя (бесконечную в обе стороны по i ∈ Z) последовательность {vit }i,t как локальные скорости частиц в конфигурации xt (r) в момент t, получаем бесконечный набор случайных блужданий, ограниченных условиями сохранения порядка и законом исключенного объема (hard core exclusion rule). Для упрощения изложения мы ограничимся только случаем неотрицательных локальных скоростей, собственно только эта ситуация осмысленна в задачах транспортного моделирования. В общем случае при анализе локальных скоростей обоих знаков определения становятся существенно сложнее, но как результаты, так и доказательства почти не изменяются (см. [5]). Для неотрицательных локальных скоростей рассматриваемые нами запреты означают, что условие допустимости нарушается для i-й частицы в момент t ∈ Z+ тогда и только тогда, когда неравенство xti (r) + vit + r ≤ xti+1 (r) − r
перестает выполняться. В последнем случае мы будем говорить о конфликте между частицами i и i + 1, для разрешения которого применяется конструкция нормализации: vit → N (vit , xt (r)). Позиции частиц в момент времени t + 1 вычисляются по правилу: xt+1 (r) := xti (r) + N (vit , xt (r)) ∀i. i Нормализация может быть проведена различными способами (что приводит к существенно разным статистическим свойствам). В настоящей работе мы рассмотрим только слабую нормализацию (другие возможности изучены в [5]), при которой в случае конфликта локальная скорость меняется так, чтобы соотвествующая частица могла продвинуться вперед на максимально возможное расстояние. В терминах зазоров ∆i (xt ) ≡ ∆ti := xti+1 − xti − 2r
между частицами в конфигурации xt нормализация записывается следующим образом: t vi , если vit ≤ ∆ti ; t t N (vi , x ) := ∆ti — в противном случае. 210
Здесь важно отметить, что между любыми двумя конфигурациями частиц x(r), x ´(´ r) с общей последовательностью зазоров ∆ := {∆i } имеется взаимно однозначное соответствие ϕ: x ´i (´ r) = ϕ(xi (r)) := xi (r) − 2i(r − r´) ∀i ∈ Z. Поскольку нормализация зависит только от зазоров между частицами, достаточно провести анализ случая частиц нулевого радиуса (r = 0). Статистика в общем случае r > 0 пересчитывается при помощи замены переменных ϕ. С другой стороны, полагая r = = 1/2, x0i (r) ∈ Z ∀i ∈ Z и vit ∈ Z ∀i ∈ Z, t ≥ 0, мы получаем, что xti (r) ∈ Z ∀i ∈ Z, t ≥ 0. Последнее означает, что системы на целочисленной решетке инвариантны относительно веденной динамики. Поэтому наши результаты приводят к принципиально новому подходу для анализа решеточных систем. Заметим все же, что в случае r = 0 условие допустимости разрешает наличие произвольного (и даже бесконечного) числа частиц в одной точке пространства, что запрещено для решеточной системы. Естественно, без специальных предположений о структуре локальных скоростей {vit }i,t никакие содержательные результаты о динамике подобных систем невозможны. Будем полагать, что vit ∈ [0, v] ∀i ∈ Z, t ∈ Z0 := Z+ ∪ {0} и выполнено одно из следующих (на первый взгляд противоположных) предположений: t−1 P 1 min(v0s , γ) t t→∞ s=0
(a) vit ≡ v0t ∀i ∈ Z, t ∈ Z0 и ∃ v¯(γ) := lim почти наверное (п.н.);
∀γ > 0
(b) {vit } являются независимыми одинаково распределенными (н.о.р.), как по i, так и по t, случайными величинами (с.в.). Пересечение между множествами локальных скоростей, удовлетворяющих предположениям (a) или (b), не пусто и содержит принципиально важный случай чисто детерминированных скоростей: vit ≡ v ∀i ∈ Z, t ∈ Z0 . Как мы покажем, свойства всех систем, удовлетворяющих условию (a), близки к чисто детерминированному случаю. Поэтому в дальнейшем мы будем говорить о постановке (a) как о детерминированной,2 а о постановке (b) как о стохастической. 2 Заметим,
что {v0t } может быть траекторией детерминированного хаотического отображения f : [0, 1] → [0, 1], т.е. v0t+1 := vf t (v0t /v), как и (несмотря на название) реализацией настоящей стохастической цепи Маркова.
211
Заметим, что кажущаяся простейшей чисто детерминированная постановка vit ≡ v ∀i ∈ Z, t ∈ Z0 приводит к чрезвычайно сложной динамике частиц. Это видно например из того, что детерминированная динамическая система, описывающая динамику конфигураций частиц, в этом случае оказывается хаотической, и, более того, топологическая энтропия этой системы бесконечна (теорема 5.3). Обычно математический анализ систем взаимодействующих частиц начинают с изучения инвариантных распределений на них и, выбрав удачное инвариантное распределение, переходят к анализу его статистических характеристик. В нашем случае этот подход не работает. Дело в том, что у рассматриваемых нами систем может быть как бесконечно много инвариантных распределений, так и ни одного (напомним тривиальный пример одной частицы, совершающей асимметричное случайное блуждание). Несмотря на отсутствие инвариантного распределения, последний пример демонстрирует, что здесь имеется другая важная статистическая характеристика – средняя скорость движения частиц, легко вычисляемая в этом примере.
4.
Элементарные свойства
В этом разделе мы изучим вопросы, связанные с определениями понятий плотности и средней скорости частиц для процессов в непрерывном пространстве. Под плотностью ρ(x, I) конфигурации x ∈ X в ограниченном сегменте I = [a, b] ∈ R будем понимать число частиц из x, центры которых xi находятся в I, деленное на длину |I| > 0 сегмента I. Если для любой последовательности вложенных ограниченных сегментов n→∞ {In } с |In | −→ ∞ предел ρ(x) := lim ρ(x, In ) n→∞
корректно определен, то этот предел назовем плотностью конфигурации x ∈ X. В противном случае рассматриваются верхняя и нижняя (по отношению ко всем возможным коллекциям вложенных ограниченных сегментов {In }) плотности частиц ρ± (x). Замечание 4.1.
(a) Если ρ(x) < ∞, то |xn −xm | 212
|n−m|→∞
−→
1/ρ(x).
(b) Пусть конфигурации x(r) ∈ X(r), r > 0 и x ∈ X имеют общую ρ± (x) . последовательность зазоров {∆i }. Тогда ρ± (x(r)) = 1+2rρ ± (x) Лемма 4.2. Верхняя/нижняя плотности ρ± (xt ) инвариантны относительно динамики, т.е. ρ± (xt ) = ρ± (xt+1 ) ∀t. Под (средней по времени) скоростью i-й частицы в конфигурации x ∈ X в момент t > 0 будем понимать t−1
V (x, i, t) :=
1X N (vis , xs ) ≡ (xti − x0i )/t. t s=0
Если предел V (x, i) := lim V (x, i, t) t→∞
корректно определен, назовем его (средней по времени) скоростью i-й частицы. В противном случае рассматриваются нижняя и верхняя скорости частицы V± (x, i). Лемма 4.3.
Для любой конфигурации x ∈ X выполнено t→∞
|V (x, j, t) − V (x, i, t)| −→ 0 п.н. ∀i, j ∈ Z. Следствие 4.4. Нижняя и верхняя скорости i-й частицы V± (x, i) не зависят от индекса i. Доказательство этого результата кроме всего прочего демонстрирует тот факт, что в детерминированной постановке зазоры между последовательными частицами не могут существенно увеличиваться. Следующее утверждение показывает, что при некоторых слабых технических предположениях (заведомо выполняемых при высокой плотности частиц) большие зазоры со временем исчезают. Лемма 4.5. Пусть x ∈ X и рассматривается только чисто детерминированная постановка (т.е. vit ≡ v). Предположим, что ∀t ∃j > t : ∆j (xt ) < v. Тогда ∀i ∃ti < ∞ : ∆i (xt ) < 2v ∀t ≥ ti .
5.
Эргодические свойства
Сформулируем теперь основные результаты для процессов с запретами в непрерывном пространстве.
213
Теорема 5.1. Пусть плотность ρ(x) конфигурации x ∈ X корректно определена. Тогда множество предельных точек при t → ∞ последовательности {V (x, t)}t∈Z0 зависит только от ρ(x).
Теорема 5.2 (фундаментальная диаграмма). В детерминированной постановке t−1 1X v, если ρ(x) ≤ 1/v, min(1/ρ, v0s ) = V (x) = lim 1/ρ(x) — в противном случае, t→∞ t s=0 если
v0t ≡ v.
Следствие 5.1. Пусть для конфигурации x(r) ∈ X(r), r > 0 плотность ρ(x(r)) корректно определена и пусть ∀i, t vit ≡ v. Тогда 1 v, если ρ(x) ≤ v+2r , V (x(r)) = 1/ρ(x(r)) − 2r — в противном случае. В частности, для версии процесса на целочисленной решетке получаем 1 v, если ρ(x) ≤ v+1 , V (x(1/2)) = 1/ρ(x(1/2)) − 1 — в противном случае. Замечание 5.2. Последний результат совпадает с соответствующим утверждением о процессе на решетке, описанном в теореме 2.1 (см. также [2, 16]). Несмотря на это сходство, в решеточном случае имеется важное качественное отличие динамики: при высокой плотности частицы неминуемо образуют плотные кластеры (статические транспортные пробки). Доказательство же теоремы 5 в действительности показывает, что «типичное» поведение конфигураций высокой плотности качественно отлично: они также образуют кластеры частиц (т.е. наборы последовательных частиц, расстояния между которыми строго меньше v), но эти кластеры не стоят на месте, а передвигаются с постоянной скоростью как «эшелон». Интересно отметить, что ранее был разработан целый ряд весьма сложных решеточных моделей для имитации подобного поведения. В чисто детерминированной постановке (т.е. vit ≡ v ∀i, t) рассматриваемая система описывается детерминированным отображением Tv : X → X из пространства допустимых конфигураций в 214
себя. Покажем, что это отображение сильно хаотическое в том смысле, что его топологическая энтропия бесконечна.3 Читатель может найти детальное описание конструкций, связанных с энтропией динамической системы и ее свойств, например, в [13]. Чтобы обойти сложности, связанные с некомпактностью фазового пространства, мы определим топологическую энтропию отображения Tv (обозначение htop (Tv )) как супремум по всем метрическим энтропиям этого отображения относительно его вероятностных инвариантных мер. Теорема 5.3. Топологическая энтропия чисто детерминированного процесса с запретами в непрерывном пространстве бесконечна. Доказательство этого результата основано на аналогичном утверждении для действия отображения сдвига σv : X → X в непрерывном пространстве: (σv x)i := xi + v
i ∈ Z, x ∈ X.
Лемма 5.3. Топологическая энтропия отображения сдвига σv в непрерывном пространстве бесконечна. Идея здесь состоит в том, чтобы построить инвариантное подмножество пространства конфигураций X, на котором отображение σv изоморфно полному отображению сдвига в пространстве последовательностей со счетным алфавитом. Замечая теперь, что топологическая энтропия полного отображения сдвига в пространстве последовательностей с алфавитом из n элементов равна ln n, получаем наше утверждение.
6.
Каплинг
Одной из основных технических новаций в доказательстве результатов, сформулированных в предыдущем разделе, является конструкция «динамического» каплинга. Напомним, что под каплингом двух марковских процессов xt и t y , действующих на пространстве X, понимается представление этой 3 Обычно говорят, что отображение хаотическое, если его топологическая энтропия положительна, поэтому бесконечное значение энтропии говорит об очень высоком уровне хаотичности.
215
пары процессов на общем вероятностном пространстве. Иными словами, каплинг — это процесс пар (xt , y t ), определенный на пространстве прямого произведения X × X, удовлетворяющий следующим условиям: P ((xt , y t ) ∈ A × X) = P (xt ∈ A),
P ((xt , y t ) ∈ X × A) = P (y t ∈ A),
т.е. проекции нового процесса пар ведут себя точно так же, как исходные процессы. Обсудим теперь конструкцию динамического каплинга между двумя копиями xt , x ´t рассматриваемого нами марковского процесса. Обычно при анализе систем взаимодействующих частиц на решетке с асинхронными взаимодействиями используется так называемый «равный» каплинг (см., например, [14]). В этом случае каплинг состоит в спаривании частиц процессов xt , x ´t , занимающих одинаковые позиции. После спаривавания все выборы случайных скоростей для элементов одной пары предполагаются одинаковыми. В рассматриваемом нами случае систем с синхронными взаимодействиями этот подход не работает. Действительно, произвольное число частиц может сдвинуться одновременно, что приводит к ситуации, когда частицы, принадлежащие процессам xt , x ´t , обгоняют друг друга, но при этом ни в какой момент времени не занимают одинаковые позиции. Кроме того, имеется и более важное препятствие: может оказаться, что движение только одной частицы из пары заблокировано в момент t неспаренной частицей. В результате одновременного движения всех этих частиц получаем следующую диа◦ ◦ грамму: •◦ • −→ ◦ . Как видим, старая пара уничтожается, но при равном каплинге новая пара не образуется. Здесь и далее мы используем диаграммное представление для конфигураций при каплинге: спаренные частицы обозначаются черными кружками, а неспаренные — белыми, при этом верхняя строка диаграммы показывает x-частицы (т.е. частицы x-процесса), а нижняя строка соответствует x ´-частицам. Чтобы обойти это препятствие, мы и вводим динамический4 каплинг, описанный в [5, 6]. Отметим для сравнения идейно близкую конструкцию каплинга в [1, 11], предложенную для случая решеточных систем с асинхронными взаимодействиями. Важным преимуще4 Слово «динамический» используется для того, чтобы подчеркнуть то, что взаимное положение частиц в одной паре меняется со временем, в отличие от равного каплинга.
216
ством динамического каплинга по отношению к этим конструкциям является ограниченность расстояний между элементами одной пары (в конструкциях [1, 11] эти расстояния могут становиться бесконечно большими). Под динамическим каплингом процессов xt , x ´t понимается последовательное спаривание достаточно близко расположенных частиц в разных процессах, удовлетворяющее следующим условиям. (A1) В момент t = 0 все частицы предполагаются неспаренными. Локальные скорости взаимно спаренных частиц всегда одинаковы. (A2) Однажды созданная пара частиц никогда не исчезает; при этом частицы, образующие данную пару, могут меняться. (A3) Частица, обгоняющая под действием динамики за один шаг времени некоторые неспаренные частицы, становится спаренной с одной из них. Согласно (A1) – (A3) частицы, принадлежащие одной паре, двигаются синхронно до тех пор, пока либо нарушается условие допустимости для одной из них (т.е. ее движение заблокировано другой частицей), либо одна из частиц в паре заменяется неспаренной частицей, принадлежащей тому же процессу (см. рис. 2). Удобно представлять результат каплинга наших процесов как «газ», состоящий из ординарных (неспаренных) частиц и «гантелей» (пар). Спаренная прежде частица (элемент гантели) может наследовать роль ординарной от одного из своих соседей. Для того чтобы удобнее отслеживать позиции неспаренных частиц, мы будем называть их x- и x ´-дефектами в зависимости от процесса, к которому они принадлежат. Практически динамический каплинг может быть реализован самыми разными способами (в частности, используя только идею обгона частиц). Чтобы продемонстрировать гибкость конструкции, мы опишем другой подход. Отметим, что в дальнейшем только свойства (A1) – (A3) используются в доказательствах. Под x-тройкой ( •◦ • или • ◦• ) в процессе пар (xt , x ´t ) понимается две взаимно спаренные частицы и x-дефект, находящийся между ними, индекс которого отличается на единицу от индекса спаренной x-частицы. x ´-тройка ( •◦ • или • ◦• ) определяется аналогично. 217
xt x ´t
xt+1 x ´t+1
i i+1 t d A vi+1 AAjt vj = vi
i+2 d vi+2
id it + 1 A A jt A
j d+ 1 vj+1
i+ t 2 A AA jt + 1
Рис. 2. Спаривание частиц. Взаимно спаренные частицы обозначены черными кружками и соединены прямыми линиями, а дефекты — белыми кружками. В момент t частицы i и j спарены, тогда как в момент t + 1 x-частица i становится неспаренной, а x ´-частица j спаривается с x-частицей i + 1. Неспаренные в момент t частицы i + 2 и j + 1 спариваются в момент t + 1
Говорят, что две пары частиц пересекают друг друга, если прямые линии, соединяющие позиции частиц из одной пары, пересекаются, т.е. •⋆ ⋆• (здесь взаимно спаренные частицы обозначены одинаковыми символами). ´-дефектом в x ´tj x-дефект в xti вместе с ближайшим к нему5 x ◦ ◦ t t ( ◦ или ◦ ) назовем d-парой, если |xi − x ´j | < v, эта пара дефектов не пересекается с другими взаимно спаренными частицами, и интервал (xti , x ´tj ) не содержит других дефектов. Будем говорить, что d-пара (i, j) меньше чем d-пара (n, m), если |i| < |n|, или i < n — в случае |i| = |n|. Заметим, что ситуация i = n и j 6= m может произойти, в отличие от ситуации i 6= n и j = m. Приведем два примера. В наборе •◦•• • две первых x-частицы вместе с первой x ´-частицей образуют x-тройку, несмотря на наличие дополнительной спаренной частицы в интервале между ними. С другой стороны, набор ◦••◦ не содержит ни троек, ни d-пар. Пара конфигураций (xt , x ´t ) называется правильной, если она не содержит x- или x ´-троек, d-пар и пересекающихся взаимно спаренных частиц. 5 Если имеется несколько ближайших x ´-дефектов, то выбирается тот, который имеет минимальный индекс.
218
Правильность пары конфигураций (xt , x ´t ) в момент t в общем случае не препятствует тому, что под действием динамики в момент (t + 1) пара (xt+1 , x ´t+1 ) может оказаться неправильной. В частности, могут возникнуть тройки обоих типов и d-пары, например • • или ◦ ◦◦ −→ ◦◦◦ . Здесь важно, что ввиду сохране• ◦ −→• ◦ ния порядка частиц пересекающиеся взаимно спаренные частицы не могут появиться. Лемма 6.1. Пусть пара конфигураций (xt , x ´t ) не имеет пересекающихся взаимно спаренных частиц. Тогда тройки одного типа не могут иметь общих элементов. Поэтому все тройки одного типа могут быть устранены одновременно. Под устранением x- или x ´-тройки будем понимать следующее: бывший дефект спаривается с частицей из другого процесса, а спаренная ранее частица становится неспаренной: ◦ • •
−→
• ◦ . •
Устранение d-пары еще проще: дефекты «аннигилируют» друг друга, образуя спаренную пару частиц: ◦◦ −→ •• . Во всех случаях позиции частиц сохраняются, а меняются только их «роли». В результате конструкция динамического каплинга состоит из следующих шагов. 1. Каждая x-тройка рекурсивно устраняется:
◦ • •
−→
• ◦ •
.
2. Каждая x ´-тройка рекурсивно устраняется:
• ◦ •
−→
• • ◦
.
• •
.
3. Наименьшая6 d-пара рекурсивно устраняется:
◦ ◦
−→
Лемма 6.2. Описанная процедура каплинга корректно определена, приводит к марковскому процессу пар и удовлетворяет условиям (A1) – (A3). Чтобы объяснить необходимость рекурсий, заметим, что пространственные сегменты, на которых расположены спаренные частицы, могут пересекаться. Поэтому устранение x- или x ´-тройки может привести к созданию новой тройки того же типа: ◦ • • • • 6 Порядок
−→
• ◦ • • •
−→
• • ◦ . • •
d-пар может меняться после каждой процедуры рекурсии.
219
Заметим теперь, что при рекурсиях в процедуре каплинга дефект может сдвинуться на произвольно большое расстояние от его начальной позиции: • • ··· • • ◦ • • ··· • •
−→
• • ··· • • • • ··· • • ◦ .
Обозначим через ρu (x, I) плотность x-дефектов в конечном сегменте I, а через ρu (x) := ρu (x, R) — верхний предел величин ρu (x, In ), взятый по всем возможным наборам вложенных конечных сегментов In , длины которых стремятся к бесконечности. Говорят, что каплинг двух марковских процессов xt , x ´t почти удачен, если верхняя плотность x-дефектов ρu (x) стремится к нулю по времени почти наверное. Это определение существенно отличается от принятого определения удачного каплинга (см., например, [14]), которое, грубо говоря, означает, что рассматриваемые процессы со временем стремятся друг к другу. Применяя понятие почти удачного каплинга к рассматриваемым процессам с запретами, получаем следующий условный результат. Лемма 6.3. Пусть x, x ´ ∈ X с ρ(x) = ρ(´ x) > 0, и предположим, что имеет место почти удачный каплинг (xt , x ´t ), удовлетворяющий дополнительному условию о том, что расстояния между взаимно спаренными частицами равномерно ограничены сверху величиной γ(t) = o(t). Тогда t→∞
|V (x, 0, t) − V (´ x, 0, t)| −→ 0.
7.
Схема доказательства основных эргодических результатов
Начнем с двух технических результатов. Лемма 7.1. Супремум |Wijt | := xti − x ´tj по всем взаимно спаренным частицам при динамическом каплинге (см. раздел 6) процессов (xt , x ´t ) равномерно ограничен величиной v для любого t ∈ Z0 .
Лемма 7.2. Пусть ρ(x) = ρ(´ x) и пусть при каплинге ∀i, j найдется такой (случайный) момент времени tij < ∞, что xti > x ´tj для любого t ≥ tij . Тогда каплинг почти успешен.
220
При наших предположениях (стандартный) удачный каплинг7 может не существовать (например, в случае чисто детерминированной постановки с двумя равнораспределенными начальными конфигурациями, сдвинутыми друг относительно друга). Поэтому лемма 7.1 не может быть применена непосредственно для сравнения скоростей частиц. Тем не менее оказывается, что это не является серьезным препятствием и даже отсутствие удачного каплинга может быть использовано в качестве диагностического средства. Идея доказательства теоремы 5.1 состоит в следующем. Рассмотрим две произвольных допустимых конфигурации x, x ´ одинаковой плотности ρ > 0. Если предположить, что имеется почти удачный динамический каплинг процесса пар с начальными условиями x, x ´, то по лемме 7.1 выполняются условия леммы 6.3, откуда следует, что t→∞ |V (x, 0, t)−V (´ x, 0, t)| −→ 0. Применение леммы 4.3 доказывает наше утверждение. Предположим теперь, что нет почти удачного динамического каплинга. Определим новые случайные величины: Wijt := xti − x ´tj , i, j ∈ Z, t ∈ Z0 . Тогда V (x, i, t) − V (´ x, j, t) = Wijt /t − Wij0 /t. Согласно лемме 4.3 средние скорости разных частиц в одной конфигурации стремятся друг к другу со временем. Поэтому достаточно t рассмотреть случай i = j = 0. Для W00 возможны три следующих ситуации. t (a) lim W00 /t = 0. Тогда |V (x, 0, t) − V (´ x, 0, t)| ≤ t→∞
t→∞
t 0 ≤ |W00 |/t + |W00 |/t −→ 0, что по следствию 4.4 влечет совпадение средних скоростей. t (b) lim sup W00 /t > 0. Тогда ∀i ∈ Z i-я частица x-процесса со вреt→∞
менем обгонит любую частицу x ´-процесса, исходно расположенную правее точки x0i . Это наблюдение вместе с условием равенства плотностей позволяет применить лемму 7.2, согласно которой каплинг почти успешен. С другой стороны, по
7 Удачный каплинг — когда почти все частицы со временем оказываются спаренными.
221
лемме 7.1 расстояния между взаимно спаренными частицами не могут превысить величины v. Поэтому по лемме 6.3 t→∞ имеем |V (x, 0, t) − V (´ x, 0, t)| −→ 0, что противоречит предположению (b). t (c) lim sup W00 /t < 0. Меняя роли процессов xt , x ´t , возвращаемся t→∞
к случаю (b). Поэтому только предположение (a) может иметь место. Идея доказательства теоремы 5 состоит в построении для каждого значения плотности специального семейства конфигураций, остающегося инвариантным под действием динамики. Показывается, что для любой конфигурации из этого семейства все частицы двигаются с постоянной скоростью, которая явно вычисляется. Применяя теперь результат теоремы 5.1 о том, что конфигурации одинаковой плотности имеют одинаковые средние скорости, получаем требуемое утверждение.
222
Литература 1. Angel O. The Stationary Measure of a 2-type Totally Asymmetric Exclusion Process // J. Combin. Theory Ser. A. 2006. V. 113. N. 4. P. 625–635. [arXiv/0501005 math.CO]. 2. Blank M. Ergodic properties of a simple deterministic traffic flow model // J. Stat. Phys. 2003. V. 111. N. 3–4. P. 903–930. 3. Blank M. Hysteresis phenomenon in deterministic traffic flows // J. Stat. Phys. 2005. V. 120. N. 3–4. P. 627–658. [math.DS/0408240]. 4. Blank M. Travelling with/against the Flow. Deterministic Diffusive Driven Systems // J. Stat. Phys. 2008. V. 133. N. 4. P. 773–796. [arXiv:0810.2205 math.DS]. 5. Blank M. Metric properties of discrete time exclusion type processes in continuum // J. Stat. Phys. 2010. V. 140. N. 1. P. 170–197. [arXiv:0904.4585 math.DS]. 6. Бланк М. Л., Пирогов С. А. О квазиуспешном каплинге марковских процессов // Пробл. передачи информ. 2007. Т. 43. № 4. С. 51–67. 7. Borodin A., Ferrari P. L., Sasamoto T. Large time asymptotics of growth models on space-like paths II: PNG and parallel TASEP // [arXiv:0707.4207 math-ph], 2007. 8. Chowdhury D., Santen L., Schadschneider A. Statistical physics of vehicular traffic and some related systems // Physics Reports. 2000. V. 329. P. 199–329. [arXiv:0007053 cond-mat]. 9. Comtet A., Majumdar S. N., Ouvry S., Sabhapandit S. Integer partitions and exclusion statistics: limit shapes and the largest parts of Young diagrams // J. Stat. Mech. 2007. P10001. [arXiv:0707.2312]. 10. Evans M. R., Rajewsky N., Speer E. R. Exact solution of a cellular automaton for traffic // J. Stat. Phys. 1999. V. 95. P. 45–98. 11. Evans M. R., Ferrari P. A., Mallick K. Matrix representation of the stationary measure for the multispecies TASEP // [arXiv:0807.0327 math.PR], 2008. 223
12. Gray L., Griffeath D. The ergodic theory of traffic jams // J. Stat. Phys. 2001. V. 105. N. 3–4. P. 413–452. http://psoup.math.wisc.edu/traffic/ 13. Корнфельд И. П., Синай Я. Г., Фомин С. В. Эргодическая теория. М.: Наука, 1980. 14. Liggett T. M. Interacting particle systems. N.Y.: Springer-Verlag, 1985. 15. Maerivoet S., De Moor B. Cellular Automata Models of Road Traffic // Physics Reports. 2005. V. 419. N. 1 P. 1–64. [arXiv:physics/0509082]. 16. Nagel K., Schreckenberg M. A cellular automaton model for freeway traffic // J. Physique I. 1992. V. 2. P. 2221–2229. 17. Penrose M. D. Existence and spatial limit theorems for lattice and continuum particle systems // Probab. Surveys. 2008. V. 5. P. 1–36.
224
Е. В. Гасникова
О возможной динамике в модели расчета матрицы корреспонденций 1. ВВЕДЕНИЕ После работ ряда крупных биологов первой половины прошлого века, а также работ Е. Т. Джейнса (конца 50-х годов XX века) [1], А. Дж. Вильсона (конца 60-х годов ХХ века) [2], И. Пригожина с коллегами, Г. Хакена (70-е годы XX века) [3, 4] в литературе достаточно прочно укрепилась концепция о плодотворности перенесения термодинамического формализма (см., например, [5–14] и цитированную там литературу) на различные макросистемы (в частности, встречающиеся в экономике, биологии, социальной сфере [2–4; 15–24]). В России систематические исследования в этом направлении были предприняты Л. Н. Розоноэром в начале 1970-х [25] (см. также [26–34] и цитированную там литературу). Упомянутая концепция часто используется для нахождения равновесия макросистемы. А именно, по аналогии с феноменологической термодинамикой, вводится вероятностное распределение на множестве состояний, в которых может пребывать макросистема. Такое распределение может, например, совпадать с инвариантной мерой эргодической динамической системы, порождающей рассматриваемую макросистему [11], или с финальным (равным стационарному) распределением эргодического (например, марковского) случайного процесса, порождающего рассматриваемую макросистему [35–40]. Если размерность макросистемы увеличивается, то, как правило, распределение сосредотачивается в окрестности наиболее вероятного макросостояния 1. Таким образом, с ростом времени наблюдения за макросистемой и размерности макросистемы следует ожидать нахождения макросистемы с большой вероятностью в малой окрестности наиболее вероятного макросостояния вне зави1 Заметим, что отмеченное обстоятельство (концентрация) может быть по-разному обосновано (как правило, достаточно элементарных комбинаторных соображений и формулы Стирлинга [1, 2, 30, 33].
225
симости от того, в каком состоянии макросистема находилась сначала (иначе говоря, большую часть времени (иногда, и просто, на больших временах) макросистема будет пребывать в малой окрестности наиболее вероятного макросостояния). Естественно поэтому под равновесием макросистемы понимать наиболее вероятное макросостояние. Задача нахождения наиболее вероятного макросостояния часто сводится (асимптотически по размерности системы) к задаче максимизации энтропийно подобного функционала при ограничениях (в термодинамике таким образом можно получить статистики Больцмана, Ферми–Дирака, Бозе–Эйнштейна [1, 5]). Подробнее о приложениях этой концепции см., например, [1, 2, 30, 33; 41–45].2
2. ВОЗМОЖНАЯ ДИНАМИКА, ПРИВОДЯЩАЯ В АСИМПТОТИКЕ (ПО ВРЕМЕНИ) К СТАТИЧЕСКОЙ МОДЕЛИ А. ДЖ. ВИЛЬСОНА РАСЧЁТА МАТРИЦЫ КОРРЕСПОНДЕНЦИЙ
Рассмотрим для начала более простой пример, иллюстрирующий формализм, описанный во введении. Пример 1 (кинетика социального неравенства [23, 47]). В городе живет N 1 (например, 10 000) пронумерованных жителей. У каждого i-го жителя есть в начальный (нулевой) момент времени целое (неотрицательное) количество рублей si 0 (монетками, достоинством в один рубль). Со временем пронумерованные жители (количество которых не изменяется, так же как и суммарное количество рублей) случайно разыгрывают свое имущество. Пусть в момент времени t 0 r-й житель имеет k рублей, а l-й житель – m рублей. Тогда pk ; m t t o t есть вероятность того, что жители с Укажем некоторые часто встречающиеся в приложениях [41–45] формализмы, также приводящие к задачам оптимизации энтропийно подобных функционалов: принцип наибольшего правдоподобия (при оценке неизвестных параметров по простой выборке); принцип максимума апостериорной вероятности; наименьшее отклонение в смысле расстояния Кульбака–Лейблера (энтропийное расстояние) [46]; принцип наименьшей неопределенности (энтропия – мера неопределенности) в теории информации (рассуждения опираются в ряде случаев на теорему Шеннона–МакМиллана–Бреймана). Важно также отметить, что энтропийно подобный функционал часто является функцией Ляпунова для динамической системы (например, системы обыкновенных дифференциальных уравнений, итерационного процесса, уравнения(-ий) в частных производных эволюционного типа и т.п.), порождающей рассматриваемую макросистему [12; 17–20]. Пожалуй, наиболее ярким примером этого тезиса является кинетическая теория (Л. Больцман [8]).
2
226
номерами r и l ( 1 r l N ) встретятся и попробуют разыграть один рубль по следующему правилу: с вероятностью 1 2 житель с большим номером отдаѐт 1 рубль (если, конечно, он не банкрот) жителю с меньшим номером и с вероятностью 1 2 наоборот. Будем считать, что pk ; m t N 1 ( 0 ). При этом «в среднем» в единицу времени осуществляется N 2 встреч. Т.е., скажем, при 1 в единицу времени каждый житель с вероятностью, большей 1 2 , с кем-то должен встретиться. Приблизительно такую постановку задачи в конце XVIII века предложил известный итальянский экономист Вильфредо Парето, чтобы объяснить социальное неравенство. Пусть cs t – доля жителей города, имеющих ровно s рублей в момент времени t (заметим, что cs t – случайная величина). Пусть N S S si 0 , s . N i 1 Тогда по эргодической теореме для конечных однородных марковских цепей (см. [18, 19; 35–38] и упражнение ниже):3 q 0, ..., S q 0, Tq N : t Tq c t q P s s s 1 , s 0, ..., q 0.999 , Ce N где C определяется из условия нормировки: S 1 Ce s s 1 , т.е. C . s s 0 Скорость сходимости оценивается сверху, исходя из оценок в доказательстве эргодической теоремы для однородных марковских цепей с
3 Эргодическая теорема используется для нахождения распределения случайных величин cs t на больших временах. Далее используются законы больших чисел или, дру-
гими словами, явление концентрации инвариантной (стационарной) меры, о котором мы подробнее поговорим в следующем примере. Точнее не само это явление, а его следствие о том, что «хорошие» (например, липшицевы) функции на «хороших» компактных пространствах с мерой большого числа измерений почти везде близки к медиане [48].
227
конечным числом состояний.4 Как показывают численные эксперименты, оценка N точная. Так, если в городе 10 000 жителей и единица времени – день, то при начальном «социальном равенстве» с вероятностью, близкой к единице, через 20–30 лет (при 1 ) установится «социальное неравенство». Заметим, что описанный выше случайный процесс обратим во времени. Однако наблюдается необратимая динамика cs t . Но в таком случае можно удивляться также и тому, что газ, собранный в начальный момент в одной половине сосуда, с течением времени равномерно распределится по сосуду. Приведем отчасти схожую постановку задачи (та же самая мера будет концентрироваться), восходящую к В. П. Маслову [33]. Ниже приведен фрагмент его интервью 2009 года, посвященного объяснению финансового кризиса 2008 г. В. П. Маслов: Поясню на знаменитом трюке Коровьева– Фагота – помните булгаковского героя, который разбрасывал в варьете червонцы? Понятно, что кому-то досталось больше купюр, кому-то меньше, а кто-то вообще остался ни с чем. Вопрос: если купюр миллион, то сколько должно быть зрителей, чтобы ни один не остался без банкноты? Вроде очень неопределенная задача, не Необходимо (для простоты формулировок, в рамках этой сноски считаем время ди скретным) асимптотически (по размеру макросистемы) оценить второе по величине м одуля собственное значение матрицы переходных вероятностей – инфинитезимальной матрицы (первое собственное значение, которое для неотрицательных матриц часто называют числом Фробениуса–Перрона, равно единице, поскольку матрица стохастическая – все элементы неотрицательны и сумма всех элементов в любой строке равна единице), определяющее основание геометрической прогрессии, мажорируемой последовательность норм отклонений текущего состояния от стационарного в различные моменты времени [35–38]. Здесь нельзя не упомянуть о том, что в этом направлении за последние несколько десятков лет произошла определенная революция [49], которую можно пояснить рассмотренным примером 1. Несложно проверить, что число (макро-) состояний марковской цепи в этом примере растет быстрее, чем экспоненциально с ростом N . В то время как по прошествии всего лишь N тактов распределение це4
пи будет уже довольно близко к финальному (предельному) = стационарному (инвариантному). Таким образом, если возникает потребность быстро сгенерировать дискретные случайные величины, которые могут принимать огромное число значений, то в ряде случаев удается подобрать такую марковскую цепь, которая быстро «выйдет» на стационарный режим, соответствующий желаемому распределению. Несколько интересных примеров в этом направлении (модель Изинга и др.) собрано, например, в современном курсе марковских случайных процессов [38]. Заметим, что при оценках второго по величине модуля собственного значения активно используется уже упоминавшийся принцип концентрации меры (см. [49, 50] и цитированную там литературу, а также приложение А. В. Колесникова).
228
имеющая однозначного решения. И тем не менее ответ есть: примерно квадратный корень из миллиона, то есть тысяча зрителей. Точнее говоря, как следует из выше написанного, с вероятностью, близкой к 1, доля банкротов будет равна примерно 1 s 0.001 , поскольку по условию sN S 106 и N S . Поэтому количество банкротов с вероятностью, близкой к 1, незначительно отличается от N s 1. Упражнение (принцип сжимающих отображений и фокусирующие операторы, эргодическая теорема для конечных однородных марковских цепей [51])*. а) Покажите, что если оператор (вообще говоря, нелинейный) A действует в полном метрическом пространстве X и k : x, y X Ak x , Ak y x, y , 0,1 , то ! x* X : A x* x* и x X An x , x * n k .
б) Пусть X Pn – множество лучей пространства n , лежащих во внутренности неотрицательного ортанта, на котором введена метрика Биркгофа: x y x, y ln min : x y x ln min j k . j , k 1,..., n x y k j Покажите, что X – полное метрическое пространство. Покажите, что если линейный оператор A : X X ( A aij
n i , j 1
– матрица n n )
положительный, т.е. i, j 1,..., n aij 0 , то 0,1 : x, y X Ax, Ay x, y .
в) (стохастический вариант теоремы Фробениуса–Перрона, или эргодическая теорема для конечных однородных дискретных марковских цепей (д.м.ц.)). Следующие условия для стохастической матрицы n n P равносильны: 0 , т.е. i, j 1, ..., n pij m0 0 ; T 2) P – эргодическая матрица, т.е. p* 0 : lim P m p* , p* ,..., p* , m n причѐм p* является единственным решением системы:
1) m0 : P m0 pij m0
n
i , j 1
229
p*T p*T P ,
n
p k 1
* k
1 .5
(S)
Пример 2 (модель расчета матрицы корреспонденций [2]). В некотором городе имеется n районов, Li 0 – число жителей i -го района, W j 0 – число работающих в j -м районе (число рабочих мест), x ij t 0 – число жителей, живущих в i-м районе и работающих в j-м в момент времени t 0 . Со временем пронумерованные n
n
i 1
j 1
жители (количество которых не меняется6 и равно N Li W j ) меняют места жительства (квартиры). Считается, что отмеченные изменения могут происходить только за счѐт обмена квартирами, т.е. 5
T Заметим, что из вида матрицы lim P m p* , p* ,..., p* следует, что m n
n T p 0 0 pk 0 1 lim p m lim P m p 0 p* . m k 1 m Это условие означает равенство финального распределения ( lim p m ) стационарному m
p* ( p* PT p* ) вне зависимости от начального распределения p 0 . Заметим также, что условия 1), 2) равносильны следующим требованиям: конечная однородная д.м.ц. с матрицей переходных вероятностей P – неразложимая = неприводимая (т.е. из произвольного состояния «можно прийти» в любое, наперед заданное) и непериодическая
( Н.О.Д. k : P k 0 1 ). Если убрать условие непериодичности, то 11
! p* 0
p
*
S : lim
N
T 1 N m p* , p* ,..., p* (сходимость по Чезаро). P N m1 n
Если перейти к непрерывному времени, осуществляя соответствующий скейлинг, то легко показать, что необходимость в условии непериодичности исчезает. Если же цепь разложима, то система (S), вообще говоря, уже будет разрешима не единственным образом. Финальное распределение существует, но уже может зависеть от того, с какого распределения стартуем. Соответствующий вариант эргодической теоремы приведен, например, в [37]. Доказательство в [37] также базируются на принципе сжимающих отображений. Другое, более вероятностное, доказательство эргодической теоремы для конечных однородных д.м.ц. имеется, например, в [35, 38] и базируется на каплинге (см. также приложение М. Л. Бланка). 6 Поскольку мы будем следить за системой на больших временах, то сделанное предположение кажется неестественным. Заметим, однако, что если «номер жителя» передаѐтся его потомкам (номер папы передаѐтся сыну, номер мамы – дочери), то предположение о постоянстве состава жителей выглядит разумным в первом приближении. Здесь мы также пренебрегаем миграционными потоками (город изолирован).
230
x ij t 0 ,
n
n
x t L , x t W ij
j 1
i
ij
i 1
j
, i, j 1, ..., n .
(A)
Пусть в момент времени t 0 r-й житель живет в k-м районе и работает в m-м, а l-й житель живет в p-м районе и работает в q-м. Тогда pkL, m; p, q t t o t – есть вероятность того, что жители с номерами r и l ( 1 r l N ) поменяются квартирами в промежутке времени t , t t . Естественно считать, что вероятность в единицу времени обмена местами жительства зависит только от мест проживания и работы обменивающихся. Например, можно считать, что время, потраченное в пути от района i до района j , есть tij 0 (вместо tij в приводимую ниже формулу также осмысленно подставлять lij 0 – расстояние от района i до района j ), а
pkL, m; p , q t p L N 1 exp tkm t pq t pm tkq 2 0 ,
где p 0 , 0 . Тогда по эргодической теореме для конечных L
однородных марковских цепей (см. [18, 19; 35–38]): xij
A lim P x ij t xij , i, j 1,..., n
n, n
i 1, j 1
Z 1
t
n, n
i 1, j 1
exp tij xij xij ! p xij 1 def
n, n
i 1, j 1
,
где статсумма Z находится из условия нормировки получившейся
пуассоновской вероятностной меры [52]. Распределение p xij
n, n
i 1, j 1
на множестве (A) сконцентрировано при N 1 (см. ниже) в окрестности наиболее вероятного значения
x
* n, n ij i 1, j 1
, которое находится,
как решение задачи энтропийно линейного программирования:7
Нетрудно заметить, что задача поиска наиболее вероятного состояния асимптотически (по n ) эквивалентна задаче максимизации энтропийного функционала (воспользовались формулой Стирлинга): 7
ln p xij
n, n
i 1, j 1
~ x ln x n, n
i 1, j 1
ij
231
ij
e
n, n
i 1, j 1
tij xij const n
n, n
i 1, j 1
n, n
xij ln xij e
i 1, j 1
tij xij
min
xij i1, j1 A n, n
.
(1)
Решение задачи (1) можно представить как xij exp 1 iL Wj tij ,
на множестве (A). Поскольку функционал строго вогнутый и решение задачи максимизации, без предположения целочисленности
x
n, n
ij i 1, j 1
, считаем таким, что xij* 1 (так
как n 1 ), то ограничение «целочисленности» является для данной задачи несущественным, и применение асимптотической формулы Стирлинга было законным. Обратим внимание также на то, что задача максимизации энтропийного функционала на множестве (A), т.е. по принципу Лагранжа [53] (балансовые ограничения (A) перенесли в функционал) задача n, n n, n n, n L xij ; L , W xij ln xij e tij xij
i 1, j 1
i 1, j 1
n n xij Li Wj i 1 j 1 j 1 n
L i
i 1, j 1
n xij W j sup i1 xij 0, i , j 1,..,n
имеет и притом единственное решение xij*
n, n
i 1, j 1
L xij
n, n
i 1, j 1
; L , W
x ln x ij
ij
, которое определяется из системы:
L i
Wj tij 0 , i, j 1, ..., n .
Приятной особенностью класса задач энтропийно линейного программирования (задач максимизации энтропийно подобных функционалов, при наличии линейных ограничений в виде равенств и неравенств на неотрицательном ортанте) является явная (легко выписываемая) зависимость решения прямой задачи, через двойственные переменные. Поскольку количество ограничений (количество двойственных переменных – множителей Лагранжа), как правило, на много порядков меньше числа прямых переменных, то эффективные численные методы отыскания решений базируются на решении двойственной задачи, представляющей собой задачу минимизации выпуклой функции на неотрицательном ортанте [30, 45, 54]. Можно показать, см. [54], что многие популярные в литературе [30, 45] численные методы решения этой двойственной задачи являются барьерно-мультипликативными аналогами квазиградиентных итерационных методов. В частности, к ним относится один из первых методов: «метод балансировки», заключающийся в подстановке прямых переменных, как функций двойственных, в систему ограничений (в методе предполагается, что есть ограничения только в виде равенств) и разрешение полученной системы (размерность которой как раз равна числу двойственных переменных) относительно двойственных переменных. Для рассматриваемого далее частного случая i, j 1, ..., n tij 0 , все это можно сделать аналитически, и в результате получить формулу (2). Отметим здесь также эффективность сепарабельных (функционал декомпозируется в аддитивную сумму функций одного аргумента) алгоритмов типа Нестерова–Немировского для задач энтропийного программирования, возникающих при нахождении равновесий макросистем [55].
232
где множители Лагранжа (двойственные переменные)
n
W j
j 1
L n i i 1
и
определяются из равенств системы (A). На практике мы име-
ем информацию о Li ,Wi i 1 и tij
n, n
n
i 1, j 1
L ,W xkm
i
n i i 1
. Решив задачу (A), мы найдем
; tij
n, n
i 1, j 1
n, n
.
k 1, m 1
Такой способ расчета матрицы корреспонденций в литературе часто называют гравитационной моделью: xij Ai B j LW i j exp tij , где Ai i 1 и B j n
n j 1
определяются из соотношений [2, 30, 32]: 1
1
n n Ai B jW j exp tij , B j Ai Li exp tij . i 1 j 1 Описанная модель (точнее говоря, рассчитанная по этой модели матрица корреспонденций) активно используется в теоретико-игровых моделях (например, базирующихся на принципах Дж. Г. Вардропа) равновесного распределения потоков [32] (см. также [56] и главу 1). Подробнее об этих моделях речь идет в главе 1 (Е. А. Нурминского и Н. Б. Шамрай). Один из возможных способов определения времени в пути, в зависимости от загрузки ребра, предложен в приложении М. Л. Бланка. Заметим также, что задача (1) по своим свойствам очень похожа на транспортную задачу (см. приложение А. В. Колесникова). Перейдем теперь к исследованию полученного стационарного
распределения вероятностей
x
n, n
ij i 1, j 1
p xij
n, n
i 1, j 1
на
макросостояниях
A . Если8
N ~ n 1 , Li ,W j ~ n ( 1 ), n 1 , i, j 1, ..., n tij 0 , 8 Отметим, что хотя в этом случае динамика рассматриваемой нами макросистемы обратима по времени (так же, как и в примере 1), макросистема (в каком бы состоянии она не находилась в нулевой момент времени) по прошествии достаточно большого времени окажется в малой окрестности равновесного макросостояния (характеризующегося наибольшим из возможных значением энтропии) и будет в дальнейшем пребывать в этой окрестности подавляющую часть времени. Схожая ситуация имеет место и в статистической физике (см., например, [8, 11, 14, 18, 19, 27]).
233
то распределение вероятностей p xij
1 2 центрировано в n
n, n
i 1, j 1
на множестве (A) скон-
окрестности (почему именно в такой ок-
рестности, будет показано ниже) наиболее вероятного значения 1 , i, j 1, ..., n , (2) xij* LW i j N ~ n которое ищется с помощью метода множителей Лагранжа [2, 53]. Формулу (2) можно интерпретировать как наличие у районов «потенциалов притяжения» [2]: Li N exp iL , i 1, ..., n и W j N exp iW , j 1, ..., n , произведение которых даѐт пассажиропоток xij* , i, j 1, ..., n (асимптотически совпадающий с математическим ожиданием и медианой). Исследуем теперь, следуя [1, 2, 30], явление концентрации ста-
ционарного распределения p xij роятного значения xij*
n, n
i 1, j 1
определения xij*
n, n
i 1, j 1
xij
n, n
i 1, j 1
n, n
i 1, j 1
. Для этого прежде всего заметим, что из
(см. также сноску 7) следует
ln p xij*
n, n
A
xij
n, n
i 1, j 1
* ij
2
* n, n ij i 1, j 1
n, n
i 1, j 1
* ij
i 1, j 1
Но
ij
ln p x ln p x x 1 x x
x x 0 .
A 0,1 :
ln p xij
n, n
n, n
i 1, j 1
xij
i 1, j 1
Поэтому
в окрестности наиболее ве-
n, n 2 ln p xij 2 i 1, j 1 xij
n, n
ij
i 1, j 1
* 2 ij
ij
xij2
2
.
x x ln x x1 . 2
n, n
2 ij
i 1, j 1
ij
ij
ij
Следовательно, приходим к «неравенству о концентрации меры»:
234
M 0 , xij
n, n
i 1, j 1
p xij
n, n
i 1, j 1
A :
x
n, n
ij
i 1, j 1
xij*
2
2 max xij , xij*
M
e p x . * n, n ij i 1, j 1
M
Из этого неравенства имеем результат о концентрации распре-
деления p xij
n, n
i 1, j 1
на множестве (A) в n
наиболее вероятного значения xij*
n, n
i 1, j 1
1 2
окрестности
:
0 : lim P i, j 1,..., n x ij t xij* 1 n t
1 2
0.999 .
Упражнение (М. С. Ишманов, 2010)**. а) Верно ли, что скорость сходимости в этом соотношении оценивается как n 1 ? б) Верно ли, что при фиксированном n и N скорость сходимости (в том же смысле, что и в п. а)) оценивается как N ? Замечание (о других возможных подходах к исследованию концентрации стационарного распределения). Один из способов восходит к методу вычисления математических ожиданий Дарвина– Фаулера [2, 5, 9] (метод производящих функций и анализ их асимптотического поведения методом перевала) – в этом случае концентрация наблюдается в окрестности математического ожидания (интересные приложения этого метода в комбинаторике имеются, например, в [57], см. также приложение А. А. Замятина и В. А. Малышева в этой книге и конец следующего пункта). Исследование концентрации в окрестности математического ожидания можно также приводить, например, используя предельные меры [58], метод канонических ансамблей [59] или обобщѐнную схему размещения [60], нашедшие применения к задачам асимптотической перечислительной комбинаторики,9 к исследованию случайных матриц и уравнений, к изучению статистических свойств группы перестановок с приложениями к теории разбиений (диаграммам Юнга) и асимптотической теории чисел, а также к теории предельных форм. К методу производящих функций также тесно примыкают метод моментов [60], метод пуассоновской и гауссовской аппроксимации (метод локальной предельной теоремы) [7, 60]. ДруВ частности, к теории случайных графов (компьютерные, транспортные сети – вопросы надѐжности и т.п. [24, 39], см. также приложение А. М. Райгородского в этой книге). 9
235
гой способ восходит к принципу концентрации А. Пуанкаре и П. Леви, получившему дальнейшее развитие в работах В. Д. Мильмана и др. [61] – в этом случае концентрация наблюдается в окрестности медианы.10 В заключение краткого обзора методов исследования концентрации меры упомянем теоремы тауберова типа [63] и мартингальные неравенства [62]. Ввиду всего вышесказанного важно отметить, что поиск наиболее вероятного распределения – это особенность работ, в которых изучаются равновесия макросистем. Но также важно заметить, что наиболее вероятное распределение в содержательных задачах асимптотически (по размеру системы) эквивалентно математическому ожиданию (в работе [2] соответствующие выкладки проделаны на примере модели расчета матрицы корреспонденций А. Дж. Вильсона, см. также следующий пункт) и медиане [61]. Замечание (модели Д. Бернулли–Лапласа, П. и Т. Эренфестов). Важно обратить внимание на то, что описанный способ изучения равновесных состояний макросистем применим к достаточно широкому классу макросистем (модель Д. Бернулли–Лапласа, модель Эренфестов, круговая модель М. Каца и др. (см., например, [8, 27, 64] и цитированную там литературу)), в том числе встречающихся в экономике, биологии, социальной сфере [3, 4; 15–24].
3. ОБЩАЯ СХЕМА ИССЛЕДОВАНИЯ РАВНОВЕСИЙ МАКРОСИСТЕМ
Ниже приводится (во многом под влиянием работ [18, 19]) общая схема, в которую «ложатся» примеры 1 и 2. Предположим, что некоторая макросистема может находиться в различных состояниях, характеризуемых вектором n с неотрицательными целочисленными компонентами (скажем, в модели «кинетика социального неравенства» ni t – количество жителей города, имеющих в момент времени t 0 i рублей). Будем считать, что в системе происходят случайные превращения (химические реакции). Пусть n n , , J – все
10 Этот принцип также нашѐл широкие применения в асимптотической перечислительной комбинаторике; в качестве достаточно известного примера можно упомянуть неравенство М. Талаграна и его приложения к изучению макросвойств (связность и т.п.) случайных графов [62] (см. также приложения А. М. Райгородского и А. В. Колесникова в этой книге).
236
возможные типы реакций, при этом
, J
, J .
Введем, следуя Березину–Клесову (1978) [19], интенсивность реакции: 1 i n , n , n n M i K ni ... ni i 1, M i: 0
где
i
K 0 – константы реакции (в химической кинетике –
постоянные, а в социодинамике (В. Вайдлих, 2000 [20]) – необязательно); при этом часто считают ni M . Т.е. , n – i вероятность осуществления в единицу времени перехода n n : в единицу времени равновероятно выбираются («приближение среднего поля») любые два жителя города и в зависимости от того, в каких состояниях они находились, «случайно» переводятся (разыгрывают один рубль) в новые состояния. На макроуровне все это соответствует принципам химической кинетики (закон действующих масс Гульдберга–Вааге, 1864 [18]). Предположим теперь, что множество J не зависит от M , и в начальный момент времени для любого i существует предел ci 0 lim ni 0 M . M
Тогда (Малышев–Пирогов–Рыбко, 2004 [19, 65]) в произвольный момент времени t 0 и для любого i существует предел по вероятности (заметим, что ni t – случайные величины, тем не менее ci t – уже не случайные величины) п.н.
ci t lim ni t M . M
Описанный выше приѐм называется каноническим скейлингом. В результате такого скейлинга приходим к «динамике квазисредних» (терминология В. Вайдлиха [20]): dci i i K c c j j . (3) dt , J j Эти же уравнения можно получить и по-другому. А именно, как приближенную динамику средних ci t E ni t M . Приближенную в том смысле, что при выводе (1) используется приближение: 237
F ci t E F ni t M для «достаточно хороших» функций F (например, полиномов). Это верно в случае пикообразного распределения ni t .11 Пусть су ществует хотя бы одно положительное решение системы (условие динамического равновесия, В. В. Веденяпин (2001) [18], Малышев– Пирогов–Рыбко (2004) [19, 65], Батищева–Веденяпин [66]): (4) K j j K j j ( K c K ). j j : , J : , J Частным, но часто встречающимся в приложениях, случаем условия (4) является условие детального равновесия: , J K j j K j j .
j
j
Несложно проверить, что , удовлетворяющее (4), является неподвижной точкой системы (3). Более того, если существует хотя бы одно положительное решение системы (4), то тогда все неподвижные точки системы (3) удовлетворяют условию (4), также называемому условием унитарности, или условием Штюкельберга– Батищевой–Пирогова. Покажем, во многом следуя В. В. Веденяпину [18], что в этом случае (существования хотя бы одного положительного решения (4)) траектория (3) сходится к неподвижной точке (какой именно, зависит, вообще говоря, от «точки старта»).12 Для этого, следуя второму методу Ляпунова, введѐм (минус) энтропию: H ci ln ci i 1 i
и покажем, что она является функцией Ляпунова для системы (3). Посчитаем полную производную H в силу системы (3): dH K j j y j j ln yii i i i dt , J i j i 11 Заметим, что этот переход и возможность его использования в правой части равенства (3) нуждаются в строгом обосновании (и далеко не всегда правомочны). В качестве примера, укажем популярный в литературе [3; 16–22] марковский процесс «рождения– гибели» (приводящий к системе уравнений «хищник–жертва»), для которого «флуктуации играют решающую роль, качественно меняя выводы макроскопического анализа». 12 Стоит заметить, что аттрактор системы (3) с постоянными коэффициентами реакции, по-видимому, в общем случае может быть сколь угодно сложным множеством [19, 67].
238
, J
K j j y j j i i
i
j
, J
K j j y j j ln yii i ,
j
i
где введено обозначение yi ci i . Заметим, что
, J
K j j y j j
j
, J
K j j y j j
j
, J
K j j y j j .
j
Таким образом, dH K j j y j j y j j j ln yii i y j j j 1 0 , dt j i j j , J поскольку u ln u u 1 0 при u 0 , и равенство достигается в одной точке u 1 . Оказывается (Малышев–Пирогов–Рыбко [19, 65]), что условие (4) можно проинтерпретировать как достаточное условие инвариантности “пуассоновской” меры [52]:13 n i ni e i ni ! , i
*
где i M , а – произвольное решение (4); относительно предложенной стохастической марковской динамики. Эта мера экспоненциально быстро концентрируется, с ростом ni , в окрестности наиболее вероятного состояния (также удовлетворяющего условию (4)), которое и принимается за положение равновесия макросистемы. Задача поиска наиболее вероятного макросостояния асимптотически эквивалентна задаче максимизации энтропийного функционала (воспользо* i
вались n! 2 n n e 1 1 – формулой Стирлинга): n
E ni ln ni i 1 M H i
на множестве, заданном (как правило, линейными) ограничениями – законами сохранения (интегралами движения для (3)). Действительно, будем считать, что ограничения (законы со хранения) задаются СЛАУ An d , где A Akl – матрица макси13 Пуассоновская мера также часто встречается (при наиболее естественных условиях) в качестве притягивающей инвариантной меры, если осуществляется термодинамический предельный переход (число агентов и состояний стремятся, сохраняя пропорции, к бесконечности) [68].
239
мального ранга ( k 1, ..., m ). Обозначим через A множество неотри цательных целочисленных векторов n , удовлетворяющих An d . Тогда равновесие n * находится как решение задачи E n max n
(поскольку функционал строго вогнутый и считаем ni* 1 , то целочисленностью переменных можно пренебречь). Используя принцип Лагранжа, можно показать, что решение этой задачи представляется в виде ni y* i exp Aki yk* , k где двойственные переменные (множители Лагранжа) y * определя ются из системы An y d . Приведем, во многом следуя [2], другой путь (восходящий к Дарвину–Фаулеру), по которому можно прийти к аналогичным формулам. Для этого введем производящую функцию ni
Akl nl F z ; A n zk l n 0
k
Aki i i zk e k ni ! i ni 0
exp i zkAki 1 . i k Тогда по формуле Коши: 1 1 p E nrp11 ... nrQQ dz1 ... dzm Z 2 i m 1 zk dk 1 k ln z A q 1 1rq Z
1
dz ... dz 2 i m
1
m
pq F z ; A ,
zk dk 1 F z ; A . k
p Здесь математическое ожидание E nrp11 ... nrQQ считается по вероят ностной мере, порожденной мерой Пуассона n , а интегралы по
240
dzk берутся в комплексной плоскости по замкнутым контурам, охватывающим точку ноль. Используя метод перевала [69], асимптотически оценим математическое ожидание: pq 1 pQ p1 * pq F z * ; A , E nr1 ... nrQ ln z1 q * A1rq F z ; A q * где «точка перевала» z определяется как решение системы: zk F z ; A zk dk F z ; A , k 1, ..., m . В частности, 14
E ni i zk* k
Aki
, D ni i zk*
Aki
,
k
где z * определяется как решение системы уравнений: zkAki d k , k 1, ..., m . i Aki i k Очевидна связь «точки перевала» z * с двойственными переменными y * : zk* exp yk* .
4. ЗАКЛЮЧЕНИЕ В приложении обсуждается концепция равновесия макросистемы. Приводятся различные подходы к обоснованию следующего принципа: равновесие = наиболее вероятное макросостояние инвариантной (стационарной) меры динамической системы (марковского процесса), порождающей исследуемую макросистему. Рассматриваются примеры конкретных макросистем. В частности, один из примеров «объясняет» популярную в приложениях модель А. Дж. Вильсона расчета матрицы корреспонденций. Повторим в заключение описанную в приложении схему. 1. Макросистема состоит из огромного числа пронумерованных агентов, каждый из которых может находиться в одном из возможных состояний. Число состояний, как минимум, на несколько по14
Обратим внимание на то, что получилось E ni D ni 1 – это означает концен-
трацию распределения случайной величины ni в тического ожидания E ni .
241
D ni окрестности своего матема-
рядков меньше числа агентов (иногда можно и без этого требования). Распределение агентов (с учетом их номеров) по состояниям будем называть микросостоянием, а без учета номеров – макросостоянием. 2. Задана марковская динамика распределения агентов по состояниям, в основу которой на микроуровне положена равноправность агентов одного типа (в приближении среднего поля) и заранее прописанные возможности случайных превращений (переходов) агентов (химические реакции): равновероятно выбирается агент и в зависимости от того, в каком состоянии он находится, «случайно» переводится в новое состояние. Аналогично рассматриваются парные взаимодействия и взаимодействия, в которых участвует большее число агентов. На макроуровне это соответствует принципам химической кинетики (Гульдберг–Вааг, 1864). Предполагается, что из любого возможного макросостояния можно перейти согласно такой динамике в любое другое (характерное время такого перехода определяет скорость сходимости к равновесию). Также считается, что описанная динамика имеет макрозаконы сохранения. Соотношения (как правило, линейные) между макровеличинами, которые не меняются со временем. Пусть выполняется условие: динамика задана линейной полугруппой (однородность), динамика «обратима» (детальный баланс, условие динамического равновесия). Тогда эргодическая марковская динамика приводит на больших временах к стационарной (инвариантной) пуассоновской (сложной) мере (прямое произведение распределений Пуассона) на пространстве макросостояний. Эта мера экспоненциально быстро концентрируется, с ростом числа агентов, в окрестности наиболее вероятного макросостояния, которое и принимается за положение равновесия макросистемы. Задача поиска наиболее вероятного макросостояния асимптотически (по числу агентов) эквивалентна задаче максимизации энтропийного функционала (воспользовались формулой Стирлинга) на множестве (как правило, аффинной структуры), заданном ограничениями – законами сохранения. Этот же энтропийный функционал (взятый со знаком минус) возникает как функция Ляпунова динамики, полученной в результате канонического скейлинга исходной марковской динамики. Отыскание предельной неподвижной точки (этой динамики), в которую придет система, сводится к решению той же самой задачи энтропийно линейного программирования. 242
ЛИТЕРАТУРА 1.
2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
Jaynes E. T. Probability theory. The logic of science. Cambridge: Cambridge University Press, 2003; Papers on probability, statistics and statistical physics. Dordrecht: Kluwer Academic Publisher, 1989. Вильсон А. Дж. Энтропийные методы моделирования сложных систем. М.: Наука, 1978. Николис Г., Пригожин И. Самоорганизация в неравновесных системах. М.: Мир, 1979. Хакен Г. Информация и самоорганизация. Макроскопический подход к сложным системам. М.: УРСС, 2005. Шредингер Э. Статистическая термодинамика. М.: ИЛ, 1948. Крылов Н. С. Работы по обоснованию статистической физики. М.-Л.: Издательство АН СССР, 1950. Хинчин А. Я. Математические основания статистической механики. М.–Ижевск: НИЦ «РХД», ИКИ, 2003. Кац М. Вероятность и смежные вопросы в физике. М.: Мир, 1965. Хуанг К. Статистическая механика. М.: Мир, 1966. Рюэль Д. Статистическая механика. Строгие результаты. М.: Мир, 1971. Корнфельд И. П., Синай Я. Г., Фомин С. В. Эргодическая теория. М.: Наука, 1980. Evans L. C. Entropy and partial differential equations. Department of mathematics, UC Berkeley, 2003. http://math.berkeley.edu/~evans/ Минлос Р. А. Введение в математическую статистическую физику. М.: МЦНМО, 2002. Козлов В. В. Ансамбли Гиббса и неравновесная статистическая механика. М.–Ижевск: НИЦ «РХД», ИКИ, 2008. Марри Дж. Нелинейные дифференциальные уравнения в биологии. М.: Мир, 1983. Свирежев Ю. М. Нелинейные волны, диссипативные структуры и катастрофы в экологии. М.: Наука, 1987. Гардинер К. В. Стохастические методы в естественных науках. М.: Мир, 1986. Веденяпин В. В. Кинетическая уравнения Больцмана и Власова. М.: Физматлит, 2001.
243
19. Малышев В. А., Пирогов С. А. Обратимость и необратимость в стохастической химической кинетике // УМН. 2008. Т. 63. № 1. С. 3–36. 20. Вайдлих В. Социодинамика: системный подход к математическому моделированию в социальных науках. М.: УРСС, 2010. 21. Castellano C., Fortunato S., Loreto V. Statistical physics of social behavior // Review of modern physics. 2009. V. 81. P. 591–646. arXiv:0710.3256v2 22. Занг В.-Б. Синергетическая экономика: время и перемены в нелинейной экономической теории. М.: Мир, 1999. 23. Drǎgulescu A., Yakovenko V. M. Statistical mechanics of money // The European Physical Journal B. 2000. V. 17. P. 723–729. arXiv:cond-mat/0001432v4 24. Baldi P., Frasconi P., Smyth P. Modeling the Internet and the Web: Probabilistic methods and algorithms. Published by John Wiley & Sons, 2003. 25. Розоноэр Л. И. Обмен и распределение ресурсов (обобщенный термодинамический подход) I, II, III // Автоматика и телемеханика. 1973. № 5, № 6, № 8. 26. Горбань А. Н. Обход равновесия. Новосибирск: Наука, 1984. 27. Опойцев В. И. Нелинейная системостатика. М.: Наука, 1986. 28. Малишевский А. В. Качественные модели в теории сложных систем. М.: Наука, 1998. 29. Сергеев В. М. Пределы рациональности. М.: Фазис, 1999. 30. Попков Ю. С. Теория макросистем: равновесные модели. М.: УРСС, 1999. 31. Цирлин А. М. Методы оптимизации в необратимой термодинамике и микроэкономике. М.: Физматлит, 2003. 32. Швецов В. И., Алиев А. С. Математическое моделирование загрузки транспортных сетей. М.: УРСС, 2003. 33. Маслов В. П. Квантовая экономика. М.: Наука, 2006. 34. Олемской А. И. Синергетика сложных систем: Феноменология и статистическая теория. М.: КРАСАНД, 2009. 35. Веретенников А. Ю. Параметрическое и непараметрическое оценивание для цепей Маркова. М.: Изд-во ЦПИ при механико– математическом факультете МГУ, 2000. 36. Боровков А. А. Эргодичность и устойчивость случайных процессов. М.: УРСС, 1999.
244
37. Булинский А. В., Ширяев А. Н. Теория случайных процессов. М.: Физматлит; Лаборатория базовых знаний, 2003. 38. Кельберт М. Я., Сухов Ю. М. Вероятность и статистика в примерах и задачах. Т. 2. М.: МЦНМО, 2010. 39. Вишневский В. М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 40. Ивницкий В. А. Теория сетей массового обслуживания. М.: Физматлит, 2004. 41. The maximum entropy formalism, ed. by R. D. Levin, M. Tribus. Conf. Mass. Inst. Tech., Cambridge 1978. MIT Press, 1979. 42. International workshops on Bayesian inference and maximum entropy methods in science and engineering. AIP Conf. Proceedings (holds every year from 1980). 43. Kapur J. N. Maximum – entropy models in science and engineering. John Wiley & Sons, Inc., 1989. 44. Golan A., Judge G., Miller D. Maximum entropy econometrics: Robust estimation with limited data. Chichester, Wiley, 1996. 45. Fang S.-C., Rajasekera J. R., Tsao H.-S. J. Entropy optimization and mathematical programming. Kluwer’s International Series, 1997. 46. Маслов В. П., Черный А. С. О минимизации и максимизации энтропии в различных дисциплинах // ТВП. 2003. Т. 48. № 3. С. 466-486. 47. Богданов К. Ю. Прогулки с физикой. Библиотечка «Квант» В. 98. М.: Бюро Квантум, 2006 (глава 18). 48. Зорич В. А. Математический анализ задач естествознания. М.: МЦНМО, 2008. 49. Diaconis P. The Markov chain Monte Carlo revolution // Bulletin (New Series) of the AMS. 2009. V. 49. № 2. P. 179-205. http://www.ams.org/journals/bull/2009-46-02/S0273-0979-08-01238X/S0273-0979-08-01238-X.pdf 50. Joulin A., Ollivier Y. Curvature, concentration and error estimates for Markov chain Monte Carlo // Ann. Prob. 2010. V. 38. № 6. P. 24182442. 51. Красносельский М. А., Лифшиц Е. А., Соболев А. В. Позитивные линейные системы. Метод положительных операторов. М.: Наука, 1985. 52. Кингман Дж. Пуассоновские процессы / под ред. А. М. Вершика. М.: МЦНМО, 2007.
245
53. Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. М.: УРСС, 2003. 54. Гасникова Е. В. Двойственные мультипликативные алгоритмы для задач энтропийно–линейного программирования // ЖВМ и МФ. 2009. Т. 49. № 3. С. 453–464. 55. Нестеров Ю. Е. Введение в выпуклую оптимизацию. М.: МЦНМО, 2010. 56. Нурминский Е. А., Шамрай Н. Б. Прогнозное моделирование автомобильного трафика Владивостока // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). (в печати) 57. Flajolet P., Sedgewick R. Analytic combinatorics. Cambridge University Press, 2008. http://algo.inria.fr/flajolet/Publications/book.pdf 58. Вершик А. М., Шмидт А. А. Предельные меры, возникающие в асимптотической теории симметрических групп // ТВП. 1977. Т. 22. № 1. С. 72–88; 1978. Т. 23. № 1. С. 42–54. 59. Синай Я. Г. Вероятностный подход к анализу статистики выпуклых ломаных // Функц. анализ и его прил. 1994. Т. 28. № 2. С. 41–48. 60. Колчин В. Ф. Случайные графы. М.: Физматлит, 2004. 61. Ledoux M. Concentration of measure phenomenon. Providence, RI, Amer. Math. Soc., 2001 (Math. Surveys Monogr. V. 89). 62. Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином, 2007. 63. Якымив А. Л. Вероятностные приложения тауберовых теорем. М.: Наука, 2005. 64. Ширяев А. Н. Вероятность 1, 2. М.: МЦНМО, 2007. 65. Malyshev V. A., Pirogov S. A., Rubco A. N. Random walks and chemical networks // Mosc. Math. J. 2004. V. 4. № 2. P. 441–453. 66. Батищева Я. Г., Веденяпин В. В. II-й закон термодинамики для химической кинетики // Мат. мод. 2005. Т. 17. № 8. С. 106–110. 67. Веденяпин В. В., Орлов Ю. Н. О законах сохранения для полиномиальных гамильтонианов и для дискретных моделей уравнения Больцмана // ТМФ. 1999. Т. 121. № 2. С. 307–315. 68. Рыбко А. Н. Пуассоновская гипотеза для больших симметричных коммуникационных сетей // Глобус. Общематематический семинар / под ред. М. А. Цфасмана и В. В. Прасолова. № 4. М.: МЦНМО, 2009. С. 105–126. 69. Федорюк М. В. Метод перевала. М.: УРСС, 2010. 246
А. А. Замятин, В. А. Малышев
Введение в стохастические модели транспортных потоков 1.
Введение
Математические модели автомобильного трафика могут быть весьма различны: от дифференциальных уравнений с частными производными, средств современной компьютерной физики до создания игровых моделей, где точки на видео движутся по сети улиц с перекрестками. Мы рассматриваем здесь некоторые строгие вероятностные подходы к транспортным сетям. Основная цель этого приложения — не столько представить технику решения задач, сколько представить методику (и искусство) составления адекватных моделей, которые отличаются наглядностью определений (основной объект там именно автомобиль, а не потоки) и основаны на простых интуитивных рассуждениях. Более того, все вводимые постулаты в этих моделях допускают статистическую проверку, широкие уточнения и обобщения, и не используют сомнительных физических аналогий. Вообще, вероятностные модели должны связываться с психикой водителей, если водители не роботы. Такой законченной и общепринятой теории пока не существует, здесь делаются, по-видимому, первые строгие попытки установить такую связь. В текст включены упражнения для лучшего усвоения материала, а также задачи посложнее, в том числе и «публикабельные». Вероятностный подход к транспортным потокам существует уже более 50 лет, см. [1–3], однако здесь мы даем более современную трактовку и рассматриваем более сложные задачи. В то же время мы не говорим здесь о других вероятностных подходах к проблемам транспорта, например [12, 14], они отражены в других частях этой книги. Мы также ничего не говорим о гидродинамическом подходе, так как связь его со статистическим подходом пока математически плохо изучена. Приложение состоит из трех частей. В первой дано построение случайных потоков и некоторые модели, отражающие качественные 247
явления на автомагистрали. В том числе новая модель, основанная на сравнительно недавней теории случайных грамматик. Во второй части показано, как можно получать явные формулы с помощью техники пуассоновских потоков. В третьей рассмотрены сложные сети дорог и вычисление критической нагрузки, выше которой начинаются пробки.
2. 2.1.
Потоки автомобилей Маркированные точечные поля
Под словом поток в зависимости от контекста понимают либо среднее число J автомобилей в единицу времени, пересекающих сечение транспортного пути в данном направлении, либо статическую случайную конфигурацию ... < xi < xi−1 < ... автомобилей в данный момент времени, но можно понимать его динамически как меру на множестве траекторий {xi (t)} автомобилей. Что такое конфигурация автомобилей. Максимально детальное описание расположения автомобилей в данный момент времени таково. Автомобиль индивидуален и ему присваивается некий индекс α. Например, пусть есть автотрасса с k полосами 1, 2, ..., k , представляемая k прямыми, параллельными оси x. Тогда индекс α = (m, i) выделяет i-й автомобиль на полосе m. Индекс i нумерует автомобиль на полосе, так что автомобиль i следует за автомобилем i − 1. Пусть dα — длина этого автомобиля, xα (t) — его координата (например, переднего бампера). Автомобили движутся в положительном направлении оси x. Далее индекс полосы опускается — читатель может его добавлять где надо — и используем только индекс i. Обозначим расстояние автомобиля i до предыдущего автомобиля в реальном потоке в момент t через d+ i (t) = xi−1 (t) − xi (t) − di−1 . Обозначим (тоже важная величина для водителя) + d− i (t) = di+1 (t)
— расстояние до следующего автомобиля. 248
Как вводятся вероятности на множестве конфигураций. Формально точечный случайный поток на прямой задается вероятностной мерой на множестве всех счетных локально конечных (то есть конечных на каждом ограниченном интервале) подмножеств прямой. Иначе говоря, задается согласованной системой вероятностей P (I1 , k1 ; ...; In , kn ) того, что в интервалах Ij , j = 1, ..., n находится ровно kj частиц. Для более конкретного задания этих распределений существует две большие науки: теория восстановления (см., например, [6]) и теория гиббсовских точечных полей [23, 24]. Первая теория существенно проще, но годится только в одномерном случае. Вторая глубоко связана с физикой, годится и для многомерных ситуаций, но довольно сложна, и мы не будем ее здесь касаться. Самый простой случайный поток пуассоновский, см., например, [30]. Простейший способ его понять такой. Рассмотрим интервал [−N, N ] и бросим на него независимо и случайно (точнее равномерно) M = [ρN ] точек, где ρ > 0 — некоторая константа, называемая плотностью. Легко вычислить биномиальную вероятность PN,M (k, I) того, что в конечный интервал I попадет ровно k точек. Последняя при N → ∞ стремится к пуассоновскому выражению P (k, I) =
{ρ|I|}k −ρ|I| e . k!
Более общие потоки легко строятся на полупрямой [0, ∞). Именно, случайные точки x0 = 0, x1 , ..., xn , ... определяются как суммы независимых одинаково распределенных случайных величин ξi > 0, i = 1, 2, ..., с распределением G(x): x1 = ξ1 , x2 = ξ1 + ξ2 , ... Для определения трансляционно-инвариантного потока на всей прямой остается одна проблема — где разместить начальную точку потока, от которой откладывать независимые величины налево и направо. Для этого надо воспользоваться следующим (одним из основных) утверждением теории восстановления. Пусть P (t, t + ∆t) — вероятность того, что в интервал (t, t + ∆t) попадет ровно одна 249
точка xn . Тогда если ξi имеют плотность, то на полупрямой пре1 дел lim∆t→0 ∆t P (t, t + ∆t) существует и стремится при t → ∞ к −1 ρ = (Eξ) . Предельная (при t → ∞) плотность вероятности того, что расстояние от точки t до первой случайной точки xi > t больше s, равна произведению ρ на вероятность того, что ξi = xi − xi+1 > s, то есть равна ρ(1 − G(s)). Поэтому первую после начала координат точку потока следует взять на случайном расстоянии с этой плотностью. Расстояния же между точками будут по-прежнему независимыми от функции распределения G(x). Альтернирующие потоки. Расстояния между соседними точками потока не обязательно одинаково распределены. Распределения могут чередоваться. Например, возьмем две последовательности случайных величин: ξ1 , ξ2 , ... и η1 , η2 , ... и положим x2n = ξ1 + ... + ξn + η1 + ... + ηn , x2n−1 = ξ1 + ... + ξn + η1 + ... + ηn−1 . Тогда построение потока на всей прямой делается как и выше. В нашем случае чередуются длины автомобилей di (независимые и одинаково распределенные) и функции d+ i (независимые и одинаково распределенные). Маркированные потоки. Каждой точке xi точечного процесса может быть сопоставлена величина σi , принимающая значения в некотором множестве S. Эту величину в разных случаях называют маркой или спином в точке i и говорят о случайном маркированном точечном множестве (потоке, процессе). Он определяется мерой на последовательностях пар (xi , σi ). Проще всего, когда задана мера на счетных множествах, то есть задан поток без марок, а величины σi объявляются независимыми и одинаково распределенными. В разделе 1.5 мы построим маркированный процесс, где марками являются скорости, причем их распределение будет сложным образом коррелировать во времени с траекториями точек. О марковских процессах. Эволюция во времени конфигураций автомобилей часто использует марковские процессы, и необходимо сказать о соответствующей терминологии. Часто определение самого 250
процесса и его свойств (например, эргодичности) отличаются в разных источниках. Поясним это. Для простоты ограничимся случаем дискретного времени. Рассмотрим на некотором фазовом пространстве X систему мер (переходных вероятностей) P (A|x), определяющих вероятности того, что в момент t+1 процесс попадет в множество A ⊂ X, если в момент t процесс находился в состоянии x ∈ X. Если все меры P (A|x) одноточечные, то это эквивалентно заданию детерминированного отображения T : X → X, точнее P (.|x) = δ(T (x)) — единичная мера в точке T (x). Тогда говорят о детерминированном отображении, задающем динамическую систему. Заметим, что система мер P (A|x) определяет очевидным образом преобразование U множества вероятностных мер на X в себя: ˆ U µ = P (.|x)dµ(x). Важным является понятие инвариантной (относительно U ) меры. Обычно исследуется ее существование, единственность и другие свойства. По системе переходных вероятностей можно построить разные последовательности случайных величин ξn со значениями в X или их распределений µn на X, где P (ξn ∈ A) = µn (A). Вероятностным пространством при этом служит множество траекторий {xn }. Например, по вероятностной инвариантной мере строится стационарный марковский процесс как последовательность ξn , n ∈ Z+ случайных величин со значениями в X. Или по заданной начальной мере µ0 на X строится последовательность ξn , n ∈ Z+ . Под марковским процессом может пониматься как одна из таких последовательностей случайных величин, так и все семейство таких последовательностей ξn . Соответственно разнится терминология, например, определение эргодичности. Динамическая система с заданной инвариантной мерой µ называется эргодической, если любое инвариантное множество имеет меру µ ноль или единицу. На любой стационарный марковский процесс можно смотреть как на динамическую систему — сдвиг в пространстве траекторий. Тогда понятие эргодичности совпадает с понятием эргодичности этой динамической системы. Однако чаще, когда говорят о марковском процессе, имеют в виду не только стационарные процессы. Наиболее часто используемым 251
определением эргодичности является следующее. Процесс называется эргодическим, если существует единственная инвариантная мера µ на X, и для любой начальной меры µ0 при n → ∞ имеет место слабая сходимость µn → µ. Отметим, что марковские процессы резко разделяются на два класса. Первый класс — для которых существует положительная мера на X (не обязательно вероятностная), относительно которой все меры P (.|x) абсолютно непрерывны. К ним относятся почти все классические марковские процессы — конечные и счетные цепи Маркова, диффузионные процессы и другие. Такие процессы называются эргодическими, если, во-первых, у преобразования нет нетривиальных инвариантных множеств, а во-вторых, существует единственная инвариантная вероятностная мера. Во многих случаях отсюда следует сходимость к этой инвариантной мере из любого начального распределения. Для счетных цепей эквивалентным условием является положительная возвратность, то есть конечность (для всех пар x, y ∈ X) среднего времени достижения y из x. Второй класс характеризуется тем, что все меры P (.|x) взаимно сингулярны. К этому классу относятся почти все процессы с бесконечным числом частиц. Теория таких процессов существенно сложнее.
2.2.
Связь скорости и плотности с пропускной способностью
Психика водителя в простейшем потоке. Полностью моделировать психику конечно невозможно, но многие закономерности очевидны. Так, водитель i видит несколько автомобилей (часто только один впереди себя) в потоке и выбирает оптимальное для себя рассто(t) яние до предыдущего автомобиля. Если скорость vi−1 (t) = dxi−1 dt меняется медленно, то можно считать, что реакция водителя быстрее, и выбираемое расстояние Di+ зависит только от этой скорости: Di+ = Di+ (vi−1 ) (индекс i говорит, что функции Di+ (v) разные для разных водителей). Назовем поток алгоритмическим в момент t, если для всех i + d+ i (t) = Di (vi−1 (t)),
252
то есть все скорости последовательно определяются по скорости первого автомобиля. Конечно, нас интересуют не сами функции, а их статистические характеристики. При вероятностном подходе функции Di+ (v) становятся независимыми одинаково распределенными случайными функциями, зависящими от скорости v предыдущего водителя как от параметра. Распределение этих функций не может быть выведено из математических, статистических, физических и т. д. законов. Оно зависит от индивидуальной и коллективной психики водителя и должно находиться экспериментально, см. [22]. Детерминированная динамика без обгона. Если все автомобили, водители и скорости v одинаковы, то многие задачи решаются просто. Обозначим через d — длину автомобиля, d+ = D+ (v) — расстояние до впереди идущего автомобиля, которое водитель соблюдает. Уже такая динамика позволяет понять многие качественные эффекты. Определим пропускную способность дороги как максимально возможный поток по ней: Jmax = max vλ(v), v
где максимум берется по разрешенному интервалу скоростей, а λ(v) =
k d + D+ (v)
— плотность автомобилей на k-полосной дороге при заданной скорости v. Отсюда видно, что пропускная способность может уменьшаться при увеличении скорости. Этот простой вывод говорит лишь о том, что многие водители увеличивают расстояние до впереди идущего автомобиля при увеличении его скорости. Случайная динамика без обгона. То же самое получится, если скорости v одинаковы, функции d+ i случайны и независимы, а их средние равны (для заданного v) некоторому числу d+ (v). Мы видим, что сам факт нетривиальной зависимости пропускной способности от скорости тривиален, и для него совершенно не нужны вероятностные модели. Однако для более тонких вопросов вероятностные модели необходимы. Сейчас мы введем довольно общую вероятностную модель с очень богатым спектром фаз. При этом процессы с 253
запретами (exclusion processes) появляются как вырожденный частный случай. Другие модели см. [10, 12, 22]. Случайная динамика с обгоном (случайные грамматики). Здесь естественно возникает связь с таким недавно открытым объектом, как случайные грамматики, см. [25]. Мы дадим краткое содержательное описание одной такой модели. Пусть в момент t = 0 все автомобили находятся на левой полуоси, движение однополосное. Мы разбиваем полосу движения на клетки определенной длины и считаем, что в каждой клетке не более одного автомобиля. Таким образом, конечная последовательность автомобилей изображается парой (S, r), где r ∈ Z, а S — конечная последовательность (слово) из трех символов 0, 1, 2: S = sN ...s2 s1 . При этом 0 соответствует пустой клетке, 1 — активному (быстрому) водителю в клетке, 2 — спокойному водителю в клетке. Длина слова N = N (t) и все символы sk (t) могут меняться во времени, но так, что всегда s1 (t) 6= 0 для всех t ≥ 0. В произвольный момент t каждый символ sk (t) имеет координату x(sk (t)). Координаты однозначно определяются x(sk (t)) = x(s1 (t)) − k + 1 (1) координатой x(s1 (t)) первого символа, которую мы обозначим r = r(t). Динамика моделирует процесс ускорений и торможений отдельных водителей и определяется как цепь Маркова (S(t), r(t)) с непрерывным временем на множестве пар {(S, r)}. Интенсивности скачков определяются так. Изменения S и r независимы друг от друга. Изменение r моделирует движение всего потока с постоянной скоростью v. Именно, r увеличивается на единицу с вероятностью vdt за время dt, и все координаты немедленно изменяются соответственно формуле (1). Динамика S, таким образом, будет описывать ситуацию относительно некоторого равномерного движения. Эта динамика задается случайной грамматикой, то есть списком возможных локальных замен подслов (всего будет 5 типов замен) S на другое подслово. Любые замены из приводимого ниже списка производятся независимо, случайно и имеют разные интенсивности (всего 4 параметра). Вот этот список. 254
1) 10 → 01 — быстрый водитель передвигается на 1-го вперед, освобождая свободное место за собой, с вероятностью λ+ 0 dt за время dt; 2) 120 → 021 — быстрый водитель обгоняет спокойного, с вероятностью λ+ 1 dt; 3) 22 → 202, 21 → 201 — предусмотрительный водитель тормозит, увеличивая дистанцию перед собой, с вероятностью λ− 2 dt. Отметим, что здесь увеличивается длина S (возникает лишняя свободная ячейка), что ведет к сдвигу всех автомобилей сзади этого водителя на 1-го назад. Это нелокальный скачок, реально он растянут во времени, но это совместимо с правилом сложения относительных скоростей; 4) 200 → 020 — спокойный водитель ускоряется с вероятностью λ+ 2 dt (если впереди с его точки зрения много свободного места). Необходимо сказать, что для точной формулировки результатов, которые мы лишь обрисуем, надо делать разнообразные скейлинги параметров t, N, λ. Это будет сделано в отдельной статье. В зависимости от 4 параметров могут быть разнообразные типы (фазы) движения. Мы приведем только три из них. Если λ± 2 малы по сравнению с остальными двумя параметрами, то автомобили типа 2 едут синхронно и с постоянной скоростью, а быстрые автомобили имеют дополнительную относительную скорость. Если быстрых автомобилей мало, то эта дополнительная скорость определяется движением одного автомобиля среди неподвижных препятствий и зависит от плотности ρ2 автомобилей типа 2 и плотности дырок ρ0 и примерно равна + vrel = λ+ 0 ρ0 + 2λ1 ρ2 .
Если λ− 2 мала по сравнению с остальными двумя параметрами (нет + + нелокальных эффектов), а λ+ 2 имеет такой же порядок как λ0 , λ1 , то разница между типами стирается. Мы имеем тогда процесс, близкий к так называемому полностью асимметричному процессу с запретами (TASEP — totally asymmetric exclusion process), а для значений + − λ+ 0 = λ 1 , λ2 = 0
255
полностью с ним совпадающий (о TASEP см. приложение М. Бланка и ссылки в нем). − Если λ+ 2 мала, а λ2 велика по сравнению с остальными двумя параметрами, то картина иная. Каждый обгон 120 → 021 вызывает немедленное торможение автомобиля 2 и, как следствие, все последующие автомобили замедляются. Для автомобилей ближе к концу слова замедление будет весьма существенным, если поток достаточно плотный (мало ячеек с нулями), так как много автомобилей типа 2 будет тормозиться. Можно усложнять введенную динамику, например, избежать дискретизации (см. конец этого раздела), вводя вместо нулей положительные вещественные числа — расстояния между последовательными автомобилями. Это потребует существенных (см. однако раздел 2.5) переформулировок, особенно для скачков типа 3, но сохранит грубые качественные эффекты.
2.3.
Рост пробки
Если входной транспортный поток в некоторую фиксированную область равен Jin , а выходной Jout < Jin , то количество автомобилей в данной области за время t увеличится на t(Jin − Jout ). Так будет, однако, только если рассматриваемая область не находится на самом транспортном пути. Например, если автомобили скапливаются в пробке на самой дороге, то ответ другой. Дело в том что область сама может расти за счет скапливающихся автомобилей. Чтобы уточнить эти утверждения надо уточнить модель. Пусть автомобили одинаковой длины d едут в потоке (по одной полосе) со скоростью v один за другим на одинаковом расстоянии d+ между ними. Пусть в течение времени t движение остановлено неким препятствием, например, красным светофором. При этом ав+ томобили останавливаются на расстоянии d+ 0 < d до предыдущего автомобиля. Упражнение 1. Доказать, что за время t → ∞ пробка (то есть максимальная длина L(t) участка, где все автомобили стоят) пе-
256
ред препятствием будет иметь длину, асимптотически равную L(t) ∼t→∞ tv
d + d+ 0 . d+ − d+ 0
(2)
По-видимому, этот результат зависит в действительности лишь от средних величин и остается верным при возможности обгона. Это сделано в [16] для независимого движения автомобилей (то есть когда автомобили не мешают друг другу), причем скорости автомобилей имеют флуктуации, однако средние скорости всех автомобилей одинаковы и равны v. Однако доказательство там совсем не просто. Другие модели роста пробки см. в [17] и главе 2. Локальные расширения и сужения трассы. Что происходит при переходе участка дороги с k полосами в участок с l полосами. Пусть этот переход происходит в точке с координатой x = 0. Случай k < l. Пусть максимально разрешенная скорость равна vmax и предполагается дисциплинированность водителей. Пусть автомобили движутся по k-полосной трассе со скоростью v < vmax и быстрее ехать невозможно по причине фундаментального соотношения между плотностью автомобилей ρ и их скоростью: d + D+ (v) = ρ−1 . Тогда по l полосной трассе длины L автомобили теоретически могут сохранить ρ и двигаться с такой же скоростью, но ρ может скорректироваться так, что автомобили смогут двигаться быстрее с некоторой большей скоростью v1 . Выгода во времени будет L L − . v v1 Случай k > l. Тогда возможны три разных ситуации. Свободный поток. Если поток очень редкий, то автомобили будут подъезжать к точке 0 в одиночку и не заметят перехода. Растущая пробка. Обозначим Jk — текущий входящий поток и Jl,max — максимально возможный поток по l-полосной трассе. Если Jk > Jl,max , то будет образовываться пробка, и число автомобилей в пробке в среднем будет расти как t(Jk − Jl,max ), а точнее как в формуле (2). 257
Задержка. В случае Jk < Jl,max практическое наблюдение таково: перед сужениями могут возникать пробки случайной длины, которые однако не растут слишком сильно. Соответствующих стохастических моделей пока нет, для этого прежде всего нужны нестационарные модели начала и остановки движения. Некоторые из этих моделей мы сейчас опишем.
2.4.
Модели начала движения
В работе [9] автомобили задаются точками ... < xi (t) < xi−1 (t) < ... на прямой. В начальный момент времени t = 0 автомобили стоят и образуют пуассоновское точечное поле с плотностью ρ < 1. Автомобили могут иметь две скорости: 0 или 1; обгоны запрещены. Каждый стоящий автомобиль, через независимое экспоненциально распределенное время со средним 1, начинает двигаться со скоростью 1. Может случиться так, что автомобиль с номером i доедет до автомобиля i − 1 пока тот еще не начал двигаться. Тогда он останавливается и начинает двигаться через экспоненциальное время после того как начнет двигаться автомобиль i−1. Такое правило действует всегда. Этот процесс в некотором смысле описывает выезд автомобилей из пробки. Основной результат состоит в том, что с вероятностью 1 каждый автомобиль будет останавливаться только конечное число раз (при условии ρ < 1). Пусть ti — момент времени, начиная с которого автомобиль i все время движется. Тогда для любых i и k и любых ti , ti−1 , ..., ti−k случайные величины xi−1 (ti−1 )−xi (ti ), xi−2 (ti−2 )−xi−1 (ti−1 ), ..., xi−k (ti−k )−xi−k+1 (ti−k+1 ) будут независимы и экспоненциально распределены. Иначе говоря, после выезда из пробки автомобили будут образовывать пуассоновскую конфигурацию той же самой интенсивностью ρ, что и в начале. Пусть теперь в момент 0 пуассоновский точечный поток с плотностью ρ находится на левой полуоси. Каждая точка движется со скоростью v > 0, если расстояние до предыдущей точки не меньше некоторого def f > 0, и стоит в противном случае. Здесь очевидно, что каждая частица не останавливается, начиная с некоторого момента. Но здесь можно получить больше. Рассмотрим следующие 258
(1)
случайные величины: τk — случайное время начала движения k-й (2) точки, τk — случайное время, начиная с которого эта точка больше не останавливается, xk — расстояние до первой точки, начиная с (2) момента τk . Задача 1. Найти асимптотику распределений этих случайных величин при k → ∞. Связь с задачей задержки очевидна. Пусть есть две полосы и на каждой полосе интенсивность потока ρ; объединенный поток, таким образом, имеет плотность 2ρ. Автомобилям из первой полосы надо втиснуться во вторую. Алгоритмы втискивания могут быть разными. Например, любой автомобиль втискивается независимо от других, если его расстояние (по оси x) до предыдущего и последующего автомобиля из второй полосы было не менее некоторого числа d+ .
2.5.
Ближний и дальний порядок при меняющихся во времени скоростях автомобилей
Здесь автомобили представляются точками xi . С автомобилем i связывается случайный процесс wi (t), определяющий его скорость в момент t «на свободной дороге» (то есть при отсутствии препятствия спереди). Величина этой скорости косвенно определяет активность водителя в данный момент времени. Будем говорить, что автомобиль i имеет впереди себя препятствие в момент t, если xi (t − 0) = xi−1 (t). Процессы wi (t) взаимно независимы и определяются лишь психикой индивидуального водителя. Предположим, что существуют константы 0 < C1 < C2 < ∞ такие, что для всех t, i C1 < wi (t) < C2 . Поток задается начальным положением xi (0) автомобилей, а их движение определяется как ˆ t xi (t) = xi (0) + vi (s)ds, 0
259
где vi (t) — определяемая ниже скорость автомобиля в потоке. При этом начальные положения таковы, что расстояния d+ i (0) независимы и, например, экспоненциальны с заданным параметром ρ(0). Процесс будет полностью определен, если для всех t1 , ..., tn , i1 , ..., in мы зададим конечномерные распределения векторов: (vi1 (t1 ), ..., vin (tn )), где среди индексов ik могут быть одинаковые. Эти распределения полностью определяются следующими правилами: 1) (правило свободной дороги) если ни один из автомобилей i1 , ..., ik при k ≤ n не имеет впереди себя препятствия, то распределение вектора vi1 (t1 ), ..., vik (tk ) совпадает с распределением вектора wi1 (t1 ), ..., wik (tk ) и является независимым от распределения вектора vik+1 (tk+1 ), ..., vin (tn ); 2) (правило препятствия) если автомобиль i имеет впереди себя препятствие в момент t, то vi (t) = vi−1 (t); 3) (правила обгона) если автомобиль i имеет впереди себя препятствие в момент t, то он меняeтся местами с предыдущим автомобилем с некоторой интенсивностью λ в течение (случайного) интервала времени пока wi (t) > vi−1 (t). Смысл этого условия состоит в том, что водитель обгоняет, если его активность высока в течение некоторого промежутка времени. Уже для этого простейшего определения транспортного потока с зависимыми от времени скоростями есть много задач. Некоторые из них мы сейчас сформулируем. Назовем свободной фазой случай, когда автомобиль не задерживается при обгоне догоняемого автомобиля, то есть интенсивность обгона равна бесконечности. Тогда для любых автомобилей с индексами i, j их скорости независимы, и, значит, ковариации covij (t) = Evi (t)vj (t) − Evi (t)Evj (t) = 0. Задача 2. Для заданных распределений процессов wi (t) существует константа 0 < λ0 < ∞ такая, что при λ < λ0 существует предельный стационарный процесс (по i и по t), в котором ковариации covij (t) убывают экспоненциально по |j − i|. 260
Назовем этот тип движения фазой с ближним порядком. Существование фазы дальнего порядка определяется следующей гипотезой. Задача 3. Существует константa 0 < λcr < ∞ такая, что при λ > λcr существует предельный стационарный процесс, в котором ковариации covij (t) не стремятся к нулю при |j − i| → ∞. Будет ли λcr = λ0 предыдущей задачи ? Эти три фазы могут иметь отношение к фазам, определенным Б. С. Кернером [15]. Задача 4. Определить подобный процесс с длинами di , d+ i , а также с дополнительными индексами, соответствующими полосам движения, и с поведением водителя, зависящим не только от следующей, но и от предыдущего автомобиля. Какие дополнительные качественные эффекты могут ловить эти модели?
3.
Расчет средней скорости на автотрассе
Мы приводим здесь простейшую постановку задачи о снижении средней скорости движения автомобиля по автотрассе из-за случайных неподвижных (аварии и ремонтные работы) и движущихся (медленные автомобили) препятствий. Цель — показать (полностью решив модельные задачи), что во многих случаях можно получить простые красивые формулы, позволяющие понять основные причины замедления. Мы четко формулируем технические предположения для получения таких формул. Основное предположение касается однородности трассы, именно въезда, выезда автомобилей, специфики обгона.
3.1.
Дорога как одномерная сеть массового обслуживания
Следующая модель заимствована из [8], с. 117. Пусть есть бесконечная дорога и два типа автомобилей, задаваемые точками на бесконечной прямой, которые движутся в одном направлении. Автомобили первого типа (быстрые) двигаются с постоянной скоростью v1 , автомобили второго типа (медленные) имеют постоянную скорость v2 , где v1 > v2 . 261
Предположим, что быстрые автомобили в начальный момент времени образуют пуассоновскую случайную конфигурацию (пуассоновский точечный поток) на всей прямой с плотностью λ1 . Медленные автомобили расположены в момент t = 0 в точках x0 = 0 < x1 < ... < xn < ..., причем расстояния xk − xk−1 одинаково распределены со средним λ−1 2 (не обязательно экспоненциально). Медленные автомобили едут независимо, не замечая других автомобилей. Быстрые же «взаимодействуют» с каждым автомобилем, с которым их координаты совпадают. Именно, быстрым автомобилям разрешено обгонять медленные. Когда быстрый автомобиль догоняет медленный, то есть их координаты совпадают, то он сколько-то времени едет вместе с медленным, то есть со скоростью v2 . Через экспоненциально распределенное время с параметром µ он обгоняет медленного, то есть начинает ехать со скоростью v1 . Если быстрый автомобиль догоняет группу быстрых автомобилей, следующих за медленным, то обгон происходит в порядке очереди, точнее, в том порядке, в котором быстрые автомобили догоняли данный медленный автомобиль. Без ограничения общности, скорости медленных автомобилей можно считать равными нулю v2 = 0, а скорости быстрых соответственно равными v = v1 − v2 . Поэтому каждый медленный автомобиль можно представлять узлом обслуживания, на который приходят клиенты (быстрые автомобили) и в порядке очереди (то есть прибытия) ждут обслуживания (обгона), и обслуживаются с интенсивностью обслуживания µ. Теперь эта задача может быть сведена к линейной сети массового обслуживания, которую мы сейчас опишем. Имеется бесконечная последовательность S0 → ... → Sk → Sk+1 → ... узлов обслуживания двух типов. Каждый узел Sk представляет собой систему типа M/M/1 с дисциплиной обслуживания FIFO (firstin-first-out), то есть обслуживание в порядке естественной очереди. Эти узлы соответствуют медленным автомобилям, а требования — быстрым. Например, узел S0 соответствует крайнему левому медленному автомобилю. Вторая буква M означает экспоненциальность времени обслуживания. Это вместе с дисциплиной FIFO отвечает 262
формулировке нашей модели. Первая буква M означает пуассоновость входящего потока прибывающих требований. Так, на узел S0 поступление требований образует стационарный пуассоновский поток с интенсивностью λ1 v. Из элементарной теории очередей известно, во первых, что если λ1 v < µ, то устанавливается стационарный режим с вероятностями Pn того, что длина очереди равна n Pn = (1 − r)rn , r =
λ1 v . µ
Во вторых, известно (теорема Бюрке (Burke)), что в стационарном режиме выходящий поток из системы типа M/M/1 будет пуассоновским с интенсивностью равной интенсивности входящего потока, то есть в нашем случае это λ1 v. После первого узла, со случайным, но одинаковым для всех авто0 , поток требований поступает на мобилей временным сдвигом x1 −x v узел S1 , где также устанавливается стационарный режим. Найдем среднюю скорость быстрого автомобиля на интервале (x0 , xN ), N → ∞. При этом мы будем предполагать, что стационарный режим уже установился. Время проезда этого участка складывается из N обгонов и N путей между медленными автомобилями. Среднее время, затрачиваемое быстрым автомобилем на обгон медленного, составит ∞ X
(1 − r)rn
n=0
(n + 1) 1 1 = = , µ (1 − r)µ µ − λ1 v
в то время как среднее время движения до следующего медленного автомобиля есть 1 . λ2 v Поэтому расстояние между соседними медленными автомобилями (в среднем равное λ−1 2 ) быстрый автомобиль в среднем проходит за время (µ − λ1 v)−1 + (λ2 v)−1 . Таким образом, средняя скорость быстрого автомобиля составит vmean =
λ−1 2 . (µ − λ1 v)−1 + (λ2 v)−1
В следующих разделах мы рассмотрим более сложную ситуацию с более общими распределениями. 263
3.2.
Снижение средней скорости из-за ремонтных работ
По длинной автотрассе едут автомобили с постоянной скоростью v, встречая препятствия. Препятствия обычно имеют малый размер в сравнении с расстояниями между ними, поэтому можно представлять их точками. Они возникают на произвольном участке дороге (x, x + dx) ⊂ R за время (t, t + dt) ⊂ R с вероятностью λdxdt. Точнее говоря, пары (место и момент возникновения препятствия) (xj , tj ) ∈ R × R+ образуют пуассоновское точечное поле Π на R × R+ с интенсивностью λ. Другое эквивалентное определение состоит в том, что для любого интервала I ⊂ R есть пуассоновский поток прибывающих препятствий интенсивности λ|I|, причем в момент прибытия препятствие выбирает точку равномерно на интервале I. Предположим, что j-е препятствия находится на дороге некоторое случайное время τj , после чего оно убирается с дороги. Будем считать, что τj – независимые одинаково распределенные случайные величины с функцией распределения Q(t), не зависящие от пуассоновского точечного поля Π. Предположим, что первые два момента (2) с.в. τj конечны. Обозначим mQ = Eτj и mQ = Eτj2 . Далее мы будем рассматривать два случая. В первом случае объезд запрещен и автомобиль вынужден стоять до тех пор, пока не уберут препятствие, после чего автомобиль мгновенно набирает свою скорость v. Во втором случае объезд разрешен. Более точно, автомобилю требуется некоторое случайное время для того, чтобы объехать препятствие или группу автомобилей, стоящих перед препятствием, причем время обгона не зависит от размера этой группы. Обозначим через ηm,i случайное время объезда i-м автомобилем mго препятствия. Мы предполагаем, что ηm,i независимы и одинаково распределены с функцией распределения F (u). Эти предположения естественны для слабой нагрузки дороги, тогда перед препятствием не будет много автомобилей. Случай большой нагрузки рассматривается ниже. Нашей первой задачей будет вычисление средней скорости автомобиля. При сделанных предположениях автомобили не мешают друг другу, поэтому достаточно рассмотреть кого-нибудь одного из них. Обозначим через T (x) случайное время, затрачиваемое автомобилем на прохождение расстояния x. Мы хотим найти предел отноx при x → ∞ . шения T (x) 264
Пусть b = λmQ , ζ – с.в. с плотностью распределения h(t) = m−1 Q (1 − Q(t)).
(3)
Упражнение 2. Показать, что h — плотность. Отметим, что Eζ =
1 mQ
´∞ 0
2 ´∞ t(1 − Q(t))dt = m1Q 0 (1 − Q(t))d t2 = (2) ´∞ m = 2m1 Q 0 t2 dQ(t) = 2mQQ ,
(2)
где mQ – второй момент распределения Q(t). Определим с.в. α = min(η, ζ), где равенство по распределению, при этом с.в. η, ζ считаются независимыми и с.в. η имеет функцию распределения F (u) . Положим a = Eα. Теорема 1. С вероятностью 1 при x → ∞ x v → . T (x) 1 + abv
(4)
Доказательство. Без ограничения общности можно считать, что автомобиль выезжает в точке x = 0 в момент времени t = 0. Пусть T0 (x) – время простоя автомобиля. Тогда, очевидно, T (x) − T0 (x) = = v −1 x и x x 1 = = −1 . T (x) T (x) − T0 (x) + T0 (x) v + x−1 T0 (x) Поэтому достаточно найти предел отношения хотим показать, что π(x) X T0 (x) = αi ,
T0 (x) x
при x → ∞. Мы (5)
i=1
где αi – н.о.р. с.в., распределенные как α, π(x) – с.в. с пуассоновским распределением с параметром bx, причем αi и π(x) независимы. Смысл этой формулы в том, что автомобиль при прохождении расстояния x встретит π(x) препятствий и потеряет случайное время αi на i-м препятствии. 265
Рис. 1
Из (5) и усиленного закона больших чисел легко следует, что → ab п.н. при x → ∞. Докажем (5). Введем маркированное пуассоновское точечное поле Π1 на R × R+ с конфигурацией (xj , tj , τj ), то есть τj — марка в точке (xj , tj ). Следующее утверждение можно найти в [5]: T0 (x) x
Лемма 1. Маркированное точечное поле Π1 эквивалентно по рас2 пределению пуассоновскому полю на R × R+ с интенсивностью λdxdtdQ(t). Препятствия, возникающие на дороге, удобно представлять в виде горизонтальных отрезков, изображенных на рис. 1. Координаты начальной точки определяют место и время возникновения препятствия (пара (xj , tj )). Длина отрезка – время пребывания препятствия на дороге (марка τj ). Возьмем произвольную прямую c1 t + c2 и рассмотрим точки пересечения этой прямой с горизонтальными отрезками. Обозначим через {xi } – пространственные координаты этих точек, как показано на рис. 1. Следующая лемма доказана в [7]. Лемма 2. Конфигурация {xi } образует пуассоновский процесс интенсивности b = λmQ . 266
Рис. 2
На рис. 2 изображена траектория движения автомобиля, который стартует в точке x = 0 в момент времени t = 0. Обозначим через xi пространственные координаты препятствий, которые возникают при движении автомобиля, ti – моменты их возникновения, si – моменты времени, когда автомобиль встречает препятствие, ui – моменты времени, когда автомобиль избавляется от препятствия, либо в результате объезда препятствия, либо в результате исчезновения препятствия; αi = ui −si – задержка автомобиля на i-м препятствии. Из леммы 2 и пространственно-временной однородности пуассоновского точечного поля Π следует, что точки xi образуют пуассоновский процесс интенсивности b. Под временем жизни препятствия будем понимать время его пребывания на дороге. Назовем остаточным временем жизни препятствия – время его нахождения на дороге после того как его догнал автомобиль. Другими словами, это задержка автомобиля, если объезд невозможен. Лемма 3. Остаточное время жизни препятствия имеет распределение с плотностью h(s), где h(s) определяется формулой (3). В самом деле, из свойств пуассоновского точечного поля следует, что условное распределение остаточного времени жизни препятствия при условии, что полное время жизни равно t, совпадает с равномерным распределением на отрезке [0, t]. В силу леммы 2 ве267
роятность возникновения препятствия в интервале длины dx равна λmQ dx + o(dx), а вероятность возникновения препятствия с фиксированным временем жизни t в интервале длины dx есть λtdQ(t)dx + +o(dx), что вытекает из леммы 1. Поскольку tdQ(t) λtdQ(t)dx + o(dx) = λmQ dx + o(dx) mQ есть условная вероятность возникновения препятствия с фиксированным времени жизни t, то плотность распределения остаточного времени жизни препятствия имеет вид ˆ∞ s
tdQ(t) ds = m−1 Q (1 − Q(s))ds = h(s)ds. mQ t
Лемма доказана. В том случае, когда объезд возможен, автомобиль потеряет время, которое есть минимум из времени обгона и остаточного времени жизни препятствия, т.е. αi = min(η, ζ). Теорема доказана. Обсудим результат. Смысл константы a мы уже пояснили, а константа b имеет смысл стационарной плотности препятствий в пространстве. Этот результат довольно точен при малой плотности автомобилей, так как около препятствий будет по одному автомобилю. При высокой плотности автомобилей время объезда будет пересчитываться (увеличиваться) в зависимости от средней длины очереди перед препятствием.
3.3.
Снижение средней скорости из-за медленных автомобилей
Автотрасса описывается действительной осью R. Потоки считаются не очень плотными, поэтому длина автомобиля роли не играет, и в данный момент времени положение автомобиля задается точкой xi (t) ∈ R, где i — индекс, нумерующий автомобили. Каждый автомобиль имеет фиксированный маршрут: место и время въезда xi,in , ti,in , а также предписанное ему место выезда xi,out . Но время выезда ti,out зависит от степени загруженности дороги. Мы опреде-
268
ляем среднюю скорость автомобиля i как Vi =
xi,out − xi,in . ti,out − ti,in
Есть два типа автомобилей: быстрые и медленные, каждый движется с постоянной скоростью слева направо. У быстрых автомобилей скорость v1 , у медленных – v2 , где v1 > v2 > 0. Пусть v = v1 − v2 . Заметим, что случай неподвижных препятствий соответствует нулевой скорости v2 . Медленные автомобили движутся до пункта назначения нигде не останавливаясь, а быстрые до тех пор, пока не догонят впереди идущий медленный автомобиль. После этого быстрый автомобиль i движется вместе с этим медленным автомобилем j некоторое случайное время τi,j и затем обгоняет его, сразу набирая скорость v1 . Основное предположение состоит в том, что эти случайные величины независимы и одинаково распределены с функцией распределения F (s). Эта функция распределения может быть найдена статистически двумя способами как путем прямой выборки (оценки времени ожидания обгона), так и по статистике препятствий к обгону — плотности встречного потока. Прибытие медленных автомобилей задается тем же самым пуассоновским точечным полем Π интенсивности λ, которое было определено в предыдущем разделе. Нам потребуются также новые обозначения. С каждым медленным автомобилем мы свяжем случайное расстояние, которое ему необходимо проехать. Будем предполагать, что j-му медленному автомобилю необходимо проехать случайное расстояние ρj , после чего он съедет с дороги. С.в. ρi независимы и одинаково распределены с общей функцией распределения G(r). С.в. ρj не зависят также от пуассоновского точечного поля Π. Будем предполагать существование первых двух моментов с.в. ρ1 . Обозна(2) чим mG = Eρ1 , mG = Eρ21 . Медленный автомобиль не встречает на своем пути препятствий и проходит свой путь со скоростью v2 . Быстрым автомобилям могут мешать медленные. Мы рассмотрим два случая. В первом случае обгон запрещен и быстрый автомобиль вынужден следовать за медленным до тех пор пока медленный автомобиль не доедет до нужного места, после чего быстрый автомобиль мгновенно набирает свою скорость v1 . Во втором случае обгон разрешен. Более точно, когда i-й быстрый автомобиль догоняет j-й медленный или группу быстрых 269
автомобилей (следующих за j-м медленным), ему требуется случайное время τi,j для того, чтобы обогнать j-й медленный автомобиль или всю эту группу автомобилей. При этом время обгона не зависит от размера группы. С.в. τi,j предполагаются независимыми и одинаково распределенными с функцией распределения F (u). Пусть d = λmG v2−1 − v1−1 . Введем с.в. β с плотностью распределения g(x) = m−1 G (1 − G(x)) и с.в. γ = min(v2 τ1,1 , β), где равенство по распределению и с.в. τ1,1 , β считаются независимыми. Отметим, что (2) m Eβ = G . 2mG Положим c = Eγ. Теорема 2. С вероятностью 1 при x → ∞ x 1 + dc v1 . → v¯1 = T (x) 1 + dcv1 v2−1
(6)
Доказательство. Покажем, что этот случай сводится к рассмотренному случаю v2 = 0. Введем систему координат, которая движется со скоростью v2 относительно исходной. Найдем среднюю скорость быстрого автомобиля относительно новой системы координат c G по формуле (4), подставляя v = v1 − v2 , b = λm v2 , a = v2 : 1 (v1 − v2 )−1 +
λmc v22
=
v1 − v2 . 1 + dcv1 v2−1
Тогда средняя скорость быстрого автомобиля относительно исходной системы координат составит v¯1 =
4.
1 + dc v1 − v2 v1 . −1 + v2 = 1 + dcv1 v2 1 + dcv1 v2−1
Критерии образования пробок в сложных транспортных сетях
Обязательным атрибутом транспортной сети (например, городских улиц) является граф, где множество V вершин представляет перекрестки (узлы или пункты обслуживания), а множество ребер L = 270
= {(i, j)} — отрезки путей без перекрестков. Пусть число перекрестков равно N . Мы предполагаем, что между двумя перекрестками существует не более одного пути без перекрестков. Наиболее разработанными являются два класса сетей. С одной стороны, это (по имени авторов и в порядке увеличения общности) сети Джексона, BCMP-сети, DB-сети (см., например, [8, 26]). В них требование (сообщение, автомобиль, работа) обслуживается в каждом проходимом ими узле и затем выбирает случайно следующий узел. С другой стороны, — сети Келли (см. [8]), где каждое требование имеет заранее фиксированный маршрут. Эти два класса сетей связаны как общей техникой, так и близостью результатов. Именно они обладают замечательным свойством мультипликативности — стационарные распределения в них имеют вид так называемой, продакт-формы. Мы рассматриваем только первый класс сетей.
4.1.
Замкнутые сети
Если предполагается, что автомобили не прибывают извне и не убывают вовне, то такая сеть называется замкнутой. Таким образом, число автомобилей в сети сохраняется и далее обозначается через M . Движение отдельного автомобиля определяется так. Автомобиль ждет некоторое время на перекрестке i и затем направляется на перекресток j. Выбор j определяется стохастической матрицей маршрутизации: P = {pij }i,j=1,...,N , где pij — вероятность того, что с перекрестка i автомобиль поедет (после ожидания) на перекресток j (например, прямо, налево, направо), то есть по улице (i, j). Стохастическая матрица P определяет конечную цепь Маркова с дискретным временем, множеством состояний V = {1, ..., N }. Эта цепь Маркова предполагается неразложимой. В этом случае система линейных уравнений ρP = ρ, ρ = (ρ1 , ..., ρN ) ⇐⇒
N X
ρi pij = ρj , j = 1, ..., N
(7)
i=1
имеет единственное решение (с точностью до произвольного множителя). Нормированное решение имеет вид ρi πi = P N
i=1
ρi
, i = 1, ..., N.
271
С каждым узлом i ∈ V свяжем функцию µi (ni ) от числа автомобилей ni в i-м узле, где µi (0) = 0 и µi (ni ) > 0 при ni > 0. Эта функция характеризует пропускную способность данного узла и определяет интенсивность выходящего из узла потока автомобилей. Именно вероятность того, что за малый промежуток времени dt из узла i выедет автомобиль, равна µi (ni )dt + o(dt) при условии, что в узле находится ni автомобилей. Используя терминологию теории очередей, будем называть µi (ni ) интенсивностью обслуживания в узле i. Порядок, в котором пропускаются (обслуживаются) прибывающие в узел автомобили, определяется дисциплиной обслуживания. Простейший вариант дисциплины обслуживания – это обслуживание в порядке поступления. В узле прибывающие автомобили становятся в очередь друг за другом в том порядке, в котором они приехали, и узел пропускает автомобили согласно этой очереди. Если в узле i находится ni автомобилей, то первый автомобиль в очереди обслуживается с интенсивностью µi (ni ). Более общая дисциплина обслуживания – это дисциплина разделения общего ресурса, где под ресурсом в данном случае понимается пропускная способность узла. Согласно этой дисциплине ресурс делится в некоторой пропорции между всеми автомобилями, находящимися в данный момент в узле. В общем случае предположим, что k-й автомобиль в i-м узле обслуживается с интенсивностью µi,k (ni ) ≤ µi (ni ). При этом потребуем, чтобы ni X
µi,k (ni ) = µi (ni ).
k=1
Например, общий ресурс может быть разделен в равной степени между всеми автомобилями в очереди: µi,k (ni ) =
µi (ni ) . ni
В этом случае каждый из ni автомобилей потратит экспоненциальное время со средним ni µ−1 i (ni ) на прохождение этого узла, при условии, что число автомобилей будет сохраняться равным ni . Если взять µi,1 (ni ) = µi (ni ), то получим дисциплину обслуживания в порядке поступления. Таким образом, интенсивности µi,k (ni ) полностью определяют дисциплину обслуживания в узлах. Динамика сети описывается с помощью N -мерной марковской цепи с непрерывным временем ξ(t) = (ξi (t), i = 1, ..., N ), где ξi (t) 272
— число автомобилей, скопившихся в i-м узле в момент времени t. Случайный процесс ξ(t) принимает значение в пространстве SM , где SM – множество всех таких векторов с неотрицательными целочисленными координатами n ¯ = (n1 , ..., nN ), что n1 + ... + nN = M . Пусть ei – базисный вектор, в котором i-я координата равна 1, а остальные координаты равны 0. Из состояния n ¯ марковская цепь ξ(t) может перейти в одно из состояний Ti,j n ¯ =n ¯ − ei + ej , i 6= j, с интенсивностью α(¯ n, Ti,j n ¯ ) = µi (ni )pi,j , (8) при условии, что ni 6= 0. Переход n ¯ → Ti,j n ¯ соответствует тому, что, выехав из узла i, автомобиль поступает в узел j. Отметим, что марковская цепь ξ(t) однозначно определяется матрицей маршрутизации P и набором интенсивностей обслуживания в узлах (µi (ni ), i = 1, ..., N ). Пусть ρ = (ρ1 , ..., ρN ) – решение уравнения (7), которое рассматривается как формальное уравнение для интенсивностей ρi входящих потоков в узлы (в стационарном режиме они равны выходящим). Решая эти уравнения, находим ρi , и тогда стационарное распределение ν(n1 , ..., nN ) марковской цепи ξ(t) будет иметь вид ν(n1 , ..., nN ) =
1 ZN,M
N Y
i=1
ρni i , µi (1)µi (2)...µi (ni )
(9)
где нормирующий множитель (малая статсумма) ZN,M =
X
N Y
n1 +...+nN =M i=1
ρni i , µi (1)µi (2)...µi (ni )
что проверяется подстановкой ответа (9) в уравнения Колмогорова для стационарных вероятностей, см., например, [8, 29].
4.2.
Открытые сети
Рассмотрим сеть, состоящую из N узлов. В отличие от замкнутой сети, общее число автомобилей в сети теперь не фиксировано. Предположим, что извне сети в узел i поступает пуассоновский поток автомобилей интенсивности λi , i ∈ {1, ..., N }.
273
Зададим матрицу маршрутизации P = {pij }i,j=1,...,N , где матрица P неразложима и ∀i :
N X j=1
pij ≤ 1,
∃ i0 :
N X
pi0 j < 1.
(10)
j=1
Как и в случае замкнутой сети, pi,j — это вероятность того, что из узла i автомобиль едет в узел j. В отличие от замкнутой сети, добавляется вероятность того, что, выйдя из узла i, автомобиль покидает сеть. Эта вероятность по определению равна pi0 = 1 −
N X
pij .
j=1
Как и в случае замкнутой сети, пусть µi (ni ) — интенсивность обслуживания в i-м узле. Тогда с интенсивностью µi (ni )pi,0 автомобиль покидает сеть после выхода из узла i. Мы будем описывать динамику сети с помощью N -мерного случайного процесса с непрерывным временем η(t) = (ηi (t), i = 1, ..., N ), где ηi (t) – число автомобилей в i-м узле в момент времени t. Случайный процесс η(t) является марковской цепью с непрерывным временем и с пространством состояний S, где S – множество N -мерных векторов с неотрицательными целочисленными координатами n ¯ = (n1 , ..., nN ). Из состояния n ¯ марковская цепь ξ(t) может перейти в одно из состояний Ti,j n ¯=n ¯ − ei + ej , Ti,0 n ¯=n ¯ − ei , T i n ¯=n ¯ + ei с интенсивностями =
µi (ni )pi,j ,
α(¯ n, Ti,0 n ¯) = α(¯ n, Ti n ¯) =
α(¯ n, Ti,j n ¯)
µi (ni )pi,0 , λi ,
(11)
при условии, что Ti,j n ¯ , Ti,0 n ¯ , Ti n ¯ ∈ S. Таким образом, марковская цепь η(t) однозначно определяется триплетом (λ, µ, P ), где λ = (λ1 , ..., λN ) – вектор интенсивностей внешних потоков, µ = (µi (ni ), i = 1, ..., N ) – набор интенсивностей обслуживания в узлах и P – матрица маршрутизации.
274
Рассмотрим формальное уравнение для интенсивностей входящих потоков в узлы (в стационарном режиме они равны выходящим): N X ρ = λ + ρP ⇐⇒ ρi = λi + ρk pki , ∀ i. (12) k=1
В силу условия (10) и неразложимости матрицы P это уравнение имеет единственное решение, которое можно представить в виде ρ=λ+
∞ X
λP n .
n=1
Далее рассмотрим случай, когда интенсивности обслуживания µi (ni ) ≡ µi не зависят от числа автомобилей в узлах. Введем нагрузки в узлах по формуле ρi ri = , i = 1, ..., N. µi Следующую теорему можно найти, например, в [8, 20], она называется иногда теоремой Гордона—Ньюэлла. Теорема 3. Марковская цепь η(t) является эргодической тогда и только тогда, когда для всех i = 1, ..., N будет ri < 1. При этом стационарное распределение цепи имеет вид σ(n1 , ..., nN ) =
N Y
(1 − ri )rini .
i=1
Из этой теоремы легко следует, что средние длины очередей в стационарном режиме равны ri mi = . 1 − ri
Если в некоторых узлах i1 , ..., ik нагрузка строго больше 1, то марковская цепь η(t) является транзиентной (см., например, [33]). Это свидетельствует о том, что средние очереди в узлах i1 , ..., ik стремятся к бесконечности с течением времени. Подробный анализ открытых сетей дан в работе [19]. В частности показано, что в узлах, где нагрузка больше 1, средние очереди увеличиваются линейно с ростом времени. При этом найдены скорости роста средних очередей. 275
4.3.
Алгоритм вычисления критической нагрузки в замкнутых сетях
Этот раздел основан на работе [18]. Мы рассмотрим последовательность замкнутых сетей JN , N = 1, 2, ... Сеть JN состоит из N узлов и M = M (N ) автомобилей. Интенсивности обслуживания в узлах сети JN не зависят от длины очереди: µi,N (ni ) ≡ µi,N . Пусть PN = {pi,j,N } – матрица маршрутизации в N -й сети; PN предполагается неразложимой. Пусть ρN = (ρ1,N , ..., ρN,N ) – вектор с положительными компонентами, удовлетворяющий уравнению (13)
ρN = ρN PN . Относительные нагрузки в узлах определяются как −1 ri,N = CN ρi,N τi,N ,
где τi,N = µ−1 = maxi=1,...,N ρi,N τi,N . Очевидно, что i,N и CN ri,N ∈ [0, 1]. В соответствии с (9) стационарное распределение числа автомобилей ξi,N,M в узлах сети JN равно PN,M (ξi,N,M = ni , i = 1, ..., N ) =
1 ZN,M
N Y
ni ri,N ,
i=1
где нормирующий множитель (малая статсумма) ZN,M =
X
N Y
ni ri,N .
(14)
n1 +...+nN =M i=1
Многие важные характеристики сети выражаются через статсумму. Упражнение 3. Показать, что среднее число автомобилей в i-м узле в стационарном режиме равно mi,N,M = Eξi,N,M =
276
ri,N ∂ZN,M . ZN,M ∂ri,N
(15)
Ниже мы будем требовать слабую сходимость относительных нагрузок ri,N . Точнее, определим выборочную меру на отрезке [0, 1]: IN (A) =
1 N
X
1,
i:ri,N ∈A
где A – произвольное борелевское множество из отрезка [0, 1]. Предположим, что при N → ∞ меры IN слабо сходятся к некоторой вероятностной мере I заданной на отрезке [0, 1]. Нас будет интересовать случай больших N, M , точнее N, M → ∞, причем так, что M N → λ = const, то есть удельное число автомобилей на один узел постоянно. Именно это число определяет существование пробок. Замечание 1. Интересно найти конкретные последовательности растущих графов, для которых предельная мера I явно описывается. Некоторые примеры, где мера I одноточечна см. в ссылках к работе [18], см. также с. 157–160 в [29]. В терминах предельной меры I мы найдем критическое значение плотности λcr , так что при λ < λcr средние длины очередей равномерно ограничены. Если λ ≥ λcr , то в узле с максимальной относительной нагрузкой средняя длина очереди стремится к бесконечности, что означает возникновение пробки. Положим ˆ 1 r h(z) = dI(r), 1 − zr 0
где z ∈ C \ [1, +∞). Функция h(z) строго возрастает на [0, 1). Обозначим λcr = lim h(z). z→1−
Будем предполагать, что λcr > 0. Теорема 4. • Если λ < λcr , то средние очереди равномерно ограничены: существует такая константа B, что mi,N < B, равномерно по N ≥ 1 и 1 ≤ i ≤ N . • Если λ ≥ λcr и i(N ) удовлетворяет условию ri(N ),N = 1, то mi(N ),N → ∞, при N → ∞ т.е. пробки будут в тех узлах, где нагрузка максимальна. 277
При z ∈ C \ [1, +∞) положим SN (z) = −λ(1 + εN ) ln z − S(z) = −λ ln z −
ˆ
N 1 X ln(1 − zri,N ), N i=1
(16)
1
0
ln(1 − zr)dI(r),
где λ(1 + εN ) = M N. Введем производящую функцию (большую статсумму): ΞN (z) =
∞ X
z M ZN,M =
M =0
N Y
1 , |z| < 1. 1 − zri i=1
По формуле Коши и формуле (16) имеем следующее выражение для статсуммы (14): ˆ ˆ ΞN (z) 1 exp(N SN (z)) 1 dz = dz, (17) ZN,M = 2πi z M +1 2πi z γ
γ
где γ = {z ∈ C : |z| = σ < 1}. Для средних, согласно (15), имеем ˆ 1 ri,N mi,N = exp(N SN (z)) dz. (18) 2πiZN 1 − zri,N γ
Можно показать, что для стационарного распределения длин очередей справедлива формула =
1 2πiZN
P (ξ1,N,M = n1 , ..., ξK,N,M = nK ) = ´ N,M QK −1 ni z i=1 (1 − zri,N )(zri,N ) exp(N SN (z))dz. γ
(19)
В доказательстве теорем этого раздела существенную роль играет метод перевала (см. [27]), точнее его обобщение, поскольку функция в показателе экспоненты зависит от N . Из уравнения ∂SN (z) =0 ∂z
(20)
находятся точки перевала. Пусть z0,N – корень этого уравнения, лежащий в интервале (0, 1). 278
Упражнение 4. Показать, что все корни уравнения (20) действительны и положительны. Всегда существует единственный корень, лежащий в интервале (0, 1). Пусть z0 – корень уравнения h(z) =
∂S(z) λ ⇔ = 0, z ∂z
(21)
лежащий в интервале (0, 1). Упражнение 5. • Доказать, что при всех λ существует предел limN →∞ z0,N = z0 = z0 (λ) > 0. • Если λ < λcr , то z0 (λ) – корень уравнения (21); z0 (λ) строго возрастает по λ, z0 (λ) ∈ (0, 1), limλ→λcr− z0 (λ) = 1. • Если λ ≥ λcr , то z0 = 1. В следующей теореме мы находим асимптотику статсуммы и предельное распределение для последовательности замкнутых сетей JN . Теорема 5. Пусть λ < λcr . • При N → ∞ статсумма ZN и свободная энергия FN = имеют следующие асимптотики: ZN ∼
1 N
ln ZN
exp(N SN (z0,N )) 1 p ln ZN ∼ S(z0 ). , FN = N z0 2πN S ′′ (z0 )
• Если при i = 1, ..., K существуют пределы ri = limN →∞ ri,N , то z0 ri lim mi,N = , N →∞ 1 − z0 ri lim PN,M (ξ1,N,M = n1 , ..., ξK,N,M = nK ) =
N →∞
K Y
(1 − z0 ri )(z0 ri )ni .
i=1
Таким образом, в пределе мы получаем открытую сеть, состоящую из независимых очередей.
279
Доказательство теорем 4 и 5. Мы приведем более общий результат, из которого будут следовать теоремы 4 и 5. Пусть Ud (v) = = {z ∈ C : |z − v| < d}. Рассмотрим контур γ = {z ∈ C : |z| = z0 (λ)}. Теорема 6. Пусть λ < λcr и f (θ, z), θ ∈ Θ, – семейство функций голоморфных в кольце {z ∈ C : z0 (λ) − δ0 < |z| < z0 (λ) + δ0 } при некотором δ0 > 0, равномерно ограниченных в этом кольце и таких, что для заданного достаточно малого ǫ > 0 существует такое δu > 0 и такая ненулевая действительная константа fu , что |f (θ, z)/fu − 1| < ǫ при z ∈ U2δu (z0 ), θ ∈ Θ. Тогда при достаточно больших N , равномерно по θ ∈ Θ ˆ 1 fu exp(N SN (z0,N )) p f (θ, z) exp(N SN (z))dz = (1 + ζN ), 2πi 2πN S ′′ (z0 ) γ
где |ζN | < 25ǫ.
Доказательство этой теоремы основано на применении метода перевала (saddle-point method)(см. [27]). Отличие от стандартной ситуации состоит в том, что функция в показателе экспоненты зависит от N . Подробное доказательство можно найти в оригинальной статье [18]. Доказательство теоремы 5. Используя теорему 6, докажем первый пункт теоремы 5. Согласно (17) имеем ˆ 1 exp(N SN (z)) ZN,M = dz, 2πi z γ
где γ = {z ∈ C : |z| = z0 (λ)}. Положив f (θ, z) = z −1 , fu = z0−1 и применив теорему 6, получим, что для любого достаточно малого ǫ > 0 при достаточно больших N ZN =
exp(N SN (z0,N )) p (1 + ζN ), |ζN | < 25ǫ. z0 2πN S ′′ (z0 )
(22)
Второй пункт теоремы 5 доказывается аналогично с использованием формулы (18) для средней очереди и формулы (19) для совместного распределения длин очередей. Упражнение 6. Доказать третье утверждение теоремы 5, используя теорему 6 и формулы (18), (19). 280
Доказательство теоремы 4. Чтобы доказать первый пункт теоремы 4, рассмотрим семейство функций f (θ, z) =
θ A A + , θ ∈ Θ = [0, 1], A > 0, fu = . z 1 − zθ z0
16z0 Зафиксируем малое ǫ > 0 и выберем σu = 8ǫ , A = (1−z . По теореме 0 )ǫ 6 имеем для достаточно больших N и всех θ ∈ Θ ´ A 1 θ + 2πi z 1−zθ exp(N SN (z)) dz =
=
γ A exp(N SN (z0,N )) z0
√
2πN S ′′ (z0 )
(1 + ζN ), |ζN | < 25ǫ.
Разделив на ZN и применив (22) к правой части получившегося равенства, получим при достаточно больших N ˆ ′ ′ 1 1 θ A+ exp(N SN (z)) dz = A (1 + ζN ), |ζN | < 30ǫ. ZN 2πi 1 − zθ γ
Из последнего равенства и формулы (18) следует равномерная ограниченность mi,N . Докажем второе утверждение теоремы 4. Для этого потребуется следующее свойство монотонности: при любых M2 ≥ M1 > 0 и любом N ≥ 1 выполнено mi,M2 ,N ≥ mi,M1 ,N . Поскольку z0 (λ) строго возрастает по λ, z0 (λ) ∈ (0, 1) и lim
λ→λcr −
z0 (λ) = 1,
то функция z0 (λ) 1 − z0 (λ) монотонно возрастает и стремится к ∞, когда λ ր λcr . Поэтому для любого m > 0 существует такое λ′ = λ′ (m) < λcr , что z0 (λ′ ) = m + 1. 1 − z0 (λ′ ) Без ограничения общности можно считать, что i(N ) ≡ 1 и r1,N = = 1. Если взять M ′ (N ) = [λ′ N ], то по теореме 5 lim m1,M ′ (N ),N =
N →∞
281
z0 (λ′ ) . 1 − z0 (λ′ )
Следовательно, при достаточно больших N m1,M ′ (N ),N >
z0 (λ′ ) − 1 = m. 1 − z0 (λ′ )
Но M/N → λ ≥ λcr > λ′ , поэтому при достаточно больших N имеем M (N ) ≥ M ′ (N ). По свойству монотонности m1,N = m1,M (N ),N ≥ ≥ m1,M ′ ,N > m для достаточно больших N . Это доказывает, что m1,N → ∞. Технические обобщения и математические проблемы. Мы предполагали мгновенное перемещение между перекрестками. При этом не учитываются времена движения по улицам. Это допущение однако легко устраняется усложнением графа. Именно введением дополнительных вершин uij , соответствующих улицам, и средних времен τij =µ−1 ij пребывания на улицах. В терминах теории очередей это значит, что улицы рассматриваются как узлы обслуживания с бесконечным числом обслуживающих устройств и время обслуживания экспоненциально распределено со средним τij =µ−1 ij . Отметим, что результаты раздела 4.1 могут быть обобщены на случай, когда сеть содержит узлы с бесконечным числом обслуживающих устройств. Пусть, например, сеть содержит один узел такого типа (i = 0) и µ0,N (n) = nνN – интенсивность обслуживания в этом узле. Пусть ρN = (ρ0,N , ..., ρN,N ) – решение уравнения (13). Тогда относительные нагрузки определим по формуле µ0,N ρi,N , ri,N = ρ0,N µi,N так что r0,N = 1. Согласно (9), стационарное распределение длин очередей имеет вид PN,M (ξi,N,M = ni , i = 1, ..., N ) = где ZbN,M =
X
n1 +...+nN ≤M
и большая статсумма сети равна b N (z) = ez Ξ
1 ZbN,M (M −
(M − N Y
1 PM
282
i=1 ni )! i=1
N Y
i=1 ni )! i=1
1 . 1 − zri,N i=1
N Y
1 PM
ni ri,N ,
ni ri,N ,
Положим qi,N =
ri,N , w = zpN , pN
pN = max ri,N . 1≤i≤N
Тогда b N (w) = ew/pN Ξ
N Y
1 . 1 − wq i,N i=1
В предположении, что pN N → α > 0 при N → ∞ мы можем найти критическое значение плотности λ по формуле λcr = α
−1
+ lim
w→1−
ˆ1 0
q dI(q), 1 − wq
где, как и раньше, мера I есть слабый предел при N → ∞ выборочных мер 1 X 1, IN (A) = N i:qi,N ∈A
где A – произвольное борелевское множество из отрезка [0, 1]. В работе [21] для замкнутых сетей аналогичные результаты получаются для случая более общей зависимости интенсивностей от длин очередей в узлах. Прием усложнения графа позволяет устранить также другое ограничение, что для данного перекрестка средняя длительность красного света одна для всех направлений. Необходимо вместо вершины i, соответствующей перекрестку, ввести несколько вершин (i, d), где d перечисляет возможные направления движения на перекрестке i. Это конечно налагает ограничение на соответствующие времена обслуживания τi,d в новых вершинах типа X τi,d = τi . d
Мы ограничились задачей, когда в системе возникала хотя бы одна пробка. Интереснее рассмотреть ситуацию, когда в разных местах графа одновременно возникает много пробок.
283
Связь с практикой. Эта модель удобна тем, что все ее параметры можно оценить. Именно на практике статистические оценки параметров pij , µi имеют вид (например, для постоянных µi ) Nij (T ) 1X Nij (T ), , µi = pij ∼ P T j j Nij (T )
где Nij (T ) — число автомобилей, повернувших за время T на перекрестке i в направлении j. Практически интересна прежде всего задача оптимизации светофоров, которая может достигаться выбором τi,d , и за счет изменения матрицы P подсказками о выборе маршрута. Более того, в экспоненциальной модели многие случайные величины независимы, и, значит, полностью игнорируется проблема синхронизации светофоров. Следует сказать, что проблема светофоров в стохастическом контексте только начинает изучаться, и постановки задач там должны быть более тонкими. Ранее данная проблема изучалась в жидкостных моделях. Однако пока нет понимания (а тем более вывода) связи жидкостных транспортных моделей со стохастическими (как в статистической физике).
284
Литература 1. Хейт Ф. Математическая теория транспортных потоков. М.: Мир, 1966. 2. Renyi A. On two mathematical models of the traffic on a divided highway // Journal of Applied Probability. 1964. V. 1. P. 311–320. 3. Solomon H., Wang P. Nonhomogeneous Poisson fields of random lines with applications to traffic flow // Proc. Sixth Berkeley Symp. on Math. Statist. and Prob. 1972. V. 3. P. 383–400. 4. Solomon H. Geometric Probability. Philadelphia: SIAM, 1978. 5. Daley D., Vere-Jones D. An Introduction to the Theory of Point Processes V. 1. Springer, 2003. 6. Кокс Д., Смит В. Теория восстановления. М.: Мир, 1967. 7. Cox D. R., Isham V. Point processes. Chapman and Hall, 1980. 8. Kelly F. Reversibility and stochastic networks. N.Y.: Wiley, 1979. 9. Caceres F., Ferrari P., Pechersky E. A slow-to-start traffic model related to a M/M/1 queue // Journal of Statistical Mechanics: Theory and Experiment. 2007. [arXiv:0703709 cond-mat]. 10. Иносэ Х., Хамада Т. Управление дорожным движением. М.: Транспорт, 1983. 11. Traffic flow theory: A state-of-the-art report. Editors Gartner N. H., Messer C. J., Rathi A. K. Washington DC: Transportation Research Board, 2001. 12. Blank M. Ergodic properties of a simple deterministic traffic flow model // J. Stat. Phys. 2003. V. 111. P. 903–930. 13. Jost D., Nagel K. Probabilistic Traffic flow breakdown in stochastic car following models // Traffic and Granular Flow. 2005 V. 03. Part 2. P. 87–103. 14. Lotito P., Mancinelli E., Quadrat J.-P. A min-plus derivation of the fundamental car-traffic law // Automatic Control IEEE Transactions. May 2005. V. 50. N 5. P. 699–705. 285
15. Kerner B. S. Introduction to modern traffic flow theory and control. Berlin: Springer, 2009. 16. Замятин А. А., Малышев В. А. Накопление на границе для одномерной стохастической системы частиц // Проблемы передачи информации. 2007. Т. 43. № 4. С. 68–82. 17. Lighthill M. J., Whitham G. B. On kinematic waves. II. Theory of traffic flow on long crowded roads // Proc. R. Soc. London, Se. A. 1955. V. 229. P. 281–345. 18. Malyshev V., Yakovlev A. Condensation in large closed Jackson networks // Ann. Appl. Probab. 1996. V. 6. N. 1. P. 92–115. 19. Botvich D. D., Zamyatin A. A. On fluid approximations for conservative networks // Markov Processes and Related Fields. 1995. V. 1. N. 1. P. 113–141. 20. Fayolle G., Malyshev V., Menshikov M. Topics in the constructive theory of countable Markov chains. Cambridge University Press, 1995. 21. Fayolle G., Lasgouttes J.-M. Asymptotics and Scalings for Large Product-Form Networks via the Central Limit Theorem // Markov Processes and Related Fields. 1996. V. 2. N. 2. P. 317–349. 22. Revised Traffic Flow Theory. A state-of-art report. Editors Gartner J.-M., Messer C. J., Rathi A. K. Washington DC: Transportation Research Board, 2001. 23. Рюэль Д. Статистическая механика. Строгие результаты. М.: Мир, 1971. 24. Малышев В. А., Минлос Р. А. Гиббсовские случайные поля. М.: Наука, 1985. 25. Малышев В. А. Случайные грамматики // Успехи мат. наук. 1998. Т. 53. № 2. С. 107–134. 26. Serfozo R. Introduction to stochastic networks. Springer, 1999. 27. Федорюк М. В. Метод перевала. М.: Наука, 1977.
286
28. Буслаев А. П., Новиков А. В., Приходько В. М., Таташев А. Г., Яшина М. В. Вероятностные и имитационные подходы к оптимизации автодорожного движения. М.: Мир, 2003. 29. Афанасьева Л. Г. Очерк Исследования Операций. М.: Изд-во ЦПИ при механико-математическом факультете МГУ, 2007. 30. Кингман Дж. Пуассоновские процессы. М.: МЦНМО, 2007. 31. Blythe R. A., Evans M. R. Nonequilibrium steady states of matrixproduct form: a solver’s guide // Journal of Physics A: Mathematical and Theoretical. 2007. V. 40. N. 46. 32. Derrida B. Non-equilibrium steady states: fluctuations and large deviations of the density and of the current // Journal of Statistical Mechanics: Theory and Experiment. July 2007. 33. Малышев В. А. Кратчайшее ведение в современные вероятностные модели. М.: Изд-во ЦПИ при механико-математическом факультете МГУ, 2009. http://mech.math.msu.su/˜ malyshev/Malyshev/Lectures/course.pdf
287
А. В. Колесников
Транспортная задача и концентрация Первые результаты о концентрации были получены П. Леви в его книге по функциональному анализу [10]. Само название «концентрация мер» было предложено В. Мильманом. Благодаря ему же явление концентрации приобрело большую популярность в математическом сообществе и нашло многочисленные приложения в функциональном анализе, геометрии, вероятности, комбинаторике и технических науках. Среди сугубо математических приложений упомянем: 1) новое доказательство теоремы Дворецкого о «почти круглых» сечениях выпуклых тел, 2) изопериметрические теоремы сравнения М. Громова для многообразий положительной кривизны Риччи, 3) приложения в теории гауссовских случайных процессов (например, оценки статистического супремума), 4) применения к другим функциональным и вероятностным неравенствам (неравенства типа Соболева, неравенства типа Брунна—Минковского для выпуклых тел и т.п.). Подробнее об этом можно узнать в книгах [2; 7–9]. О вероятностных приложениях см. статью [11]. Для ознакомления с недавними результатами о концентрации и функциональных неравенствах для логарифмически вогнутых распределений также рекомендуем статью [13]. Теоремы о концентрации также позволяют оценить скорость сходимости системы к равновесному состоянию (см. комментарий ниже и приложение Е. В. Гасниковой настоящего пособия). Классический пример свойства концентрации дает стандартное нормальное (гауссовское) d-мерное распределение γ. Как известно, плотность такого распределения задается формулой ργ (x) =
|x|2 1 exp − . 2 (2π)d/2
Для произвольного множества A со свойством γ(A) > рим его r-окрестность: Ar = {x : ∃y ∈ A : |x − y| ≤ r}.
288
1 2
рассмот-
Тогда выполнено следующее неравенство концентрации: 1 r2 γ(Ar ) ≥ 1 − e− 2 . 2
(1)
Как мы видим, P (Ar ) очень быстро (квадратично экспоненциально) стремится к единице. Равномерное распределение σ на единичной сфере S d−1 ⊂ Rd также обладает аналогичным свойством: σ(Ar ) ≥ 1 −
π 21 8
e−d
r2 2
.
(2)
Одно из важных следствий неравенств такого типа — неравенства для колебаний липшицевых функций. Пусть f — 1-липшицева функция, т.е. удовлетворяющая соотношению |f (x) − f (y)| ≤ |x − y|. Используя формулу коплощади Z Z ∞ g(x) dγ = γ({g > t}) dt, −∞
из (1) можно получить неравенство вида Z 2 γ {x : f (x) − f dγ > t} ≤ 2e−ct для некоторой универсальной константы c. Полученное свойство обычно формулируется в виде «липшицевы функции с большой долей вероятности мало отличаются от своего среднего значения». Несмотря на простой вид, доказательство (1) нетривиально. Классический способ основан на описании так называемых «изопериметрических множеств» — множеств, имеющих наименьшую границу среди множеств такой же меры (вероятности). В евклидовом пространстве таким, как известно, является шар. На сфере их роль выполняют сферические «шары», а в пространстве, наделенном гауссовым распределением, — полупространства {x : hx, ai < c}, a ∈ Rd , c ∈ R. Это — хорошо известный в теории вероятностей результат, доказанный В. Судаковым и Б. Цирельсоном (и независимо от них K. Бореллем, см. [1]). Из того факта, что r-окрестности полупространств являются полупространствами (т.е. опять изопериметрическими множествами), несложно извлечь следствие, что функция
289
r 7→ F (A, r) = γ(Ar ) среди всех множеств фиксированной вероятности p растет медленнее всего для изопериметрического A. Для этого множества функция F (A, r) явно вычисляется, и мы получаем (1). Указанный способ плох тем, что явно найти изопериметрические множества в более общем случае невозможно. Существует несколько подходов к доказательству неравенства концентрации. В настоящем пособии мы опишем связь явления концентрации с транспортной задачей, возникшей и развившейся в совершенно другой области математики. Связь эта была найдена в работе К. Мартон [12]. Транспортная задача ведет свою историю от классической работы Г. Монжа [14], написанной в 1781 году. В этой работе задача была сформулирована следующим образом: имеется куча песка и яма одинаковых объемов. Как засыпать песком яму, потратив наименьшие усилия на перевозку? Конечно, это не единственная возможная «экономическая» формулировка транспортной задачи. Речь, например, может идти о перевозе грузов со складов по заданным адресам. В дискретной постановке мы имеем набор точек {xi }, 1 ≤ i ≤ N . Задано N других точек {yi } и фукция стоимости c(x, y) (например, расстояние или квадрат расстояния). Как построить взаимнооднозначное отображение T , сопоставляющее каждой точке из первого набора PN точку из второго набора, так, чтобы суммарная стоимость i=1 c(xi , yi ) была наименьшей? В дальнейшем транспортная задача переживала как периоды забвения, так и бурного развития. На языке современной математики транспортная задача была переформулирована и решена Л. Канторовичем в 40-х годах XX-го века (см. [3]) и получила в дальнейшем название задачи Монжа—Канторовича. Важным шагом в работах Канторовича было применение развитого им в теории линейного программирования метода двойственности и формулировка транспортной задачи на языке теории меры и функционального анализа. О приложениях двойственности и задач типа транспортной в технических науках см., например, главу 2 и приложение Е. В. Гасниковой настоящего пособия. Пусть задана пара вероятностных распределений µ и ν на пространствах X = Y = Rd . Решением задачи Монжа—Канторовича называется распределение m на R2d , удовлетворяющее следующим условиям:
290
1. Проекции m на X и Y равны соответственно µ и ν: prX m = µ, prY m = ν.
(3)
2. Распределение m реализует минимум следующего функционала: Z F(m) : m → c(x, y) dm, X×Y
где c : X ×Y → R — некоторая функция, называемая функцией стоимости (cost function). При весьма общих предположениях задача Монжа—Канторовича имеет решение. В дальнейшем мы будем интересоваться только случаем c(x, y) = = |x − y|2 . Обратим теперь внимание на важное отличие задачи Монжа— Канторовича от исходной задачи Монжа. В задаче Монжа речь идет о перевозе груза, что на математическом языке соответствует задаче существования отображения T : X → Y , преобразующего распределение µ в распределение ν (последнее означает, что ν(A) = µ({x : T (x) ∈ A}) и реализующего минимум функционала Z 2 W2 (µ, ν) = |x − T (x)|2 dµ. Rd
Оказывается, что при весьма общих условиях (например, распределения µ и ν непрерывны) эти задачи эквивалентны. Если m — решение задачи Монжа—Канторовича, то m сосредоточено на графике некоторого отображения T : m{(x, y) : y = T (x)} = 1. Мы будем называть T оптимальным отображением. Существование T было доказано Я. Бренье в [5]. Более того, имеет место следующий удивительный факт. Теорема 1. T имеет вид T (x) = ∇ϕ(x), где ϕ — некоторая выпуклая функция. Величина
sZ W2 (µ, ν) = Rd
291
|x − T (x)|2 dµ
называется расстоянием Канторовича (также можно встретить названия «расстояние Канторовича—Рубинштейна» и «расстояние Васерштейна»). Действительно, можно проверить, что W2 (µ, ν) является расстоянием на пространстве вероятностных распределений. Пусть теперь распределения µ и ν заданы плотностями µ = ρ1 dx, ν = ρ2 dx. Свойство T отображать µ в ν аналитически записывается с помощью формулы замены переменной: ρ2 (∇ϕ) det D2 ϕ = ρ1 . Если рассматривать ϕ как неизвестную функцию, то мы получаем уравнение Монжа-Ампера. Под D2 ϕ = D(∇ϕ) подразумевается матрица вторых производных (гессиан) функции ϕ. Сделаем важное техническое замечание. Выполнено очевидное тождество Z Z Z Z |x − y|2 dm = |x|2 dµ − 2 hx, yidm + |y|2 dν. Rd
Rd
Rd
Rd
Поэтому поиск минимума функционала |x − y|2 dm эквивалентен Rd R поиску максимума функционала Rd hx, yi dm. Существование ϕ может быть доказано разными способами. Стандартный подход состоит в применении метода двойственности Канторовича и работе с так называемыми циклически монотонными множествами. При этом выпуклость ϕ получается автоматически. Двойственная задача Канторовича принимает вид Z Z Φ(x) dµ + Ψ(y) dν → max, R
где функционал максимизируется среди функций, удовлетворяющих условию Φ(x) + Ψ(y) ≤ |x − y|2 . Отображение T связано с Φ следующим образом: T (x) = x − ∇Φ(x) (см. подробнее гл. 1, [16]). Формальное, но поучительное доказательство того факта, что T является градиентом, можно получить путем вывода уравнения Эйлера—Лагранжа (см. [6]). Пусть T — произвольное отображение из µ в ν. Решение задачи Монжа—Канторовича можно искать, как условный экстремум функционала Z hT (x), xidµ Rd
292
при условии ρν (T ) det DT = ρµ . Составим функционал Лагранжа: Z hT (x), xiρµ + λ(x)(ρν (T ) det DT − ρµ ) dx. Rd
Функция λ играет роль множителя Лагранжа. Чтобы найти первую вариацию функционала Лагранжа, рассмотрим инфинитезимальную вариацию Tε (x) = T (x) + εω(x) отображения T . Здесь ω — гладкое векторное поле с компактным носителем. Очевидно, ρν (Tε ) ≈ ρν (T ) + εhω, ∇ρν (T )i. Можно проверить, что det(DT + εDω) = det DT · det(I + ε(DT )−1 Dω) ≈ ≈ det DT 1 + εTr DT −1 · Dω . Таким образом, первая вариация функционала Лагранжа равна Z hω(x), xiρµ + λ(x) · ρν (T )Tr DT −1 Dω + d R ρµ dx. + λ(x)h∇ρν (T ), ωi ρν (T ) Заметим, что div(ω(T −1 )) = TrD ω(T −1 ) = Tr DT −1 Dω (T −1 ). Интегрируя по частям и применяя замену переменных, несложно убедиться в том, что Z Z λ(x) · Tr DT −1 · Dω ρµ dx = λ(T −1 )div(ω(T −1 ))ρν dx = d d R R Z Z
∇ρν −1 −1 =− h∇ λ(T ) , ω(T )iρν dx − λ(T −1 ) ω(T −1 )), ρν dx. ρν Rd Rd Следовательно, вариация равна Z Z hω(x), xiρµ − h∇ λ(T −1 ) , ω(T −1 )iρν dx = 0. Rd
Rd
293
Пусть λ = u(T ), где u — некоторая функция. Применяя опять формулу замены переменных, получаем, что для любого гладкого поля ω выполнено Z hω(x), xi − h∇u(T ), ω(x)i ρµ dx = 0. Rd
Следовательно: ∇u(T ) = x =⇒ T −1 = ∇u. Таким образом, T −1 = ∇u. В силу симметричности задачи относительно µ и ν то же утверждение можно сделать для самого отображения T . В качестве иллюстрации эффективного использования оптимальной транспортировке в анализе приведем доказательство М. Громова классического изопериметрического неравенства. Пример 1. Среди множеств фиксированной меры Лебега шары имеют наименьшую поверхностную меру. Доказательство. Пусть A ⊂ Rd — борелевское множество, Br = {x : |x| ≤ r} — шар, удовлетворяющий условию λ(A) = λ(Br ), где λ — мера Лебега на Rd . Пусть T = ∇ϕ — оптимальная транспортировка, отображающая λ|A в λ|Br . По формуле замены переменных det D2 ϕ = 1 на A (для простоты изложения считаем, что ϕ — гладкая функция, хотя аргументы ниже легко обобщаются на негладкий случай). Матрица D2 ϕ симметрична и неотрицательна, поэтому p d 2 1 = det D ϕ ≤ ∆ϕ d в силу неравенства между средним арифметическим и средним геометрическим. Проинтегрируем это неравенство по A и применим теорему Остроградского-Гаусса: Z Z
dλ(A) ≤ ∆ϕ dx = ∇ϕ, nA dHd−1 ≤ rHd−1 (∂A). A
∂A
Здесь nA — единичная нормаль к ∂A, Hd−1 — (d − 1)-мерная меd
ра Хаусдорфа. Из соотношения λ(A) = λ(Br ) = классическое изопериметрическое неравенство
π2 rd Γ(1+ d 2)
получаем
1
λ1− d (A) ≤ κd Hd−1 (∂A), h
Γ(1+ d 2) √ d π
i d1
где κd = . Из доказательства следует, что неравенства становятся равенствами в случае A = {kx − x0 k ≤ r}. Таким образом, 294
шары имеют наименьшую поверхностную меру среди множеств фиксированной меры Лебега. Пусть ν — некоторое вероятностное распределение. Энтропией вероятностного распределения g · ν относительно ν называется велиR чина Entν (g) = g log g dν (мы считаем, что функция x log x равна нулю в точке 0). Следующий результат, доказанный М. Талаграном [15], связывает теорию оптимальной транспортировки с функцинальными неравенствами. Теорема 2. Пусть µ = γ — стандартное гауссовское распределение. Предположим, что ν = g · γ — другое вероятностное распределение. Тогда квадрат расстояния Канторовича между этими распределениями оценивается относительной энтропией g: Z 1 2 W (γ, g · γ) ≤ g · log g dγ := Entγ (g). 2 Rd Доказательство. Для простоты изложения предположим, что g и ϕ — гладкие функции (это бывает не всегда, но общий случай можно свести к этому). Рассмотрим формулу замены переменной: e−
x2 2
= g(∇ϕ)e−
|∇ϕ|2 2
det D2 ϕ.
Прологарифмируем это соотношение: −
x2 |∇ϕ|2 = log g(∇ϕ) − + log detD2 ϕ. 2 2
Перепишем его в виде 1 |x − ∇ϕ|2 = hx, x − ∇ϕi + log g(∇ϕ) + log detD2 ϕ. 2 Проинтегрируем полученное неравенство по γ. Заметим, что x2 x2 ∇e− 2 = −xe− 2 . Из формулы интегрирования по частям следует: Z Z hx, x − ∇ϕi dγ = d − TrD2 ϕ dγ Rd
Rd
(напомним, что d — размерность). Следовательно, Z Z Z 1 |x−∇ϕ|2 dγ + TrD2 ϕ−d−log det D2 ϕ dγ ≤ log g(∇ϕ)dγ. 2 Rd Rd Rd 295
Заметим теперь, что TrD2 ϕ − d − log det D2 ϕ ≥ 0. Действительно, если λi — собственные значения матрицы D2 ϕ, то TrD2 ϕ − d − log det D2 ϕ =
d X
λi − 1 − log det λi ≥ 0
i=1
(в силу неотрицательности функции x − 1 − ln x). Таким образом, получаем Z Z Z 1 2 |x − ∇ϕ| dγ ≤ log g(∇ϕ)dγ = g log g dγ. 2 Rd Rd Rd
Теорема 3 (К. Мартон). Если вероятностное распределение µ удовлетворяет неравенству Талаграна: Z 2 W (µ, g · µ) ≤ C g · log g dµ, Rd
то µ удовлетворяет неравенству гауссовской концентрации: r2
µ(Ar ) ≥ 1 − 2e− 4C , µ(A) ≥
1 . 2
(4)
В частности, неравенству гауссовской концентрации удовлетворяет гауссовское распределение. Доказательство. Положим (Ar )c = Rd \Ar . Рассмотрим оптималь1 ную транспортировку ∇ϕ вероятностного распределения µ1 = µ(A) × 1 ×IA · µ в вероятностное распределение µ2 = µ((Ar )c ) I(Ar )c · µ. В силу того, что расстояние между носителями µ1 , µ2 превосходит r, имеем W2 (µ1 , µ2 ) ≥ r. В силу неравенства треугольника (напомним, что W2 — расстояние): r ≤ W2 (µ1 , µ2 ) ≤ W2 (µ1 , µ) + W2 (µ2 , µ). По неравенству Талаграна p p r ≤ 2CEntµ µ1 + 2CEntµ µ2 . 296
1 , Entµ µ2 = log µ((A1r )c ) , немедленно полуТак как Entµ µ1 = log µ(A) чаем r2 1 1 ≤ log + log . 4C µ(A) µ((Ar )c ) Следовательно, r2 µ((Ar )c ) ≤ 2e− 4C .
Остается заметить, что µ((Ar )c ) = 1 − µ(Ar ). Теорема доказана. Несложно проверить, что приведенные выше аргументы применимы к случаю распределения с плотностью e−V , где D2 V ≥ K · Id, K > 0 (неравенство понимается в матричном смысле, эквивалентная формулировка: hD2 V · v, vi ≥ K для любого вектора v ∈ Rd единичной длины). В этом случае также получаем гауссовскую концентрацию. Те же самые аргументы работают для сферы или, более общим образом, для многообразия с ограниченным снизу тензором Риччи. Напоследок кратко обсудим еще одно приложение транспортной задачи — оценку скорости сходимости к равновесному состоянию. Пусть V — равномерно выпуклый потенциал: D2 V ≥ K · Id, K > 0. Рассмотрим решение уравнения Фоккера—Планка: ∂µt = ∆µt + div(∇V · µt ), ∂t µt = ρt dx — вероятностное распределение. Оказывается, для двух решений этого уравнения выполнено неравенство d 2 W (µt , νt ) ≤ −2K · W22 (µt , νt ) dt 2 (см. [16], пример 9.10). Это можно проверить, непосредственно продифференцировав расстояние Канторовича по параметру t. Очевидно, эта оценка дает экспоненциальную скорость сходимости µt к равновесному распределению: W2 (µt , νt ) ≤ W2 (µ0 , ν0 )e−Kt . Приложения такого рода включают в себя широкий класс уравнений, являющихся градиентными потоками относительно метрики Канторовича. Подробнее об этом см. в [4]. 297
Литература 1. Богачев В. И. Гауссовские меры. М.: Наука, 1997. 2. Зорич В. А. Математический анализ задач естествознания. М.: МЦНМО, 2008. 3. Канторович Л. В. О перемещении масс // ДАН СССР. 1942. Т. 37. С. 227–229. 4. Ambrosio L., Gigli N., Savar´e G. Gradient flows in metric spaces and in the Wasserstein spaces of probability measures. Lectures in Math. ETH Zurich, 2008. 5. Brenier Y. Polar factorization and monotone rearrangement of vector valued functions // Comm. Pure Appl. Math. 1991. V. 44. P. 375–417. 6. Evans L. C. Partial differential equations and Monge-Kantorovich mass transfer. In «Current developments in mathematics». Cambridge, 1997; Boston: Int. Press, 1999. P. 65–126. http://math.berkeley.edu/˜ evans/ 7. Gromov M. Metric structure for Riemannian and non-Riemannian spaces. V. 152. Boston: Birkh¨ auser, 1998. 8. Milman V., Schechtman G. Asymptotic theory of finite dimensional normed vector spaces. Lect Notes in Math. V. 1200. Springer, 1986. 9. Ledoux M. The concentration of measure phenomenon. Mathematical Surveys and Monographs 89. Amer. Math. Soc., 2001. 10. Levy P. Probl`eme concretes d’analyse fonctionelle. Paris: GauthierVillars, 1951. 11. Lugosi G. Concentration of measures inequalities. Barcelona, 2009. http://www.econ.upf.edu/˜ lugosi/anu.pdf 12. Marton K. A measure concentration inequality for contractive Markov chains // Geom. Func. Anal. 1997. V. 6. P. 556–571. 13. Milman E. On the role of Convexity in Isoperimetry, Spectral-Gap and Concentration // Invent. Math. 2009. V. 177. N. 1. P. 1–43.
298
14. Monge G. M´emoire sur la th´eorie des d´edlais et de remblais. Histoire de l’Acad’emic Royale des science, 1781. 15. Talagrand M. Transportation cost for Gaussian and other product measures // Geom. Funct. Anal. 1996. V. 6. P. 587–600. 16. Villani C. Topics in Optimal Transportation. Amer. Math. Soc. Providence. Rhode Island, 2003. http://math.univ-lyon1.fr/homes-www/villani/
299
А. М. Райгородский
Модели случайных графов и их применения1
В этом приложении дается обзор основных современных направлений в теории случайных графов. Делается акцент на связь моделей случайного графа с транспортной проблематикой.
1.
Введение
Теория графов играет огромную роль в фундаментальной и прикладной математике. Ей посвящены сотни монографий и тысячи – если не десятки тысяч – статей. Разумеется, мы не можем ставить перед собою цель дать на этих страницах сколь-нибудь подробное изложение теории графов. Нас будет интересовать лишь одно направление, которое с каждым годом становится все более актуальным. В рамках этого направления графы изучаются с вероятностной точки зрения. Типичная постановка вопроса (говоря не совсем строго) такова: велика ли вероятность того, что граф обладает данным свойством? Вопрос исключительно важный, и мы в этом не раз убедимся ниже. Правда, в нем ни слова не сказано о том, как именно мы понимаем термин вероятность. Всякий человек, имеющий представление об аксиоматике Колмогорова, хорошо знает, что можно вложить множество разных смыслов в этот термин. И его можно действительно определять по-разному. В зависимости от определения получится та или иная модель случайного графа. С чисто математических позиций любая такая модель имеет право на существование. Однако для приложений – в том числе приложений к транспортной проблематике – некоторые из этих моделей более интересны, некоторые – менее. Соответственно ниже мы расскажем о двух классах моделей, каждый из которых за десятилетия, прошедшие с момента 1 Работа выполнена при финансовой поддержке гранта РФФИ 09-01-00294, гранта Президента РФ МД-8390.2010.1, гранта поддержки ведущих научных школ НШ-8784.2010.1.
300
своего появления, зарекомендовал себя плодотворным как в рамках «чистой» математики, так и в рамках ее разнообразных приложений, среди которых надежность транспортной сети, рост Интернета и других социальных и биологических сетей, теория алгоритмов и пр. Не претендуя на полноту изложения (это было бы нелепо, т.к. и здесь наука разрослась безгранично), мы постараемся выделить лишь самые основные и принципиальные моменты теории случайных графов.
2.
Модель Эрдеша—Реньи
Этот раздел мы посвятим описанию модели случайного графа, которая возникла исторически первой. На рубеже 50-х и 60-х годов ХХ века эту модель предложили классики современной комбинаторики и теории вероятностей П. Эрдеш и А. Реньи (см. [1–3]). Отметим, что Эрдеш – это, пожалуй, одна из самых ярких фигур в математике ХХ века. Ему принадлежат сотни статей и задач, которые оказали огромное влияние на развитие многих математических дисциплин. Реньи также сыграл значительную роль в формировании венгерской вероятностной школы, и его именем назван математический институт в Будапеште.
2.1.
Формальное описание модели
Пусть дано множество Vn = {1, . . . , n}, элементы которого мы назовем вершинами. Именно на этом множестве мы будем «строить» случайный граф. Понятно, что случайным будет множество ребер графа. Мы не хотим сейчас рассматривать графы с кратными ребрами (мультиграфы), графы с петлями (псевдографы) и ориентированные графы (орграфы). Поэтому мы считаем, что потенциальных ребер у графа не больше, чем Cn2 штук. Будем соединять любые две вершины i и j ребром с некоторой вероятностью p ∈ [0, 1] независимо от всех остальных Cn2 −1 пар вершин. Иными словами, ребра появляются в соответствии со стандартной схемой Бернулли, в которой Cn2 испытаний и «вероятность успеха» p. Обозначим через E случайное множество ребер, которое возникает в результате реализации такой схемы. Положим G = (Vn , E). Это и есть случайный граф в модели
301
Эрдеша—Реньи. Напомним, что E также обозначает математическое ожидание (из контекста будет ясно, какое E имеется в виду в том или ином случае). Если записывать приведенное только что определение в формате аксиоматики Колмогорова, то мы имеем вероятностное пространство G(n, p) = (Ωn , Fn , Pn,p ), в котором Ωn = {G = (Vn , E)},
Fn = 2Ωn ,
2
Pn,p (G) = p|E| (1 − p)Cn −|E| . (1)
Здесь через |A| обозначена мощность множества A (количество элементов), а 2A – это совокупность всех подмножеств множества A. Элемент сигма-алгебры Fn – это набор графов. Если нам хочется найти вероятность, с которой граф на n вершинах обладает данным свойством A, то мы просто берем множество A ∈ Fn , состоящее из всех графов, для которых выполнено свойство A, и вычисляем X Pn,p (A) = Pn,p (G). G∈A
Таким образом, вероятность того, например, что случайный граф связен, – это величина, равная сумме вероятностей всех связных графов (на фиксированном множестве вершин). Казалось бы, все совсем просто и мы вряд ли имеем шансы наткнуться здесь на нечто особенно интересное. Однако дело обстоит прямо противоположным образом: специфика вероятностных методов, которые эффективно работают в задачах о случайных графах, позволит нам пронаблюдать весьма нетривиальные и, главное, неожиданные явления, которые возникают даже в этой простой модели и которые влекут приятные следствия для приложений. Прежде чем двигаться дальше, сделаем еще ряд полезных замечаний. Во-первых, если p = 21 , то, как видно из формулы (1), 2 вероятность любого графа равна 2−Cn . Иными словами, в этом специальном случае все графы равновероятны и всякое утверждение о вероятности какого-либо свойства – это, по сути, утверждение о доле графов данным свойством обладающих. В действительности, мы не только не обязаны предполагать, что p = 21 (хотя и этот случай очень важен), мы даже можем считать, 302
что с ростом величины n (числа вершин) вероятность p возникновения ребра изменяется. Иначе говоря, p = p(n) – любая функция, значения которой заключены между нулем и единицей. Как правило, в науке о случайных графах важны даже не сами вероятности событий, но их предельные значения. Почему это так, мы скоро увидим. Скажем, наконец, что свойство выполнено почти всегда, если его вероятность стремится к единице при n → ∞.
2.2.
Транспортная интерпретация модели
Представим себе, что в некоторой стране есть 10 городов, которые попарно соединены дорогами. Это довольно сильное предположение, но пока сохраним его. Допустим, каждая из дорог за определенный срок изнашивается (т.е. становится непроезжей) с известной вероятностью q. При этом износ данной дороги никак не зависит от совокупного износа остальных дорог. Спрашивается: какова максимальная вероятность q, при которой с вероятностью больше 1/2 не исчезнет возможность перемещения между любыми двумя городами? По существу, это вопрос о надежности транспортной сети: чем выше искомая вероятность q, тем, разумеется, сеть надежнее. Нетрудно видеть, что вопрос о надежности сети – это в свою очередь вопрос о связности случайного графа. В самом деле, сопоставим каждому городу вершину i ∈ V10 . Тогда «дорога» между «городами» i и j – это ребро. Износ дороги – это исчезновение ребра. Значит, утверждение «дорога изнашивается с вероятностью q» равносильно утверждению «ребро появляется с вероятностью p = 1−q». Таким образом, нас интересует, какова минимальная вероятность p, при которой в модели Эрдеша—Реньи G(n, p) вероятность связности графа больше половины (граф, скорее, связен, чем несвязен). Понятно, что если мы заменим число 10 другим числом, то соответствующее минимальное p может измениться. Этим и обусловлено наше желание рассматривать не только постоянные p, но и нетривиальные функции p = p(n). В разделе 2.4 мы обсудим ряд строгих утверждений, касающихся сформулированного выше вопроса. Однако есть у нас и более срочное дело: все-таки предположение о том, что города связаны дорогами попарно, чересчур сильное, и в следующем разделе мы приведем модификацию модели Эрдеша—Реньи, в рамках которой это пред303
положение можно будет адекватно ослабить.
2.3.
Обобщения модели Эрдеша—Реньи
Пусть по-прежнему Vn = {1, . . . , n}. Однако теперь вероятность ребра между вершинами i и j мы обозначим через pij . Иными словами, мы, как и раньше, проводим ребра независимо друг от друга, но с разными вероятностями. В формате аксиоматики Колмогорова мы получаем вероятностное пространство G(n, pij ) = (Ωn , Fn , Pn,pij ), в котором Ωn = {G = (Vn , E)}, Fn = 2Ωn , Pn,pij (G) =
Y
(i,j)∈E
pij ·
Y
(1−pij ).
(i,j)6∈E
Важный частный случай описанного пространства получается, коль скоро мы фиксируем некоторый граф Hn = (Vn , En ) и полагаем p, (i, j) ∈ En , pij = 0, (i, j) 6∈ En . Иначе говоря, ребра графа Hn возникают в случайном графе независимо друг от друга с одной и той же вероятностью p = p(n) ∈ [0, 1], а ребра, которых в графе Hn нет, не возникают в случайном графе вовсе. Этот вариант модели принято обозначать G(Hn , p). В ней Pn,pij (G) = p|E| (1 − p)|En |−|E| . Ясно, что модель G(Hn , p) и есть та самая модель, которая вполне адекватна вопросу о надежности транспортной сети. На сей раз мы не обязаны предполагать, что города попарно соединены дорогами, мы можем с самого начала зафиксировать граф дорог Hn и следить за износом его ребер.
2.4.
Некоторые математические результаты о надежности сети
Прежде всего справедлива следующая теорема.
304
n Теорема 1. Рассмотрим модель G(n, p). Пусть p = c ln n . Если c > 1, то почти всегда случайный граф связен. Если c < 1, то почти всегда случайный граф не является связным.
Этот довольно простой с точки зрения доказательства факт мы обоснуем в разделе 2.5. Однако при всей своей формальной простоте теорема 1 несет весьма содержательную и в каком-то смысле неожиданную информацию. Действительно, вернемся к вопросу о надежности сети. Пусть число n городов, попарно соединенных дорогами, n довольно быстро стрерастет. Тогда, разумеется, величина p = c ln n мится к нулю. Тем не менее теорема 1 утверждает, что вероятность сохранения связности графа при уничтожении его ребер с вероятностью q = 1 − p стремится к единице. Грубо говоря, если городов 1000, то мы можем позволить дорогам разрушаться с вероятностью ≈ 0.993, так что в результате с вероятностью, близкой к единице, перемещение между любыми двумя городами останется возможным. Поначалу это кажется противоречащим интуиции, но, по здравому размышлению, становится понятно, в чем здесь смысл. Дорог у нас Cn2 = Θ(n2 ), вероятность износа дороги равна 1 − Θ(ln n/n). Значит, ожидаемое количество неизношенных дорог имеет порядок n ln n. Этого хватает для сохранения связности. При определенной аккуратности в выкладках, которые мы частично проведем в разделе 2.5, можно доказать, например, такой факт. Теорема 1′ . Рассмотрим модель G(n, p). Пусть p = c > 3, то при n > 100 Pn,p (G связен) ≥ 1 −
c ln n n .
Если
1 . n
Этот результат совсем замечателен своей конкретностью. Получается, что при той же тысяче городов и вероятности износа дороги 1000 1 − 3 ln ≈ 0.98 вероятность сохранения связности не меньше, чем 1000 0.999! Теорема 1 любопытна еще и тем, что в ней наблюдается резкий скачок от «почти всегда связности» к «почти всегда несвязности». Функция p(n) = lnnn служит своего рода рубежом, преодоление которого означает переход от ненадежности к надежности. Такой переход принято называть фазовым, а соответствующую функцию p(n) – пороговой. 305
Следующая теорема содержит в себе еще более глубокую информацию о природе связности-надежности. Она была доказана самими Эрдешем и Реньи (см. [1–3]). Теорема 2. Рассмотрим модель G(n, p). Пусть p = nc . Если c < 1, то найдется такая константа β = β(c), что почти всегда размер каждой связной компоненты случайного графа не превосходит β ln n. Если же c > 1, то найдется такая константа γ = γ(c), что почти всегда в случайном графе есть ровно одна компонента размера ≥ γn. И снова мы имеем фазовый переход – резкое изменение свойств случайного графа при преодолении некоторого порога. В данном случае порогом служит функция p = n1 . Оказывается, что если вероятность ребра в c > 1 раз «ниже» порога, то все связные компоненты графа, скорее всего, крошечные – имеющие логарифмический от общего числа вершин размер; если же вероятность ребра в c > 1 раз «выше» порога, то, скорее всего, найдется компонента с числом вершин порядка n. Такая компонента называется гигантской. Теорема 2 допускает различные уточнения. Например, можно утверждать, что при c > 1, помимо единственной гигантской компоненты, в случайном графе ничего сколь-нибудь крупного почти никогда не возникает: все остальные компоненты снова логарифмические. Можно еще аккуратнее описывать размер гигантской компоненты. В действительности, верно не только неравенство ≥ γn, но и асимптотика ∼ γn. В. Е. Степанов доказал, что при p = nc , c > 1, размер гигантской компоненты асимптотически нормален (см. [4–6]). В целом изменение свойств случайного графа при изменении вероятности ребра p принято трактовать как эволюцию графа. Нам кажется, что несколько правильнее говорить о своего рода истории мира. Сначала (при p ≪ n1 ) имеет место «феодализм» – весь граф поделен на несвязанные между собой логарифмические кусочки. Затем (при p ≫ n1 ) возникает «империя» – гигантская компонента. Наконец, при p ≫ lnnn империя уничтожает «окраины» и добивается мирового господства – связности. В терминах надежности смысл теоремы 2 также очевиден: можно еще в ln n раз уменьшить вероятность сохранности отдельной дороги, и если не вся страна, то значительная ее часть окажется консолидированной, т.е. не лишенной инфраструктуры – возможности сообщения между любыми двумя городами. 306
Глубокий интерес представляет, конечно, устройство мира «внутри» фазовых переходов, т.е. при p ∼ n1 и при p ∼ lnnn . В первом случае все совсем сложно, и мы отсылаем читателя к книгам [7– 9]. Во втором случае можно сформулировать, например, следующий понятный результат. Теорема 3. Пусть p = ln n+c+o(1) . Тогда Pn,p (G связен) → e−e . В n частности, при p = lnnn вероятность стремится к e−1 . −c
Здесь уже речь не идет о «почти всегда связности» или «почти всегда несвязности». Здесь асимптотическая вероятность связности есть, но она лежит в строгих пределах от нуля до единицы. Все, о чем мы говорили до сих пор, касалось модели G(n, p). Естественно, модель G(Hn , p), будучи более адекватной реальности, является и более сложной для изучения. Главный результат относительно этой модели принадлежит Г. А. Маргулису (см. [11]). Теорема 4. Пусть {Hn } – последовательность графов, реберная связность которых стремится к бесконечности при n → ∞. Тогда существует пороговая функция p для свойства связности случайного графа в модели G(Hn , p). Теорема 4 нетривиальна, и ее доказательство (а также массу ссылок на близкие результаты) можно найти в книге [8]. Разумеется, поиск пороговой функции, существование которой доказывается в теореме 4, – это всякий раз сложная задача, повязанная на специфику графов из последовательности {Hn }. Практический смысл теоремы 4 банален: надо строить дороги так, чтобы связность получающегося графа неуклонно росла. К сожалению, в России положение, как правило, противоположное. Даже в Москве есть много улиц, перекрытие которых означает фактическую потерю связности. Например, таковы улицы, проходящие под железными дорогами: они крайне редки и служат единственными лазейками с одной стороны полотна на другую. В следующем разделе мы докажем теорему 1, а в разделе 2.6 мы обсудим основные идеи доказательства теоремы 2. Отметим, что дополнительную информацию о поведении случайных графов в модели Эрдеша—Реньи можно найти в [7–10].
307
2.5.
Доказательство теоремы 1
Сперва обсудим случай c > 1. Введем случайную величину на пространстве G(n, p): 0, если G связен, Xn = Xn (G) = k, если у G ровно k компонент. Таким образом, Xn принимает неотрицательные целые значения, причем Xn 6= 1. Нам нужно показать, что Pn,p (Xn = 0) → 1 при n → ∞. Это равносильно асимптотике Pn,p (Xn ≥ 1) → 0. По неравенству Чебышёва: Pn,p (Xn ≥ 1) ≤ EXn , и нам остается обосновать стремление к нулю математического ожидания. Представим Xn в виде суммы Xn = Xn,1 + . . . + Xn,n−1 , где Xn,k = Xn,k (G) – число k-вершинных компонент графа G. Занумеруем все k-элементные подмножества множества вершин Vn случайного графа в некотором (произвольном) порядке: K1 , . . . , KCnk . Тогда в свою очередь Xn,k = Xn,k,1 + . . . + Xn,k,Cnk , коль скоро Xn,k,i = Xn,k,i (G) =
1, 0,
В итоге EXn =
если Ki образует компоненту в G, иначе. k Cn n−1 XX
EXn,k,i .
k=1 i=1
Очевидно,
EXn,k,i = Pn,p (Ki образует компоненту в G) ≤ ≤ Pn,p (из Ki в Vn \ Ki нет ребер в G). Получая последнее неравенство, мы просто пренебрегли условием связности той части графа G, которая «сидит» на множестве вершин 308
Ki (такую часть принято называть индуцированным подграфом и обозначать G|Ki ). Далее, Pn,p (из Ki в V \ Ki нет ребер в G) = (1 − p)k(n−k) , и, значит, EXn ≤
k Cn n−1 XX
k=1 i=1
(1 − p)k(n−k) =
n−1 X k=1
Cnk (1 − p)k(n−k) .
Последняя сумма симметрична в том смысле, что ее слагаемые при k и n − k равны. Рассмотрим k = 1: n(1 − p)n−1 ≤ ne−p(n−1) = ne−
c(ln n)(n−1) n
=n
c(1+o(1)) 1 = o(1), n
поскольку c > 1. Оставшаяся часть рассуждения состоит в доказательстве того, что слагаемые с k > 1 и k < n − 1 пренебрежимо малы по сравнению с первым слагаемым. Соответствующую выкладку мы пропустим. Если же поверить в ее справедливость, то получится, что вся сумма доминируется первым и последним слагаемыми, а стало быть, и она стремится к нулю. Теорема 1 для случая c > 1 доказана. Теперь рассмотрим случай c < 1. Обозначим через Xn количество изолированных вершин в случайном графе. Запишем Xn = Xn,1 + . . . + Xn,n , где Xn,k = Xn,k (G) =
1, 0,
если вершина k ∈ Vn изолированная в G, иначе.
Тогда EXn = EXn,1 + . . . + EXn,n . В свою очередь EXn,k = Pn,p (k изолированная в G) = (1 − p)n−1 . 309
Таким образом, EXn = n(1 − p)n−1 = n(1 − p)n (1 + o(1)) = = (1 + o(1))ne−c ln n = (1 + o(1))n1−c . Заметим, что ввиду неравенства c < 1 выполнено EXn → ∞. Посчитаем дисперсию случайной величины Xn : DXn = EXn2 − (EXn )2 = E(Xn,1 + . . . + Xn,n )2 − (EXn )2 = X 2 2 = EXn,1 + . . . + EXn,n + EXn,i Xn,j − (EXn )2 = i6=j
= EXn,1 + . . . + EXn,n +
X i6=j
= EXn +
X i6=j
EXn,i Xn,j − (EXn )2 =
EXn,i Xn,j − (EXn )2 .
Далее, EXn,i Xn,j = Pn,p (i и j изолированы в G) = = (1 − p)2n−1 = (1 + o(1))(1 − p)2n , т.е.
X i6=j
EXn,i Xn,j = n(n − 1)(1 + o(1))(1 − p)2n = = (1 + o(1))n2−2c = (1 + o(1))(EXn )2 .
В итоге DXn = EXn + (1 + o(1))(EXn )2 − (EXn )2 = o (EXn )2 .
По неравенству Чебышёва
Pn,p (G связен) ≤ Pn,p (Xn = 0) = Pn,p (Xn ≤ 0) = Pn,p (−Xn ≥ 0) = = Pn,p (EXn − Xn ≥ EXn ) ≤ и вторая часть теоремы доказана.
310
DXn = o(1), (EXn )2
2.6.
Идеи доказательства теоремы 2
Метод, о котором мы будем здесь говорить, восходит к Р. Карпу (см. [12]), и в таком виде он описан в книге [9]. Мы лишь перечислим ниже основные шаги рассуждения. 2.6.1.
Простейший ветвящийся процесс
Пусть Z1 , . . . , Zt , . . . – независимые пуассоновские величины с одним и тем же средним λ. Положим Y0 = 1,
Yt = Yt−1 + Zt − 1.
Представлять себе описанный только что процесс можно так. В начальный момент времени есть одна частица. Затем она приносит Z1 потомков и умирает. Заметим, что она может умереть, даже не принеся потомства, т.к. величина Z1 равна нулю с положительной вероятностью. На следующем шаге все повторяется: какая-то частица (порядок роли не играет) порождает Z2 новых частиц, а сама гибнет. И так далее. Популяция может выродиться, а может и жить вечно. Хорошо известно, что имеют место следующие результаты. Теорема 5. Пусть λ ≤ 1. Тогда с вероятностью 1 процесс Yt вырождается, т.е. P (∃ t : Yt ≤ 0) = 1. Теорема 6. Пусть λ > 1. Пусть γ ∈ (0, 1) – единственное решение уравнения 1 − γ = e−λγ . Тогда процесс Yt вырождается c вероятностью 1 − γ, т.е. P (∃ t : Yt ≤ 0) = 1 − γ. Доказательства теорем 5 и 6 можно найти, например, в [9]. Впрочем, это стандартные факты теории ветвящихся процессов (см. [13]). Забегая вперед, скажем, что величина γ в теореме 6 и одноименная величина в теореме 2 суть одно и то же. Вероятность вырождения процесса Yt и размер гигантской компоненты напрямую связаны. 2.6.2.
Ветвящийся процесс на случайном графе
Пусть дан граф G = (V, E): конкретный граф, не случайный. Зафиксируем какую-нибудь его вершину v1 ∈ V . Назовем ее «живой», а все остальные вершины – «нейтральными». Выберем среди нейтральных вершин всех соседей вершины v1 . После этого объявим
311
вершину v1 «мертвой», ее соседей – живыми, а все остальные вершины – нейтральными. Снова зафиксируем какую-нибудь живую вершину v2 . Выберем всех ее соседей среди нейтральных. Вершину v2 отправим в царство мертвых, а в живых останутся все, кто был жив, кроме v2 , и новорожденные «потомки» вершины v2 . Продолжая этот ветвящийся процесс, мы в конце концов получим кладбище вершин и ни одной живой вершины. Кладбище будет компонентой, содержащей v1 . Обозначим число живых вершин в момент времени t через Yt , число нейтральных вершин – через Nt , а число потомков очередной живой вершины, отправляющейся в последний путь, – через Zt . Тогда, очевидно, Y0 = 1,
Yt = Yt−1 + Zt − 1.
Разумеется, все введенные величины зависят от графа G и от последовательности выбираемых вершин v1 , . . . Если граф G посчитать случайным, то при любом выборе вершин v1 , . . . получатся случайные величины Yt , Nt , Zt на пространстве G(n, p). На самом деле, ясно, конечно, что распределения этих величин не зависят от v1 , . . . ; поэтому мы нигде зависимость от вершин и не указываем. Сразу понятно, что Zt не является пуассоновской. Тем не менее она похожа на пуассоновскую, а именно, имеет биномиальное распределение с «числом испытаний» Nt и вероятностью «успеха» p. Правда, число испытаний само случайно. По счастью, это не проблема. Удается доказать, что Yt имеет вид Yt = ξt + 1 − t,
ξt ∼ Binom (n − 1, 1 − (1 − p)t ).
Подробности можно найти в [9], и мы их здесь не касаемся. Как известно, биномиальное распределение сходится к пуассоновскому, коль скоро вероятность успеха обратно пропорциональна числу испытаний. Нечто подобное имеет место и у нас (p = c/n), и ровно на этом мы сыграем в итоге. 2.6.3.
Случай c < 1
Положим t0 = [β ln n], где β = β(c) – константа, которую мы подберем позднее. Нам хочется доказать, что с большой вероятностью каждая из компонент случайного графа имеет размер не больше t0 . Но размер компоненты – это момент вырождения процесса Yt 312
на случайном графе. Значит, интересующее нас утверждение можно записать в следующем виде: Pn,p (∃ v1 : Yt0 > 0) → 0,
n → ∞.
Поскольку Pn,p (∃ v1 : Yt0 > 0) ≤ nPn,p (Yt0 > 0), достаточно найти такое β, при котором 1 . Pn,p (Yt0 > 0) = o n Дальнейшие выкладки будут слегка неккуратными, но при желании их можно сделать безукоризненно строгими. Мы же хотим максимально прояснить основную суть подхода. Итак, Pn,p (Yt0 > 0) = Pn,p (ξt0 ≥ t0 ) ≈ Pn,p Binom n, 1 − (1 − p)t0 ≥ t0 ≈
(с учетом асимптотики 1 − (1 − p)t0 ∼ pt0 )
≈ Pn,p (Binom (n, pt0 ) ≥ t0 ) ≈ (с учетом центральной предельной теоремы) ≈ √
Z∞
t0 −npt0 npt0 (1−pt0 )
x2 1 √ e− 2 dx. 2π
Поскольку c < 1, нижний предел интегрирования имеет порядок √ t0 . Значит, весь интеграл не превосходит величины e−δt0 . Выберем β таким, чтобы e−δt0 оказалось меньше, чем e−2 ln n = n12 , и в случае c < 1 теорема доказана. 2.6.4.
Случай c > 1
Этот случай гораздо сложнее предыдущего. Здесь ветвящийся процесс на графе нужно «запускать» не один раз, а несколько. Только так удается доказать, что почти наверняка хотя бы в одном запуске возникнет гигантская компонента. Подробности можно найти 313
в [9], мы же лишь поясним, откуда в текущей ситуации появляется константа γ из формулировки теоремы и почему она совпадает с одноименной константой из теоремы 6. Грубо говоря, идея следующая. Нам хочется доказать, что есть гигантская компонента. Тогда, как следствие, нам нужно, чтобы ветвящийся процесс на графе не вырождался даже при t ≈ γn. Иными словами, необходимо, чтобы Pn,p (Yt ≤ 0) → 0, У нас p =
c n.
t ≈ γn,
n → ∞.
Значит, при t ∼ αn выполнено 1 − (1 − p)t ∼ 1 − e−pt ∼ 1 − e−cα .
Применим центральную предельную теорему к Pn,p (Yt ≤ 0) ≈ Pn,p Binom n, 1 − e−cα ≤ αn .
Интегрирование пойдет от минус бесконечности до αn − n (1 − e−cα ) p . n (1 − e−cα ) e−cα
Если α < 1 − e−cα , то мы получим искомое стремление вероятности к нулю. Если α > 1 − e−cα , то вероятность, напротив, будет стремиться к единице. Таким образом, критическое значение α, вплоть до которого есть именно стремление к нулю, – это решение уравнения α = 1 − e−cα или, что равносильно, 1 − α = e−cα . А это и есть уравнение из теоремы 6, коль скоро λ мы заменяем на c.
3.
Модели Барабаши—Альберт
В этом разделе мы поговорим о самых современных моделях случайных графов, которые призваны описывать рост различных сетей – социальных, биологических, транспортных. Но в первую очередь речь пойдет об интернете. В 90-е годы ХХ века, когда Интернет только зарождался, исследователи уже задались вопросом, каким законам подчиняется рост интернета и какова наиболее адекватная модель для описания свойств этой сети. Одними из первых здесь были А.-Л. Барабаши и Р. Альберт. Они нашли ряд важных эмпирических закономерностей в поведении Интернета и на их основе 314
придумали модель, которую впоследствии по-разному формализовывали многие авторы. Соответственно мы построим наше изложение следующим образом. В разделе 3.1 мы расскажем о результатах Барабаши—Альберт. В разделе 3.2 мы опишем модель Б. Боллобаша и О. Риордана, которая весьма неплохо ложится на статистики Барабаши—Альберт. В разделе 3.3 мы обсудим возможные уточнения модели Боллобаша—Риордана.
3.1.
Наблюдения Барабаши—Альберт
В своих работах [14–16] Барабаши и Альберт, а также Х. Джеонг описали те статистики Интернета, которые легли в основу науки о росте этой сети – науки, имеющей глубокие приложения как в собственно интернетской проблематике, так и в многочисленных близких дисциплинах. В действительности, большинство реальных сетей (социальные, биологические, транспортные и пр.) имеют похожую «топологию». Итак, сперва договоримся о том, что мы понимаем под сетью Интернет. Это так называемый веб-граф, вершины которого суть какиелибо конкретные структурные единицы в Интернете: речь может идти о страницах, сайтах, хостах, владельцах и пр. Для определенности будем считать, что вершинами веб-графа служат именно сайты. Ребрами же мы будем соединять те вершины, между которыми имеются ссылки. При этом разумно проводить столько ребер между двумя вершинами, сколько есть ссылок между соответствующими сайтами. Более того, ребра естественно считать направленными. Таким образом, веб-граф ориентирован и он может иметь кратные ребра, петли и даже кратные петли (ссылки вполне могут идти с одной страницы данного сайта на другую его страницу). Это такой «псевдомультиорграф». Сразу понятно, что для подобного «зверя» модель Эрдеша—Реньи вряд ли подходит. Теперь мы готовы перечислить самые основные моменты исследования Барабаши—Альберт. По существу, этих моментов всего три. Во-первых, веб-граф – это весьма разреженный граф. У него на t вершинах примерно kt ребер, где k ≥ 1 – некоторая константа. Для сравнения, у полного графа на t вершинах Ct2 = Θ(t2 ) ребер. Однако – и это, во-вторых, – диаметр веб-графа исключительно скромен. В 1999 году он имел величину 5–7 (см. [16]). Это хорошо всем известное свойство любой социальной сети, которое принято в обыденной 315
речи характеризовать выражением «мир тесен». Например, говорят о том, что любые два человека в мире «знакомы через 5–6 рукопожатий». Точно так же и сайты: «кликая» по ссылкам, можно с любого сайта на любой другой перейти за 5–7 нажатий клавиши компьютерной мыши. Конечно, тут есть важная оговорка. Некоторые едва появившиеся сайты могут не быть связаны с внешним по отношению к ним миром. Несколько правильнее сказать, что в веб-графе есть гигантская компонента, и уже ее диаметр невелик. Таким образом, веб-граф очень специфичен: будучи разреженным, он, тем не менее, в известном смысле тесен. В-третьих, у веб-графа весьма характерное распределение степеней вершин. Эмпирическая вероятность того, что вершина веб-графа имеет степень d, оценивается как c/dλ , где λ ≈ 2.1, а c – нормирующий множитель, вычисляемый из условия «сумма вероятностей равна 1». Этот любопытный факт роднит Интернет с очень многими реальными сетями – биологическими, социальными, транспортными. Все они подчиняются степенному закону, только у каждой из них свой показатель λ. Ввиду перечисленных наблюдений не остается никаких сомнений в том, что модель Эрдеша—Реньи не применима для описания роста Интернета и подобных сетей. Если подбором вероятности p еще можно добиться разреженности и тесноты (хотя и не с теми параметрами), то степенной закон совсем уж не имеет отношения к схеме Бернулли, в рамках которой появляются ребра обычного случайного графа. В модели G(n, p) степень каждой вершины случайного графа биномиальна с параметрами n − 1 и p, и при тех p, которые маломальски гарантируют разреженность (т.е. при p = Θ(1/n)), указанное биномиальное распределение аппроксимируется пуассоновским, а вовсе не степенным. Барабаши и Альберт предложили очень разумный взгляд на процесс формирования Интернета. Давайте считать, сказали они, что в каждый момент времени появляется новый сайт, и этот сайт ставит фиксированное количество ссылок на своих предшественников. На кого он предпочтет сослаться? Наверное, на тех, кто и так уже популярен. Можно допустить, что вероятность, с которой новый сайт поставит ссылку на один из прежних сайтов, пропорциональна числу уже имевшихся на тот сайт ссылок. Модели случайных графов, основанные на описанной идее, называются моделями предпочтительного присоединения. В своих рабо316
тах Барабаши и Альберт никак не конкретизировали, какую именно из этих моделей они предлагают рассматривать. А эти модели исключительно разнородны по своим свойствам. Ведь можно ставить ссылки независимо друг от друга, а можно еще и зависимости между разными ссылками с одного сайта учитывать. В итоге удается доказать даже такой забавный факт. Теорема 7. Пусть f (n), n ≥ 2, — произвольная целочисленная функция, такая, что f (2) = 0, f (n) ≤ f (n + 1) ≤ f (n) + 1 для всех n ≥ 2 и f (n) → ∞ при n → ∞. Тогда существует такая модель типа Барабаши—Альберт, что в ней с вероятностью, стремящейся к единице при n → ∞, случайный граф содержит в точности f (n) треугольников. Одну из наиболее правильных спецификаций модели Барабаши— Альберт предложили в начале двухтысячных годов Б. Боллобаш и О. Риордан. В следующем разделе мы ее обсудим.
3.2.
Модель Боллобаша—Риордана
Наиболее полно эта модель описана в книге [8] и обзоре [17]. Также имеется малодоступная книга [18]. Мы представим здесь две основных и, по сути, совпадающих модификации этой модели. В одной дается динамическое, а в другой статическое описание случайности. Интуитивно более понятна динамическая модификация, с нее и начнем. 3.2.1.
Динамическая модификация
Построим последовательность (случайных) графов {Gn1 }, в которой у графа с номером n число вершин и ребер равно n. Затем сделаем из нее последовательность {Gnk }, в которой у графа с номером n число вершин равно n, а число ребер равно kn, k ∈ N. Итак, пусть G11 = ({1}, {(1, 1)}), т.е. в начальный момент времени есть одна вершина и одна петля. Пусть теперь граф Gn−1 уже по1 строен. У него вершины образуют множество {1, . . . , n − 1}, а ребер у него тоже n − 1 штука. Добавим вершину n и ребро (n, i), у которого i ∈ {1, . . . , n}. Ребро (n, n) будет появляться с вероятностью deg i 1 2n−1 ; ребро (n, i) возникнет с вероятностью 2n−1 , где deg i – степень n−1 вершины i в графе G1 . Очевидно, что распределение вероятностей 317
задано корректно, поскольку n−1 X i=1
1 2n − 2 1 deg i + = + = 1. 2n − 1 2n − 1 2n − 1 2n − 1
Случайный граф Gn1 построен, и он удовлетворяет принципу предпочтительного присоединения. Осталось перейти к Gnk . Берем Gkn 1 . Это граф с kn вершинами и kn ребрами. Делим множество его вершин на последовательные куски размера k: {1, . . . , k},
{k + 1, . . . , 2k},
...,
{k(n − 1) + 1, . . . , kn}.
Объявляем каждый кусок «вершиной», а ребра сохраняем, т.е. если были ребра внутри куска, то будут кратные петли, а были ребра между двумя различными кусками – будут кратные ребра. Внешне – вполне себе Интернет, как мы его и представляли. Вершин стало n, а ребер – по-прежнему kn. Цель реализована. 3.2.2.
Статическая модификация, или LCD-модель
Введем такой объект, который называется линейной хордовой диаграммой. Вообще-то, он возник в топологии и теории узлов (см., например, [19]), но его комбинаторика оказывается напрямую связана с формированием веб-графа. Итак, зафиксируем на оси абсцисс на плоскости 2n точек: 1, 2, 3, . . . , 2n. Разобьем эти точки на пары, и элементы каждой пары соединим дугой, лежащей в верхней полуплоскости. Полученный объект назовем линейной хордовой диаграммой (linearized chord diagram, или LCD). Дуги в нем могут пересекаться, лежать друг под дружкой, но не могут иметь общих вершин. Количество различных LCD легко считается, оно равно (2n)! . 2n n! По каждой LCD построим граф с n вершинами и n ребрами. Действуем так. Идем слева направо по оси абсцисс, пока не встретим впервые правый конец какой-либо дуги. Пусть этот конец имеет номер i1 . Объявляем набор {1, . . . , i1 } первой вершиной будущего графа. Снова идем от i1 + 1 направо до первого правого конца i2 какойлибо дуги. Обявляем второй вершиной графа набор {i1 + 1, . . . , i2 }. ln =
318
И так далее. Поскольку правых концов у дуг в данной диаграмме n штук, получаем всего n вершин. А ребра порождаем дугами. Иными словами, две вершины соединяем ребром, коль скоро между соответствующими наборами есть дуга. Ребра ориентируем справа налево. Аналогично возникают петли. Дуг n, и ребер n. Теперь считаем LCD случайной, т.е. полагаем вероятность каждой диаграммы равной 1/ln . Возникают случайные графы. Можно показать, что такие графы по своим вероятностным характеристикам практически неотличимы от графов Gn1 . Графы с n вершинами и kn ребрами получаем тем же способом, что и в предыдущем пункте. 3.2.3.
Некоторые результаты
Замечательна модель Боллобаша—Риордана не только тем, что с ее помощью наводится порядок в «каше», которую «заварили» Барабаши и Альберт, но еще и тем, что она полностью адекватна эмпирическим наблюдениям. Прежде всего справедлива Теорема 8. Для любого k ≥ 2 и любого ε > 0 ln n ln n n → 1, n → ∞. P (1 − ε) ≤ diam Gk ≤ (1 + ε) ln ln n ln ln n На первый взгляд утверждение кажется непонятным. Ну, хорошо: диаметр плотно сконцентрирован (по вероятности) около величины ln n/ ln ln n. А у нас ведь какие-то 5–7 были? Так ничего странного. Вершин в интернете образца 1999 года около 107 . Значит, 7 ln 10 ln 107 = ≈ 6. ln ln 107 ln 7 + ln ln 10 Фантастическое попадание. Отметим, что при недавней проверке с другими цифрами эмпирика снова подтвердилась. Теорема 8 доказана в работе [20] авторами модели. А в работе [21] была внесена ясность и в вопрос о распределении степеней вершин.
319
Теорема 9. Для любого k ≥ 1 и любого d ≤ n1/15 o n i = 1, . . . , n : degGnk i = d ∼ E n ∼
2k(k + 1) . (d + k + 1)(d + k + 2)(d + k + 3)
(2)
Поскольку k – константа, выражение в правой части (2) имеет вид const/d3 . Это в точности степенной закон. Правда, в формулировке теоремы написано математическое ожидание, а не вероятность, но одно из другого получается за счет мартингальных неравенств и соответствующих теорем о плотной концентрации меры около среднего (см. [21]). У теоремы 9 есть все же два неприятных момента. Первый состоит в том, что степень d в степенном законе, который в ней устанавливается, равна не 2.1, а 3. Второй – это ограничение d ≤ n1/15 , которое ставит крест на практической применимости теоремы. Даже при n ≈ 1012 , чего в природе (пока) не бывает, мы имеем лишь d ≤ 104/5 , и это нелепо. Последний недостаток недавно устранил Е. А. Гречников – исследователь-разработчик в Яндексе, который получил более точный результат практически без ограничений на d. Статья Гречникова еще не опубликована. Первым же недостатком занимались много и, в частности, предлагали различные альтернативные модели. Одну из таких моделей мы обсудим в разделе 3.3. Но прежде скажем еще несколько слов о свойствах LCD-модели. Пусть H – фиксированный граф. Обозначим через ♯(H, Gnk ) случайную величину, равную количеству подграфов графа Gnk , изоморфных графу H. Как распределена эта величина? Изучали ее математическое ожидание в разных специальных случаях. Например, в работе [17] приводится громоздкая общая формула и пара ее симпатичных следствий, которые мы выпишем и здесь. Теорема 10. Пусть k ≥ 2. Пусть также K3 – полный граф на трех вершинах. Тогда при n → ∞ E (♯ (K3 , Gnk )) = (1 + o(1)) ·
k · (k − 1) · (k + 1) · (ln n)3 . 48
320
Теорема 11. Пусть фиксированы k ≥ 2 и l ≥ 3. Пусть также Cl – цикл на l вершинах. Тогда E (♯ (Cl , Gnk )) = (1 + o(1)) · ck,l · (ln n)l при n → ∞, где ck,l – это положительная константа. Более того, при k → ∞ имеем ck,l = Θ(k l ). Студенты МФТИ А. Рябченко и Е. Самосват недавно (в несколько иной, но очень близкой модели) установили следующий общий факт. Теорема 12. Пусть задан граф H, степени вершин которого равны d1 , . . . , ds . Обозначим через ♯(di = m) число вершин в H, степень каждой из которых равна m. Тогда √ ♯(di =1) n · (ln n)♯(di =2) . E (♯ (H, Gnk )) = Θ n♯(di =0) ·
Зависимость от k занесена в константу Θ.
Надо полагать, что нечто подобное было известно и авторам статьи [17], но мы ничего похожего в литературе не встречали. А такая запись результата очень удобна. Скажем, в теореме 10 речь идет про K3 . Ясно, что для K3 выполнено ♯(di = 0) = ♯(di = 1) = 0,
♯(di = 2) = 3.
По теореме 12 E (♯ (K3 , Gnk )) = Θ((ln n)3 ), и это прекрасно согласуется теоремой 10. Аналогично можно разобраться и с циклами (теорема 11). А если взять K4 – полный граф на четырех вершинах, – то теорема 12 скажет, что средняя его встречаемость в веб-графе постоянна. Иными словами, «тетраэдров» в веб-графах почти не бывает. Отметим, что в реальном вебе случаются не только тетраэдры, но и клики куда большей мощности. Это связано с деятельностью спамеров, которые искусственно расставляют ссылки, желая повысить рейтинги сайтов, заплативших за раскрутку. Спам в модели Боллобаша—Риордана не учтен, и это тоже минус.
321
3.3.
Модель копирования
Здесь мы опишем еще одну очень интересную модель, которая также призвана объяснить феномен степенного закона в реальных сетях. Эта модель возникла практически в одно время с моделью Барабаши—Альберт. Она принадлежит Р. Кумару, П. Рагхавану, С. Раджагопалану, Д. Сивакумару, А. Томкинсу и Э. Упфалу (см. [22]). Фиксируем α ∈ (0, 1) и d ≥ 1, d ∈ N. Случайный граф будет расти, и это будет похоже на процесс из пункта 3.2.1. Однако здесь процесс будет устроен совсем по-другому. В качестве начального графа возьмем любой d-регулярный граф (граф, у которого степень каждой вершины равна d). Пусть построен граф Gt = (Vt , Et ) с номером t. Здесь Vt = {u1 , . . . , us }, где s отличается от t на число вершин начального графа, т.е. на некоторую константу, выражаемую через d. Добавим к Gt одну новую вершину us+1 и d ребер, выходящих из us+1 . Для этого сперва выберем случайную вершину p ∈ Vt (все вершины в Vt равновероятны). Одно за другим строим ребра из us+1 в Vt . На шаге с номером i, i ∈ {1, . . . , d} разыгрываем случайную величину, которая с вероятностью α принимает значение 1 («монетка падает решкой кверху») и с вероятностью 1 − α принимает значение 0 («монетка падает орлом кверху»). Если вышла единица, то выпускаем ребро из us+1 в случайную вершину из Vt (все вершины в Vt равновероятны). Если вышел ноль, то берем i-го по номеру соседа вершины p. Последнее действие всегда возможно, т.к. по построению у каждой вершины не менее d соседей. Интуиция за всем этим примерно такая. Появляется новый сайт. Проставляя очередную ссылку, его владелец с некоторой вероятностью будет ориентироваться на кого-то из своих предшественников. Скажем, сайт посвящен автомобилям. Вероятно, владелец возьмет один из уже существовавших сайтов про автомобили и скопирует оттуда ссылку (с точки зрения стороннего наблюдателя вполне случайную). Это ситуация, когда монетка выпала орлом кверху (p – это сайт, с которого копируются ссылки). Однако при простановке ссылки владелец может и никого не копировать, а случайно (по нашему мнению) цитировать кого-то из предшественников. Это случай выпадения решки. Таким образом, 1−α – это вероятность копирования или, если угодно, вероятность выбора, мотивированного тематикой сайта.
322
Основной результат из [22] – это теорема 13. Теорема 13. Пусть Nt,r – это математическое ожидание числа вершин степени r в графе Gt . Тогда 2−α Nt,r = Θ r− 1−α . t→∞ t lim
Пафос теоремы в том, что в ней мы снова приходим к степенному закону. Более того, если вероятность копирования близка к 1 (а величина α – к нулю), то показатель степени может равняться ожидаемой величине 2.1, чего до сих пор у нас не было. В целом распределение степеней вершин в модели копирования очень похоже на распределение степеней вершин в модели Боллобаша—Риордана. В остальном модели сильно разнятся. Например, в модели Боллобаша—Риордана практически отсутствуют плотные двудольные подграфы (см. теорему 12); в модели копирования таких подграфов очень много. Это особенно важно ввиду того, что спамерские структуры, о которых мы вскользь говорили в конце пункта 3.2.3, зачастую образуют именно двудольные графы с плотной перелинковкой.
323
Литература 1. Erd˝ os P., R´enyi A. On random graphs I // Publ. Math. Debrecen. 1959. V. 6. P. 290–297. 2. Erd˝ os P., R´enyi A. On the evolution of random graphs // Publ. Math. Inst. Hungar. Acad. Sci. 1960. V. 5. P. 17–61. 3. Erd˝ os P., R´enyi A. On the evolution of random graphs // Bull. Inst. Int. Statist. Tokyo. 1961. V. 38. P. 343–347. 4. Степанов В. Е. О вероятности связности случайного графа gm (t) // Теория вероятностей и ее применения. 1970. Т. 15. № 1. С. 55–67. 5. Степанов В. Е. Фазовый переход в случайных графах // Теория вероятностей и ее применения. 1970. Т. 15. № 2. С. 187–203. 6. Степанов В. Е. Структура случайных графов gn (x|h) // Теория вероятностей и ее применения. 1972. Т. 17. № 3. С. 227–242. 7. Колчин В. Ф. Случайные графы. М.: Физматлит, 2004. 8. Bollob´ as B. Random Graphs. Cambridge: Cambridge Univ. Press, 2001. 9. Алон Н., Спенсер Дж. Вероятностный метод. М: Бином. Лаборатория знаний, 2007. 10. Janson S., Luczak T., Rucinski A. Random graphs. N.Y.: Wiley, 2000. 11. Маргулис Г. А. Вероятностные характеристики графов с большой связностью // Проблемы передачи информации. 1974. Т. 10. С. 101–108. 12. Karp R. The transitive closure of a random digraph // Random structures and algorithms. 1990. V. 1. P. 73–94. 13. Карлин С. Основы теории случайных процессов. М: Мир, 1971. 14. Barab´ asi L.-A., Albert R. Emergence of scaling in random networks // Science. 1999. V. 286. P. 509–512.
324
15. Barab´ asi L.-A., Albert R., Jeong H. Scale-free characteristics of random networks: the topology of the world-wide web // Physica A. 2000. V. 281. P. 69–77. 16. Albert R., Jeong H., Barab´ asi L. A. Diameter of the world-wide web // Nature. 1999. V. 401. P. 130–131. 17. Bollob´ as B., Riordan O. Mathematical results on scale-free random graphs. Handbook of graphs and networks. Weinheim: Wiley-VCH. 2003. P. 1–34. 18. Райгородский А. М. Экстремальные задачи теории графов и анализ данных. М.–Ижевск: НИЦ «РХД», 2009. 19. Stoimenow A. Enumeration of chord diagrams and an upper bound for Vassiliev invariants // J. Knot Theory Ramifications. 1998. V. 7. N. 1. P. 93–114. 20. Bollob´ as B., Riordan O. The diameter of a scale-free random graph // Combinatorica. 2004. V. 24. N. 1. P. 5–34. 21. Bollob´ as B., Riordan O., Spencer J., Tusn´ ady G. The degree sequence of a scale-free random graph process // Random Structures Algorithms. 2001. V. 18. N. 3. P. 279–290. 22. Kumar R., Raghavan P., Rajagopalan S., Sivakumar D., Tomkins A., Upfal E. Stochastic models for the web graph // Proc. 41st Symposium on Foundations of Computer Science. 2000.
325
Задачи Задачи к главам пособия и приложениям Задача к главе 1 (сублинейный приближенный вероятностный алгоритм для матричных игр; Григориадис–Хачиян, 1995). Рассматривается симметричная антагонистическая игра двух лиц X и Y. Смешанные стратегии X и Y будем обозначать соответственно x и y . При этом xk – вероятность того, что игрок X выберет стратегию с номером k , аналогично определяется yk . Таким образом, T x, y S x n : e T x 1, x 0 , где e 1, ..., 1 .
Выигрыш игрока X:
VX x, y yT Ax ,
а выигрыш игрока Y: VY x, y yT Ax (игра антагонистическая). Каждый игрок стремится максимизировать свой выигрыш при заданном ходе оппонента. Равновесием Нэша (в смешанных стратегиях) называ ется такая пара стратегий x * , y* , что x* Arg max y*T Ax , y* Arg min yT Ax * . yS
xS
Ценой игры называют max min yT Ax min max yT Ax y*T Ax * . xS
yS
yS
xS
Поскольку по условию игра также симметричная, то A AT – матрица n n . С помощью стандартной редукции можно свести к этому случаю общий случай произвольной несимметричной матричной игры. В рассматриваемом же случае цена игры (выигрыш игроков в положении равновесия Нэша) есть 0, а множества оптимальных стратегий игроков совпадают. Требуется найти с точностью 0 положение равновесия Нэша (оптимальную стратегию), т.е. требуется найти такой вектор x S , что Ax e . Покажите, считая элементы матрицы A равномерно ограниченными, скажем, единицей, что приводимый ниже алгоритм находит с вероятностью не меньшей 1 2 (вместо 1 2 можно взять лю бое положительное число, меньшее единицы) такой x за время 2 n log 2 n , 326
т.е. в определенном смысле даже не вся матрица (из n 2 элементов) просматривается. Отметим также, что в классе детерминированных алгоритмов время работы растет с ростом n не медленнее, чем ~ n2 (эта нижняя оценка получается из информационных соображений [1, 2]). Другими словами, никакой детерминированный алгоритм не может также асимптотически быстро находить приближенно равновесие Нэша. Точнее говоря, описанный ниже вероятностный алгоритм дает почти квадратичное ускорение по сравнению с детерминированными. Алгоритм 1. Инициализация: X U 0 , p e n , t 0 . 2. Повторить: 3. Счетчик итераций: t : t 1 . 4. Датчик случайных чисел: выбираем k 1,..., n с вероятностью pk .
5. Модификация X : X k : X k 1 . 6. Модификация U : Ui : Ui aik , i 1,..., n .
7. Модификация
p:
n pi : pi exp aik 2 p j exp a jk 2 , j 1
i 1, ..., n .
8. Критерий останова: если U t e , то останавливаемся и пе чатаем x X t . Указание. Покажите, что с вероятностью не меньшей, чем 1 2 ,
алгоритм остановится через t * 4 2 ln n итераций. Для этого введите n
Pi t exp U i t 2 и t Pi t . i 1
Покажите, что n E t 1 P t t pi t pk t exp aik 2 и i , k 1
exp aik 2 1 aik 2 2 6 . Используя это и кососимметричность матрицы A , покажите, что E t 1 nE t 1 2 6 .
Следовательно,
327
E t n exp t 2 6 и E t * n5 3 . Отсюда по неравенству Маркова имеем, что ( n 8 ):
P t * n2 P t * 2n5 3 1 2 .
Тогда
P U i t * 2 2ln n, i 1, ..., n 1 2 .
Откуда уже следует, что
P x t* e 1 2 .
Приведенные выше идеи случайного квазиградиентного спуска сейчас активно используются в современных численных методах решения задач выпуклой оптимизации в пространствах огромной размерности [3]. Литература 1. Хачиян Л. Г. Избранные труды / сост. С. П. Тарасов. М.: МЦНМО, 2009. С. 38–48. 2. ftp://ftp.mccme.ru/users/shen/kolmbook.pdf 3. http://www2.isye.gatech.edu/~nemirovs/ http://www.core.ucl.ac.be/staff/biosketchNesterov.html http://elis.dvo.ru/~nurmi/ Задача к главе 1 (стохастическая марковская динамика, приводящая к равновесию Нэша–Вардропа в модели распределения потоков; Гасникова–Дорн, 2010). Свой путь на n 1 -м шаге1 игрок, сидящий на корреспонденции w , выбирает согласно смешанной стратегии (в независимости от всех остальных: с вероятностью Probwp n 1 n x p n 1 exp Gp x n T Z nw , w W ,
выбрать путь p Pw ( 0 n 1 ), а с вероятностью 1 n – действовать согласно стратегии, использованной на предыдущем n-м шаге. Здесь x p n – количество игроков, сидящих на корреспонденции w и вы1
Например, шаг с периодом в день можно проинтерпретировать как выбор утром маршрута следования (пути) из дома на работу, исходя из «опыта» вчерашнего дня. Заметим,
что информацию о Gp x n Яндекс-пробки, а множитель
водители (игроки) черпают из открытых источников типа
x n 1 p
определяется исходя из случайного опроса сосе-
дей, знакомых, коллег и т.п.
328
бравших на n -м шаге стратегию p Pw , а Z nw
Множитель
x n 1 exp G x n T .
pPw
x n 1 p
p
p
характеризует желание имитировать, а также
надежность использования этой стратегии. Именно этот множитель подмечает специфику рассматриваемой задачи (без него сходимость будет в общем случае не к равновесию Нэша–Вардропа) и отличает предложенную в задаче динамику от многих других (см. ниже краткий обзор). Параметр характеризует «консерватизм» («ленивость»), чем меньше , тем более консервативный игрок; «температура» T характеризует отношение к риску («горячность»), чем больше температура, тем более «горячий игрок», склонный к более рискованным действиям. Как показали разнообразные численные эксперименты, часто вполне разумно выбирать n 1 n . При таком выборе n наблюдается сходимость к равновесию Нэша–Вардропа при наиболее общих условиях относительно T (вне зависимости от точки старта). Строго говоря, наблюдается сходимость не к равновесию, а к некоторой его окрестности, уменьшающейся с уменьшением T . Стоит также обратить внимание на высокую эффективность предложенной процедуры «нащупывания равновесия» с точки зрения количества итераций. Иначе говоря, на предложенный итерационный процесс можно смотреть просто как на эффективный способ численного нахождения равновесия Нэша– Вардропа. В экспериментах с людьми (студентами 5-го курса ФУПМ) также наблюдалась сходимость к равновесию и колебания около него. Введение в динамику стохастичности сближает предложенный подход с поиском так называемых «стохастических равновесий в транспортных сетях» [1], с другой стороны, он принципиально отличается тем, что предполагает знание транспортных расходов по маршрутам (используется достоверная информация вчерашнего дня), на основе которых производится рандомизированный выбор. В стохастическом же равновесии водитель узнает лишь случайную оценку времени проезда по каждому из маршрутов и затем выбирает маршрут с минимальным временем. Предложенную схему можно трактовать скорее как стохастическую динамику наилучших ответов в эволюционной (популяционной) игре [2–6], при этом имеется много общего с концепциями «quantal response equilibria» [7] (используется похожая рандомизация) и «minority games» [8] (наблюдаются похожие колебания около положения равно329
весия). Близкой к предложенному итерационному процессу является концепция генетических алгоритмов [9] и эффективный приближенный вероятностный (с гиббсовским («logit») распределением вероятностей) алгоритм Григориадиса–Хачияна [10]. Исходя из результатов главы 1, предложите ситуацию, когда равновесие Нэша–Вардропа не единственно (считайте, например, что за проезд по дороге с водителей взимается некоторая сумма; см. также пример В. И. Швецова ниже). Для описанной выше динамики, исследуйте, к какому положению равновесия (в зависимости от точки старта) она будет сходиться. Более подробно о моделях распределения потоков и связанных с ними задачах можно прочитать, например, в главе 1 и [1, 11, 12]. В заключение рассмотрим два примера. Первый демонстрирует, что в результате строительства новой дороги новое равновесие Нэша– Вардропа окажется неэффективным по Парето и будет строго хуже, чем то, которое было до строительства. Тем не менее предложенная выше марковская динамика наилучших ответов (также как и эксперимент) приводит именно к такому, не оптимальному по Парето, равновесию. Пример (парадокс Брайеса, 1968). Пусть корреспонденция x14 6 (тысяч автомобилей/ч). Вес ребра (удельные затраты на проезд по этому ребру) есть время движения по ребру (в минутах), если поток через ребро есть yij (тысяч автомобилей/ч). Например, в случае 2:
y24 x124 x1324 (см. рис. 1). Естественно считать, что время движения – возрастающая функция потока.
Случай 1
Случай 2
Рис. 1
Случай 1: x124 x134 3 . Полное время в пути T 83 мин
Случай 2: x124 x1324 x134 2 . Полное время в пути T 92 мин
Оба равновесия Нэша–Вардропа (в случаях 1 и 2) являются «притягивающими» положениями равновесия описанной выше динамики (положили 1 , T 15 35 ), см. рис. 2–4 (для случая 2). 330
Рис. 2
Рис. 3
Рис. 4
331
Второй пример демонстрирует, что при весьма естественных ус ловиях вектор-функция удельных затрат пользователей на проезд G x может не быть строго монотонной (см. п. 1.1.3.1): x, y X x y : G x G y G x G y , x y 0 . Связанно это может быть, например, с тем, что (см. п. 1.1.4) G x T y , y x , где вектор y ye eE описывает загрузку ребер (дуг) графа транспорт ной сети, y e ye eE – вектор-функция затрат на проезд по ребрам графа транспортной сети, – матрица инцидентности ребер и пу тей, и разные векторы распределения потоков x могут соответствовать одному и тому же вектору y x . Пример (неединственность равновесия; В. И. Швецов, 2010). На рис. 5 показано равновесное распределение потоков для любого значения параметра x 0, 0.5 . Подробности имеются в статье [14].
Рис. 5
Литература 1.
2. 3.
Sheffi Y. Urban transportation networks: Equilibrium analysis with mathematical programming methods. N.J.: Prentice–Hall Inc., Englewood Cliffs, 1985. Foster D., Young P. Stochastic evolutionary game dynamics // Theoretical population biology. 1990. V. 38. № 2. Cressman R. Evolutionary game theory and extensive form games. Cambridge, Mass.: MIT Press, 2003.
332
4. 5. 6. 7. 8. 9. 10. 11. 12.
13.
14.
Hofbauer J., Sigmund K. Evolutionary game dynamics // Bulletin of the AMS. 2003. V. 40. № 4. P. 479–519. Васин А. А., Краснощеков П. С., Морозов В. В. Исследование операций. М.: Издательский центр «Академия», 2008. http://www.cs.cornell.edu/home/kleinber/networks-book/ McKelvey R. D., Palfrey T. R. Quantal response equilibria for extensive form games // Experimental economics. 1998. V. 1. P. 9–41. Marsili M. Toy models of markets with heterogeneous interacting agents // e-print www.unifr.ch/econophysics/, 2001. Fogel D. B. Evolutionary Computation: Towards a New Philosophy of Machine Intelligence. New York: IEEE Press, 2000. Хачиян Л. Г. Избранные труды / сост. С. П. Тарасов. М.: МЦНМО, 2009. С. 38–48. Стенбринк П. А. Оптимизация транспортных сетей. М.: Транспорт, 1981. Гасникова Е. В., Дорн Ю. В. О стохастической марковской динамике, приводящей к равновесию Нэша–Вардропа в модели распределения потоков // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). С. 55–57. Como G., Salva K., Acemoglu D., Dahleh M.A., Frazzoli E. Stability analysis of transportation networks with multiscale driver decisions // eprint arXiv:1101.2220v1, 2011. Швецов В. И. Проблемы моделирования передвижений в транспортных сетях // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). С. 163–179.
Задача (сходимость к равновесию Нэша; Малишевский– Опойцев, 1972). Рассмотрим систему обыкновенных дифференциальных уравнений (СОДУ):2 2 Такие СОДУ возникают, например, при исследовании коллективного поведения, в частности «при нащупывании равновесия Нэша». Действительно, пусть Di x1 , ..., xi , ..., xn –
функция выигрыша игрока i , если игроки придерживаются набора стратегий x x1 , ..., xi , ..., xn . Пусть «функция цели» fi x игрока i однозначным образом определяется из условия
Di x1 , ..., fi x , ..., xn max Di x1 , ..., xi , ..., xn , xiX i
где X i – множество возможных стратегий игрока i . Тогда СОДУ (D), очевидным образом, выражает стремление игроков двигаться по направлению своей цели (по мере движе-
333
xi i t fi x1 ,..., xn xi ,
i t 0 при t 0 и
0
(D)
i t dt , i 1, ..., n ;
fi , i 1, ..., n – непрерывные функции; K n (компакт) : f K K . Докажите, что приводимое ниже условие обеспечивает существование равновесия СОДУ (единственность в K ) и его асимптотическую устойчивость: n f i x x K , i 1,..., n 1. x j j 1 Указание. В кубической норме ( x max xi ) f x – сжи-
i 1,..., n
мающее отображение компакта K в себя. Устойчивость показывается с помощью второго метода Ляпунова. В качестве функции Ляпунова сле дует взять V x x x * , где x * – единственное положение равнове
сия в K . Литература 1. 2. 3.
Опойцев В. И. Равновесие и устойчивость в моделях коллективного поведения. М.: Наука, 1977. Мулен Э. Теория игр с примерами из математической экономики. М.: Мир, 1985. Малишевский А. В. Качественные модели в теории сложных систем. М.: Наука, 1998.
Задача (устойчивые системы большой размерности; В. И. Опойцев, 1985). Из курсов функционального анализа и вычислительной математики хорошо известно, что если спектральный радиус матрицы меньше единицы: A 1 , то итерационный процесс A aij i , j 1 x n 1 Ax n b (СОДУ x Ax b x , см. СОДУ (D) из предыдущей задачи с f x Ax b ) в независимости от точки старта x 0 сходится к n
ния цель меняется), т.е. определенную рациональность игроков. Отметим здесь нечувствительность результатов к тому, насколько сильно (это характеризуется функциями i t 0 , i 1,..., n ) каждый из игроков стремится к своей цели.
334
единственному решению
x* Ax* b .
уравнения
Скажем,
если
n
A max aij 1 , то и A 1 (обратное, конечно, не верно). i
j 1
Предположим, что существует такое малое 0 , что 1 n aij 1 . n i , j 1
(S)
Очевидно, что отсюда тем более не следует: A 1 . Тем не менее, введя на множестве матриц, удовлетворяющих условию (S) равномерную меру, покажите, что относительная мера тех матриц (удовлетворяющих условию (S)), для которых спектральный радиус не меньше единицы, стремится к нулю с ростом n ( – фиксировано и от n не зависит). Указание. 1. Покажите, что при доказательстве можно ограничиться матрицами с неотрицательными элементами. 2. Покажите, что, не ограничивая общности, можно также считать, что в определении множества S стоит не неравенство, а равенство. Так определенное множество матриц будем называть SE. 3. Положите, например,3 aij Exp n 1 – н.о.р. и покажите, что при n распределение элементов случайной матрицы A aij
n i , j 1
будет сходиться (уточните в каком смысле) к равномерному распределению на SE. 4. Покажите, введя обозначение Pn P A 1 P A 1 и используя неравенство Чебышева, что 4 n n n 1 Pn nP a1 j 1 4 E a1 j 1 0 . n j 1 n j 1 Литература 1. Опойцев В. И. Устойчивые системы большой размерности // Автоматика и телемеханика. 1986. № 6. С. 43–49. 2. Опойцев В. И. Нелинейная системостатика. М.: Наука, 1986.
3
Независимые, одинаково распределенные с.в. (случайные величины) по показательному
закону с параметром n 1 , т.е. P aij x exp n 1 x .
335
Задача к главам 2, 3 и приложению М. Л. Бланка. Предложите модель клеточных автоматов многополосного транспортного потока, в которой бы учитывались перестраивания АТС из полосы в полосу (например, для осуществления необходимых маневров в окрестности вершин графа транспортной сети), и которая бы описывала три фазы Кернера. Для проверки последнего можно прибегнуть к численным экспериментам с предложенной моделью. Задача к приложению А. А. Замятина и В. А. Малышева (пуассоновский процесс как процесс восстановления). В приложениях (в теории надежности, теории массового обслуживания) широко используются процессы восстановления (потоки Пальма). Основным (и наиболее удобным для анализа) представителем таких процессов является пуассоновский процесс, который можно определить следующим образом:4 k K t max k : Ti t , i 1 5 6 t где н.о.р. с.в. Ti Exp , т.е. P Ti t e , 0 . Покажите, что пуассоновский процесс может быть определен таким образом. Будет ли пуассоновский процесс марковским? Задача к приложению А. А. Замятина и В. А. Малышева (парадокс времени ожидания). Автобусы прибывают на остановку в соответствии с пуассоновским процессом с параметром 0 . Вы приходите на остановку в фиксированный момент времени (скажем, в полдень). Каково математическое ожидание времени, в течение которого Вы ждѐте автобуса? Литература 1. Секей Г. Парадоксы в теории вероятностей и математической статистике. М.–Ижевск: ИКИ, 2002. 4
K t – число отказов приборов к моменту времени t 0 (отказавший прибор сразу же
заменяется исправным). Все приборы идентичны, т.е. имеют одинаковое распред еление времени безотказной работы. Кроме того, приборы работают независимо друг от друга. 5 Параметр 0 принято называть интенсивностью пуассоновского процесса. 6
Напомним важную особенность показательного распределения Exp «отсутствие
последействия»: P Ti t Ti t P Ti . Заметим также, что общие процессы восстановления задаются аналогичной формулой с той лишь разницей, что н.о.р. Ti 0 п.н. уже не обязательно распределены по показательному закону.
336
2. 3.
Фѐллер В. Введение в теорию вероятностей и ее приложения Т. 2. М.: УРСС, 2010. Кельберт М. Я., Сухов Ю. М. Вероятность и статистика в примерах и задачах. Т. 2. Марковские процессы как отправная точка теории случайных процессов и их приложения. М.: МЦНМО, 2010.
Задача к приложению А. А. Замятина и В. А. Малышева (замкнутая сеть, теорема Гордона–Ньюэлла, 1967; Л. Г. Афанасьева, 2007). Рассматривается транспортная сеть, в которой между N станциями курсируют M такси. Клиенты пребывают в i-й узел в соответствии с пуассоновским потоком с параметром i 0 ( i 1, ..., N ). Если в момент прибытия в i-й узел там есть такси, клиент забирает его и с вероятностью pij 0 направляется в j-й узел, по прибытии в который покидает сеть. Такси остается ждать в узле прибытия нового клиента. Времена перемещений из узла в узел – независимые случайные величины, имеющие показательное распределение с параметром ij 0 для пары узлов i, j . Если в момент прихода клиента в узел там нет такси, клиент сразу покидает узел. Считая pij N 1 , i , ij , покажите, что вероятность того, что клиент, поступившей в узел (в установившемся (стационарном) режиме работы сети), получит отказ, равна M Ck M k M CNk 1 k M k pотказа N , M N 2 k , N . k 0 M k ! k 0 M k ! Методом перевала покажите справедливость следующей асимптотики при N : 2r 1 pотказа N , rN 1 . 2 N r 1 r 1 4 r 1. 2. 3.
Литература Афанасьева Л. Г. Очерки исследования операций. М.: Изд-во механико-математического факультета МГУ, 2007. Федорюк М. В. Метод перевала. М.: УРСС, 2010. Афанасьева Л. Г., Булинская Е. В. Математические модели транспортных систем, основанные на теории очередей // Труды МФТИ (специальный выпуск, посвященный математическому моделированию транспортных потоков / под ред. акад. В. В. Козлова). 2010. Т. 2. № 4(8). С. 6–21.
337
Задача к приложению А. М. Райгородского (обобщенная схема размещений; В. Ф. Колчин, 1984). а) Пусть для неотрицательных целочисленных с.в. 1 , …, N существуют независимые одинаково распределенные с.в. 1 , …, N , такие, что P 1 k1 , ..., N kN P 1 k1 , ..., N kN 1 ... N n .
(*)
Введем независимые одинаково распределенные с.в. 1 r , …, N r , где r – целое неотрицательное число и
P 1 k P 1 k 1 r , k 0, 1, ...
Пусть
r
pr P 1 r и SN 1 ... N , S N r 1 r ... N r . Пусть
r n, N – число тех с.в. 1 , …, N , которые приняли значение r . Покажите, что с.в. типа r n, N можно изучать с помощью обобщенной схемы размещений: для любого k 0, 1, ..., N : P r n, N k C p 1 pr k n
k r
N k
P S N k n kr r
P SN n
.
Напомним, что в классической схеме размещений n различных частиц по N различным ячейкам было доказано, что распределение заполнений ячеек 1 , …, N имеет вид P 1 k1 , ..., n kn
где
k1 , …, k n
–
неотрицательные
n! , k1 ! ... k N ! N n
целые
числа,
такие,
что
k1 .... kn n . Если положить 1 , …, N Po – н.о.р. ( 0 произвольно), то получим (*). б)* Дан случайный граф 7 (модель Эрдѐша–Реньи) G n, p . Пусть 7
Даны n вершин, любые две вершины соединены ребром с вероятностью p независимо
от того, какие еще пары вершин соединены ребрами. Таким образом, q 1 p есть вероятность отказа ребра. По сути, в задаче приведен некий порог q для q (по аналогии со статистической механикой иногда говорят, что этот порог характеризует «фазовый переход случайного графа»). Если в полном графе на n вершинах ребра отказывают с вероятностью, «большей» q , то транспортная система почти наверное разрушится, если же ребра отказывают с вероятностью, «меньшей» q , то транспортная система (несмотря на то, что может потерять много ребер) почти наверное сохранит свое основное свойство – возможность добраться по ребрам из любой вершины в любую другую.
338
p c ln n n . Покажите, что при c 1 граф G n, p почти наверное связен8, а при c 1 – почти наверное не связен.
в)** Пусть p
2ln n
n , причем длина (вес) rij каждого появив-
шегося ребра есть независимая от того, какие еще пары вершин соединены ребрами и какие длины у этих ребер – случайная величина, имеющая равномерное распределение на отрезке 0, 2r . Покажите, что тогда почти наверное граф G n, p имеет гамильтонов цикл, причѐм длина почти всех гамильтоновых циклов стабилизируется (имеет место плотная концентрация) около nr . Литература 1. Перепелица В. А. Асимптотический подход к решению некоторых экстремальных задач на графах // Проблемы кибернетики. 1973. Т. 26. С. 291–314. 2. Колчин В. Ф. Случайные графы. М.: Физматлит, 2004. 3. Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином, 2007. Задача к приложениям А. В. Колесникова, Е. В. Гасниковой (принцип концентрации площади сферы; А. Пуанкаре, 1911). Покажите, что если в многомерном шаре задано равномерное распределение вероятностей и согласно этому распределению вероятностей сгенерировано два случайных вектора, то с вероятностью, близкой к единице, концы этих векторов будут лежать почти на границе шара и эти два случайных вектора будут почти ортогональны. Указание. Нетривиально второе утверждение (про ортогональность). Для того чтобы его установить, покажите, что доля от площади всей сферы S rn (радиуса r ) в n ( n 3 ), которую занимает площадь сегмента, проектирующегося в отрезок a, b , скажем, оси x1 , равна
1 x r b
2
P a, b
a r
1 x r
r
2
n 3 2
n 3 2
dx
. dx
Фиксируя r 1 и устремляя n к бесконечности, получите Из любой вершины можно добраться в любую другую по ребрам. Словосочетание «почти наверное» означает, что вероятностная мера тех графов, для которых это не так, стремится к нулю с ростом n .
8
339
P , ~ 1 2 exp 2 n 2 .
В статистической физике n
2 En n. m i 1 Поэтому если известно, что вектор скоростей молекул газа равномерно распределен по поверхности постоянной энергии, 9 то для того чтобы найти (следуя Максвеллу) распределение компонент вектора скорости, скажем, V1 , нужно осуществить термодинамический скейлинг (термо-
V
i
2
динамический предельный переход) n , r n1 2 : b x2 b a exp 2 2 dx x2 1 P a, b exp 2 dx . 2 x2 2 2 a exp 2 2 dx Таким образом, получаем нормальный закон распределения Максвелла в статистической физике. Литература 1. Зорич А. В. Математический анализ задач естествознания. М.: МЦНМО, 2008. С. 48–56. Задача к приложениям Е. В. Гасниковой, А. В. Колесникова, А. М. Райгородского (изопериметрическое неравенство и принцип концентрации меры; П. Леви, 1919). Число f называют медианой функции f , если x S1n : f x f 1 2 и x S1n : f x f 1 2 , где dx – равномерное мера на единичной сфере S1n в n . Пусть A – измеримое (борелевское) множество на сфере S1n . Через A будем обозначать -окрестность множества A на сфере S1n . Предположим теперь, что в некотором царстве, расположенном на S13 , царь предлоРавномерное распределение на поверхности постоянной энергии возникло из-за того, что инвариантной (и предельной по эргодической гипотезе) мерой для гамильтоновой системы будет как раз равномерная мера Лиувилля (фазовый объем сохраняется). Поскольку выполняется закон сохранения энергии, то система «живет» на поверхности постоянной энергии. Следовательно, носитель инвариантной меры сосредоточен именно на этой поверхности.
9
340
жил царице Дидоне построить «огород с заданной длиной забора». Царица хочет, чтобы еѐ огород при заданном периметре имел наибольшую площадь. Таким образом, царице надо решить изопериметрическую задачу (такие задачи обычно рассматриваются в курсах вариационного исчисления). Решение этой задачи хорошо известно – «круглый огород». Для нас же полезно рассмотрение двойственной задачи, имеющей такое же решение: при заданной площади огорода спроектировать его так, чтобы он имел наименьшую длину забора, его ограждающего. Используя решение обобщения двойственной задачи на случай n 3 , покажите, что если A 1 2 , то
A 1 2 exp 2 n 2 .
Пусть теперь на S1n задана функция с модулем непрерывности f sup f x f y : x, y , x, y S1n .
Тогда
x S1n : f x f f 2 exp 2 n 2 .
Можно показать, что при весьма естественных условиях медиана асимптотически близка к среднему значению (математическому ожиданию). Аналогичное неравенство можно получить (М. Талагран, 1996), например, для модели случайных графов (Эрдѐша–Реньи). И исследовать плотную концентрацию около среднего значения различных функций на случайных графах: число независимости, хроматическое число и т.п. Литература 1. Ledoux M. Concentration of measure phenomenon. Providence, RI, Amer. Math. Soc., 2001 (Math. Surveys Monogr. V. 89). 2. Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином, 2007. Задача к приложениям Е. В. Гасниковой, А. В. Колесникова, А. М. Райгородского (изопериметрическое неравенство Талаграна и его приложения; М. Талагран, 1996). а)* Пусть заданы множества i , i 1, ..., n элементарных исходов. На этих множествах заданы вероятностные меры Pi , i 1, ..., n . Положим n
n
i 1
i 1
i , P Pi .
Введѐм взвешенную метрику Хэмминга:
341
d x , y
xi yi
n
i
i 1
2 i
и определим d x, A min d x, y , x, A sup d x , A . Пусть
yA
n
A . Определим t-окрестность ( t 0 ) множества A по формуле At x : x, A t . Покажите, что тогда справедливо следующее неравенство: P A 1 P At exp t 2 4 . б)** Пусть в сельском районе, имеющем форму квадрата со стороной 1, находится n домов ( n 1 ), размерами которых можно пренебречь по сравнению с линейным размером района. Будем считать, что при строительстве домов застройщик случайно (согласно равномерному распределению R 0,1 ) и независимо выбирал их местоположения. Почтальону необходимо обойти все n домов ровно по одному разу (от любого дома почтальон может направиться к любому другому по прямой). Обозначим через TSP длину наикратчайшего из таких путей (кратчайший гамильтонов путь). Используя п. а), покажите, что найдутся такие постоянные c 0 и 0 , не зависящие от n , что 2
P TSP E TSP t exp t 2 4c , где E TSP n .
в)*** Пусть в условиях п. б) требуется построить систему дорог минимальной суммарной длины SteinerTree , по которой можно было бы добраться из любого дома в любой другой (дерево Штейнера с минимальной суммарной длиной ребер). Получите неравенство о плотной концентрации с.в. SteinerTree в окрестности своего математического ожидания, аналогичное неравенству п. б). Как себя асимптотически ведѐт E SteinerTree при n ? Литература 1. Ledoux M. Concentration of measure phenomenon. Providence, RI, Amer. Math. Soc., 2001 (Math. Surveys Monogr. V. 89). 2. Алон Н., Спенсер Дж. Вероятностный метод. М.: Бином, 2007. 3. Dubhashi D. P., Panconesi A. Concentration of measure for the analysis of randomized algorithms. Cambridge University Press, 2009. 4. Gromov M. Metric Structures for Riemannian and Non-Riemannian Spaces. With Appendices by M. Katz, P. Pansu, and S. Semmes. Modern Birkhäuser Classics, 2001; Chapter 3 12 . 342
Задача Штейнера и задачи на графах транспортных сетей Е. Г. Молчанов (при участии Р. А. Гимадеева, Ю. В. Дорна, С. П. Тарасова, П. А. Шишкина)
Приведенные задачи разделяются на два типа: задачи, связанные с задачей Штейнера на плоскости, и задачи на транспортных графах. Последние обычно являются (возможно, нетривиальными) случаями, разновидностями и усложнениями нескольких стандартных задач: задачи поиска минимального остовного дерева, кратчайшего пути, максимального потока, а также транспортной задачи. Этот задачный раздел будет состоять из нескольких частей, во главе каждой из которых будет одна из таких «стандартных» задач, далее – задачи, которые связаны с первоначальной «стандартной» задачей. Если в задачах требуется оценить время работы программы, будем считать, что она выполняется на компьютере, совершающем порядка 1010 операций с плавающей точкой в секунду. Остальные параметры этого компьютера (например, оперативную память) будем считать неограниченными. Часть 1. Минимальная сумма расстояний Задача 1. Согласно плану в районе строятся несколько домов, в каждом из которых будет проживать определенное количество человек. Нужно построить парковку, чтобы сумма расстояний, пройденных каждым человеком до парковки, была минимальной. а) Где нужно построить парковку, если есть три одинаковых дома? б) Докажите, что если все дома не лежат на одной прямой, то у задачи ровно одно решение. Задача 2. Для решения задачи 1 о минимальной сумме расстояний можно воспользоваться следующей гамильтоновой системой: на плоский фанерный лист кладется карта района и в центрах домов просверливаются маленькие дырочки. Через дырочки продеты нерастяжимые нити, к которым прикреплены грузики с весом, пропорциональным количеству жителей в соответствующем доме. Начала всех нитей завязаны в один узел. Будем считать узел достаточно большим: он не будет пролезать в дырочки. 343
а) Докажите, что (при условии, что все точки не лежат на одной прямой), если «отпустить» все грузики, узел застрянет в точке с минимальной суммой. б) Может ли узел застрять в вершине? в) На основе описанной гамильтоновой системы предложите итерационный процесс решения задачи о минимальной сумме расстояний и оцените его скорость сходимости. Задача 3. Предположим теперь в задаче 1, что от домов до парковки можно строить только «вертикальные» и «горизонтальные» дорожки (т.е. дорожки направления юг–север и запад–восток). а) Где теперь нужно строить парковку, чтобы сумма расстояний до домов по дорожкам была минимальная. б) Может ли у пункта а) быть не единственное решение? Как в общем случае выглядит область с минимальной суммой расстояний? Указание. Сведите эту задачу к задаче о поиске минимального расстояния в одномерном случае (все дома лежат на одной прямой) Часть 2. Минимальное остовное дерево Задача 4. N точек-пунктов (вершин графа) соединены между собой дорогами. Каждая дорога соединяет две точки и имеет некоторую длину. Известно, что из любой такой точки до любой другой можно добраться по дорогам. Нужно реконструировать некоторое количество дорог, так чтобы от любой точки можно было добраться до любой другой только по реконструированным дорогам, и чтобы сумма длин дорог была минимальной. Иными словами, в графе со взвешенными ребрами нужно найти минимальное остовное дерево. а) Покажите, что при решении этой задачи можно считать, что произвольные две точки соединены дорогой (т.е. граф полный). б) Какую сложность имеют стандартные алгоритмы Прима и Краскала; как эта сложность зависит от способов хранения информации, нужной для алгоритмов (например, матрицы расстояний). в) Оцените время работы стандартных алгоритмов, если количество точек-вершин – 1000. Задача 5. а) В задаче 4 проектировщик решил искать нужные дороги среди гамильтоновых циклов, т.е. среди маршрутов, выходящих из какой-то 344
вершины и последовательно проходящих через все остальные вершины. Покажите, что найденное проектировщиком решение может в любое количество раз по длине превосходить минимальное (уточнить, что вкладывается в слово «минимальное»). б) Оцените время поиска гамильтонова цикла. Примите количество вершин равным 1000 (100, 10). Сравните его с временем поиска минимального остовного дерева. Задача 6. Дорожная сеть города была построена следующим образом: каждый год строился новый микрорайон в последовательности, предусмотренной генпланом, и он соединялся дорогой с тем микрорайоном, до которого расстояние было наименьшим. После постройки города микрорайоны были связаны между собой системой дорог, образующей дерево. Будем считать, что расстояния между каждыми двумя микрорайонами известно до постройки и никаких географических ограничений на эти расстояния нет. Сумма длин всех построенных дорог зависит от того, в каком порядке были построены микрорайоны. Докажите, что отношение максимально возможной суммы к минимально возможной может быть сколь угодно большим числом. Задача 7. В некоторых местах построены несколько микрорайонов и несколько станций метро. Будем считать, что от любой станции можно на метро добраться до любой другой. Длины возможных дорог от микрорайонов до станций метро и между микрорайонами известны. Нужно построить минимальную по суммарной длине систему дорог так, чтобы из любого города можно было добраться до любого другого, возможно, воспользовавшись метро. Как свести эту задачу к задаче 4 о минимальном остовном дереве? Указание. Будем считать, что от любой станции метро до любой другой можно добраться за нулевое время. Тогда, считая все станции метро одной вершиной, определите расстояния от метро до микрорайонов нужным образом. Часть 3. Задача Штейнера Задача 8. Несколько городов на плоскости нужно соединить дорогами так, чтобы из любого города можно было бы доехать до любого другого по построенным дорогам, и суммарная длина построенных до345
рог была бы минимальна. Расстояния считаются по обычной, Евклидовой метрике, при построении дорог можно строить дополнительные узлы – пересечения нескольких дорог. а) Решите задачу для четырѐх городов, расположенных в вершине квадрата. Объясните, почему найденное решение не обладает всеми теми симметриями, которыми обладает исходная постановка задачи. б) Докажите, что в оптимальной системе дорог в любом «вспомогательном» узле должны сходиться ровно три дороги под углами в 120° друг к другу. в) Решите задачу для десяти городов, расположенных в вершинах правильного 10-угольника. Задача 9. Сетью Штейнера называется систем прямых дорог, такая, что любая дорога соединяет напрямую какие-то две точки, где точками могут быть города, а также вспомогательные узлы, обладающая следующими свойствами: 1. В каждом вспомогательном узле сходятся ровно три дороги под углами в 120° друг к другу. 2. Из каждого города должно выходить не более трех дорог; если из города выходят две дороги – они должны образовывать угол не менее 120°, если три – все образованные ими углы должны быть по 120°. а) Обязана ли такая сеть обладать минимальной суммой расстояний среди всех возможных сетей дорог (таких, что из любого города можно доехать до любого другого)? б) Покажите, что сеть с минимальной суммой расстояний нужно искать среди возможных сетей Штейнера. Задача 10. Проектировщик соединил некоторые пары городов на плоскости прямыми дорогами так, чтобы из любого города в любой другой можно было бы доехать по построенным дорогам, и суммарная длина построенных дорог при этом была бы минимальной. Будем считать, что все дороги пересекаются вне города на разных уровнях – съехать с одной дороги на другую можно только в городах. а) Докажите, что в оптимальном решении задачи 9 не будет дорог, пересекающихся вне городов. б) Докажите, что решение задачи 9 по суммарной длине построенных дорог не более чем в два раза превосходит решение задачи 8. Замечание. Отношение длины минимального остовного дерева (веса ребер – расстояния на плоскости) к длине минимальной сети 346
Штейнера называется числом Джильберта–Поллака. В п. б) предстоит доказать, что это отношение не превосходит числа 2. Это грубая оценка сверху, точная оценка – 3 2 .10 в) Приведите пример, когда оценка 3 2 достигается. Замечание. Построение минимальной сети Штейнера является NP-трудной задачей, поэтому нахождение минимального остовного дерева среди графа городов (вершины – города, расстояния между парами вершин считаются по обычной, Евклидовой метрике) является полиномиальным приближенным решением задачи Штейнера с коэффициентом приближения 3 2 (найденная длина дорог минимального остовного дерева не более чем в
3 2 превосходит оптимальное решение).
Часть 4. Кратчайший путь Задача 11. Пусть есть некоторая система дорог, каждая из которых соединяет 2 пункта-вершины, причем для каждой дороги известно время движения по этой дороге. Требуется доехать из пункта А в пункт Б за минимальное время. Иными словами в графе со взвешенными ребрами требуется найти кратчайший путь из одной вершины в другую. а) Оцените сложность алгоритма Дейкстры и время его работы, если количество вершин-пунктов равно 1000. б) Будем считать, что время движения из одного пункта до другого зависит от направления (т.е. граф – ориентированный). Как изменится время решения пункта а)? Замечание. Разумеется, при поиске кратчайшего расстояния на реальной сети дорог всегда рассматривают ориентированные графы. В последующих задачах этого параграфа, если неуказанно обратное, графы будут ориентированными. Задача 12. В задаче 11 будем считать, что время проезда по определенному участку пути зависит от того, в какое время вы въехали на этот участок. Для упрощения время проезда каждого участка мы будем считать целым неотрицательным числом Tij t0 : мы движемся от i-го перекрестка к j-му, начиная движение в момент времени t0 (очевидно, t0 также целое неотрицательное). Хотя и принято считать, что «точность» этой оценки доказана около 20 лет назад, в известном нам оригинальном доказательстве имеются «лакуны». 10
347
Как свести эту задачу к задаче 11 о кратчайшем пути в графе, веса ребер которого не изменяются со временем? Указание. Постройте новый граф, сопоставив одной вершине исходного графа несколько вершин, каждая из которых отвечает своему времени. Задача 13. M автомобилям, первоначально находящимся в какихто пунктах (вершинах графа), необходимо встретиться в одном месте (может быть, на дороге, соединяющей две вершины) и передать друг другу важную информацию. К сожалению, машинам негде припарковаться, поэтому останавливаться не разрешено, но разрешено поворачивать или разворачиваться в любом направлении в каждой вершине. Будем считать, что все машины движутся с одинаковыми скоростями, а все дороги, соединяющие некоторые пары перекрестков, требуют единицу времени для их прохождения. Найдите минимальное время, необходимое для встречи. Задача 14. Из пункта А в пункт Б (вершин транспортного графа) нужно добраться с помощью общественного транспорта, возможно, с пересадками. Каждый вид общественного транспорта ходит от какогото одного пункта-вершины до какого-то другого строго по расписанию; расписание представляет собой таблицу времен отправлений из начального пункта и соответствующих им времен прибытий в конечный. Пересадка на другой вид транспорта в промежуточном пункте возможна, если время отправления превосходит время прибытия в этот пункт на предыдущем виде транспорта. Будем считать, что ровно в 12:00 мы оказались в пункте А. Требуется найти минимальное время, за которое мы сможем добраться до пункта Б, пользуясь общественным транспортом. Приведите алгоритм решений этой задачи (например, метод ветвей и границ) и оцените сложность его работы. Задача 15. В задаче 11 будем считать, что на некоторых вершинах могут быть установлены ограничения, запрещающие поворот с одной дороги на другую в этой вершине. Как свести эту задачу к задаче 11 о минимальном графе, в котором не существует запрещенных поворотов. Указание. Как и в задаче 12, нужно превратить одну исходную вершину в несколько. Замечание. См. ниже задачу «Преобразования запрещенных маневров», являющуюся обобщением этой задачи. 348
Задача 16. Пусть в условиях задачи 11 кратчайший путь ровно один. Требуется найти путь, который будет являться вторым по величине длины (времени прохождения). Задача 17. В городе были построены дороги, соединяющие некоторые перекрестки (вершины графа транспортной сети). Длина каждой дороги известна. Строителям для отчета требуется найти кратчайшие пути между каждой парой перекрестков. а) Оцените сложность алгоритма и время работы соответствующей программы (1000 перекрестков), если разрешается пользоваться только алгоритмом Дейкстры поиска кратчайшего расстояния (правда, много раз). б) Предложите более быстрый алгоритм (например, алгоритм Флойда–Уоршола) и также оцените его время работы при тех же условиях. в) В каком смысле поиск кратчайших путей (алгоритмом Флойда) эквивалентен вычислению в идемпотентном полуполе (см. п. 2.1.3 главы 2) некоторой степени (укажите какой степени и предложите эффективный способ возведения в эту степень) матрицы, заполненной длинами всевозможных ребер–дорог? Как действовать, если какие-то вершины не соединены ребром? Задача 18. Сопоставим каждому перекрестку (вершине графа транспортной сети) некоторое число – потенциал Pi и определим новое расстояние (время прохождения) между перекрестками i и j : Newij Oldij Pj Pi , где Oldij – «старое» расстояние между вершинами i и j . а) Докажите, что кратчайший путь в графе с «новыми» расстояниями совпадает с кратчайшим путем в графе со «старыми» расстояниями. б) Какие потенциалы нужно расставить в вершины, чтобы алгоритм Дейкстры нашел нужный кратчайший путь, не добавляя в множество рассмотренных вершин «лишние» вершины, т.е. не лежащие на кратчайшем пути? Задача 19. В городе были выделены несколько перекрестков (вершин графа транспортной сети) и были подсчитаны все расстояния от выделенных перекрестков до всех остальных. а) Как, используя эту информацию, оценить снизу кратчайшее расстояние между любыми двумя перекрестками (вершинами)? 349
б) Какие перекрестки (вершины) мы должны выделить (их количество заранее оговорено), чтобы оценка из п. а) была более точной? Часть 5. Максимальный поток Задача 20 (О максимальном потоке). Будем считать, что из пункта А в пункта Б едет (возможно, через другие пункты) непрерывный поток автомобилей величиной X автомобилей в единицу времени. Также будем считать, что у каждой дороги, соединяющей два пункта, пропускная способность ограничена числом cij машин в единицу времени. Необходимо найти, какой максимальный поток можно запустить из пункта А в пункт Б с учетом пропускных способностей дорог. а) Запишите эту задачу, как задачу линейного программирования, напишите двойственную к ней задачу. Указание. Считайте граф ориентированным. Используйте матрицу инциденций графа. б) Пусть cij – неотрицательные целые числа. Покажите, что в оптимальном решении задачи поток, проходящий через каждую дорогу, будет также целым. Указание. Используйте вид матрицы инциденций графа (в каждом столбце только два числа не равны нулю; эти числа: 1 и минус 1). в) Как при доказательстве целочисленности решения (см. пункт б)) можно использовать теорему Гофмана–Краскала [6] о том, что полиэдр, задаваемый ограничениями вида Ax b , x 0 с абсолютно унимоду лярной матрицей A и произвольным вектором b (таким, что система Ax b , x 0 совместна), имеет все вершины с целочисленными компонентами? Замечание. Отметим, что по теореме Пуанкаре [5], матрица инциденций произвольного ориентированного графа абсолютно унимодулярна, т.е. определитель любой еѐ квадратной подматрицы равняется одному из трех чисел: минус 1, 0, 1. г) Оцените сложность алгоритма Форда–Фалкерсона ( cij – неотрицательные целые числа) и время работы соответствующей программы для поиска максимального потока (количество пунктов – 1000). д) Сойдется ли за конечное время к оптимальному решению алгоритм Форда–Фалкерсона, если cij – неотрицательные вещественные числа? е) Модифицируйте алгоритм Форда–Фалкерсона для решения задачи 350
максимального потока при неотрицательных вещественных cij (например, алгоритмы Эдмонса–Карпа и Диница), оцените их сложность и время работы (количество вершин – 1000). ж) Оцените пространственную и временную сложность алгоритма Карзанова нахождения максимального потока. 11 В чем заключаются преимущества алгоритма Карзанова, например, над алгоритмом Форда– Фалкерсона? Задача 21. В контексте предыдущей задачи будем считать, что суммарный поток машин через вершину также ограничен. Как эту задачу свести к задаче 20 поиска максимального потока? Задача 22. Во вражеской стране некоторые города соединены прямыми дорогами. Партизаны хотят сорвать перевозку оружия от города А до города Б: для этого им нужно взорвать минимальное количество дорог так, чтобы от города А стало бы нельзя доехать до города Б. а) Предложите алгоритм нахождения дорог, которые предполагается взорвать (минимальный разрез) и оцените его время работы (количество вершин – 1000). б) Докажите, что количество взорванных дорог равняется максимальному потоку из вершины А в вершину Б (веса всех ребер – 1). Задача 23. Чиновник хочет проинспектировать все дороги города. Для этого он составил маршрут, проходящий по каждой дороге хотя бы один раз. Будем считать, что чиновнику нужна единица времени, чтобы проинспектировать одну дорогу (проезжая дорогу несколько раз, он еѐ соответствующее число раз и инспектирует). Необходимо найти минимальное время, нужное чиновнику для инспекции всех дорог (как минимум по разу). Как свести эту задачу к задаче 20 о максимальном потоке? Указание. Когда в графе нельзя найти Эйлеров цикл? Какие ребра нужно сделать двойными, чтобы Эйлеров цикл нашелся? Задача 24. Некоторые объекты (подмножество вершин) в городе назовем стратегически-важными. Найдите минимальное по суммарной длине подмножество дорог, таких, что из каждого стратегическиОписание этого алгоритма имеется, например, в лекции М. Г. Фуругяна, прочитанной студентам второго курса ФУПМ МФТИ весной 2009 г., http://www.intuit.ru/department/algorithms/algomodex/2/.
11
351
важного объекта до каждого стратегически важного можно добраться по дорогам из выбранного множества. а) Частным случаем каких вышеупомянутых задач является данная задача? Что известно про сложность решения частных случаев? б) Докажите NP-полноту этой задачи путем сведения к ней задачи 3-SAT о выполнимости булевых формул в 3-конъюнктивной нормальной форме. Замечание. Условие задачи 3-SAT см. в книге [16]. Задача 25 (Транспортная задача). Имеется m производителей и n потребителей некоторого товара, расположенных в узлах транспортной сети. Пусть xij 0 обозначает количество продукта, перевозимого из i-го узла в j-й, cij 0 – стоимость перевозки, ai 0 – объѐм производства в i-м узле, b j 0 – суммарную потребность – в j-м (при этом m
n
a b i 1
i
j 1
j
). Поставим задачу о составлении плана перевозок миними-
зирующего общую стоимость перевозок от производителей к потребителям: m, n
i 1. j 1
cij xij min ,
n
x j 1
ij
ai ,
m
x i 1
ij
bj .
а) Напишите двойственную задачу к вышеприведенной задаче. б) Дополнительно введя сток и исток и пользуясь матрицей инциденций, запишите задачу нахождения максимального потока минимальной стоимости и двойственную к ней. в) Рассматривая эту задачу как задачу линейного программирования, получите оценку для времени работы известных вам алгоритмов в наихудшем случае и в среднем. Примите m n 500 . Задача 26. Рассматривается та же самая транспортная задача с целыми неотрицательными параметрами ai , i 1, , n ; b j , j 1, , m . а) Покажите, что решения xij задачи в классе неотрицательных действительных чисел будут целыми. Указание. Запишите задачу нахождения максимального потока минимальной стоимости (см. задачу 25 б)), затем воспользуйтесь теоремой Гофмана–Краскала (см. задачу 20 в)). б) Как нужно модифицировать алгоритм Форда–Фалкерсона нахож352
дения максимального потока для решения транспортной задачи? Оцените время работы получившегося алгоритма при m n 500 . в) Сойдется ли за конечное время модифицированный алгоритм из пункта а), если параметры задачи могут быть не целыми? Замечание. Вообще говоря, нахождение целочисленных решений, как правило, значительно усложняет алгоритм, иногда делая задачу, решаемую за полиномиальное время, NP-трудной (например, в задаче размещения производства, см. [15]). Однако приведенная задача как раз является исключением из этого правила. Задача 27. Пусть есть граф со взвешенными ребрами, причем веса ребер могут быть отрицательными числами. а) Как в данном графе найти цикл, сумма длин ребер которого отрицательна? б) Как нахождение таких циклов использовать при решении транспортной задачи 24? в) Оцените время работы полученной программы при m n 500 . Часть 6. Построение оптимальной транспортной сети Задача 28 (П. П. Бобрик, 2000). Распределение мест проживания населения по городу, имеющему форму квадрата со стороной A км и не имеющего дорог, равномерное. Условное распределение мест работы жителей (при условии, что зафиксировано место жительства) также равномерное (и, как следствие, не зависит от места жительства). Руководство города решило построить сеть дорог в виде квадратной решѐтки со стороной квадратной ячейки, равной a A n . Известно, что затратами на строительство сети дорог можно пренебречь по сравнению с последующими суммарными затратами на еѐ поддержание. Пусть CL – стоимость поддержания 1 км дороги (в одну сторону) в течение 1 года, CT – стоимость 1 часа, потраченного одним человеком в дороге. Число жителей в городе N . Каждый человек Q 300 раз в год направляется из дома на работу и обратно с работы домой. Скорость движения человека не по дороге v км/ч, скорость движения человека по дороге V км/ч ( V v ), время, потраченное на прохождение одного перекрѐстка, есть t 0 мин. а) Постройте целевую функцию, отвечающую за эффективность построенной транспортной сети. б) Какое значение n «оптимально» выбрать руководству города? 353
Задача 29. В условиях предыдущей задачи было решено построить радиально-кольцевую систему дорог, состоящую из k колец и m радиусов. а) Постройте целевую функцию, отвечающую за эффективность построенной транспортной сети. б) При каких условиях эта сеть окажется эффективней оптимальной квадратной сети из предыдущей задачи? Задача 30. В условиях задачи 28 был предложен альтернативный план транспортной сети – регулярная сеть дорог, с элементарной «ячейкой» в виде правильного (равностороннего) треугольника со стороной b (из расчета, что длина сети совпадает с «квадратной»). При этом оказалось, что время, потраченное на прохождение перекрестка в вершине графа транспортной сети, t mi , пропорционально степени mi этой вершины. Определить, при каком значении эффективность сетей совпадает (если такое существует). Задача 31 (А. П. Буслаев, 2001). В литературе имеется довольно большое количество различных характеристик графов транспортных сетей. Интересной задачей является исследование этих макрохарактеристик на различных типах случайных графов. Например, во второй части монографии [23] вводятся такие показатели «хорошести» графа транспортной сети (отметим, что терминология пока не устоялась, поэтому в других местах аналогичные термины могут иметь иное содержание): N E pG – надежность, rG p N 1 где N – число вершин в графе G , G – число связных компонент в графе G , полученном из исходного графа G путем случайного и незаp
висимого разыгрывания его ребер (с вероятностью p 0 ребро оставляют и с вероятностью 1 p ребро стирают), E pG – математическое ожидание с.в. G ; sG p
E pG 1
– устойчивость, N 1 где G – размер (число вершин) максимальной связной компоненты в графе G ; p
354
rtG p
1 E p ijG – доступность, N 1 N i , j i
где ijG – длина кратчайшего пути в графе G p , ведущего из вершины i в вершину j (доопределим ij i (i – мнимая единица), если из вершины i нельзя добраться по графу G p в вершину j ). а) Исследуйте качественно зависимость приведенных показателей от p для графов транспортной сети со структурой задачи 28 и 30 (считайте, что N 1 ). б) Сравните эффективность транспортных сетей задач 28 и 30 с помощью приведенных показателей. в) (гигантская компонента; см. приложение А. М. Райгородского) Покажите, что если взять в качестве G полный граф на N вершинах, то G p G N , p (модель Эрдѐша–Реньи) и для любого c 1 найдѐтся такое 0 c 1 , что
P sG c N c 1 . N
Задача 32 (показатель качества графа транспортной сети; Уотс–Строгатц, 1998)*. Рассматривается такой ориентированный взвешенный граф транспортной сети, что из любой его вершины можно добраться по ребрам (с учетом ориентации ребер) в любую другую. Обозначим через d ij – длину кратчайшего пути по рассматриваемому графу транспортной сети из вершины i в вершину j . Показателем качества исследуемого графа назовем величину: e n 1 n1 1
i , jV : i j
dij1 ,
где V 1, ..., n – множество вершин графа. Оцените значение этого показателя для графа транспортной сети из задачи 28, считая n 1 . Задача 33 (нахождение минимума функционала среднего расстояния; Е. О. Степанов, 2005)**. На множестве всех замкнутых связных множеств 2 хаусдорфовой размерности 1 ( H 1 ), удовлетворяющих ограничению на длину, H 1 l , требуется найти решение * следующей задачи: 355
F
A dist x, d x
2
min ,
: H1 l
где x – мера, отвечающая распределению населения в окрестности точки с координатой x , число A d задает затраты жителя на проезд
на расстояние d . Транспортная сеть , таким образом, проектируется исходя из соображений минимизации полных затрат населения на достижение сети из мест проживания. Покажите, что при весьма общих условиях решение * этой задачи существует, не содержит петель, имеет конечное число концевых точек и точек ветвления, а также обладает некоторыми свойствами регулярности (см. раздел, посвященный задаче Штейнера). Предложите эффективный способ численного поиска * .
Литература 1. 2. 3. 4.
5. 6. 7. 8.
К частям 1, 3: Hwang F. K., Richards D., Winter P. The Steiner tree problem. Elsevier Science Publishers, 1992. Гордеев Э. Н., Тарасцов О. Г. Задача Штейнера. Обзор // Дискретная математика. 1993. Т. 5. № 2. С. 3–28. http://www.mathnet.ru/12 Иванов А. О., Тужилин А. А. Теория экстремальных сетей. Москва– Ижевск: Институт компьютерных исследований, 2003. Протасов В. Ю. Максимумы и минимумы в геометрии. № 31. М.: МЦНМО, Библиотечка «Математическое просвещение», 2005. http://www.mccme.ru/mmmf-lectures/books/books/book.31.pdf К частям 2, 4, 5: Берж К. Теория графов и ее приложения. М.: ИЛ, 1962. Гвишиани А. Д., Гурвич В. А. Динамические задачи классификации и выпуклое программирование в приложениях. М.: Наука, 1992. Stoer Mechthild, Wagner Frank A Simple Min-Cut Algorithm // Journal of the ACM. 1997. V. 44. № 4. P. 585–591. Разборов А. А. О сложности вычислений // Матем. просв. 1999. № 3. http://www.mccme.ru/free-books/matpros4.html
Обратим внимание, что на этом электронном ресурсе открыт свободный доступ к полным текстам статей ряда ведущих российских научных журналов (Успехи математических наук, Математический сборник, Математические заметки, Функциональный анализ, Известия РАН, Дискретная математика, Математическое моделирование, Журнал вычислительной математики и математической физики и др.).
12
356
9. 10.
11.
12. 13. 14.
15. 16.
17. 18. 19. 20.
Смейл С. О проблемах вычислительной сложности // Матем. просв. 2000. № 4. http://www.mccme.ru/free-books/matpros5.html Schrijver Alexander On the history of the transportation and maximum flow problems // Math. Program., Ser B. 2002. V. 91. P. 437–445. http://oai.cwi.nl/oai/asset/10084/10084A.pdf Вялый М. Н. Линейные неравенства и комбинаторика. М.: МЦНМО, Летняя школа «Современная математика», 2003. http://www.mccme.ru/free-books/dubna/vyalyi.pdf Зыков А. А. Основы теории графов. М.: Вуз. книга, 2004. Diestel R. Graph Theory. Electronic Edition, NY: Springer, 2005. Goldberg A. V., Harrelson C. SODA '05 Proceedings of the sixteenth annual ACM-SIAM symposium on discrete algorithms. USA Society for Industrial and Applied Mathematics Philadelphia. 2005. P. 156–165. Кормен Т. Х., Лейзерсон Ч. И., Ривест Р. Л., Штайн К. Алгоритмы: Построение и анализ. М.: Вильямс, 2005. Кузюрин Н. Н., Фомин С. А. Эффективные алгоритмы и сложность вычислений. М.: МФТИ, 2007. http://discopal.ispras.ru/ru.lectures-mipt.htm Емеличев В. А., Мельников О. И., Сарванов В. И., Тышкевич Р. И. Лекции по теории графов. М.: УРСС, 2009. Annual IEEE Symposium on Foundations of Computer Science, 1 – 51. http://theory.stanford.edu/focs2010/ http://e-maxx.ru/algo/; http://www.machinelearning.ru/ Шень А. Х. Программирование: теоремы и задачи. М.: МЦНМО, 2011.
К части 6: 21. Стенбринк П. А. Оптимизация транспортных сетей. М.: Транспорт, 1981. 22. Бобрик П. П. Cравнение эффективностей треугольной и квадратичной регулярных транспортных сетей // Транспорт: наука, техника, управление. М.: Изд-во ВИНИТИ, 2000. № 7. 23. Луканин В. Н., Буслаев А. П., Трофимов Ю. В., Яшина М. В. Автотранспортные потоки и окружающая среда. Ч. 1, 2. М.: ИНФРА-М, 1998, 2001. 24. Latora V., Marchiori M. Efficient behavior of small-world networks // Phys. Rev. Letters. 2001. V. 87. № 19. http://www.w3.org/People/Massimo/papers/2001/efficiency_prl_01.pdf 25. Степанов Е. О. Математические модели оптимизации транспортных сетей. Санкт-Петербург: СПбГУ ИТМО, 2005. 357
Преобразования запрещенных маневров (от Яндекс-пробки) А. И. Верещагин, В. Б. Гольдштейн, И. И. Колесниченко, М. В. Левин, Андрей А. Петров Постановка задачи При нахождении маршрутов проезда по городу важно учитывать не только взаимное расположение дорог, но и правила дорожного движения. Картографические компании собирают информацию о расположении дорог и дорожных знаках. Эта информация предоставляется отдельно, однако для маршрутизации обязана учитываться вместе. Граф дорог состоит из перекрестков и улиц их соединяющих. Встречаются улицы с односторонним и двусторонним движением, а также улицы, по которым проезд машин запрещен вовсе. Однако из-за запрещающих знаков на некоторые улицы можно выехать не всегда. Простейшим примером служит запрещенный левый поворот. Несмотря на то, что по улицам AMB и CMD разрешен проезд в обоих направлениях, нельзя проехать по ним последовательно. То есть проезд по пути AMC и BMD запрещен. Обобщая этот пример, назовем запрещенным маневром последовательность дорог, проезд по которым от начала и до конца запрещен. Запрещенные маневры могут состоять как из двух ребер (запрет левого поворота), так и из 4–5 дорог (сложный выезд на трассу).
Рис. 1
358
Рис. 2
Так на рис. 1 два запрещенных маневра: P1 = (AM, MC) и P2 = (BM, MD). На рис. 2 три запрещенных маневра: P1 = (AM1, M1D) и P2 = (AM1, M1M2, M2F, FG) и P3 = (M1M2, M2E). Формальная постановка задачи Задан ориентированный (для простоты в примерах будем рассматривать неориентированный граф, каждому ребру без стрелок на рис. 1, 2 соответствуют два ребра в разных направлениях) граф G без петель и набор запрещенных маршрутов P. Маршрут Pi – последовательность ребер графа. Запрет проезда по маршруту Pi означает запрет проезда по всему маршруту начиная с первого ребра и заканчивая последним. Проезд по любой части маршрута не запрещен. Требуется построить такой граф H, в котором не будет запрещенных маневров. Каждой вершине (ребру) графа G соответствует одна или несколько вершин (ребер) графа H. Каждому разрешенному пути (чередующаяся последовательность вершин и ребер) в графе G соответствует путь в графе H. Запрещенному пути в графе не должно соответствовать ни одного пути в графе H. Разрешенный путь в графе G – путь, не содержащий запрещенных маневров. Запрещенный путь в графе G – путь, содержащий хотя бы один запрещенный маневр. Все вершины графа G имеют вполне конкретный географический смысл и находятся в некоторых различных точках земли. Различные 359
вершины графа H могут находиться в одной точке Земли, однако отражать разное состояние. На рис. 1 знание, что машина находится в точке M, не достаточно для понимания, куда может ехать машина. В графе H вершине M будет соответствовать три вершины: 1) если мы приехали из вершины А; 2) из вершины B; 3) из другой вершины. Рассмотрим граф H для графа, изображенного на рис. 2. Светлым обозначены двусторонние дороги. Вершина M1 означает, что машина находится в вершине M1 и запрещены следующие пути: {M1M2E, M1D, M1M2FG}, вершина M 2 находится в M2 и запрещен путь M2E, M2 находится в M2 и запрещены пути {M2E, M2FG}, F' находится в F и запрещен путь FG.
360
Используемые сокращения м – метр, с – секунда, км – километр, ч – час, мин – минута т.е. – то есть, т.д. – так далее, т.п. – тому подобное др. – другие, см. – смотри, п. – пункт, пп. – пункты, г. – год УДС – улично-дорожная сеть ЗОС – загрязнение окружающей среды LWR – Лайтхилл–Уизем–Ричардс АТС – автотранспортное средство (автомобиль) RRH – Риман–Ранкин–Гюгонио E-условие – энтропийное условие О. А. Олейник Г–Я – Гамильтон–Якоби, Г–Я–Б – Гамильтон–Якоби–Беллман T.V. – total variation (полная вариация) CTM – Cell Transmission Model (модель клеточных автоматов Даганзо) IDM – Intelligent Driver Model (модель разумного водителя) ПДД – правила дорожного движения CA – Cellular Automata (клеточные автоматы) СОДУ – система обыкновенных дифференциальных уравнений КдФБ – Кортевег–де Фриз–Бюргерс ДМ – Дженерал Моторс F – free flow, S – synchronized flow, J – wide moving jam СП – синхронизованный поток ЛСП – локализованный синхронизованный поток РСП – расширяющийся синхронизованный поток МСП – мигрирующий синхронизованный поток ОП – общей структурой плотного потока ЕП – единой структурой плотного потока ЕСП – единая структура синхронизованного потока ЕОП – единая общая структура плотного потока РОП – рассасывающаяся общая структура плотного потока п.н. – почти наверное, н.о.р. – независимые одинаково распределенные с.в. – случайная(-ые) величина(-ы), д.м.ц. – дискретная марковская цепь E – Expected value (математическое ожидание), D – Dispersion (дисперсия) Н.О.Д. – наибольший общий делитель СЛАУ – система линейных алгебраических уравнений TASEP – totally asymmetric exclusion process (полностью асимметричные процессы с запретами) LCD – linearized chord diagram (линейная хордовая диаграмма) (R) – множество действительных чисел (N) – множество натуральных чисел (1, 2, 3, … ) (Z) – множество целых чисел
361
Учебное издание
ВВ ЕД ЕНИ Е В МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ТРАНСПОРТНЫХ ПОТОКОВ Гасников Александр Владимирович Кленов Сергей Львович Нурминский Евгений Алексеевич Холодов Ярослав Александрович Шамрай Наталья Борисовна Приложения : Бланк Михаил Львович Гасникова Евгения Владимировна Замятин Андрей Андреевич и Малышев Вадим Александрович Колесников Александр Викторович Райгородский Андрей Михайлович
Редакторы В. А. Дружинина, И. А. Волкова Корректор О.П. Котова, Л.В. Себова Подписано в печать 30.11.2010. Формат 60 84 1/16. Печать офсетная. Усл. печ л. 22,5. Уч.- изд. л. 22,0. Тираж 250 экз. Заказ № ф-003. Государственное образовательное учреждение высшего профессионального образования «Московский физико-технический институт (государственный университет)» 141700, Московская обл., г. Долгопрудный, Институтский пер., 9 __________________________________________________________________ Отдел автоматизированных издательских систем «ФИЗТЕХ-ПОЛИГРАФ» 141700, Московская обл., г. Долгопрудный, Институтский пер., 9
Учебное пособие посвящено математическому моделированию транспортных потоков. Излагается математический аппарат и некоторые физические концепции, которые могут пригодиться при создании (модернизации) комплексной интеллектуальной транспортной системы.
С глубокой благодарностью дорогому А.А. Петрову
Академик РАН Александр Александрович Петров (03.02.1934 – 23.02.2011) I SBN 5 - 7 4 1 7 - 0 3 3 4 - 8
9 785741 703342