В.А. Окороков Е.В. Сандракова
ФРАКТАЛЫ В ФУНДАМЕНТАЛЬНОЙ ФИЗИКЕ
ФРАКТАЛЬНЫЕ СВОЙСТВА МНОЖЕСТВЕННОГО ОБРАЗОВАНИЯ ЧАСТИ...
40 downloads
548 Views
5MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
В.А. Окороков Е.В. Сандракова
ФРАКТАЛЫ В ФУНДАМЕНТАЛЬНОЙ ФИЗИКЕ
ФРАКТАЛЬНЫЕ СВОЙСТВА МНОЖЕСТВЕННОГО ОБРАЗОВАНИЯ ЧАСТИЦ И ТОПОЛОГИЯ ВЫБОРКИ
Москва 2009
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ МОСКОВСКИЙ ИНЖЕНЕРНО-ФИЗИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)
В.А. Окороков Е.В. Сандракова
ФРАКТАЛЫ В ФУНДАМЕНТАЛЬНОЙ ФИЗИКЕ ФРАКТАЛЬНЫЕ СВОЙСТВА МНОЖЕСТВЕННОГО ОБРАЗОВАНИЯ ЧАСТИЦ И ТОПОЛОГИЯ ВЫБОРКИ
Москва 2009
УДК 539.1 (075) + 519.21 (075) ББК 22.38я7 + 22.171я7 О - 51 Окороков В.А., Сандракова Е.В. Фракталы в фундаментальной физике. Фрактальные свойства множественного образования частиц и топология выборки. Учебное пособие. М.: МИФИ, 2009. – 460 с. Настоящее учебное пособие посвящено систематическому изложению основ таких перспективных и динамично развивающихся разделов современной фундаментальной науки, как физика многочастичных процессов и фрактальные функции. Представлено как физическое описание эффектов, связанных со случайными фракталами и топологией выборки в квантовой физике, так и соответствующий математический аппарат, что является уникальной особенностью данного пособия. В конце каждой главы приведены контрольные вопросы и список рекомендуемой литературы, в конце пособия представлены многочисленные практические упражнения, что способствует лучшему усвоению материала. Содержание пособия соответствует дополнительным главам курса «Математический анализ» и разделам курса «Фундаментальные взаимодействия», посвященным физике множественного образования частиц и фемтоскопии. Пособие предназначено для студентов старших курсов и аспирантов, обучающихся по специальностям «Физика ядра и элементарных частиц», «Физика высоких энергий». Может быть полезно специалистам в соответствующих областях исследований. Рецензенты: доктор физ.-мат. наук, профессор Нарожный Н.Б., кандидат физ.-мат. наук, доцент Федотов А.М.
Рекомендовано редсоветом МИФИ в качестве учебного пособия ISBN 978-5-7262-1126-8 © Московский инженерно-физический институт (государственный университет), 2009
ОГЛАВЛЕНИЕ
СПИСОК СОКРАЩЕНИЙ ………………………………….
7
ПРЕДИСЛОВИЕ ……………………………………………...
8
ВВЕДЕНИЕ ……………………………………………………… 9 Глава 1. СТРУКТУРНЫЕ ФУНКЦИИ В КХД: ФРАКТАЛЬНОСТЬ И САМОПОДОБИЕ………… §1. Адронные структурные функции: основные сведения……. §2. Партонная модель……………………………………………. §3. Структурные функции в КХД……………………………...... §4. Некоторые основные экспериментальные результаты…...... §5. Фрактальность структурных функций в КХД……………… Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………...... Глава 2. НЕДИФФЕРЕНЦИРУЕМЫЕ ИЛИ ФРАКТАЛЬНЫЕ ФУНКЦИИ И МНОЖЕСТВА……………….. §1. Недифференцируемые функции: краткая история возникновения ……………………………………………...... §2. Классы недифференцируемых функций ……..…………...... §3. Множества первой и второй категории по Бэру …………... §4. Интегралы и производные дробного порядка: краткая историческая справка ……………………………………… §5. Интегральное уравнение Абеля …………………………….. §6. Интегралы и производные во фрактальной геометрии …… §7. Физическая интерпретация дробных операторов ………..... Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………......
3
20 20 35 40 56 64 72 72
73 73 76 80 85 89 97 104 109 109
Глава 3. ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ И СЛУЧАЙНЫЕ ПРОЦЕССЫ…………………….. §1. Вводные замечания…………………………………………... §2. Основные понятия теории множеств …….….……………... §3. Пространства, классы и алгебры в теории вероятности …... §4. Меры и интегралы ……….………...………………………… §5. Вероятности …………...…………...………………………… §6. Случайные процессы ……………...………………………… §7. Распределения случайной функции………………………… §8. Инфинитезимальные операторы переходных функций …... Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………......
110 110 112 118 123 130 141 143 157 161 161
Глава 4. МАРКОВСКИЕ ПРОЦЕССЫ …………………...… §1. Марковские процессы и марковские семейства …….……... §2. Элементы теории групп …………………………...….……... §3. Диффузионные процессы …………………………………… §4. Результаты Колмогорова. Прямое и обратное уравнения Колмогорова ………………...……….…………………..…... Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………......
162 162 171 181
Глава 5. БРОУНОВСКОЕ ДВИЖЕНИЕ ……………………. §1. Вводные замечания……………………………..…….……… §2. Линейное (одномерное) броуновское движение ….……….. §3. Траектория линейного броуновского движения ….……….. §4. Кривая плоского броуновского движения ………….….…... §5. Некоторые основные теоремы для кривой плоского броуновского движения ……………….……………….......... §6. Замыкание плоской броуновской кривой C ……………..... §7. Броуновское движение в пространстве ……………...……... §8. Процесс Орнштейна – Уленбека…………………………….. §9. Обобщенное (фрактальное) броуновское движение ……..... §10. Некоторые важные примеры процессов обобщенного броуновского движения ………………………………….… §11. Моделирование обобщенного броуновского движения….. §12. Самоаффинность фрактальной броуновской функции ...... §13. Функция Вейерштрасса – Мандельброта ………………….
202 202 204 213 215
4
193 200 201
224 227 233 234 239 244 247 255 261
§14. Фурье-анализ фрактального броуновского движения …… §15. Спектр обобщенного броуновского движения …….....…... Контрольные вопросы …………………………………… Рекомендуемая литература ……………………………........ Глава 6. ТРАНСПОРТНЫЕ ПРОЦЕССЫ ВО ФРАКТАЛЬНЫХ ПРОСТРАНСТВАХ ….……….. §1. Устойчивые распределения …….……..…………………..… §2. Аномальная диффузия ………….………..………...……...… §3. Супердиффузия и строго устойчивые распределения …...... §4. Кинетические уравнения …………………………...…...…... §5. Функция Фокса и процессы во фрактальных средах ……… §6. Волновое уравнение во фрактальных средах ……………… §7. Стохастические процессы с операторами дробных порядков…………………………………………………........ §8. Решение уравнения Ланжевена общего вида……….……… Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………......
262 264 266 267
268 268 280 281 283 287 291 292 301 311 311
ГЛАВА 7. ОПЕРАТОРЫ ДРОБНЫХ ПОРЯДКОВ В ФИЗИКЕ ФУНДАМЕНТАЛЬНЫХ ВЗАИМОДЕЙСТВИЙ……………………………... §1. Вводные замечания…………………….…………………….. §2. Математический формализм………….……………………... §3. Некоторые важные распределения…….…………………..... §4. Уравнение Фоккера – Планка дробного порядка…………... §5. Сравнение с экспериментом…………………………………. Контрольные вопросы ………………………………………. Рекомендуемая литература ………………………………......
312 312 316 326 334 337 345 345
ГЛАВА 8. ФЕМТОСКОПИЯ И УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ………………………………... §1. Метод интерферометрии……………….…………………..... §2. Метод HBT в физике микромира……….…………………… §3. Системы координат……………………….………………….. §4. Физическая интерпретация параметров источника………... §5. Метод фемтоскопии в эксперименте………………………... §6. Корреляционный пик и устойчивые распределения…….....
346 346 355 365 375 378 379
5
§7. Корреляционная функция в случае одномерных устойчивых распределений……………..…...... §8. Устойчивые распределения многих переменных и геометрия источника……..……………………………….... §9. Устойчивые распределения для расширяющихся источников…….…….………………………………………... §10. Устойчивые распределения и трехчастичные бозе-эйнштейновские корреляции………………………..... §11. Устойчивые распределения: сравнение с экспериментальными данными………...………………… §12. Некоторые выводы………………………………………….. Контрольные вопросы ……………………………………... Рекомендуемая литература ……………………………........ Приложение 1. Определение параметров КХД в экспериментах по ГНР……………………….. Приложение 2. Интегрирование дробных порядков ……….…. Приложение 3. Аналитический аппарат теории вероятностей .. Приложение 4. Нормальное распределение……………………. Приложение 5. Теоремы Хинчина и Леви ………...…………… Приложение 6. Уравнение Ланжевена ………………………..... Приложение 7. Интегральные преобразования…....……………
381 387 391 393 398 402 403 404
405 407 412 416 422 426 427
УПРАЖНЕНИЯ ………………………………………………… 437 СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ …………
6
442
СПИСОК СОКРАЩЕНИЙ
ВФ – волновая функция ГНР – глубоко неупругое рассеяние КТП – квантовая теория поля КХД – квантовая хромодинамика л.с. – лабораторная система с.ц.м. – система центра масс ТВ – теория возмущений (о)ЦПТ – (обобщенная) центральная предельная теорема BNL – Брукхейвенская национальная лаборатория (США) CERN – Европейский центр ядерных исследований LHC – большой адронный коллайдер LLA – главное логарифмическое приближение NLO – следующий за лидирующим порядок ТВ КХД RHIC – коллайдер релятивистских тяжелых ионов SPS – суперпротонный синхротрон
7
ПРЕДИСЛОВИЕ Использование современных математических методов и подходов нередко приводило к революционным изменениям в понимании и описании физической картины мира. В настоящее время в различных областях фундаментальной физики все более популярными становятся такие разделы математики, как фрактальная геометрия и фрактальные или недифференцируемые функции, случайные процессы и обобщенные устойчивые распределения. Аппарат указанных разделов математики успешно используется, в частности, в исследованиях по квантовой теории поля, физике высоких энергий, теории хаоса и критических явлений в квантовых системах. Применение понятий самоподобия и фрактальности оказалось полезным, в частности, для развития современных подходов в квантовой механике и в квантовой хромодинамике. В рамках предлагаемого пособия авторы в явной форме постарались продемонстрировать глубокую взаимосвязь фрактальной геометрии и физики фундаментальных взаимодействий. В пособии изложены математические основы теории операторов дробного порядка, теории вероятностей и случайных процессов, необходимых при рассмотрении случайных фракталов. Рассмотрено применение данного математического аппарата для описания броуновского движения, в различных областях современной физики высоких энергий, а именно, в корреляционном анализе и при изучении распределений по множественности. Такой подход к изложению материала, по мнению авторов, является актуальным и представляется положительной отличительной чертой настоящего пособия. Данное пособие продолжает серию учебно-методических работ, посвященных фракталам в современной фундаментальной физике. Пособие не претендует на обзор последних достижений ни в физике многочастичных процессов, ни в используемых разделах математики. Авторы выражают глубокую благодарность профессору Сергееву Ф.М. за постоянный интерес к работе и многочисленные полезные обсуждения. Авторы искренне признательны Окорокову М.А. за предоставление необходимых компьютерных ресурсов и помощь в подготовке к изданию данного учебного пособия.
8
ВВЕДЕНИЕ На наиболее фундаментальном уровне исследования в экспериментальной и теоретической физике высоких энергий представляют собой исследования природы массы и энергии и, в конечном счете, структуры и геометрии пространства-времени. В настоящее время одним из многообещающих подходов представляется исследование функциональных уравнений Шредингера и соответствующих формулировок принципа неопределенности для «квантовой механики струн». Важнейшим следствием в данном случае является введения квантового пространства-времени дробной размерности, то есть фрактального пространства-времени в квантовой физике. Роль фракталов и соответствующей геометрии в квантовой физике содержит два аспекта. Во-первых, само изучаемое пространство может обладать фрактальными свойствами и это может оказывать влияние на динамику квантовых систем. Одним из примеров здесь может служить явление перколяции. Во-вторых, рассматриваемое пространство может быть достаточно гладким, и проявление фрактальных свойств, фрактальной геометрии может быть обусловлено динамикой квантовой системы. Важнейшим примером в данном случае может служить интерпретация интегралов по траекториям Фейнмана и глубокая взаимосвязь броуновского движения и квантовой механики. Данный пример более подробно рассматривается ниже. Важно отметить, что в отличие от конструктивных фракталов, рассмотренных в [1], более реалистичные фракталы для квантовой физики должны строиться и исследоваться с привлечением основополагающих для данной области исследований понятий: «вероятность» и «случайность». Таким образом, фракталы в квантовой физике являются, по своей сути, «случайными» или «вероятностными» фракталами. Вероятность в квантовой физике – это категория, необходимость привлечения которой обусловлена тем, что наблюдаемое поведение физических объектов атомного и субатомного уровня носит выраженный статистический характер. Соответственно, предсказания квантовой теории, описывающей поведение микрообъектов, являются по своему существу вероятностными и выражаются в
9
терминах вероятностей переходов, средних значений, дисперсий, корреляций и так далее. Принципиально важным, однако, является следующее обстоятельство: хотя результат каждого, отдельно взятого эксперимента можно рассматривать как обычную случайную величину, оказывается, что невозможно дать «классическое» описание совокупности статистических результатов всевозможных экспериментов над данным микрообъектом, которое характеризовало бы состояние этого микрообъекта в терминах какого-либо пространства элементарных исходов. Квантовая статистичность подлинна в том смысле, что носит первичный характер и принципиально неустранима за счет повышения точности и детальности измерений. С математической точки зрения это свойство квантовой теории выражается в том, что вероятностное описание квантово-механического объекта не может быть целиком построено на классической аксиоматике пространства элементарных исходов и требует привлечения иных аналитических средств. Такие методы разработаны в рамках, например, некоммутативной теории вероятностей. Тезис о невозможности введения в квантовую механику «скрытых параметров», то есть о несводимости квантовых вероятностей к той или иной форме классического вероятностного описания был выдвинут Н. Бором и послужил предметом глубокой физикофилософской дискуссии в 30-х гг. XX века. Признание де факто такой несводимости явилось следующим после построения кинетической теории вещества принципиальным шагом на пути отказа от догматов детерминизма и внедрения статистических категорий в физическое мышление [2]. В 40-х годах XX века Р. Фейнманом была выдвинута гипотеза, согласно которой амплитуда вероятности перехода квантовомеханической системы из начального состояния с 4-мерной координатой ta , xa в конечное состояние с координатой tb , xb пропорциональна сумме амплитуд, соответствующих всевозможным траекториям связывающим точки a и b. Данное предположение лежит в основе метода функционального интеграла, представляющего собой метод квантования физических систем, альтернативный волновой механике Шредингера и операторному методу Гейзенберга [3]. Необходимо отметить, что основы математической тео-
10
рии интегралов по траекториям были заложены в 20-х годах XX века Н. Винером, однако строгая математическая теория функциональных интегралов пока еще не создана. Представление амплитуды перехода в виде функционального интеграла естественным образом обобщается на случай квантовой теории поля (КТП). Данный метод занимает особое место в теории калибровочных полей. Необходимо отметить, что исторически первый пример использования геометрии сильнонерегулярных, сильноизрезанных объектов1 в квантовой физике был предложен Р. Фейнманом и А. Хиббсом в 1965 г. именно при рассмотрении самоподобного (фрактального) поведения контуров, возникающего в интегрировании по траекториям в КТП. В то время как частицы в классической механике двигаются по гладким (дифференцируемым) траекториям, в квантовой механике, как известно, ситуация отличается качественно. Как было отмечено в [4], в рамках фейнмановской интерпретации квантовой механики перемещения массивной частицы, которые условно можно описывать траекториями, в квантовой механике являются недифференцируемыми и самоподобными кривыми, то есть сильно изломанными зигзагообразными кривыми (рис. В.1). Необходимо отметить аналогию квантовой траектории с фрактальной кривой, которая имеет подобный вид на различных масштабах (см. рис. В.1). В связи с этим, еще в 1965 г. Р. Фейнманом и А. Хиббсом было особо отмечено свойство (стохастического, веротностного) самоподобия, которое играет исключительно важную роль во многих областях современной физики [4]. Затруднительно точно в количественном смысле определить, в чем именно состоит «нерегулярность» или «изрезанность» рассматриваемых объектов, не считая, конечно, отрицательной характеристики – это не многообразия и не счетные объединения таковых. Как было показано в [1], в настоящее время существует несколько определений понятия «фрактал», носящих, как правило, достаточно общий качественный характер. Важно отметить, что множество дробной хаусдорфовой размерности, очевидно, «нерегулярно», но оно не обязано быть «самоподоб1
Это соответствует фрактальной геометрии, однако в то время, когда появился данный пример, термины «фрактал», «фрактальная геометрия» еще не были введены.
11
ным», а множество целой хаусдорфовой размерности вполне может быть «нерегулярным» (или, можно сказать другими словами, «изрезанным») и при этом обладать или не обладать свойством локального «самоподобия». Не является вполне обязательным для фракталов и другое свойство, первоначально также называвшееся как основное: хаусдорфова размерность больше топологической [5]. Термин «фрактальный» можно трактовать и как «дробный, не целый», так и как «изломанный» [1, 6].
Рис. В.1. Типичная траектория квантовой частицы в фейнмановской формулировке, являющаяся сильнонерегулярной кривой на малых масштабах [4]. Данная кривая нигде не дифференцруема и стохастически самоподобна
В ряде случаев наблюдения о «фрактальности» тех или иных множеств (включая сюда утверждения и о размерности, и о «самоподобии») подтвердились в ходе строгих математических исследований, при этом был достигнут значительный прогресс и в других отношениях. Это особенно относится к «конформной динамике», то есть исследованию итераций аналитических функций в области комплексного переменного [2].
12
В классической физике недифференцируемой траекторией обладает броуновская частица. Траектория броуновской частицы является одним из наиболее известных и важных примеров фрактальных кривых. Броуновское движение играет особую роль в квантовой физике. Функциональный или континуальный интеграл, предложенный Р. Фейнманом, является обобщением интегралов по траекториям, введенных в работах А. Эйнштейна и М. Смолуховского и применяемых при изучении броуновского движения в классической физике. Как было указано выше, стандартная формулировка и интерпретация квантовой механики базируется на теории вероятностей, при этом считается, что волновая функция (ВФ) системы покрывает все конфигурационное пространство, описывая вероятность локализации системы в определенной точке пространства-времени. Однако такая интерпретация не обеспечивает интуитивно понятной картины явлений микромира, какую дает, например, классическая механика для явлений макромира. Вследствие этого были предложены альтернативные интерпретации и формулировки, основанные на интуитивно более понятной концепции траектории. Одной из формулировок такого рода является рассмотренная выше фейнмановская формулировка квантовой механики. Основой другого подхода является теория квантового броуновского движения [7]. Было показано [7, 8], что имеется тесная взаимосвязь между броуновским движением и квантовой механикой1. Броуновское движение переходит в свободное движение массивной квантово-механической частицы, если выполняются формальные замены времени t it и коэффициента диффузии Kd 2m , при этом уравнение диффузии переходит в уравнение Шредингера нерелятивистской квантовой механики. В [9] было показано, что усредненная квантовомеханическая траектория свободного движения обладает фрактальной геометрией с целочисленной размерностью Хаусдорфа d H 2. Таким образом, динамика свободной системы без граничных условий может быть охарактеризована на основе фрактальных 1
Подробное рассмотрение данного вопроса может служить предметом отдельной книги. В данном пособии рассматривается только соответствующий математический аппарат.
13
траекторий. Контуры для большинства взаимодействий (с локальными потенциалами) соответствуют траекториям с размерностью Хаусдорфа d H 2. Интерес представляют ситуации, когда d H 2. Пример такой ситуации – потенциал, зависящий от скорости, U x 4 , который может встретиться, когда частица распространяется в среде, приводя в результате к модифицированным дисперсионным соотношениям. В качестве другого примера можно было бы рассмотреть квантовую механику в искривленном пространствевремени, соответствующем ситуации, когда квантовая частица падает на нейтронную звезду или черную дыру [10]. Особую роль при исследовании основ квантовой механики играют так называемые квантовые фракталы. Данные объекты, например, позволяют снять некоторые противоречия в квантовой механике Бома [11, 12], сохраняя всю ее предсказательную силу и интуитивно более понятную формулировку на основе сильноизрезанных нигде не дифференцируемых траекторий. При этом квантовые фракталы рассматриваются как волновые функции, у которых реальная и мнимая части являются всюду непрерывными, но нигде не дифференцируемыми функциями. В данном подходе квантовые траектории, ассоциированные с указанными ВФ, также являются фракталами [13]. Важно отметить, что в настоящее время исследования в данной области продолжаются. В системах многих тел таких, как системы спинов или системы полей в КТП, фрактальная геометрия оказывается полезным инструментом, в особенности для анализа критических явлений. Используя ковры Серпинского, оказалось возможным моделировать системы в пространстве нецелого числа измерений и изучать критическое поведение как функции размерности пространства. Выполнение численных моделирований методом Монте-Карло на таких решетках дает информацию в непертурбативной области теории при нецелом числе измерений. Фрактальная геометрия использовалась для анализа геометрии критических кластеров при фазовых переходах второго рода. Интересным и важным является вопрос соотношения между критическими показателями и хаусдорфовой размерностью. Однако, к сожалению, нет никакого уникального пути для определения такой хаусдорфовой размерности. В квантовой гравитации, например, размерность Хаусдорфа была оп-
14
ределена через сравнение масштабных показателей для двух наблюдаемых, которые имеют естественные физические размерности длины и объема соответственно. Размерность Хаусдорфа, определенная таким способом, тесно связана с аномальной размерностью вершинной функции [10]. В настоящее время значительные усилия, в частности, в физике фундаментальных взаимодействий концентрируются на изучении так называемых квантовых фазовых переходов или квантовых критических явлений. Действующие экспериментальные установки на коллайдере релятивистских тяжелых ионов (RHIC) Брукхейвенской национальной лаборатории, экспериментальная программа на научно-ускорительном комплексе LHC (CERN) позволяют исследовать сильновзаимодействующую материю при экстремально высоких температурах и плотностях энергии. Особый интерес представляет фазовый переход от состояния деконфайнмента к состоянию бесцветной адронной материи. Важно отметить, что в настоящее время интенсивно развиваются как теоретические, так и экспериментальные исследования в новой области физики фундаментальных взаимодействий, которую можно назвать «релятивистская ядерная физика конденсированных / сплошных сред». Таким образом, рассматриваемые в данной книге методы могут носить важный междисциплинарный характер. Один из наиболее интересных аспектов – это роль фрактальной геометрии при фазовом переходе к состоянию деконфайнмента при конечной температуре в теории поля на решетке. Была найдена наблюдаемая (токовая петля монополя), которая является нефрактальной в фазе деконфайнмента, но становится фрактальной в фазе конфайнмента. Таким образом, данная наблюдаемая характеристика играет роль параметра порядка [10]. Делаются попытки описания поведения кварков тяжелых ароматов в окружающей среде на основе классического броуновского движения [14]. При этом окружающая среда может рассматриваться в качестве сильнонерегулярного фрактального пространства. Известно, что в макрофизике при изучении процесса просачивания именно фрактальная геометрия является подходящей для описания геометрии пористых сред. Таким образом, математический аппарат, разработанный для описания транспортных явлений во фрактальных пространствах, может оказаться полезным при построении
15
более реалистичных моделей в релятивистской ядерной физике. При моделировании таких важнейших коллективных эффектов как азимутальные корреляции относительно плоскости реакций может быть полезно уравнение Ланжевена. Применение простейшего варианта данного уравнения позволило разумно на качественном уровне описать параметр эллиптического потока в столкновениях релятивистских тяжелых ионов при энергиях RHIC [15, 16]. Однако в настоящее время в распоряжении физиков имеется мощный математический аппарат, позволяющий выполнять обобщения стандартного уравнения Ланжевена для моделирования сложных статистических физических явлений. Важно отметить, что в связи с выполнением и планированием экспериментов с пучками тяжелых ионов при релятивистских энергиях в условиях больших множественностей вторичных частиц использование рассматриваемого в данной книге математического аппарата будет находить все более широкое применение в релятивистской ядерной физике как для экспериментальных исследований новых состояний сильновзаимодействующей материи в экстремальных состояниях, так и для построения более реалистичных феноменологических моделей. Важно отметить, что в основе указанных выше физических моделей и подходов лежит глубокая математическая теория: современная теория вероятностей, теория операторов дробного порядка и фрактальных функций, фрактальная геометрия. В результате ряда исследований было обнаружено исключительно важное соответствие между фракталом, являющимся геометрическим объектом, который обладает свойством самоподобия, и ренормализационной группой в физике, которая также была построена с учетом свойства самоподобия (приводя к возникновению бегущей константы взаимодействия). В настоящее время физика адронных процессов часто сводится к исследованию струй адронов, изучение свойств которых позволило получить ряд экспериментальных подтверждений справедливости предсказаний КХД. Одним из важнейших модельно независимых предсказаний КХД является зависимость сечения взаимодействия партонной конфигурации от ее геометрии. Таким образом, исследование геометрических характеристик конечных адронных состояний может помочь существенно продвинуться в понимании динамики процессов сильного взаимодействия и, в конечном
16
итоге, затрагивает фундаментальные вопросы о структуре пространства-времени и физическом смысле геометрии. Как известно, фрактальная размерность в классической физике дает некоторую информацию о поведении наблюдаемой (например, длины береговой линии), когда разрешение по длине стремится к нулю [1]. Подобная ситуация возникает, когда рассматриваются адронные структурные функции в зависимости от квадрата переданного импульса, для которого обратная величина может трактоваться как квадрат длины волны, определяющей пространственное разрешение. Необходимо отметить, что структурные функции являются важнейшим элементом, характеризующим начальное состояние при описания процесса образования адронных струй. Таким образом, по-видимому, наряду с объектами, форма которых с высокой степенью точности изображается привычными «евклидовыми» фигурами, в природе действительно встречаются объекты «фрактальной» формы. Важно отметить, что пока это только феноменология: встает вопрос, почему тот или иной объект имеет фрактальную форму, и притом с такими-то количественными характеристиками. В данной книге рассмотрен ряд областей именно квантовой физики, в которых фрактальная геометрия играет существенную роль. Краткое содержание данного пособия следующее. В первой главе рассматриваются процессы глубоко неупругого рассеяния и адронные структурные функции. Основное внимание уделено зависимостям физических характеристик от квадрата переданного импульса. Показана роль, которую фрактальная геометрия могла бы, возможно, играть при изучении внутренней структуры частиц. Актуальность данного подхода обусловлена как современными прецизионными экспериментальными результатами, полученными при изучении структуры протона на RHIC, так и планируемым развитием данной области исследований и, в частности, проектом создания электрон-ядерного коллайдера (e-RHIC). В следующих трех главах вводится математический аппарат, необходимый для исследования как самих случайных фракталов, так и физических процессов, происходящих в пространствах с соответствующей нетривиальной структурой. Подробно рассмотрено интегро-дифференциальное исчисление дробных порядков, аксиоматический подход в теории вероятностей и случайные процессы.
17
Особое внимание уделено прямому и обратному уравнениям Колмогорова и марковским процессам. Вследствие важности и в качестве необходимой основы для изучения квантовых систем в пятой главе рассмотрено броуновское движение различной размерности. В данной главе введено обобщенное (фрактальное) броуновское движение и подробно рассмотрены его свойства и некоторые фрактальные свойства временных рядов. В шестой главе рассмотрены устойчивые распределения и процессы переноса во фрактальных пространствах. Значительное внимание уделено обобщенному уравнению Ланжевена. Это обусловлено тем, что частный случай, классическое уравнение Ланжевена, являющееся примером стохастического дифференциального уравнения, играет в настоящее время заметную роль при исследовании коллективных эффектов в ядро-ядерных взаимодействиях при релятивистских энергиях. Седьмая и восьмая главы посвящены физическим приложениям операторов дробных порядков и устойчивых распределений к исследованию процессов множественного рождения и геометрических характеристик источника вторичных частиц. В конце каждой главы представлены контрольные вопросы, которые позволят читателям лучше усвоить изложенный материал, а также список дополнительной литературы, рекомендуемый для более углубленного изучения материала данной главы. В приложениях кратко описаны эксперименты по определению значений свободных параметров КХД в процессах глубоко неупругого рассеяния, представлены некоторые важные сведения по теории вероятности и операторам дробных порядков. В конце пособия приведены упражнения по теории вероятности и случайным процессам. Список литературы содержит используемые и цитируемые в данной книге работы. Конечно, данный список не исчерпывает всей литературы по рассматриваемым вопросам, однако авторы надеются, что представленный список литературы является достаточным, чтобы заинтересованный читатель мог, используя его, найти дальнейшие обзоры и оригинальные статьи, посвященные научным исследованиям в данных областях.
18
Рекомендуемая литература В.11. Бор Н. Избранные научные труды. М., 1971. Т.2. В.22. Нейман Дж. Математические основы квантовой механики. Пер. с нем., М., 1964. В.3. Холево А.С. Статистическая структура квантовой механики и скрытые параметры. М., 1985.
1
Данная книга полезна для более углубленного рассмотрения дискуссии о проблеме скрытых параметров как с точки зрения физики, так и философии. 2 Книга, в которой предпринята одна из первых попыток придать «проблеме скрытых параметров» в квантовой механике строгий математический статус.
19
Глава 1 СТРУКТУРНЫЕ ФУНКЦИИ В КХД: ФРАКТАЛЬНОСТЬ И САМОПОДОБИЕ
В [1] было рассмотрено общее описание образования струй адронов в рамках пертурбативной КХД. Распределения партонов в адронах не могут быть, во всяком случае пока, вычислены исходя из первых принципов теории. Данные распределения определяются на основе экспериментальных данных, в частности, по глубоко неупругому лептон-нуклонному рассеянию. Процессы данного типа играют ключевую роль для определения внутренней структуры адронов. Измерения партонных распределений в адронах является, таким образом, существенным элементом общей программы построения законченной теории сильных взаимодействий и проверки справедливости КХД. В [1] были рассмотрены схемы фрагментации и проявления фрактальных свойств конечных адронных состояний в процессах с образованием струй вторичных частиц. В данной главе основное внимание уделено такому элементу, соответствующему начальному состоянию общей схемы образования струй адронов, как структурные функции. Детальное изложение теории глубоко неупругого взаимодействия и структурных функций выходит за рамки данной книги, существенное внимание будет уделено эволюции структурных функций в рамках КХД и связанным с этим возможным проявлением фрактальных свойств данных функций. §1. Адронные структурные функции: основные сведения В данном параграфе приводятся определения и основные свойства адронных структурных функций. Определение 1.1. Глубоко неупругими процессами (глубоко неупругим рассеянием – ГНР) называются инклюзивные процессы взаимодействия лептонов и адронов, при которых как квадрат передачи 4-импульса лептоном, так и квадрат суммарной полной
20
энергии вторичных адронов в системе их центра масс значительно превышает характерную энергию покоя адронов 1 ГэВ [17]. Количественные кинематические критерии ГНР будут приведены ниже (п. 1.1.). Вследствие соотношения неопределенности процессы ГНР, как было указано выше, играют важную роль в исследовании структуры как адронов, так и атомных ядер, а также в изучении динамики взаимодействий на малых расстояниях. Исторически структурные функции были введены в рассмотрение для описания процессов глубоко неупругого рассеяния лептонов на нуклонах1: l k N p l ' k ' X PX . (1.1) Здесь X соответствует системе нерегистрируемых адронов в конечном состоянии. Реакция (1.1) является полностью инклюзивной относительно конечного адронного состояния. В случае нейтральных токов ( l l ' e, или l , l ' – электрически нейтральные) процесс ГНР определяется однофотонным обменом, если переданные импульсы не очень велики, а именно, много меньше массы промежуточного Z 0 -бозона. Однако, например, электрон-позитронный коллайдер HERA (DESY, Гамбург) позволяет исследовать столкновения встречных пучков протонов и электронов с энергиями 820 и 30 ГэВ соответственно. В данном случае энергия столкновения в с.ц.м. составляет около 314 ГэВ, что соответствует энергии электронного пучка E 50 ТэВ для экспериментальной схемы с фиксированной мишенью, при этом достижимые значения переданного импульса сопоставимы с массой промежуточных бозонов. Поэтому при высоких энергиях необходимо также учитывать обмен нейтральным промежуточным Z 0 -бозоном. Обмен заряженными промежуточными W -бозонами соответствует заряженным токам: l l N X или N l l X . В общем случае схема-
1
При исследовании, как теоретическом, так и экспериментальном, ГНР в качестве мишени для подавляющего большинства случаев рассматривается именно нуклон. Поэтому когда говорят о ГНР общего вида подразумевается, тем не менее, как правило, лептон-нуклонное рассеяние.
21
тическое изображение и соответствующие кинематические величины для lN -рассеяния представлены на рис. 1.1. 1.1. Кинематика лептон-нуклонного ГНР В соответствии с рис. 1.1. лептон характеризуется начальным, k E , k , и конечным, k ' E ', k ' , четырехмерными импульса ми, нуклон – начальным p E N , p 4-импульсом, – угол рассеяния лептона.
Рис. 1.1. Схематическое изображение и кинематические переменные для глубоко неупругого лептон-нуклонного рассеяния при обмене промежуточным бозоном в лабораторной системе отсчета
Кинематика глубоко неупругого рассеяния описывается следующими параметрами: q k k ' – переданный 4-импульс при обмене виртуальным промежуточным бозоном; mN – масса нуклона; ml l ' – масса начального (конечного) лептона; Q 2 q 2 2 EE ' k k ' ml2 ml2' 0 – квадрат 4-импульса, пе-
редаваемого промежуточным бозоном; Q 2 4 EE 'sin 2 при
22
EE 'sin 2 ml2 , ml2' , где – угол рассеяния лептона в системе покоя нуклона-мишени относительно направления лептонного пучка; 2
S p k 2 pk mN2 ml2 – квадрат энергии лептон-нуклон-
ного столкновения, при ml mN – справедливо S 2 pk mN2 ; 2
M X2 PX2 p q – квадрат инвариантной массы системы адронов в конечном состоянии1; pq mN Q 2 M X2 mN2 2mN ; смысл данного параметра
наиболее прозрачен в лабораторной системе, в которой справедливо E ' E – переданная энергия2. Процесс, изображенный на рис. 1.1 соответствует ГНР, если 2 M X mN2 (условие неупругости) и Q 2 mN2 (условие «глубины», то есть зондирования структуры адрона-мишени на малых линейных масштабах). Дополнительно учитывая, что ml l ' mN при l l ' , e, , массы лептонов в начальном и конечном состояниях, как правило, считают пренебрежимо малыми, то есть при описании ГНР используется приближение безмассовых лептонов. Процесс ГНР удобно описывать с помощью следующих масштабно-инвариантных переменных: Q2 Q2 Q2 x 2 переменная Бьеркена, 2 pq 2mN Q M X2 mN2 (1.2) pq Q 2 M X2 mN2 y . pk E S mN2
Вследствие того, что M X2 mN2 , область значений переменной Бьеркена – 0 x 1, причем упругому рассеянию соответствует x 1. Учитывая, что S M X2 , область значений масштабноинвариантной переменной y соответствует 0 y 1. Распределе1
Данная переменная может интерпретироваться также как квадрат энергии для системы «промежуточный бозон - нуклон». 2 Другими словами, в системе покоя нуклона-мишени данный параметр соответствует энергии промежуточного бозона.
23
ние по переменной y отражает спиновую структуру процесса взаимодействия. Параметр (или соответствующая безразмерная переменная y ) характеризует степень неупругости взаимодействия и иногда называется, соответственно, «неупругость». Важно отметить, что глубоко неупругим называется кинематический режим, при котором выполнены следующие условия: 1) mN и Q 2 mN2 ; 2) бьеркеновская переменная x фиксирована и имеет конечную величину. При данном кинематическом режиме можно благополучно пренебречь массой нуклона по отношению к другим (большим) характерным параметрам, описывающим процесс взаимодействия. Справедливы следующие соотношения: Q 2 2mN Exy , xy Q 2 S mN2 , при S 2 pk mN2 можно использовать xy Q 2 S . Дж. Бьеркеном было предложено рассматривать предельный случай 2 Q , , x const, называемый бьеркеновским пределом. На рис 1.2 представлены различные кинематические области ГНР. Основное внимание в данной главе будет сосредоточено на процессах с большими Q 2 , которые соответствуют высокой виртуальности промежуточного бозона и описываются DGLAP уравнением Докшитцера – Грибова – Липатова – Альтарелли – Паризи (DGLAP), более подробно рассмотренного ниже. Процессы с малыми x , соответствующие пределу высоких энергий, описываются уравнениями Балицкого – Фадина – Кураева – Липатова (BFKL). Важно отметить, что величина Q 2 определяет жесткость взаимодействия, то есть разрешающую способность взаимодействия для пространственно-временной структуры мишени. Промежуточный бозон выступает в роли «зонда», дающего возможность исследовать структуру мишени с пространственной разрешающей способностью L 1 Q 0,197 Q фм, где Q берется в гигаэлектронвольтах [18].
24
Рис. 1.2. Кинематические области для лептон-нуклонного рассеяния в плоскости переменных ,Q - (а) и переменных x , Q - (б)
25
1.2. Сечение ГНР Дифференциальное сечение для инклюзивного lp l ' X может быть записано в следующем виде [18]: 1 d 3k ' 1 1 d 3 PX d J 2 3 2 E ' 2 sl ,sl ' 2 sN X 2 3 2 PX0 2
4
процесса
(1.3)
4
M 2 p k k ' PX . Поток для входящих частиц в приближении безмассовых лептонов определяется как J 4 pk , что соответствует J 4mN E в системе покоя нуклона-мишени. Суммирование выполняется по всем ненаблюдаемым конечным адронным состояниям X , каждое из котоnX рых содержит n X частиц, соответственно, PX pi . Учитывая, i 1
что рассматривается неполяризованное ГНР, в (1.3) выполнено усреднение по спинам начальных частиц sl , sN и суммирование по спиновым состояниям конечного лептона sl ' . Дальнейшая качественная схема вычисления сечения состоит в следующем: 1) квадрат амплитуды может быть представлен в виде произведения лептонной l и адронной w части; 2) в рассмотрение вводятся лептонный L и адронный W тензоры и сечение оказывается пропорционально произведению данных тензоров; 3) в то время как лептонный тензор является полностью определенным, тензор W , описывающий внутреннюю структуру адрона (нуклона), определяется динамикой сильных взаимодействий в непертурбативной области; 4) адронный тензор и сечение ГНР выражаются через некоторые зависящие от кинематических переменных функции, называемые структурными и определяемые из эксперимента. Определение 1.2. Структурной функцией в квантовой теории поля и при описании, в частности, ГНР называется функция (инва-
26
риантных) импульсных переменных, определяющих неупругое взаимодействие -кванта или W -, Z 0 -бозонов с адронами [19]. Выражение (1.3) и представленная схема носят общий характер. Конкретные реализации схемы вычислений и конечные формулы зависят от типа рассматриваемого взаимодействия1. Рассмотрим подробно ГНР при обмене фотоном. Квадрат амплитуды в (1.3) имеет для данного случая следующий вид: 2
*
4
M эл e q ul ' k ', sl ' ul k , sl ul ' k ', sl ' ul k , sl X J эл 0 P, sN
*
2
(1.4)
эл X J эл 0 P, s N 4 q 2 lэл w ,
где e 2 4 – постоянная тонкой структуры. Лептонный и адронный тензоры вводятся следующим образом: * 1 1 lэл ul ' k ', sl ' ul k , sl ul ' k ', sl ' ul k , sl , 2 sl , sl ' 2 sl , sl ' 1 d 3 PX 1 4 эл эл (1.5) W w 2 4 p q PX 3 0 8 mN sN X 2 2 PX 8 mN d 3 PX P, sN J эл 0 X X Jэл 0 P, sN 2 4 p q PX . 0 2 PX sN X
L эл
Для лептонного тензора (в пренебрежении массой лептона) 2 справедливо: L 2 , где g , , 0 3 – эл 2 k k ' k k ' q g метрический тензор. Учитывая следующую интегральную форму представления функции:
2
4
4 x d 4 ze ixz , трансляционное свойство тока
eizq P, sN J эл 0 X P, sN J эл z X
ронного состояния
X
и свойство полноты для ад-
X 1, для адронного тензора справед-
X
ливо следующее выражение общего вида: 1
Учитывая, что нейтрино обладает определенной спиральностью, в формуле (1.3) для ГНР за счет слабых токов не проводится усреднение по спину нейтрино, соответственно, один из множителей 1 2 будет исключен.
27
1 d 4 ze iqz N J † z J 0 N , (1.6) 4 mN где усреднение по спинам учтено в нуклонном (адронном) состоянии N , J † – эрмитово сопряженный ток1. Важно отметить, что W
представленные рассуждения и, соответственно, выражение (1.6) не зависят от конкретного вида взаимодействия и носят общий характер, поэтому индекс типа взаимодействия в (1.6) отсутствует. Таким образом, адронный тензор может рассматриваться как фурье-образ коррелятора двух векторных токов (электромагнитных или слабых) J x в адроном состоянии с 4-импульсом p [4]. Тогда, в системе покоя нуклона-мишени дифференциальное сечение будет иметь вид d 2 эл 2 E ' 4 Lэл k , q, S Wэл p, q, S , (1.7) d dE ' q E где d d cos d – телесный угол, определяющий направление вылета лептона в конечном состоянии. Адронный тензор Wэл является лоренцевым тензором второго ранга, зависящим от 4-импульсов p и q. Лептонный тензор является симметричным в данном случае. Поэтому тензор Wэл должен содержать только симметричные члены. Из закона сохранения тока J эл 0 следует, что справедливо q Wэл q Wэл 0. С учетом вышеизложенного адронный тензор Wэл при усреднении по спинам может быть записан в виде симметричного ковариантного разложения общего вида: Wэл g W1эл 1 mN2 p pW2эл q qW4эл p q p q W5эл . Здесь Wi эл , i 1,2,4,5 – лоренцовские скаляры. В данной формуле отсутствует член W3 , который стандартно обозначает член адронного тензора, ответственный за нарушение пространственной чет1
Как известно, в случае электромагнитного взаимодействия для токов справедливо J † J .
28
ности в слабом взаимодействии (см. ниже). Можно показать, что для указанного разложения справедлива следующая форма1: q q W эл pq pq Wэл p, q W1эл g 2 22 p 2 q p 2 q . q mN q q Величины W1эл и W2эл называются адронными структурными функциями2. Данные функции будут зависеть только от скалярных (инвариантных) кинематических переменных, находящихся в адронной части диаграммы взаимодействия. Такими скалярами являются Q 2 и инвариантная масса конечного адронного состояния, которая, в свою очередь, является функцией M X2 M X2 , Q 2 . Таким образом, структурные функции зависят от двух кинематических инвариантных переменных Wi эл Wi эл , Q 2 , i 1,2. В случае электромагнитного взаимодействия сечение неполяризованного ГНР может быть выражено через структурные функции следующим образом: d 2 эл 4 2 E ' 2 эл 2 эл 2 (1.8) 2W1 sin W2 cos . 4 d dE ' Q 2 2 Видно, что в случае неполяризованного рассеяния сечение ГНР зависит только от угла рассеяния и не зависит от азимутального угла , по которому может быть выполнено интегрирование. Обычно вводятся безразмерные адронные (нуклонные) структурные функции следующего вида: mNW1эл , Q 2 F1 x , Q 2 , W2эл , Q 2 F2 x , Q 2 . (1.9) Тогда сечение глубоко неупругого рассеяния неполяризованного заряженного лептона при обмене виртуальным фотоном в рамках приближения Борна и в пренебрежении массой лептона можно записать следующим образом: 1
В случае учета спина частиц, например, при рассеянии поляризованных пучков выражение для адронного тензора будет существенно сложнее [20]. 2 Иногда в литературе данные величины называют неупругими формфакторами, в отличие от упругих формфакторов, используемых для описания, соответственно, упругого рассеяния.
29
d 2 эл 4 2 1 2 m xy F1 x , Q 2 1 y xy N F2 x, Q 2 . (1.10) 2 4 dQ dx Q x 2E Для удобства читателя ниже приводится ряд наиболее важных выражений для сечения ГНР в различных кинематических перемен-
ных. Учитывая что dQ 2dx dQ 2 dy dxdy xSdxdy , 2
d эл S 4 2 4 dxdy Q
mN 2 2 2 xy F1 x, Q 1 y xy 2 E F2 x , Q 2 2 m 2 xy F1 x, Q 2 1 y xy N F2 x , Q 2 . 2 2 mN Ex y 2E Учитывая определение глубоко неупругого кинематического режима и, в частности, условие Q 2 mN2 , данные формулы могут быть преобразованы к более компактному виду: d 2 эл 4 2 1 xy 2 F1 x , Q 2 1 y F2 x, Q 2 , 2 4 dQ dx Q x (1.11) d 2 эл 2 S 2 2 2 4 4 xy F1 x, Q 1 y F2 x , Q . dxdy Q На основании оптической теоремы можно получить следующую полезную взаимосвязь полного сечения поглощения виртуального фотона и структурными функциями [18]: 2 * 4 2 *N tot F2 x, Q 2 , L ,TN x , Q 2 FL,T x, Q 2 . (1.12) x, Q 2 4 4 4 Q Q *
N Здесь tot x, Q 2 – полное сечение виртуального фотопоглощения, *
L ,TN x , Q 2 – полное сечение поглощения продольно (поперечно) поляризованного виртуального фотона, FL F2 2 xF1 , FT 2 xF1 – продольная и поперечная структурные функции. Необходимо отметить, что приведенные выражения (1.10), (1.11) для сечения ГНР справедливы только при электромагнитном взаимодействии, сохраняющем пространственную четность P . Действуя согласно общей схеме для ГНР, в случае слабого взаимодействия с заряженными токами, например, для процессов рас-
30
сеяния лептонов N l X , l N X , а также для соответствую l X , l N X , можно пощих процессов для антилептонов vN лучить следующие результаты [20]. В случае эффективного (точечного) четырехфермионного взаимодействия квадрат амплитуды в (1.3) имеет вид *
2
M сл GF2 2 ul ' k ', sl ' 1 5 ul k , sl ul ' k ', sl ' 1 5 ul k , sl X J сл 0 P, s N
*
(1.13)
сл X J сл 0 P, s N GF2 2 lсл w ,
где GF – постоянная Ферми. Лептонный и адронный тензоры для
l N -рассеяния имеют следующий вид [21]: L k ' k , сл 8 k k ' k k ' g kk ' i
Wсл gW1сл 1 mN2 p pW2сл i p q W3сл q qW4сл p q p q W5сл i p q p q W6сл ,
где – абсолютно антисимметричный тензор1. Для случая
l N -рассеяния выражение для адронного тензора получается аналогично с учетом V-A структуры слабого взаимодействия и замены соответствующих токов на эрмитово сопряженные в (1.6). Важно отметить, что в пределе безмассовых лептонов структурные функции Wi сл , i 4 6 не дают вклад в сечение процесса. Сечение
l N l N -рассеяния для слабого взаимодействия имеет следующий вид: N
d 2 сл GF2 E '2 сл сл E E ' sin 2 W2сл cos 2 . (1.14) d dE ' 2 2 2W1 W3 mN 2 2 N Для слабого взаимодействия аналогично вводятся безразмерные адронные структурные функции: сл mNW1сл , Q 2 F1сл x, Q 2 , W2,3 , Q 2 F2,3сл x, Q 2 . (1.15)
1
Видно, что в отличие от электромагнитного взаимодействия, в данном случае лептонный и адронный тензоры являются антисимметричными.
31
Таким образом, в данном случае вводится структурная функция F3 x , Q 2 , которая определяет корреляцию аксиального и векторного токов [19]. Данная структурная функция отлична от нуля только для процессов слабого взаимодействия и соответствует нарушению пространственной четности. Сечение глубоко неупругого l N l N -рассеяния в рамках четырехфермионного приближения для заряженных токов имеет следующий вид: l N d 2 сл G 2 m2 F xy 2 F1 x , Q 2 1 y x 2 y 2 N2 2 Q dQ dx l N 2 x (1.16) 2 y F2 x , Q 2 y xF3 x, Q 2 . 2 Учитывая, что dQ 2 2mN Exdy и условия глубоко неупругого кинематического режима, выражение (1.16) можно записать в более общем виде, справедливом для ГНР как с заряженными, так и с нейтральными слабыми токами: lN
d 2 сл dxdy lN
(1.17) 2 y 2 A xy F1 x , Q 2 1 y F2 x, Q 2 y xF3 x, Q 2 , 2 где коэффициент пропорциональности A зависит от области значений рассматриваемых энергий (переданных импульсов). В области Q 2 M W2 ,Z , когда слабое взаимодействие достаточно хорошо описывается в рамках точечного 4-фермионного приближения, справедливо A GF2 mN E . Видно, что полное сечение рассеяния линейно растет с энергией. Такое поведение типично также для рассеяния (анти)нейтрино на точечном заряженном лептоне. Важно отметить, что экспериментальное наблюдение аналогичного поведения в ГНР служит дополнительным подтверждением существования точечноподобных составляющих нуклона. При высоких энергиях и Q 2 M W2 ,Z процесс ГНР описывается, как было указано
32
выше, в рамках электрослабой теории и необходимо учитывать обмен виртуальным W Z 0 -бозоном между лептоном и нуклоном при рассеянии с заряженными / нейтральными токами (CC/NC). В общую формулу для дифференциального сечения (1.17) будут входить структурные функции для заряженных, F CC , или нейтральных, F NC , токов. В рамках электрослабой теории обмен только W Z 0 -бозоном возможен для реакций с заряженными токами или для реакций вида N X соответственно. Тогда, с учетом обмена только массивными калибровочными бозонами, справедливо 2 2 2 GF2 1 1 Q M W CC, A S 2 2 1 Q 2 M 2 2 NC, z где M W – масса W -бозона, M Z M W cos W – масса промежуточного Z 0 -бозона, GF2 M W4
2
2sin , 4
W
W
– угол Вайнбер-
га теории электрослабого взаимодействия. В первом случае справедливо Fi CC FiW , i 1 3, структурные функции будут обозначаться FiW и описывать взаимодействие заряженного промежуточного бозона с мишенью, во втором случае – Fi NC Fi Z , i 1 3 и данные структурные функции описывают поглощение Z 0 -бозона нуклоном-мишенью. Однако для реакций l N l X возникает более сложная ситуация. В рамках электрослабой теории при высоких энергиях для указанных процессов глубоко неупругого рассеяния с нейтральными токами необходимо учитывать как обмен фотоном, так и обмен нейтральным промежуточным Z 0 -бозоном. В выражении (1.17) A 4 2 S Q 4 и структурные функции для ГНР с нейтральными токами Fi NC , i 1 3 в (1.17) будут определяться следующим образом [21]:
F NC 12
l l
2
2
F12 gVl g Al Z F12Z gVl g Al 2 gVl g lA Z F1Z2 ,
33
NC l 3 l
F
2
gVl g Al Z F3 Z 2 gVl g Al gVl g Al Z F3Z ,
где 1 – спиральность начального (анти)лептона, g lA 1 2, 1 GF Q 2 gVl 2e sin 2 W , 1, Z , Z 2Z . 2 2 2 1 Q 2 M Z2
полнительные структурные функции
Fi Z , i 1 3
До-
возникают
0
вследствие Z интерференции в электрослабой теории. В данном случае возникают дополнительные важные особенности. Вследствие нарушения P -четности в слабых взаимодействиях, сечение будет различно для правых и левых лептонов даже в случае неполяризованной мишени. Для ГНР с участием левого / правого L R заряженного лептона с нейтральными токами в соответствующем кинематическом режиме справедливо: L 2 d 2 NC Q2 4 2 S 2 2 2 xy F1 x, Q 1 y F2 x, Q 2 2 Q 4 dxdy R Q Z al 2 Z y2 Z 2 Z 2 2 l xy F1 x, Q 1 y F2 x, Q y xF3 x, Q sin 2W 2 al 2 Z y2 Z 2 Z 2 2 l xy F x , Q 1 y F x , Q y 1 2 xF3 x , Q , 2 sin 2W где l 1 4sin 2 W 2sin 2W , al 1 2sin 2W , l e, , . В физике для обозначения отсутствия зависимости от какоголибо масштабного параметра ( Q 2 , массы или длины) используется термин «масштабная инвариантность» или «скейлинг». Определение 1.3. Гипотеза бьеркеновского скейлинга состоит в утверждении, что в пределе больших Q 2 при фиксированном x величины Fi x , Q 2 , i 1 3 являются функциями только переменной x. Таким образом, lim Fi x, Q 2 Fi x , i 1 3. 2 Q x фикс.
34
(1.18)
В рамках данной гипотезы безразмерные структурные функции становятся независимыми от какого-либо масштабного параметра. Величины Fi x , i 1 3 часто называют скейлинговыми (структурными) функциями [22]. Явление зависимости структурных функций только от одной переменной x получило, соответственно, название «бьеркеновский скейлинг». Данное явление не является уникальным в физике высоких энергий. Для адрон-адронных взаимодействий хорошо известны «фейнмановский скейлинг» и «KNO-скейлинг». Ранние экспериментальные данные согласовались с бьеркеновским скейленгом, как это видно из рис. 1.3.
Рис. 1.3. Ранние экспериментальные данные для структурной функции W2 при указанном значении x, полученные для ep -рассеяния на SLAC ( W2 F2 в бьеркеновском пределе) [10]
§2. Партонная модель Физическая интерпретация бьеркеновского скейлинга дается в рамках партонной модели [23], которая является субъядерным вариантом обычного импульсного приближения в теории высоко-
35
энергетического рассеяния составных частиц со слабосвязанными составляющими [22]. Процесс лептон-нуклонного ГНР рассматривается как некогерентное упругое рассеяние на точечноподобных объектах, составляющих нуклон и названных партонами1 (рис. 1.4).
а)
б)
Рис. 1.4. Лептон-нуклонное ГНР в рамках партонной модели (а). Элементарный процесс лептон-партонного рассеяния (б)
Для более удобной интерпретации результатов эксперимента на основе партонной модели рассматривается некоторая выделенная система отсчета, называемая брейтовской. Брейтовская система определяется требованием, что лептон имеет одинаковую энергию в начальном и конечном состоянии, то есть виртуальный фотон переносит только трехмерный импульс, но не энергию2. В данной системе отсчета PB Q 2 x – модуль 3-импульса нуклона. Далее, система Брейта может быть выбрана таким образом, что 3-импульс 1
Как известно, заряженные партоны с полуцелым спином отождествляются с кварками, которые впервые были введены для расчета спектроскопических свойств адронов. В литературе термин «партон» употребляется в качестве общего названия структурных составляющих адрона, например, в рамках КХД партонами называют кварки и глюоны. 2 Это означает, в частности, что 4-импульс фотона является пространственно-подобным.
36
начального лептона и нуклона будут антипараллельны. Таким образом, в указанной системе отсчета для 4-импульсов нуклона и фотона можно записать: pB
PB2 mN2 ,0,0, PB ; qB 0,0,0, Q .
В бьеркеновском пределе, когда Q 2 mN и x – конечен, выполняется условие PB Q 2 x и, таким образом, нуклон является быстродвижущимся1. Существенным достоинством системы бесконечного импульса является то, что она позволяет интерпрети ровать трехмерный вектор передачи импульса Q как разрешающую способность (длину волны) частицы, зондирующей структуру нуклона, то есть как некоторый масштабный параметр. В данном случае 4-импульс нуклона можно представить как некогерентную сумму импульсов параллельного потока партонов, импульс каждого из которых равен xpB 0 x 1 . Таким образом, в рамках «наивной» кварк-партонной модели бьеркеновская переменная имеет достаточно простой смысл – это часть импульса нуклона, которую уносит партон, участвующий в процессе соударения. Данная интерпретация справедлива только в системе бесконечного импульса, когда массы партонов и их поперечные импульсы считаются пренебрежимо малыми. Условие некогерентности партонной системы с хорошей точностью выполняется в экспериментах при энергиях, достижимых на действующих ускорителях. В силу закона сохранения энергии виртуальный фотон может быть поглощен только партоном с 4-импульсом, равным Q 2. После поглощения будет меняться только направление, но не модуль вектора импульса партона. Время взаимодействия между фотоном и партоном может быть определено как время перекрытия между партоном и полем фотона tin 2m p Q 2 , где m p – эффективная масса партона. Время жизни партона может быть оценено следующим образом: t p Q m 2p tin . Следовательно, при больших Q 2 действительно можно рассматривать партоны как (квази)свободные и пренебречь возможными 1
В литературе выбранную указанным способом систему отсчета часто называют системой бесконечного импульса.
37
взаимодействиями виртуального фотона (промежуточного бозона) с другими партонами [24]. Таким образом, в рамках партонной модели делаются следующие основные физические предположения: 1) партоны двигаются приблизительно в том же направлении, что и нуклон; 2) реакция лептон-нулонного рассеяния описывается (в импульсном приближении) рассеянием точечного лептона на отдельном точечном партоне и берется некогерентная сумма всех вкладов элементарных рассеяний; 3) партоны двигаются квазисвободно внутри нуклона и взаимодействиями между партонами можно пренебречь, по крайне мере, в течение времени лептон-партонного рассеяния; 4) фрагментация в конечные адронные состояния происходит в течение такого относительно большого промежутка времени, что влияние данного процесса можно не учитывать при вычислении сечения ГНР. В рамках электрослабой теории взаимодействие калибровочных бозонов с кварками данного аромата i i u, d , s, c, b, t является суперпозицией векторного и аксиально-векторного взаимодействий, характеризуемых параметрами i и ai соответственно. Структурные функции нуклона можно представить в виде линейной комбинации функций распределения кварков qi x , которые являются плотностями вероятности распределения кварков данного типа в нуклоне по переменной x. Для невзаимодействующих партонов («наивная» кварк-партонная модель) в рамках гипотезы бьеркеновского скейлинга справедливы следующие формулы для адронных структурных функций [24]: 1 F1 x qi x qi x i2 ai2 , 2 i F2 x x qi x qi x i2 ai2 ,
(1.19)
i
F3 x 2 qi x qi x i ai , i
где индексы i пробегают по всем ароматам кварков и антикварков, участие которых во взаимодействии допускается законами сохра-
38
нения. Для простейшего случая электромагнитного взаимодействия i : ai 0, i ei , где ei – заряд кварка данного аромата. Для заряженных токов – i : ai i 1 для кварков и i : ai i 1 для антикварков. В случае взаимодействия с нейтральными токами, соответствующих обмену Z 0 -бозоном, значения параметров определяются как i : ai T3i , i T3i 2ei sin 2 W , где T3i – третья компонента слабого изоспина (анти)кварка данного аромата. Как было отмечено выше, в случае нейтральных токов необходимо учитывать играющую важную роль интерференцию между нейтральными калибровочными бозонами. Из (1.19) видно, что F2 x 2 xF1 x . Данное соотношение называется соотношением Калана – Гросса [25, 26], справедливость которого обусловлена тем фактом, что партоны-кварки имеют спин 1 2. Необходимо отметить, что данное соотношение выполняется только в системе бесконечного импульса. Нарушение соотношения Калана – Гросса при конечных энергиях выражается путем введения модифицированной продольной структурной функции 4m 2 FLm x F2 x 1 x 2 2N 2 xF1 x , Q которая, в свою очередь, связана с отношением сечений поглощения для продольно- и поперечно-поляризованных виртуальных фо*
*
тонов: R L N T N FLm FT . Универсальные партонные распределения (1.19) используются для вычисления сечений ГНР с различными частицами. Учитывая физические предположения партонной модели о некогерентном характере взаимодействий и физический смысл кварковых функций распределения, дифференциальное сечение ГНР (рис. 1.4,а) в рамках партонной модели можно записать в следующей факторизованной форме [18]: d d qi qi d x , (1.20) i
39
где d – сечение элементарного подпроцесса lq q l ' q q (см. рис. 1.4,б). Учитывая закон сохранения энергии-импульса (1.20) можно переписать в виде d d d d qi qi x qi x qi x . dxdy dy dy i i Предполагая наличие групп симметрий по типам-ароматам кварков SU f 3 или SU f 4 , можно получить обширный набор
дополнительных соотношений и правил сумм. Экспериментальная проверка данных соотношений, в свою очередь, может служить в качестве теста симметрий теории сильных взаимодействий. Детальное обсуждение данных вопросов выходит за рамки данной книги, более подробное рассмотрение можно найти в [18, 22, 27]. Более поздние и обширные экспериментальные данные показали, что при конечных Q 2 имеется слабая Q -зависимость структурных функций. Мировые данные различных экспериментов для структурной функции протона F2p x , Q 2 и дейтрона F2p x , Q 2 представлены на рис. 1.5 и рис. 1.6 соответственно. Видно, что Q зависимость особенно сильно проявляет себя при малых x. Данные результаты означают, что скейлинг Бьеркена выполняется в природе не строго. Необходимо отметить, что наблюденная Q зависимость является малым эффектом. Это означает, что в случае гипотезы Бьеркена масштабная инвариантность оказывается (незначительно) нарушена. Таким образом, приближение «наивной» кварк-партонной модели, позволяющее получать структурные функции на основе кварковых распределений, должно быть дополнено и изменено для учета таких динамических эффектов как нарушения масштабной инвариантности, соотношения Калана – Гросса и т.д. Развитие данной модели было выполнено в рамках КХД. §3. Структурные функции в КХД Как известно, в рамках КХД предполагается, что кварки связаны внутри нуклона посредством глюонов. Поэтому можно ожидать наличие квантовых флуктуаций, таких как испускание и поглоще-
40
Рис. 1.5. Структурная функция протона F2p x , Q 2 , измеренная в экспериментах на коллайдере HERA (H1 и ZEUS) и в экспериментах с фиксированной мишенью при рассеянии электронов (SLAC) и мюонов (BCDMS, E665, NMC). Данные показаны как функции Q 2 при фиксированных x. Некоторые точки немного смещены по Q 2 для наглядности. Используется разбиение на интервалы по x, принятое в эксперименте ZEUS, данные всех других экспериментов приведены в соответствии с разбиением по x для ZEUS. Представлены полные погрешности (сложенные квадратично статистические и систематические погрешности). Для наглядности значение F2p x , Q 2 умножено на 2 i , где i является номером интервала x в диапазоне от 1 x 0,85 до 28 x 6,3 10 5 [28]
41
Рис. 1.6. Структурная функция дейтрона F2d x , Q 2 , измеренная в экспериментах с фиксированной мишенью при рассеянии электронов (SLAC) и мюонов (BCDMS, E665, NMC), показана как функция Q 2 при фиксированных x. Представлены полные погрешности (сложенные квадратично статистические и систематические погрешности). Для наглядности значение F2d x , Q 2 умножено на 2 i , где i является номером интервала x в диапазоне от 1 x 0,85 до 29 x 9 10 4 [28]
42
ние глюонов, образование и аннигиляция qq пар. В зависимости от пространственной разрешающей способности зондирующей частицы и времени взаимодействия некоторые из этих флуктуаций могут проявляться, что будет приводить, соответственно, к изменению наблюдаемой партонной структуры адрона (рис. 1.7). Вследствие этого структурные функции приобретают Q 2 -зависимость. Важно отметить, что указанная зависимость является отличительной особенностью КХД и экспериментальное измерение Q 2 -зависимости структурных функций представляет собой проверку КХД на фундаментальном уровне. Нарушение соотношения Калана – Гросса также является следствием КХД-излучения. Вклад в нарушение скейлинга структурных функций могут давать непертурбативные эффекты КХД, например, рассеяние на когерентных партонных состояниях. Данные вклады убывают степенным образом с ростом Q 2 . Предположение безмассовости кварков не выполняется для тяжелых c, b, t -кварков. Излучение тяжелых кварков будет подвержено влиянию пороговых эффектов, которые могут быть существенны вплоть до больших Q 2 [24]. Поправки высших порядков, теоретическое понимание которых в настоящее время все еще достаточно ограничено, также оказывают влияние на поведение структурных функций в различных кинематических областях. Ниже в кратком виде представлены основы формализма, который необходим для анализа нарушений масштабной инвариантности структурных функций нуклона и обсуждения возможного фрактального характера данного явления. 3.1. Нарушение масштабной инвариантности в КХД В данном разделе, если специально не оговорено, рассматриваются только лидирующий (LO) или следующий к лидирующему (NLO) порядок ТВ пертурбативной теории. По аналогии с факторизованной формулой (1.20) партонной модели адронные структурные функции в общем случае можно записать как сумму партонных структурных функций, взвешенных с учетом партонных функций распределений qi qi x , то есть как сумму сверток:
43
а) Q 2 0,1 ГэВ2 – область «мягких» взаимодействий
б) Q 2 1 ГэВ2 – промежуточная область
в) Q 2 102 ГэВ2 – область «жестких» взаимодействий
Рис. 1.7. Схематическое изображение фотон-нуклонного рассеяния при увеличении виртуальности Q 2 фотона (промежуточного бозона) при фиксированном значении M X . При увеличении Q 2 фотон способен зондировать поперечные расстояния все меньших масштабов и, соответственно, способен «различать» дополнительные особенности структуры протона (б). При дальнейшем увеличении Q 2 (в) увеличивается число кварков и глюонов, которые способна «различать» зондирующая частица [24]
44
1 F j x d qi F jqi x qi Fjqi x , j 1 3. (1.21) i x qi qi Здесь F j – структурная функция кварка (антикварка) i -го аро-
мата. Для определенности ниже будет рассматриваться структурная функция F2 . Данный выбор обусловлен, в частности, тем, что значительный массив экспериментальных данных (см. ниже) полуq q чен именно для этой функции [28]. Структурная функция F2 i i является с точностью до постоянного множителя сечением фотопоглощения для * q q -рассеяния1. В рамках партонной модели данный процесс соответствует просто * q q q q (рис. 1.4,б и рис. 1.8,а) и элементарная структурная функция определяется как q q F2 i i z ei2 1 z . Подставляя данное выражение в (1.21), можно получать стандартную для партонной модели формулу (1.19) для структурной функции F2 x при учете только фотонного обмена. Рассмотренное выше приближение партонной модели соответствует, как было указано выше, невзаимодействующим кваркам, то есть лидирующему порядку s0 ТВ КХД. Однако в действительности кварки внутри адрона не являются свободными частицами. Они взаимодействуют посредством испускания / поглощения глюонов. Поэтому существуют процессы, дающие дополнительный вклад в сечение * q q -рассеяния. Данные процессы порядка s показаны на рис. 1.8,б-е и могут быть разделены на процессы с ис пусканием реальных глюонов ( t -канал – рис. 1.8,б, s -канал – рис. 1.8,в) и на процессы с эмиссией виртуальных глюонов – радиационные поправки (поправка к вершинной функции – рис. 1.8,г, поправки к собственной энергии – рис. 1.8,д,е).
1
В данном разделе для простоты рассмотрение будет ограничено только фотон-кварковым рассеянием. Однако представленная схема справедлива и в более общем случае электрослабой теории.
45
Рис. 1.8. Диаграммы, дающие вклад в * q q -рассеяния в лидирующем порядке (а) и в следующем к лидирующему порядке (б-е) ТВ КХД [18]
Рассмотрим вначале диаграммы, соответствующие испусканию реальных глюонов. Данные диаграммы приводят к возникновению сингулярности двух типов [18]: а) коллинеарная сингулярность, возникающая вследствие диа граммы для t -канала (рис. 1.8,б) в пределе t 0, то есть когда глюон испускается параллельно кварку; б) сингулярность вследствие испускания мягких глюонов. Необходимо отметить, что сингулярность второго типа исключается при суммировании вкладов диаграмм с испусканием реальных и виртуальных глюонов. Таким образом, остается единственный тип сингулярности – коллинеарная. Важно отметить, что пре дел kT2 0 для поперечного импульса рассеянного кварка соответствует мягкой части (большие линейные масштабы) сильных взаимодействий, которая не может быть вычислена в рамках пертурбативной теории. Данная сингулярность может быть регуляризована с помощью установления нижнего граничного значения kT2 k02 для поперечного импульса рассеянного кварка. Диаmin граммы, показанные на рис. 1.8,б-е, дают вклад в F2qi qi вида
46
s 2 Q2 ei z Pqi qi z ln 2 hqi qi z , 2 k0 где Pqi qi z , hqi qi z – некоторые конечные функции [18, 27]. i :
Функция P z , которая называется функцией расщепления, представляет собой вероятность для партона испустить другой партон с долей импульса z первоначального партона и может быть представлены в виде ряда P z sm P m z . m
Таким образом, в NLO ТВ КХД элементарная структурная функция будет иметь следующий вид: Q2 F2qi qi x , Q 2 ei2 x 1 x s Pqi qi x ln 2 hqi qi x . (1.22) 2 k0 Видно, что в элементарной структурной функции возникает зависимость от масштабного фактора Q 2 и эта зависимость порядка s . Соответствующая данному порядку ТВ КХД функция распределения (анти)кварка определяется как Q2 qi qi x, Q 2 1 x s Pqi qi x ln 2 hqi qi x . (1.23) 2 k0 Учитывая полученную Q 2 - зависимость в элементарной структур0
ной функции и обозначая q q i x 1 x экспериментально не измеряемую «затравочную» или «голую» функцию распределения (анти)кварков, можно переписать (1.21) в следующем виде [18]: 1 x x F2 x, Q 2 ei2 x d qi0 F2qi , Q 2 qi0 F2qi , Q 2 i x 1 x Q2 x d 0 ei2 x qi0 x s qi Pqi ln 2 hqi (1.24) 2 x i k0 1 x Q2 d 0 x e2j x q j0 x s q j Pqi ln 2 hqi . 2 x j k0 Здесь многоточия обозначают вклад членов более высоких порядков. Таким образом, за рамками LO адронная структурная функция
47
зависит от двух переменных и возникает нарушение масштабной инвариантности. Данное нарушение слабо зависит от квадрата переданного импульса ln Q 2 , и поэтому обнаруживается на эксперименте только при достаточно высоких Q 2 . Видно, что в данном случае все сингулярности учитываются в функции распределения (анти)кварка. Конечная функция h z может быть произвольным образом разделена на две части h z h z h ' z . Важно отметить, что данное разделение зависит от схемы факторизации. Определение 1.4. Схема факторизации, при которой совместно с сингулярными членами весь дополнительный конечный вклад h z учитывается в функциях распределений (анти)кварков и при которой справедливо F2 x, Q 2 x ei2 qi x, Q 2 qi x, Q 2 при i
отсутствии конечных поправок, например, в следующем за лидирующим порядке (NLO) ТВ КХД O s , называется схемой глубоко неупругого рассеяния (ГНР-схемой). Определение 1.5. Схема факторизации, при которой совместно с сингулярными членами только некоторая (произвольная) часть дополнительного конечного вклада h z учитывается в функциях распределений (анти)кварков и при которой к формуле F2 x, Q 2 x ei2 qi x, Q 2 qi x, Q 2 имеются конечные поi правки, например, в NLO ТВ КХД O s , называется схемой минимальных вычитаний ( MS -схемой). Определение 1.6. Схема факторизации, при которой совместно с сингулярными членами только однозначно определенная часть дополнительного конечного вклада h z учитывается в функциях распределений (анти)кварков и при которой к формуле F2 x, Q 2 x ei2 qi x, Q 2 qi x, Q 2 имеются конечные поi
48
правки, например, в NLO ТВ КХД O s , называется схемой модифицированных минимальных вычитаний ( MS -схемой). Количественное определение данной схемы будет приведено ниже. В настоящее время ГНР- [29] и MS -схема [30] являются наиболее широко используемыми схемами факторизации. Для удобства и без потери общности ниже будут рассматриваться только кварковые распределения и соответствующие индексы будут опущены, в качестве схемы факторизации рассматриваются схемы с вычитаниями. Возможна также другая схема учета сингулярностей в кварковых функциях распределений. Вводится масштаб факторизации 2 так, что расходящийся логарифм в (1.22) может быть записан как ln Q 2 k02 ln Q 2 2 ln 2 k02 .
Сингулярности, связанные с коллинеарным испусканием глюонов учитываются в «голом» кварковом распределении при масштабе факторизации 2 , который играет аналогичную роль, как и масштаб ренормализации. Ренормализованные функции распределения кварков по доли импульса адрона, учитывающие сингуляр ность ln 2 k 02 и произвольный конечный член h ' z , определя-
ются следующим образом [18]: 1 x 2 x s d 0 q ln 2 h ' (1.25) i P 2 x k0 и структурная функция (1.24) запишется как (кварковая часть) 1 x d F2 x, Q 2 ei2 x qi , 2 C , Q 2 , 2 , (1.26) i x
qi x, 2 qi0 x
где C x , Q 2 , 2 называются коэффициентными функциями и в NLO ТВ КХД определяются следующим образом [3]: Q2 C z, Q 2 , 2 1 z s P z ln 2 h z 2 Необходимо отметить, что существует более разумный способ учета инфракрасных и ультрафиолетовых расходимостей – размер-
49
ная регуляризация [18]. Если проводить вычисления не в обычном 4-мерном пространстве, а в 4 -размерном пространстве, где 0, то коллинеарные сингулярности будут проявлять себя как полюса вида 1 . Данные полюса могут быть включены в определение партонных распределений. Для того чтобы в новом пространстве 4 -измерений константа взаимодействия была также безразмерной, необходимо переопределить безразмерную константу сильного взаимодействия как g s g s R 2 . Данное преобразование приводит к возникновению нового масштаба – масштаба ренормализации R , который может быть отождествлен с масштабом факторизации R . Тогда формула (1.24) может быть записана как (кварковая часть) F2 x, Q 2 ei2 x i
(1.27) 1 x Q2 2 s d 0 x 0 qi x qi Pqi ln 2 hqi , 2 x где конечная функция h z имеет в данном случае следующую структуру: h z h z ln 4 P z , 0,5772... – постоянE
E
ная Эйлера. Учет следующего однозначно определенного члена 2 E ln 4 в перенормированной функции распределения
q x, 2 количественно определяет схему модифицированного минимального вычитания ( MS -схема). В рамках данной схемы факторизации справедливо (1.26), где коэффициентные функции определяются следующим образом [18]: C z , Q 2 , 2 C MS s Q2 P z ln h z E ln 4 P z 2 2 Видно, что представленное выше рассмотрение было ограничено кварк-антикварковыми степенями свободы. Учет глюнных степеней свободы несколько усложняет выражение для структурной 1 z
50
функции, приводит к следующей модификации полученного ранее выражения (1.26) [18]: F2 x, Q 2 (1.28) 2 q x 2 2 2 g x 2 2 qi , C , Q , g , C , Q , i x и возникновению зависимости структурной функции нуклона от глюонного распределения. Глюонные коэффициентные функции C g x , Q 2 , 2 возникают вследствие наличия диаграмм, описы1
ei2 x
d
вающих g -взаимодействия, и, следовательно, имеют наименьший порядок s , то есть в отличие от кварковых коэффициентных функций для глюонных функций справедливо: Q2 C g z, Q 2 , 2 s Pg z ln 2 hg z 2 Масштабно-зависимые кварковые распределения в данном случае имеют вид [18]: 1 x 2 d 0 x qi x, 2 qi0 x s qi Pqq ln 2 h ' q 2 x k0 (1.29) 1 x 2 x s d 0 g Pqg ln 2 h ' g 2 x k0 Видно, что коэффициентные функции зависят от схемы факторизации. Поэтому следует быть очень внимательным и использовать согласующиеся коэффициентные функции и функции расщепления. Явный вид коэффициентных функций для NLO ТВ КХД в рамках MS -схемы приведен в [27]. Вследствие того, что структурные функции являются физически наблюдаемыми и экспериментально измеримыми величинами, они не могут зависеть от нефизического масштабного параметра 2 . Дифференцирование выражения (1.23) по ln 2 приводит к уравнению, определяющему масштабную зависимость кварковых функций распределения [18]:
51
q x , 2
1
s dy x P q y , 2 . (1.30) ln 2 2 x y y Данное интегродифференциальное уравнение известно как уравнение Альтарелли – Паризи или DGLAP-уравнение [31]1. При рассмотрении структурных функций в рамках КХД необходимо различать кварковые распределения, которые являются синглетами, qiSI x, Q 2 , и несинглетами, qiNS x , Q 2 , в пространстве
ароматов кварков: qiNS x , Q 2 qi x, Q 2 qi x, Q 2 , qSI x, Q 2 qi x , Q 2 qi x, Q 2 .
(1.31)
i
Строго говоря, уравнение DGLAP в форме (1.25) справедливо только для несинглетных распределений, в общем случае данное уравнение является матричным уравнением размерности 2 N f 1 в пространстве кварков, антикварков и глюонов [18, 27]: x x Pqi q j , s Pqi g , s 1 qi x, t s t d q j , t , t g x , t 2 i , j x x x g , t Pgq j , s Pgg , s 2 2 где t ln Q . Таким образом, для синглетных, несинглетных кварковых и глюонной функций распределения можно записать следующую систему эволюционных уравнений: qiNS x, t s t 1 d x NS P qi , t , t 2 x x x (1.32) Pqq , s 2 N f Pqg , s SI q x, t s t d q , t . t g x, t 2 x x x g , t Pgq , s Pgg , s SI
1
1
Функция расщепления является, соответственно, эволюционным ядром для данного интегродифференциального уравнения.
52
Здесь N f – число кварковых ароматов. Необходимо отметить, что DGLAP-уравнение (1.31) является аналогом ренормгруппового уравнения для -функции, описывающей эволюцию константы
s 2 , и относится к наиболее важным уравнениям пКХД. Как было указано выше, для функций расщепления можно записать следующие разложения в виде степенных рядов [27]: 1 0 Pqi q j z, s ij Pqq z s Pqi qj z , 2 s 1 0 Pij z, s Pij z Pij z , ij qg , gq, gg. 2 В лидирующем порядке ТВ КХД для числа цветов N c 3 функции расщепления имеют вид: 4 1 x2 0 Pqq 2 1 x , 3 1 x 1 2 0 Pqg x 2 1 x , 2 2 4 1 1 x 0 Pgq (1.33) , 3 x 1 x N x 11 0 Pgg 6 x 1 x 1 x f 1 x . 1 x 12 x 3
Здесь «+»-распределение F x определяется таким образом, что выполняется равенство 1 1 x 1 1 x для 0 x 1 и для интеграла от произведения данного распределения и любого достаточно гладкого распределения f x справедливо следующее ра1
венство:
1
dxf x F x dx f x f 1F x . Для NLO ТВ 0
0
КХД подробное рассмотрение эволюционных уравнений и соответствующие выражения для функций расщепления представлены в [27].
53
Любая структурная функция может быть преобразована в линейную комбинацию структурных функций ароматового синглета и несинглета (см., например, [8]). Таким образом, представленное выше рассмотрение носит общий характер и применимо для адронных структурных функций любого типа. 3.2. Моменты функций распределений и аномальные размерности Для партонных функций распределений оказывается полезным, в том числе при изучении фрактальных свойств (см. ниже), определение моментов. Определение 1.7. Моментом n -го порядка партонной функции распределения p x, t , p qi qi , g называется функция 1
M
p
n, t dxx n 1 p x, t ,
(1.34)
0
представляющая собой преобразование Меллина исходной функции распределения. На основе моментов M np t исходное распределение в пространстве бьеркеновской переменной x может быть получено с помощью обратного преобразования Меллина: c i 1 p x, Q 2 dnx n M p n, t , 2 i c i где c выбирается таким образом, чтобы контур интегрирования лежал справа относительно всех сингулярностей подынтегрального выражения. Определение 1.8. Моменты функций расщепления называются аномальными размерностями 1
n, s dxx n 1 Pij x , s .
(1.35)
0
Использование моментов (1.34) и (1.35) позволяет получить альтернативную, более удобную в определенных случаях, формулировку уравнений эволюции. Вследствие того, что преобразование
54
Меллина свертки двух функций1 равно произведению преобразований Меллина данных функций, уравнения эволюции, выраженные в терминах моментов распределений, становятся алгебраическими. Например, в n - пространстве для моментов несинглетной, синглетной кварковой и глюонной функций распределения справедлива следующая система уравнений эволюции: M iNS n, t s t qq n, s M iNS n, t , t 2 (1.36) SI SI M i n, t s t qq n, s 2 N f qg n, s M i n, t . gg n, s M g n, t t M g n , t 2 gq n, s Из второго уравнения системы (1.36) видно, что в общем случае аномальная размерность представляет собой матрицу 2 2, связывающую кварковые и глюонные функции распределения. Однако в тех случаях, когда по квантовым числам участие глюонных партонов невозможно2 аномальная размерность является числовой функцией от s (первое уравнение данной системы). Учитывая соотно Q 2 s Q 2 ln Q02 2КХД шения t ln 2 , , в простейшем 2 2 2 КХД s Q0 ln Q КХД случае несинглетных кварковых функций распределения решение уравнения (1.36) имеет следующий вид: 2 M iNS n, t s Q M iNS n, t0 s Q02
dn
, dn
qq n, s . b
(1.37)
Здесь b 11N c 2 N f 3 16 2b, b – лидирующий коэффициент ренормогрупповой -функции. В лидирующем порядке ТВ КХД аномальные размерности определяются следующим образом (для N c 3 ) [18]:
1
В данном случае под сверткой двух функций понимается F1 x F2 . Это соответствует несинглетному каналу, зависящему от разности функций распределения кварков и антикварков, например, для функций распределения валентных кварков. 2
55
n 4 1 1 1 0 qq 2 , n 3 2 n n 1 k 2 k
1 2 n n 2 0 4 2 n n2 0 qg , n , gq n 2 n n 1 n 2 3 n n 2 1 n 1 1 1 1 N f 0 gg . n 6 12 n n 1 n 1 n 2 k 2 k 3 1
Необходимо отметить, что вследствие
dxx
n 2
1 n 1 полюс
0
функции расщепления при x 0 проявляется как полюс аномальной размерности при n 1. Подробно аномальные размерности обсуждаются, например, в [18, 22, 27]. В частности, вычисление значений аномальных размерностей предсказывает, что с ростом Q 2 партонные функции распределения логарифмически уменьшаются в области x 0, 2, и логарифмически возрастают в области x 0,2. Указанное поведение функций распределений действительно наблюдалось экспериментально (см. ниже). §4. Некоторые основные экспериментальные результаты К настоящему времени набран очень значительный объем экспериментальных данных по ГНР. Измерения структурных функций были выполнены в нескольких экспериментах на большой статистике. Более 35 лет исследований привели в результате к достаточно обширным и прецизионным знаниям внутренней структуры нуклона. С тех пор акцент исследований различных аспектов КХД с помощью ГНР стал постепенно смещаться с качественных проверок КХД на точное количественное определение распределений партонов в нуклоне и параметров теории (приложение 1). Кинематические области доступные для изучения как в ГНР, так и в других процессах при высоких энергиях представлены на рис. 1.9,а, 1.9,б соответственно. Эксперименты на коллайдерах (HERA, Тэватрон) позволили продвинуться в область очень больших Q 2 .
56
Рис. 1.9. Области в плоскости x , Q 2 , где были выполнены измерения структурных функций только в процессах ГНР (а) и совместно с экспериментами по адронным взаимодействиям (б) [24, 28]
57
Важно отметить, что именно в экспериментах по ГНР на HERA (H1, ZEUS, HERMES) удалось достичь как области очень больших переданных импульсов, так и области очень малых x. В частности, на HERA впервые оказалось возможным исследовать ГНР при очень малых x в (квази)пертурбативном режиме, то есть изучать область x 104 при Q 2 , превышающих несколько ГэВ2 . Цель КХД-анализа экспериментальных данных по ГНР для сечений или структурных функций заключается в определении партонных функций распределений. Как правило, это достигается с помощью параметризации последних при некотором масштабе Q02 1 2 ГэВ2 и дальнейшем использовании DGLAP-уравнений в NLO ТВ КХД для описания эволюции функций распределений. С одной стороны, функциональная форма функций распределений при начальном масштабе Q02 , то есть их x -зависимость, не может быть, пока, предсказана КХД, поэтому данная форма определяется на основе экспериментальных данных методом простого подбора. С другой стороны, как было показано выше, Q 2 -эволюция партонных функций распределений полностью определяется уравнениями эволюции. Таким образом, изучение Q 2 -зависимости функций распределений партонов является важным и подлинным тестом пКХД [18]. Результаты КХД-анализа экспериментальных данных по ГНР представлены на рис. 1.10 для протонной мишени и на рис. 1.11 для дейтериевой мишени. Видно, что точность данных высока и аппроксимация на основе КХД очень хорошо описывает экспериментальные результаты. Например, для протона КХД позволяет корректно предсказывать Q 2 -зависимость структурных функций при изменении квадрата переданного импульса. Поскольку экспериментальные данные SLAC сдвинуты в сторону низких значений до Q 2 1 ГэВ2 , то в ходе анализа удалось получить оценку для непертурбативных вкладов «высших твистов1» в наблюдаемое нарушение масштабной инвариантности при малых Q 2 [26]. 1
«Твист» оператора равен размерности минус спин [22].
58
Эффекты «высших твистов» возникают, в основном, вследствие взаимодействий в конечных состояниях на больших расстояниях, которые трудно рассчитывать в пертурбативной КХД. В настоящее время проблема остается нерешенной в общем случае, количественно оценить вклады «высших твистов» достаточно сложно и существуют лишь некоторые теоретические соображения относительно кинематической зависимости вклада «высших твистов», в частности то, что их можно разложить в ряд по параметру 1 Q 2 [33]. Это выражается следующим соотношением: C x F2 x, Q 2 F2LT x, Q 2 1 HT x, Q 2 F2LT x, Q 2 1 HT 2 , (1.38) Q
где структурная функция лидирующего «твиста» F2LT x, Q 2 соответствует DGLAP-уравнению. Такие поправки действительно видны в экспериментальных данных для структурных функций. На рис. 1.12 представлены аппроксимации данных экспериментов с фиксированной мишенью при учете только структурной функции лидирующего «твиста» и при учете вклада «высших твистов» в соответствии с (1.37). Видно, что в последнем случае наблюдается улучшение согласия теоретических кривых и экспериментальных данных. Качество аппроксимации лучше всего иллюстрируется в представлении «логарифмических наклонов», которые показывают d F2 x , Q 2 d ln Q 2 . Усредненные по диапазону Q 2 для x - интервала, логарифмические производные ведут себя так, как и предсказано DGLAP-уравнениями (рис. 1.13). В данном анализе член «высшего твиста» C HT x уравнения (1.37) аппроксимируется набором констант для каждого интервала по x. Оказалось, что эти постоянные коэффициенты близки к нулю для x 0,4, то есть пКХД может описывать нарушения масштабной инвариантности в этом диапазоне x до таких малых значений как Q 2 1 ГэВ2 [26]. На рис. 1.14 представлены экспериментальные данные и аппроксимации в области малых x. Наблюдается рост структурной функции протона, усиливающийся с ростом Q 2 , по мере продвижения в область малых x. Видно, что удается достичь разумного
59
Рис. 1.10. Экспериментальные данные для протонной структурной функции, полученные в различных экспериментах и соответствующие аппроксимации с учетом DGLAP-уравнения в рамках NLO ТВ КХД. Для наглядности к значению F2p x , Q 2 добавляется константа c x 0,6 i 0,4 , где i является номером интервала x в диапазоне от 1 x 0,65 до 24 x 2 105 [32]
60
Рис. 1.11. Структурная функция дейтрона (экспериментальные данные для наглядности умножаются на указанные постоянные множители). Экспериментальные данные получены для мюонного рассеяния в CERN и электронного рассеяния в SLAC. Сплошные линии соответствуют КХД-аппроксимации, учитывающей теоретически предсказанное нарушение масштабной инвариантности и использующей в качестве параметров фитирования константу сильного взаимодействия и глюонное распределение [10]
согласия теоретического описания и экспериментальных данных в широком диапазоне изменения Q 2 и x , причем, как и ожидалось по мере увеличения Q 2 улучшается согласие между КХД-кривыми и данными эксперимента. Таким образом, экспериментальные данные и усовершенствованный анализ КХД четко и однозначно определили справедливость DGLAP-уравнений для корректного описания поведения структурных функций, наблюдаемого в ГНР. Как было указано выше, на основе экспериментальных данных для адронных структурных функций можно определить кварковые и глюонную функции распределений. Известно, что глюоны не участвуют в электрослабом взаимодействии и, соответственно, их функции распределения не могут быть определены из ГНР. Но на основе изучения других процессов при высоких энергиях, таких
61
Рис. 1.12. КХД-аппроксимация функции F2 x , Q 2 как функции Q 2 для фиксированных x по данным SLAC и NA4/BCDMS . Пунктирная линия соответствует чисто пертурбативному случаю со структурной функцией лидирующего порядка F2LT x , Q 2 . Сплошная линия включает вклад «высших твистов» [26]
62
Рис. 1.13. Нарушение масштабной инвариантности в логарифмических производных, наблюденное на водороде и дейтроне в объединенных экспериментальных данных SLAC и NA4/BCDMS. Приведены только статистические погрешности. Сплошная линия – КХД-аппроксимация с s M Z2 0,113; пунктирные линии соответствуют s M Z2 0,010 [26]
как образование струй с большими поперечными импульсами, рождение прямых фотонов и тяжелых кварков, удалось получить информацию для g x, 2 в широком диапазоне изменения x. Однако необходимо отметить, что для используемых в данном случае процессов присутствуют значительные экспериментальные и теоретические неопределенности, что отражается на точности определения глюонной функции распределения. На рис. 1.15 представлены неполяризованные партонные функции распределений при различных масштабах факторизации [28]. Все глобальные анализы данных по ГНР выполняются на основе DGLAP-уравнения в NLO или NNLO (последние данные) ТВ КХД, но могут отличаться некоторыми важными деталями: выбором форм функций распределений при начальном масштабе Q02 , набо-
63
Рис. 1.14. Структурная функция протона F2p x , Q 2 для области преимущественно малых x и Q 2 , измеренная в электромагнитном рассеянии позитронов (ZEUS, H1), электронов (SLAC) и мюонов (BCDMS, NMC) на протонах. Штриховые линии соответствуют параметризации по модели Редже для малых Q 2 и получены в эксперименте ZEUS, сплошные линии – КХД-параметризации при более высоких Q 2 , выполненные в эксперименте H1. Некоторые точки незначительно смещены по x для наглядности [28]
64
ром экспериментальных данных, включенных в анализ, трактовкой экспериментальных погрешностей, схемами описания массивных кварков и так далее. Феноменологические неопределенности приводят к неопределенностям в функциях распределений как показано на рис. 1.15. Видно, что функции распределений валентных uV , dV -кварков известны с значительно более высокой точностью, чем для морских кварков или глюонов. Наблюдается существенное улучшение точности определения партонных функций распределений с ростом масштаба факторизации, то есть по мере продвижения в область больших передач импульсов и жестких процессов, где точность предсказаний ТВ КХД увеличивается и неопределенности играют все меньшую роль.
Рис. 1.15. Неполяризованные партонные функции распределения в виде xf x с соответствующими неопределенностями в следующем к следующему к лидирующему порядке (NNLO) ТВ КХД для параметризации MRST2006 [34] при различных масштабах факторизации [28]. Здесь f x uV , dV , u , d , s, c , b, g , где u d V – валентные кварки
§5. Фрактальность структурных функций в КХД Исследование геометрии некоторого объекта в обычном пространстве-времени осуществляется на основе изучения именно
65
структурных функций объекта при рассеянии на данном объекте каких-либо частиц, рассматриваемых a priori в качестве точечных. Как было отмечено выше, точное выполнение бьеркеновского скейлинга возникает, если можно использовать импульсное приближение и рассматривать процесс ГНР как некогерентную сумму рассеяний на свободных конституентах мишени. Данная картина имеет место в случае любой слабосвязанной системы, и рассеяние представляет собой зондирование структуры мишени виртуальными калибровочными бозонами. Из принципа неопределенности следует, что виртуальный бозон с массой
Q 2 позволяет исследовать внутреннюю структуру адро-
на-мишени на линейных масштабах 1 Q 2 . Соответственно, с увеличением массы виртуального бозона появляется возможность исследовать структуру на все меньших расстояниях. Таким образом, при увеличении неупругости процесса естественным образом возникают «структуры в структурах в структурах…», что соответствует фрактало-подобной природе мишени в некотором интервале масштабов1. При этом возможная фрактальная геометрия структуры частиц в обычном пространстве-времени носит динамический характер и непрерывно меняется. Такое представление материи в виде «структуры в структурах в структурах…», то есть в виде дискретных уровней, позволяет объяснить нарушение скейлинга при значениях Q 2 из некоторых конкретных интервалов (при достижении следующих уровней). Таким образом, в общем случае можно ожидать наблюдение чередования скейлингового поведения и его нарушения по мере перехода от одного уровня структуры материи к другому2. На границах, разделяющих эти уровни, где происходит 1
Как было отмечено в [1], естественные фрактало-подобные объекты проявляют свойства истинных (математических) фракталов в ограниченном диапазоне изменения масштаба. В неодушевленной природе концы данного диапазона могут различаться примерно в 104 раз, в биологических примерах – примерно в 102 раз. 2 В настоящее время применительно к ГНР можно говорить только о двух уровнях материи: адронном и партонном. Как известно, пока внутренняя структура кварков не обнаружена.
66
нарушение скейлинга, структурные функции будут изменяться в зависимости от Q 2 и перераспределяться в сторону области, соответствующей меньшим значениям масштабной переменной x , так как каждая составляющая будет нести все меньшую долю импульса мишени. В соответствии с указанными представлениями партонной модели следствия КХД можно интерпретировать в терминах адронов, имеющих непрерывный набор составляющих слоев [22]. По мере увеличения Q 2 и все более глубокого проникновения в одетый кварк будет обнаруживаться все большее число виртуальных кварков и глюонов, и валентные кварки будут все большую часть первоначального импульса нуклона отдавать глюонам и морским кваркам. При ультравысоких виртуальностях и, соответственно, на ультрамалых расстояниях структурная функция будет приближаться к -функции, сосредоточенной в точке x 0 : lim F2 x , Q 2 x . 2 Q
Важно отметить, что зависимость количественных значений физических наблюдаемых от масштаба, на котором выполнено наблюдение, является достаточно широко распространенной в квантовой физике. В качестве примера зависимости от масштаба наблюдения можно привести фундаментальную зависимость значения константы взаимодействия КХД от переданного импульса Q 2 (см., например, [1] и приложение 1). Описанная выше слабая Q -зависимость структурных функций может быть вычислена в рамках более формального подхода пертурбативной КХД, использующего уравнение ренормализационной группы и операторное разложение [22]. При исследовании возможных проявлений фрактальности в ГНР полезным оказывается изучение поведения моментов структурных функций, определяемых аналогично моментам партонных функций распределения. Момент n -го порядка адронной структурной функции Fi x , Q 2 , i 1 3 определяется следующим образом: 1
Fi n, Q
2
dxx 0
67
n 1
Fi x, Q 2 .
Формальный подход пКХД, указанный выше, также предсказывает логарифмические поправки. В данном случае, учитывая соотношения (1.19) и (1.37), моменты несинглетных по аромату комбинаций структурных функций нуклона изменяются в зависимости от квадрата переданного 4-импульса согласно формуле s Q 2 NS 2 NS 2 Fi n, Q Fi n, Q0 2 s Q0
dn
.
Величина d n положительна при n 1, отрицательна при n 1 и равна нулю при n 1, то есть с ростом Q моменты высоких рангов убывают, моменты низших рангов растут и Fi NS 1, Q 2 const. В синглетном канале свойством постоянства обладает Fi S 2, Q 2 . На рис. 1.16 показаны n -е моменты структурной функции F3 x , Q 2 , полученные экспериментально и вычисленные в рамках пертурбативной КХД. Учитывая поведение константы сильного взаимодействия, определяемое уравнением ренормализационной группы, в логарифмическом масштабе пКХД предсказывает линейный рост моментов структурных функций в соответствующей степени, что и показано на рис. 1.16. Точка пересечения с осью абсцисс определяет значение Q02 . Важно отметить, что в случае точного выполнения скейлинга Бьеркена эти прямые должны были быть строго горизонтальными. Наблюдаемое очень хорошее согласие экспериментальных и расчетных данных является существенным свидетельством в пользу справедливости КХД и СМ. Таким образом, слабое не достаточно быстрое логарифмическое убывание s Q 2 с ростом Q 2 является причиной нарушения масштабно-инвариантного поведения структурных функций и приводит в пКХД к слабой зависимости структурных функций и партонных функций распределения от Q 2 [19, 20, 22, 35]. Хотя теория является асимптотически свободной, на малых расстояниях все еще имеются некоторые остаточные взаимодействия. Причем изменение моментов как адронных (нуклонных) структурных функций, так и партонных функций распределения определяется уравнения-
68
ми ренормализационной группы и задается аномальными размерностями моментов. Важно отметить, что уравнение ренормализационной группы имеет тесную связь с фракталами и обладает свойством самоподобия, что может приводить к фрактальности и самоподобному поведению структурных функций в пКХД. Более того, уравнения эволюции подразумевают, что возникновение именно фрактальной структуры партонного каскада в импульсном пространстве является предпочтительным, при этом аномальные размерности КХД оказываются тесно связанными с размерностями Реньи. Таким образом, можно ожидать проявления фрактальной структуры партонного каскада и в обычном пространстве-времени.
Рис. 1.16. Момент n -го порядка nF3 n, Q 2 в степени 1 d n , соответствующий несинглетной структурной функции
xF3 N
для глубоко неупругого N -
2
рассеяния, в зависимости от Q . пКХД предсказывает зависимость от ln Q 2 (логарифмическое нарушение масштабной инвариантности) [10, 36]
В рамках теории вероятностей также можно получить указание на возможное проявление фрактальности в партонных функциях распределения. Приведенные выше результаты, полученные в рам-
69
ках КХД, допускают следующую вероятностную интерпретацию явления нарушения скейлинга. Пусть q x обозначает вероятности того, что кварк q переносит долю x импульса нуклона. Увеличение массы виртуального фотона от t до t t приводит к увеличению соответствующей вероятности от q x до q x q x вследствие того, что другой кварк с долей импульса x ' x может испустить глюон и уменьшить тем самым свой импульс от значения x ' до значения x. Таким образом, можно условно считать, что данный кварк содержался в том, который первоначально наблюдался при рассеянии фотона с меньшей виртуальной массой t. Это означает, что распределение кварков в нуклоне является t зависимым. Можно определить функцию Pqq z , которая соответствует вариации (на единицу t ) вероятности обнаружения внутри некоторого кварка другого кварка с долей z x y импульса первоначального кварка, равного y (соответственно, импульс начального кварка рассматривается в долях импульса нуклона). Такая вариация является эффектом порядка g 2 t , где эффективная константа взаимодействия g t удовлетворяет ренормгрупповому уравнению [1]. Тогда t -зависимость q x (уравнение эволюции) определяется следующим соотношением: 1 1 dq x, t 2 g t dy dz x yz Pqq z q y , t dt 0 0 1
dy x Pqq q y , t . y y 0 Видно, что данное уравнение с точностью до коэффициента совпадает с уравнением DGLAP (1.32) для кварковой несинглетной функции распределения и функция Pqq z может быть отождеств g 2 t
лена с функцией расщепления Pqq z . Полученный интеграл имеет вид свертки, и его можно проанализировать с помощью преобразования Меллина, так как при данном преобразовании, как было указано выше, момент произведения является произведением моментов. Тогда можно получить:
70
1 1 dM q n, t x dy g 2 t dxx n 1 Pqq q y , t dt y y 0 0 1
1
g 2 t dyy n 1q y , t dzz n 1Pqq z g 2 t M q n, t D , n
0
0
где моменты кварковых структурных функций определяются согласно (1.34) и моменты функции, соответствующей вариации вероятности, вводятся следующим образом: 1
D dzz n 1Pqq z . n
0
Таким образом, рассмотрение на основе теории вероятностей нарушения скейлинга приводит к дифференциальному уравнению для моментов кварковых несинглетных функций распределения, решение которого имеет вид n D 2 b
M q n, t s t . M q n , t0 s t0 Данный результат в точности совпадает с результатом КХД (1.37), полученном при логарифмическом нарушении масштабной инвариантности, если ввести следующее соотношение для аномальных размерностей и моментов функции Pqq z : 2 qq n, s D n . Как
было отмечено выше, результат КХД получен на основе уравнения ренормализационной группы, которое обладает свойством самоподобия. Таким образом, результат, полученный при вероятностной интерпретации нарушения скейлинга, также указывает на возможный фрактальный характер структурных функций. Важно напоминать, что фрактальная размерность в классической физике дает некоторую информацию о поведении наблюдаемой (например, длины береговой линии), когда разрешение по длине стремится к нулю. Подобная ситуация возникает и в данном случае, когда рассматриваются адронные структурные функции как функции Q 2 , где величина L 1 Q 2 представляет собой длину волны, определяющую пространственное разрешение (разрешающую способность). В настоящее время в экспериментах по ГНР выполнены исследования в следующих диапазонах кинематиче-
71
ских параметров: 106 x 1 и 0,2 Q 2 105 ГэВ2 (см. рис. 1.9), что соответствует L 6 104 101 фм. Это означает, что в современных экспериментах по ГНР разрешающая способность может достигать 103 линейного масштаба нуклона. Отображением пространственно-временой фрактальной геометрии изучаемого объекта может служить степенное поведение структурных функций в ГНР. В [37] было предложено измерять именно структурные функции в ГНР для определения соответствующих фрактальных размерностей геометрии частиц. Однако модельная зависимость теоретических расчетов и достигнутые экспериментальные возможности не позволили до настоящего времени сделать конкретные выводы, и проблема фрактальной геометрии внутри элементарных частиц остается пока открытой [38]. Таким образом, оказывается, что поведение структурных функций может соответствовать фрактало-подобным объектам и важную роль при изучении структуры адрона может играть именно фрактальная геометрия. Контрольные вопросы 1. Дайте определение процесса глубоко неупругого рассеяния. 2. Приведите систему эволюционных уравнений (DGLAP) для партонных функций распределения. 3. Приведите выражение для эволюции моментов функций распределения в зависимости от переданного импульса. Рекомендуемая литература Андреев И.В. Хромодинамика и жесткие процессы при высоких энергиях. М.: Наука, 1981. 1.2. Roberts R.G. The structure of the proton. Cambridge: Cambridge University Press, 1993. 1.31. Frankfurt L., Strikman M., Weiss Ch. // Annu. Rev. Nucl. Part. Sci. 2005. V.55. P.403. 1.1.
1
Данный обзор полезен для знакомства с физикой ГНР в области малых значений бьеркеновской переменной, не рассматриваемой в данной главе.
72
Глава 2 НЕДИФФЕРЕНЦИРУЕМЫЕ ИЛИ ФРАКТАЛЬНЫЕ ФУНКЦИИ И МНОЖЕСТВА
§1. Недифференцируемые функции: краткая история возникновения В своем письме от 15 января 1898 г. к Ф. Клейну Л. Больцман специально отмечал, что «… в природе существуют такие физические проблемы1, для решения которых недифференцируемые функции абсолютно необходимы, и если бы К. Вейерштрасс не придумал бы такие функции, то физикам просто не осталось бы ничего другого, как самим их изобрести…» [39]. Важно отметить, что такие функции и были изобретены. В настоящее время они общеизвестны под названием «обобщенные функции» и широко используются в физике. Применение обобщенных функций для описания случайный процессов во фрактальных средах более подробно рассмотрено ниже (гл. 6). Существенно и примечательно также то, что одна из основных концепций современного понятия «фрактал» и фрактальной геометрии, а именно, концепция самоподобия вошла в математику с двух независимых направлений (через канторовы множества и функции Вейерштрасса) примерно в одно и то же время для фундаментальных понятий математики: числа и функции (соответственно). Важно отметить, что еще Г. Лейбниц в своем трактате «Монадология» [40], написанном в 1714 г., использовал понятие самоподобия («миры внутри миров»), а также применял его в определении прямой. Непрерывные функции, не имеющие производных, привлекали внимание многих, в том числе, великих, математиков. В данном параграфе очень кратко описывается история возникновения и развития этой области математики. Более подробно с истори1
Здесь имеются в виду проблемы в рамках статистической физики.
73
ческими и методологическими аспектами рассматриваемого направления можно ознакомиться в [41 – 46]. После открытия дифференциального исчисления интуитивно сложилось мнение, что каждую функцию можно дифференцировать любое число раз. В 1806 г. великий французский физик Ампер сделал попытку теоретически обосновать это убеждение на чисто аналитической основе в рамках математической концепции Лагранжа. Позже в разное время одни математики автоматически переносили утверждения Ампера на функции, непрерывные в теперешнем смысле, другие, считая данное утверждение фундаментом всего дифференциального исчисления, приводили свои доказательства этого положения и использовали его в качестве отправной точки для получения других результатов. Среди них были, в частности, Лакруа (1810 г.), Галуа (1831 г.), Раабе (1839 г.), Дюамель (1847 г.), Ламарье (1855 г.), Фрейсане (1860 г.), Бертран (1864 г.), Серре и Рубини (1868 г.). Однако в XIX веке время веры математиков в неразрывность взаимосвязи непрерывности функции и ее дифференцируемости истекло. В 1830 г. Б. Больцано в рукописи «Учение о функции» строит первый пример непрерывной, нигде не дифференцируемой функции. Рукопись данной работы была обнаружена лишь после Первой мировой войны около 1920 г. в Высшей государственной библиотеке [47]. Только через сто лет работа Б. Больцано появилась в печати. В 1834 – 1835 г.г. понятие дифференцируемости и непрерывности четко разграничивает великий русский математик Н.И. Лобачевский. В 1854 г. Дирихле отмечает, что в общем случае нельзя доказать существование производной у произвольной непрерывной функции, и высказывает убеждение в существовании непрерывных функций без производной. В 1861 г. Риман привел в качестве примера следующую функцию: sin n 2 x f x , (2.1) n2 n 1 относительно которой Дюбуа-Раймон утверждал, что она не дифференцируема на всюду плотном множестве. К. Вейерштрасс отказался провести доказательство данного факта, и только в 1916 г. Харди, опираясь на некоторые тонкие результаты диофантова ана-
74
лиза, сумел доказать, что рассматриваемая функция f x не имеет конечной производной ни в какой точке , где – иррациональное или рациональное число следующего вида:
2m 4n 1
или 2m 1 2 2n 1 , где m, n – целые. Затем Харди несколько обобщил пример Римана [48]. В 1969 г. Гервер расширил полученный результат [49] и показал, что функция Римана (2.1) дифференцируема в бесконечном числе точек , где является рациональным числом с нечетным знаменателем и числителем. В [50] было показано, что других точек дифференцируемости у функции Римана (2.1) нет. До 1870 г., не считая указанной выше функции Римана (2.1), не было опубликовано ни одного примера непрерывной функции, не имеющей производной на бесконечном множестве точек. Гюэль о таких функциях утверждал, что «… сегодня нет ни одного математика, который поверил бы в существование непрерывных функций без производных…» [51]. В 1870 г. Ханкель [52] предложил метод сгущения особенностей, состоящий в построении функций, у которых нет производных на всюду плотном множестве рациональных точек. Одним из примеров таких функций является функция вида 1 1 f x sin n x sin , s sin n x n 1 n где s – произвольное число такое, что s 1. В 1873 г. Шварц [53] построил другой пример монотонной непрерывной функции, не имеющей производной на всюду плотном множестве точек, 2 n x f x , 4n n 1
где x x x x , x 0, x – целая часть x. Эту функцию Шварц считал недифференцируемой, но как оказалось позже, она почти всюду имеет конечную производную. Позже, как принято считать в 1861 г., К. Вейерштрасс построил свою знаменитую функцию [54]:
75
f x W x
a
n
cos bn x ,
(2.2)
n 1
где ab 1 3 2 , 0 a 1, b 1, b – нечетное целое число. К. Вейерштрасс доложил об этом открытии Берлинской академии наук 18 июля 1872 г., однако сам пример недифференцируемой функции (2.2) был опубликован только в 1875 г. Дюбуа-Раймоном [55]. Поэтому как отмечено в [56]: «…год 1875 является не более чем удобной символической датой для обозначения начала Великого кризиса математики…». Однако появление недифференцируемых функций было воспринято неоднозначно мировым математическим сообществом. Более того, в предисловии к своей книге [57] С. Сакс писал: «…Исследования, имеющие дело с неаналитическими функциями и функциями, нарушающими те законы, которые предполагались всеобщими, эти исследования рассматривались почти как распространение хаоса и анархии там, где предшествующие поколения искали порядка и гармонии…». Ш. Эрмит писал Т. Стильтьесу в 1893 г. «… Я с ужасом и отвращением отворачиваюсь от этой разрастающейся язвы функций, не имеющих производных…» [57]. Даже в начале XX века Дж. Бусенеск был не одинок во мнении, что «весь интерес функции заключается в обладании ею производной» [58], имея в виду обычную производную. Независимо от К. Вейерштрасса к идее недифференцируемой функции пришел Дарбу, который обобщил примеры Ганкеля и Шварца и построил следующую функцию [59]: sin n 1 ! x f x , (2.3) n! n 1 не имеющую производной при любом значении x. Он доложил о своем результате на заседании Французского математического общества 19 марта 1873 г. и 28 января 1874 г., то есть до выхода в свет публикации Дюбуа-Раймона.
§2. Классы недифференцируемых функций Исследования, краткая хронология которых приведена выше, послужили основой для построения классов недифференцируемых
76
функций и поиска общих условий дифференцируемости непрерывных функций. Наибольший вклад в данное направление внес итальянский математик У. Дини, вплотную приблизившийся к теореме Лебега о производной непрерывной монотонной функции. Теорема 2.1. Пусть на отрезке 0,1 задана последовательность
f n x функций, удовлетворяющая следующим условиям: 1. n, n 1,2, : f n x является непрерывной функцией, имеющей ограниченную производную на отрезке 0,1.
2. Ряд
f x n
сходится на отрезке 0,1 к непрерывной функ-
n 1
ции f x . 3. n, n 1,2, : f n x имеет конечное число экстремумов, причем число их неограниченно возрастает с ростом n и притом так, что 0 n0 n n0 : расстояние между точками экстремумов функции f n x меньше . 4. Если n – наибольшее расстояние между двумя последовательными экстремумами, а Dn – наибольшая по абсолютной величине разность двух последовательных экстремальных значений, то справедливо lim n Dn 0. n
5. Если через hn обозначить для каждого значения x те два приращения (одно из которых положительное, а другое отрицательное), для которых x hn дает первый правый (соответственно, левый) экстремум, для которого
f n x hn f n x Dn 2, то
можно задать такие положительные числа rn , что для всех x0,1 и соответствующих каждому из них hn справедливо соотношение
Rn x hn Rn x 2rn , где Rn является остатком ряда
f x n
n 1
из условия 2.
77
6. Если Cn – последовательность таких положительных чисел, что x 0,1 : f n x Cn , то начиная с некоторого значения индекса n справедливо следующее неравенство: 4 n Dn
n
4 rn
C D 1
, 0 1.
n
7. Знак разности f n x hn f n x , начиная с некоторого номера n0 не зависит от значения hn для всех x0,1 и для всех n n0 .
Тогда функция f x , являющаяся суммой ряда
f x n
из
n 1
условия 2, ни в одной точке x0,1 не будет иметь конечной производной. Бесконечную производную данная функция может иметь на бесконечном множестве точек [60, 61]. Позже У. Дини показал [61], что при некоторых дополнительных предположениях такая функция f x ни в одной точке не будет иметь и бесконечной производной. Важно отметить, что класс функций, удовлетворяющих теореме Дини, бесконечен [60], в частности, в нем содержится функция Вейерштрасса W x [61]. В 1879 г. Дарбу предложил достаточно общий метод построения недифференцируемых функций [62]. Он изучал функции x , определяемые следующим рядом: f anbn x x , (2.4) an n 1
где an и bn – некоторые последовательности действительных чисел, f x – непрерывная ограниченная функция с ограниченной второй производной. Если последовательности an и bn выбраны так, что при фиксированном k справедливы соотношения a a b2 a2b22 an k bn2k lim n 0, lim 1 1 0, n a n an n 1
78
то ряд (2.4) сходится к некоторой непрерывной функции x . При некоторых дальнейших ограничениях на выбор an , bn , k и f x можно получить непрерывные функции, не имеющие произ-
водной ни в одной точке. Так, если n : bn 1 и k 1, то на члены последовательности an достаточно наложить условие a1 a2 an 1 0, an которому удовлетворяют, например, числа n !, чтобы можно было указать бесконечное множество функций f x , для которых соответствующая функция (2.4) не дифференцируема ни в одной точке. В частности, при всех f x cos x функция x нигде не диффеlim
n
ренцируема. При выборе bn n 1, k 3 и f x sin x из общего соотношения (2.4) получается недифференцируемая функция x из работы Дарбу [59]. В 1918 г. метод построения непрерывных недифференцируемых функций был предложен К. Кноппом [63]. Можно даже сказать, что после упомянутых выше работ была создана целая индустрия по производству как отдельных недифференцируемых функций, так и целых их классов. Замечание. Пример функции Вейерштрасса опирается на свойства лакунарного ряда, то есть такого ряда, в котором члены, отличные от нуля «очень редки и разбросаны» [64, 65]. Понятие лакунарного тригонометрического ряда было введено Ж. Адамаром в 1892 г. при изучении функций, не продолжаемых аналитически за границу сходимости [66]. Определение 2.1. Лакунарным (в смысле Адамара) тригонометрическим рядом называется ряд следующего вида: a0 ak cos n k x bk sin nk x (2.5) 2 k 1 при nk 1 nk q 1. Таким образом, номера nk лакунарного ряда (2.5) при всех k растут не медленнее геометрической прогрессии со знаменателем,
79
большим единицы. В [48] было также доказано, что функция Вейерштрасса W x не имеет конечной производной ни в одной точке при выполнении следующих условий: a 1, b 1 и ab 1. §3. Множества первой и второй категории по Бэру Чтобы корректно рассмотреть вопрос о месте, занимаемом дифференцируемыми функциями в множестве всех непрерывных функций, представляется важным напомнить некоторые понятия, относящиеся к множествам (подробнее – см., например, [39]). Для данного случая вводится удобное определение согласно [67 – 69]. Определение 2.2. Множество M называется топологическим пространством, если всякому подмножеству X M поставлено в соответствие подмножество X M так, что выполнены следующие аксиомы: 1) X Y X Y ; 2) X X ; 3) , – пустое множество; 4) X X . Определение 2.3. Множество X называется всюду плотным в топологическом пространстве M , если X M . Определение 2.4. Множество X называется граничным, если его дополнение в топологическом пространстве M является всюду плотным множеством, то есть M \ X M . В 1899 г. Бэр сформулировал следующее определение. Определение 2.5. Множество X топологического пространства M называется множеством первой категории на M , если оно является объединением счетного семейства множеств нигде не плотных на M . Определение 2.6. Множества второй категории определяются как множества, не являющиеся множествами первой категории. Согласно теореме Бэра справедливы следующие утверждения: - дополнение любого множества первой категории на прямой является плотным;
80
- никакой интервал на множестве действительных чисел R не является множеством первой категории; - каждое счетное множество на прямой является множеством первой категории и множеством меры нуль; - в множестве действительных чисел рациональные числа образуют множество первой категории. Простейшим примером несчетного множества, принадлежащего к множеству первой категории и к множеству меры нуль, является канторово совершенное множество, имеющее мощность континуума. Доказывается, что прямую можно разбить на два взаимно дополняющих друг друга множества A и B так, что множество A будет являться множеством первой категории, а множество B – иметь меру нуль. Во многих проблемах топологии и теории функций множества первой категории играют роль, аналогичную роли множеств меры нуль в теории меры (то есть множеств, которыми можно пренебречь). При доказательстве теорем существования в теории множеств часто пользуются так называемым методом категорий, который основан на теореме Бэра, согласно которой всякое метрическое пространство является множеством второй категории на самом себе [57]. На основе данного утверждения доказывается следующая важная теорема. Теорема 2.2. Пусть C 0,1 – пространство непрерывных функций x t , наделенное нормой x max x t . Пусть G – множество t 0,1
функций из C 0,1 , которые не имеют конечной правой производной ни в одной точке t0,1. Тогда G является множеством второй категории по Бэру на пространстве C 0,1 , а его дополнение является множеством первой категории по Бэру [70, 71]. Из приведенных выше определений и теорем следует исключительно важный вывод: множество функций, имеющих конечную одностороннюю производную хотя бы в одной точке t0,1 , является пренебрежимо малым в смысле категории Бэра по сравнению с множеством всех непрерывных функций. Тем более данное ут-
81
верждение справедливо для функций с конечной обычной производной. Доказательство данного утверждения и приведенной выше теоремы приведено в [69], а в [72] показано, что множество таких функций образует коаналитическое неборелевское подмножество пространства 0,1 . Как отмечено в работе [41], классы непрерывных функций без производных, рассмотренные в XIX веке и в первые два десятилетия XX века, не давали примера такой сингулярной непрерывной функции, у которой ни в одной точке не существовала бы конечная или бесконечная (левая или правая) производная. Например, у функции Вейерштрасса W x (2.2) имеется односторонняя производная на всюду плотном множестве. Первый пример такой в сильном смысле недифференцируемой функции был построен в 1922 г. и опубликован в 1924 г. А.С. Безиковичем [73]. В связи с этим Банах и Штейнгауз поставили следующий важный вопрос о распространении с помощью метода категорий результата С. Мазуркевича и Банаха на функции типа функции Безиковича: можно ли показать, что дополнение множества всех непрерывных функций, не имеющих ни в одной точке ни конечной, ни бесконечной производной, является множеством первой категории? В 1932 г. С. Сакс дал отрицательный ответ на данный вопрос. Он показал [74], что множество непрерывных на отрезке 0,1 функций, у которых или существует конечная правая производная, или эта производная равна на множестве мощности континуум, есть множество второй категории в пространстве всех непрерывных функций. Таким образом, можно сделать исключительно важный вывод: класс функций, односторонне дифференцируемых хотя бы в одной точке, в смысле категорий существенно шире класса функций, имеющих обычную производную хотя бы в одной точке. Соответственно, класс функций, не имеющих ни конечной, ни бесконечной односторонней производной в каждой точке отрезка, уже в смысле категорий класса функций, нигде не имеющих двухсторонней производной.
82
По словам С. Сакса «… это быть может объясняет трудности с нахождением первого примера функции, не имеющей конечной или бесконечной односторонней производной в каждой точке …» [74]. Таким образом, непрерывные дифференцируемые функции, в основном используемые в физических исследованиях, составляют существенно малую часть (подмножество меры нуль) множества всех непрерывных функций. Естественно, что попытки корректно и на количественном уровне описывать, в частности, сложные многочастичные процессы, фазовые переходы, резко нерегулярные и квазихаотические явления в физике микромира и квантовой теории поля привели к необходимости введения аппарата недифференцируемых (фрактальных) функций, который является относительно новым для физиков и в то же время достаточно давно известен математикам. Важно отметить, что раздел недифференцируемых функций имеет прочную и строгую фундаментальную математическую основу. С целью расширения известных классов недифференцируемых функций В. Орлич в 1947 г. нашел достаточно общие условия, при которых непрерывные функции, являющиеся суммами равномерно сходящихся рядов, нигде не дифференцируемы [75]. Однако общность результатов была достигнута за счет того, что коэффициенты этих рядов задавались неэффективно, с использованием метода категорий. Такой подход сам В. Орлич охарактеризовал как «в некотором смысле промежуточный» между «эффективными» способами задания недифференцируемых функций в виде рядов и «неэффективным» методом Мазуркевича – Банаха [75]. Таким образом, класс непрерывных функций, не имеющих производной ни в одной точке, неизмеримо богаче класса функций с производными. Как метко было отмечено в [41] «… создалась любопытная ситуация, когда оказалось, что те непрерывные функции, которые изучались математиками на протяжении веков, те функции, которые использовались для описания (физических) явлений внешнего мира, – эти функции оказались принадлежащими лишь пренебрежимо малому классу всех непрерывных функций …». Постепенно с течением времени математики привыкли к тому, что нигде не дифференцируемые функции действительно существуют, но физики
83
долго не соглашались с этим и воспринимали такие функции в виде неких «монстров», «уродливых порождений математических фантазий», не имеющих отношения к миру реальных физических явлений1. Важно отметить, что с позиций современной физической науки функция без производной вовсе не абстрактное понятие, такая функция описывает реальное физическое явление, в частности, траекторию движения броуновской частицы. В настоящее время идеи фрактальной геометрии и соответствующие ей разделы математического анализа, в частности, связанные с недифференцируемыми функциями, интегродифференциальным исчислением дробных порядков (см. ниже), все более широко используются в современных физических исследованиях. Великий ученый Н. Винер писал: «… В рамках этой теории мне удалось подтвердить замечание Перрена, показав, что за исключением множества случаев, имеющих суммарную вероятность нуль, все траектории броуновского движения являются непрерывными нигде не дифференцируемыми кривыми …» [77]. Существенным моментом является то, что в спектральной теории стационарных случайных процессов недифференцируемые функции возникают совершенно естественно и избежать их возможно лишь при отказе от имеющего ясный физический смысл условия стационарности, единственно делающего данную теорию простой и наглядной [76]. Ввиду важности кратко поясним данное утверждение. При спектральном разложении стационарного процесса X t использование интеграла Стилтьеса оказывается неизбежным в силу того, что случайная функция Z не является дифференцируемой ни в каком смысле, и поэтому никак нельзя перейти от интеграла Фурье – Стилтьеса
X t
e
i t
dZ
1
Долгое время физики исходили из принципа «в физике все функции дифференцируемы» [76].
84
к обычному интегралу Фурье. В случае существования спектральной плотности f всегда справедливо следующее соотношение:
dZ
2
f d .
(2.6)
В силу соотношения (2.6) во всех реальных физических случаях, когда процессу X t соответствует положительная спектральная плотность f , средний квадрат приращения Z случайной функции Z на малом отрезке оси частот будет близок к величине f , то есть имеет тот же порядок малости, что и величина . В таком случае само значение приращения Z имеет, как правило, порядок , что несовместимо с допущением о дифференцируемости случайной функции Z , то есть о существовании предела отношения Z при 0 [78]. Как отмечено в работе [76] «… мы сталкиваемся здесь с довольно редким случаем, когда в задаче, имеющей реальный физический смысл, возникают нигде не дифференцируемые функции, которые еще совсем недавно многим прикладникам представлялись заумной математической абстракцией, которая не может иметь никаких приложений …». В арсенале математика нашелся и аналитический аппарат для адекватного и строгого описания таких объектов и процессов. Место обычной размерности заняла размерность Хаусдорфа (подробнее – см. [39]), а место обычной производной – дробная производная или показатель Гельдера. §4. Интегралы и производные дробного порядка: краткая историческая справка Представляется важным отметить, что мысль об обобщении понятия дифференцирования d p f x dx p на нецелые значения порядка дифференцирования p возникла практически с самого возникновения дифференциального исчисления.
85
Первая попытка обсуждения идеи обобщения понятия производной на любые порядки, зафиксированная историей, содержится в переписке создателя дифференциального исчисления Г. Лейбница. В своих письмах к Г. Лопиталю (1695 г.) и Уоллису (1697 г.) Г. Лейбниц сделал несколько замечаний о возможности рассматривать дифференциалы и производные дробного порядка, а именно, для p 1 2. Следующий шаг, который можно рассматривать как первую попытку количественного решения проблемы производных произвольного порядка, был сделан Л. Эйлером (1738 г.), заметившим, что результатам вычисления производной d p x dx p от степенной функции можно придать смысл при нецелых значениях порядка дифференцирования p. П. Лаплас (1812 г.) высказал идею о возможности (нецелого) дифференцирования функций, которые можно представить с помощью следующего интеграла:
F t t
x
dt ,
где F t – некоторая функция. В трактате С. Лакруа (1820 г.) повторена мысль Л. Эйлера и уже приведена явная формула вычисления производной дробного порядка d 1 2 x dx1 2 от степенной функции. Следующий шаг в развитии данного направления аппарата интегродифференциального исчисления сделал Ж. Фурье (1822 г.), который предложил использовать равенство d p f x 1 p d f t cos tx t p dt p dx 2 2 для определения производной нецелого порядка. Важно отметить, что это было первое определение производной любого положительного порядка от любой (достаточно «хорошей») функции, и, что примечательно, дано это определение было еще в первой половине XIX века. Таким образом, дифференцирование и интегрирование дробных порядков имеет достаточно длительную историю развития и является неотъемлемой частью математического анализа. В настоящее время в связи с развитием теоретических и экспериментальных методов физических исследований данный раздел математики нахо-
86
дит все более широкое применение при решении различных задач, в том числе и в физике фундаментальных взаимодействий. Описанные выше эпизоды можно отнести к предыстории развития аппарата дробного интегродифференциального исчисления1. Собственно историю интегрирования и дифференцирования дробных порядков следует вести с работ Н. Абеля и Ж. Лиувилля. В работах Н. Абеля 1823 г. и 1826 г. в связи с так называемой задачей о таутохроне было решено следующее интегральное уравнение: x t (2.7) a x t dt f x , x a,0 1. В обеих указанных выше работах Н. Абеля решение было дано для произвольного значения 0,1 , хотя задача о таутохроне приводит к случаю 1 2. Хотя работы Н. Абеля и не были выполнены в русле идей обобщения дифференцирования на произвольные порядки, они сыграли важную и непосредственную роль в их развитии. Это связано с тем, что левая часть уравнения Н. Абеля (2.7) представляет собой, как выяснится позже, операцию дробного интегрирования порядка 1 , а обращение данного уравнения – операцию дробного дифференцирования соответственно. Однако в такой форме понятия дробного интегродифференциального исчисления были сформулированы позже. В 1832 – 1837 г.г. появляется серия работ Ж. Лиувилля, сделавших его по праву создателем уже достаточно полноценной картины интегродифференциального исчисления дробных порядков. Хотя теория, созданная Ж. Лиувиллем, еще и не достигла той формы, которую ей придало дальнейшее развитие подходов дробного интегрирования и дифференцирования другими исследователями, но в ней уже были высказаны и далеко продвинуты важные идеи. Ис1
Здесь и далее, если специально не оговорено, под термином «дробное интегродифференциальное исчисление» понимается, естественно, интегродифференциальное исчисление дробного порядка, то есть именно дробный порядок интегрирования / дифференцирования. Ниже в соответствии с установившимися понятиями и для краткости будут использоваться сочетания «дробное интегродифференциальное исчисление, дробное интегрирование / дифференцирование».
87
ходное определение Ж. Лиувилля, предложенное им в работе 1832 г., основано на формуле дифференцирования показательной функции и относится только к функциям f x , представимым в виде
следующего ряда: f x Ck e ak x . Для таких функций, согласно k 0
определению Ж. Лиувилля, для производной любого (в том числе и комплексного) порядка p справедливо следующее соотношение:
p
D p f x Ck a k e a k x . k 0
Ограниченность этого определения связана, очевидно, со сходимостью ряда, в виде которого представима рассматриваемая функция. В одной из работ Ж. Лиувилль получил также формулу дифференцирования дробного порядка для степенной функции. Более того, в той же работе Ж. Лиувилль выводит1 формулу 1 D p f x x t t p 1dt, x , , Re p 0, p 1 p 0 p
называемую теперь (без множителя 1 ) лиувиллевой формулой дробного интегрирования2. В один ряд с работами Ж. Лиувилля по значимости следует поставить работы Б. Римана и Х. Хольмгрена. Работа Б. Римана по данному направлению, выполненная им в 1847 г. в студенческие годы, была опубликована только в 1876 г. – спустя десять лет после его смерти. Б. Риман пришел к следующей конструкции дробного интегрирования: x t 1 dt, x 0, 0 x t 1 служащей с тех пор наряду с конструкцией Ж. Лиувилля одной из основных форм интегрирования дробного порядка.
1
Однако необходимо отметить, что данный вывод представляется не совсем строгим с современной точки зрения. 2 Здесь p – гамма-функция, определение которой приведено ниже.
88
На этом представляется оправданным, в рамках данной работы, закончить историческую справку, подойдя к возможности более подробного рассмотрения вопросов, связанных с дробным интегродифференциальным исчислением. Для более подробного знакомства с историческими аспектами интегродифференциального исчисления дробных порядков читателю можно посоветовать обратиться к [79, 80], где данный вопрос освещен детально. §5. Интегральное уравнение Абеля Понятие дробного интегрирования тесно связано с интегральными уравнениями Абеля. Необходимо отметить, что дробные интегралы и производные, так же как и интегральное уравнение Абеля и его обобщения имеют важное прикладное значение. Данный аппарат используется в самых различных областях прикладных исследований – в физике, механике, химии и др. После задачи Н. Абеля о таутохроне первые приложения аппарата дробного интегродифференциального исчисления к задачам геометрии, физики и механики были даны Ж. Лиувиллем. Среди рассмотренного круга задач была и задача Лапласа о влиянии прямолинейного проводника бесконечной длины на магнит; задача Ампера о взаимодействии двух таких проводников; задачи, связанные с притяжением тел; задача о распределении тепла в шаре; задача Гаусса о приближенных квадратурах и другие1. 5.1. Определение и решение уравнения Абеля Определение 2.7. Интегральное уравнение x t 1 dt f x , x a,0 1 a x t 1
(2.8)
называется (интегральным) уравнением Абеля. Для дальнейшего рассмотрения необходимы некоторые дополнительные определения, которые приводятся ниже. Определение 2.8. Равенство 1
Подробный обзор задач, рассмотренных Ж. Лиувиллем, см., например, в [79 – 81].
89
b
x
b
b
dx f x, y dy dy f x, y dx a
a
a
(2.9)
y
называется равенством Дирихле. Определение 2.9. Функция 1
B z, w x z 1 1 x
w 1
dx , Re z 0, Re w 0
(2.10)
0
называется бэта-функцией (эйлеровым интегралом первого рода). Определение 2.10. Функция
z
x
z 1 x
e dx, Re z 0
(2.11)
0
называется гамма-функцией (эйлеровым интегралом второго рода). Известно, что справедливо следующее соотношение для эйлеровых интегралов: z w B z, w . (2.12) z w В силу важности, ниже приведем подробно решение уравнения Абеля. В (2.8) можно сделать замену x на t, положить t s соот
ветственно; далее, умножить обе части равенства (1.8) на x t и проинтегрировать полученное выражение по t на отрезках a , x , x a , b , считая, что a, b – числа и рассматривая уравнение Абеля (1.8) на конечном отрезке a , b. В результате выполнения указанных преобразований можно получить следующее интегральное равенство: x t x s f t dt ds a x t a t s 1 a x t dt. Поменяв порядок интегрирования по формуле Дирихле (2.9) в левой части данного соотношения, можно получить равенство x x x f t dt s ds a s x t t s 1 a x t dt. Внутренний интеграл в левой части равенства можно вычислить после замены t s x s и использования формул для эйлеро-
90
вых интегралов (2.10) и (2.12). Таким образом, можно получить x 1 dt следующую цепочку равенств: 1 1 d 1 s x t t s 0 B ,1 1 . В результате выполненных преобразований можно получить: x x f t 1 s ds dt. (2.13) a 1 a x t
Отсюда, после дифференцирования можно получить равенство x f t 1 d x dt. (2.14) 1 dx a x t Таким образом, если уравнение Абеля имеет решение, то это решение имеет вид (2.14) и, следовательно, единственно. Важно отметить, что для простоты в (2.8) рассматривался случай 0 1. Случай 1 очевиден, а случай 1 сводится, вообще говоря, к рассмотренному подробно случаю 0 1 дифференцированием обеих частей в (2.8). Совершенно аналогично приведенному выше решению уравнения Абеля (2.8), рассматривается уравнение Абеля вида b t 1 dt f x , x b, x t x 1 но в данном случае вместо (2.14) при 0 1 получается следующая формула обращения: b f t 1 d x dt. (2.15) 1 dx x t x Методом математической индукции доказывается следующая общая формула для n -кратного интеграла вида x
x
dt t dt
a a
x
1 n 1 x t t dt. n 1! a
(2.16)
n
В силу того, что n n 1! правой части (2.16) можно придавать смысл и при нецелых значениях порядка интегрирования n.
91
5.2. Обоснование решения уравнения Абеля В данном разделе более подробно выясняется, при каких условиях на функцию f x , стоящую в правой части (2.8), уравнение Абеля действительно разрешимо. Для того чтобы сформулировать основную теорему, введем следующее обозначение: x f t 1 f1 x dt. 1 a x t Справедливо следующее неравенство: b b 1 1 f x dx f t b t dt. a 1 2 a Докажем данное утверждение. Действительно, справедливы следующие соотношения: b
b x
f1 x dx
a
1 1 a
f t
x t
dt dx
a
(2.17)
b x f t 1 dx dt . 1 a a x t
Поменяв порядок интегрирования в последнем выражении, можно получить следующую цепочку равенств: 1 b b b b f t x t 1 1 f t dt dt dx 1 a t x t 1 a 1 t b b f t 1 1 1 dt f t b t dt. 1 2 a 1 1 a b t Неравенство (2.17) доказано. Для дальнейшего рассмотрения представляется необходимым напомнить некоторые определения из математического анализа. Определение 2.11. Функция f x называется абсолютно непрерывной на отрезке a , b , a b, если для каждого 0 существует 0 такое, что для любой конечной системы попарно непересекающихся отрезков ak , bk a, b , k 1,2,, n, удовлетвоn
ряющей условию
b
k
ak , справедливо неравенство
k 1
92
n
f b f a . k
k
k 1
Класс всех абсолютно непрерывных на отрезке a, b функций обозначается AC a, b . Замечание. Известно, что класс AC a, b совпадает с классом первообразных от суммируемых по Лебегу функций: x
b
f x AC a, b f x C t dt , t dt . a
a
Определение 2.12. Говорят, что функция f x , заданная на отрезке a , b , удовлетворяет условию Гельдера (порядка ) на отрезке a , b , если x1 , x2 a , b справедливо неравенство:
f x1 f x2 A x1 x2 , где A – некоторая постоянная, параметр называется «показатель Гельдера». Класс всех (вообще говоря, комплекснозначных) функций, удовлетворяющих на отрезке a, b условию Гельдера фиксированного порядка , обозначается как H H a , b . Необходимо отметить, что здесь важность представляет только случай 0 1, так как при условии 1 класс H a, b содержит только константы: f x const на a , b. Важно, что H1 a, b AC a, b ; обратное утверждение не
верно. Действительно, например, f x x a AC a, b , но, с
другой стороны, f x x a H1 a , b при 0 1, так как в точке x a условие Гельдера не выполняется. Через L1 a, b обозначается множество всех измеримых на отрезке a, b функций f x , вообще говоря, комплекснозначных, для которых справедливы следующие соотношения:
93
b
b
f x dx ,
f x
a
L1 a ,b
f x dx. a
Из приведенного выше доказательства справедливости неравенства (2.17) следует, что если f x L1 a, b , то справедливо: f1 x L1 a , b . Необходимо дополнительно заметить, что на
множестве функций L1 a, b справедлива теорема Фубини о смене порядка интегрирования. Теорема 2.3. Интегральное уравнение Абеля (2.8) при 0 1 разрешимо на множестве функций L1 a, b тогда и только тогда, когда f1 x AC a , b и f1 a 0. При выполнении данных условий уравнение Абеля (2.8) имеет единственное решение, определяемое формулой (2.14). Доказательство. На первом этапе доказывается необходимость. Пусть уравнение Абеля (2.8) разрешимо в L1 a , b . Тогда справедливы все рассуждения, приведенные выше в п.5.1, при этом возможность перестановки интегрирования в равенстве Дирихле (2.9) обосновывается с помощью теоремы Фубини. Следовательно, справедливо соотношение (2.13). Откуда следует, что выполняются условия f1 x AC a , b и f1 a 0. Необходимость доказана. На втором этапе доказывается достаточность. В силу выполнения условия теоремы f1 x AC a , b справедливо следующее соотношение: f1' x df1 x dx L1 a , b . Поэтому функция (2.14) существует почти всюду и принадлежит L1 a , b . Теперь необходимо показать, что функция (2.14) действительно дает решение уравнения Абеля (2.8). Подставим функцию (2.14) в левую часть уравнения (2.8) и результат подстановки обозначим через g x . В результате данных преобразований можно получить следующее равенство:
94
x f1' t 1 dt g x . a x t 1
(2.18)
Доказав теперь, что почти всюду f x g x , тем самым будет доказана достаточность, следовательно, и данная теорема. Равенство (2.18) есть уравнение Абеля (2.8) относительно функции f1' t . Данное уравнение заведомо разрешимо, поэтому, в силу соотношения (2.14), справедливо следующее равенство: x g t 1 d f1' x dt , 1 dx a x t то есть f1' x g1' x . Функции f1 x и g1 x являются абсолютно непрерывными: первая по условию теоремы, вторая – в силу равенства (2.13) с функцией g x в правой части. Тогда f1 x g1 x C 1. По предположению теоремы справедливо f1 a 0, а в силу того, что (2.18) – разрешимое уравнение справедливы равенства g a
a f1' t 1 dt 0. Поэтому a a t 1 x
C 0. Таким образом, справедливо
f t g t dt 0. Последнее
x t a
равенство есть уравнение Абеля (2.8). В силу единственности решения уравнения (2.8) справедливо f x g x 0 на отрезке
a , b .
Достаточность доказана. Теорема доказана. ▲ Необходимые и достаточные условия разрешимости интегрального уравнения Абеля были сформулированы выше в терминах
1
Необходимо отметить, что требование абсолютной непрерывности в данном рассуждении существенно: его нельзя ослабить просто до непрерывности, так как известны непрерывные функции, но не являющиеся абсолютно непрерывными, отличные от тождественной постоянной и имеющие почти всюду производную, равную нулю.
95
вспомогательной функции f1 x . Следующая лемма и следствие из нее дают простое достаточное условие разрешимости уравнения Абеля в терминах самой функции f x . Лемма 2.1. Если f x AC a , b , то и f1 x AC a , b и при этом справедливо следующее равенство: x 1 1 1 f1 x f a x a f ' t x t dt . (2.19) 2 a Доказательство. Подставляя функцию f t , представленную в t
виде f t f a f ' s ds, в следующее интегральное равенство a
x f t 1 f1 x dt , можно получить: 1 a x t
f1 x
x f a 1 dt 1 x a 2 1 a x t
t '
f s ds.
(2.20)
a
Здесь первое слагаемое – абсолютно непрерывная функция, в силу x 1
того, что x a
1 t a dt. Поскольку справедливо a
t f ' s f s ds ds (2.21)1 a x t a a a x t dt , то второе слагаемое в (2.19) является первообразной от функции, соответствующей внутреннему интегралу в правой части (2.21), и, следовательно, абсолютно непрерывно. Представление (2.19) следует из (2.20) после перестановки порядка интегрирования. Лемма доказана. ▲ Следствие. Если f x AC a , b , то уравнение Абеля (2.8) x
dt
t
x
'
разрешимо при 0 1 на множестве функций L1 a , b , при этом решение (2.14) можно представить также в следующем виде: 1
Справедливость данного соотношения проверяется непосредственной перестановкой порядка интегрирования в обеих частях равенства.
96
x f a f ' s 1 ds . (2.22) 1 x a a x s Действительно, условия разрешимости, сформулированные в теореме 2.3, выполнено в силу леммы 2.1 и формул (2.20) и (2.21). Так как x df1 x dx , то формула (2.22) получается дифференцированием равенства (2.19), при этом дифференцирование под знаком интеграла возможно в силу справедливости (2.21). Совершенно аналогично представленной выше теореме 2.3 показывается, что уравнение b t 1 dt f x , x b x t x 1
x
разрешимо на множестве функций L1 a, b для тех и только тех правых частей, для которых выполнена совокупность следующих условий: f1 x AC a , b и f1 b 0, где при 0 1 функция
f1 x
b f t 1 dt. 1 x t x
Решение рассматриваемого
уравнения в случае f x AC a, b можно записать в виде b f b f ' s 1 ds . 1 b x t s t Необходимо отметить, что существует и другая форма обращения Абеля. На основании изложенного выше, можно приступить к определению операторов дробного интегрирования и дифференцирования.
t
§6. Интегралы и производные во фрактальной геометрии Как было показано выше (§5), аппарат дробного интегродифференциального исчисления известен в математике достаточно давно и к настоящему времени является хорошо разработанным и строго обоснованным [79, 81, 82]. Однако широкое применение дробных интегралов и производных в области релятивистской ядерной фи-
97
зики и физики высоких энергий пока ограничено из-за отсутствия их явной физической трактовки. Тем не менее, с возрастанием интереса к процессам множественного рождения частиц, переходным явлениям в рамках КХД, увеличением энергии современных ускорительных комплексов и детектирующих возможностей экспериментальных установок можно ожидать более глубокое использование рассматриваемого математического аппарата в современных исследованиях в области физики фундаментальных взаимодействий. 6.1. Дробные операторы Римана – Лиувилля Определение 2.13. Операторы I a и I b , действующие на функцию x следующим образом: x
I a
I b
t 1 dt , x a; x a x t 1
1 x
b
t
t x
1
(2.23)
dt , x b,
x
называются левосторонним и правосторонним дробным оператором Римана – Лиувилля соответственно. Справедлива следующая формула дробного интегрирования по частям: b
b
x I a a
x dx x I b
x dx.
(2.24)
a
Дробное интегрирование обладает полугрупповым свойством: I a I a I a ; (2.25) I b I b I b 0, 0 . Операция дробного дифференцирования вводится естественным образом в качестве операции, обратной дробному интегрированию. Определение 2.14. Дробные производные Римана – Лиувилля порядка при 0 1 для произвольной функции f x определяются следующим образом:
98
x
x
f t 1 d dt , 1 dx a x t
Da f
1 d Db f x 1 dx
b
f t
(2.26)
t x dt. x
Важно отметить, что если дробные интегралы (2.23) определены для любого порядка 0, то, как было указано выше, дробные производные (2.26) определены только для 0 1. Для более высоких порядков 1 при их целой – , 1 и дробной –
, 0 1
частях числа справедливы следую-
щие определения для дробных производных Римана – Лиувилля: n x f t 1 d Da f x dt, n dx a x t n 1 (2.27) n n b 1 d f t Db f x dt , n dx x t x n 1
где n 1. Если в приведенных выше формулах – целое число, то под дробной производной порядка понимается обычное дифференцирование:
d d Da , Db , 1,2,3, dx dx В литературе дробные производные могут обозначаться поразному. Иногда используются следующие обозначения тождественные друг другу:
f I
Da f I a f I a Db f I b
1
1 b
f, f , 0.
Пример 2.1. 1 1 Рассмотрим функции 1 x x a и 2 x b x , где Re 0. Левосторонний и правосторонний дробный оператор Ри-
99
мана – Лиувилля порядка действуют на эти функции следующим образом: 1 I a 1 x , x a
I
b
2 x
Дробные интегралы x t 1 dt , a x; a x t 1
b x 1 .
1
b
t
t x
1
dt , x b,
x
соответствующие лево- и правостороннему дробному оператору Римана – Лиувилля, можно естественным образом расширить с конечного отрезка a , b на полуоси a, или , b. Для общего случая x дробные интегралы (т.е. левосторонний и правосторонний дробный операторы Римана – Лиувилля) по всей прямой определяются следующим образом: x t 1 I x dt; x t 1 (2.28) t 1 I x dt. x t x 1
Ряд примеров действия дробных операторов Римана – Лиувилля (2.23) и дробных операторов Римана – Лиувилля на прямой (2.28) для некоторых функций представлены в приложении 2. Подобно дробным производным Римана – Лиувилля Da и Db вводятся лиувиллевы производные для всей числовой прямой: x f t 1 d D f x dt , 1 dx x t (2.29) f t 1 d D f x dt, 1 dx x t x
100
где 0 1 и x . Для дробных производных более высоких порядков 1 при n 1 справедливо следующее определение для общего случая всей числовой прямой: n f x t 1 d D f x dt. (2.30) n dx 0 t 1n
Дробные производные Лиувилля на оси D можно привести к более удобному виду, чем (2.29). Получаемые в результате некоторых преобразований конструкции называются дробными производными Маршо:
D
f x 1
f x f x t t1
0
dt
x
D
f x f t dt; 1 x t 1
f x 1
f x f x t
0
t1
(2.31)
dt ,
где 0 1 и x . В теории интегродифференциального исчисления дробных порядков для функций многих переменных, которое1 является дроб 2 ной степенью оператора Лапласа, широко используется дробное риссово интегродифференциальное исчисление. В образах Фурье F данная операция записывается в виде: I f , Re 0; 2 1 (2.32) f F x Ff D f , Re 0. Подробное изложение теории дифференцирования Рисса приведено в [81]. Как следует из теоремы о свертке функций, интеграл дробного порядка
I f x , Re 0 O
следующего вида: 1
Здесь подразумевается исчисление.
101
является сверткой Лапласа
I O f
x f x
x 1 , Re 0,
вследствие чего имеет место свойство совместного действия преобразования Лапласа и оператора дробного интегрирования.
6.2. Обобщенная формула Лейбница В случае интегродифференциального исчисления дробных порядков справедливы следующие формулы, представляющие собой обобщения соответствующих формул дифференцирования на произвольные порядки: k Da fg Dak f g , R1; k 0 k (2.33) k k Da fg f Da g , k Da k
где R1 , , , R1 и 1, 2, 3, при нецелом . Обобщенный биномиальный коэффициент определяется как sin 1 1 . 1 1 1 Замечание. В случае целых значений n и k обобщенный биномиальный коэффициент переходит в обычный биномиальный коэффициент: n 1 n n! k . Cn k k 1 n k 1 k ! n k ! В интегродифференциальном исчислении дробных порядков имеет место обобщенная формула Лейбница с остаточным членом: n 1 k Da uv Dak u v Rn , (2.34) k k 0 где остаточный член имеет вид:
n
Rn
x x 1 1 n 1 x t u t dt x v n d . n 1! a t
102
Необходимо отметить, что обобщенная формула Лейбница (1.34) не требует от функции v x бесконечной дифференцируемости. 6.3. Функция Фокса При интегральных преобразованиях, вводимых для описания диффузионных процессов в средах и пространствах обобщенного типа, в частности, во фрактальных пространствах, и при использовании дробных операторов широко применяется H -функция Фокса H mn pq , где 0 m q и 0 n p. Данная функция является функцией общего вида и применяется в физике фундаментальных взаимодействий при изучении корреляционных характеристик процессов множественного образования частиц, в частности, трехчастичных корреляций Бозе – Эйнштейна в случае устойчивых распределений. Функция Фокса представляет собой функцию общего гипергеометрического типа и определяется следующим образом: a1 , 1 , a p , p 1 h s z s ds, H mn pq z b , , b , 2 i 1 1 q q C
m
h s
bj j s
j 1 q
1 b
n i
i
i 1
j
(2.35)
1 a s
js
j m 1
,
p
a s i
i
i n 1
где i i 0,1,, p , j j 0,1,, q являются положительными числами, ai i 0,1,, p , b j j 0,1,, q – комплексные числа, удовлетворяющие следующему условию: k bl l ak 1 , k 1,2,, n; l 1,2, m. Числа и являются целыми и неотрицательными: , 0,1, Контур интегрирования C в комплексной s -плоскости проходит так, что полюсы b j j s j 0,1,, m находятся справа, а полюсы 1 ai i s i 1,2,, n – слева от контура.
103
Преобразование Лапласа функции Фокса представляет собой также функцию Фокса, но с другими индексами: 1 bj , j p 1 H n 1,m p , 0 1; H q , p 1 1,1 , 1 ai , i p 0,1 , ai , i p 1 H m ,n 1 p , 1. H p 1, q p bj , j Для обратного преобразования Лапласа справедливо: 1 bj , j , 0 1; 1 H t H qn,,mp 1 t 1 ai , i , 1,1 t ai , i , 0,1 1 , 1. H t H mp ,n1,q t t bj , j Функция H является аналитической функцией при выполнении следующих условий: 0 при 0 и 1 при q
p
p
q
0, где j i , ii j j . j 1
i 1
i 1
j 1
Асимптотическое разложение функции Фокса дается формулой H mp ,,qn res h s s , справедливой для 0 и n 0 при на каждом замкнутом секторе arg 2. При этом вычеты должны определяться в точках s ai 1 i i 1,2,n; 0,1, . Ниже (гл. 6) более подробно рассмотрено применение функции Фокса для описания процессов во фрактальных средах. §7. Физическая интерпретация дробных операторов Различные аспекты применения математического аппарата интегродифференциального исчисления дробных порядков, например, в электромагнетизме обсуждается в [83]. Наличие прямой связи между дробным интегралом и фрактальным множеством Канто-
104
ра подробно рассматривается и доказывается в [84]. Для большей наглядности и более глубокого понимания данной взаимосвязи рассмотрим два предельных случая, широко используемых в физике. Пусть задана некоторая физическая система, процесс эволюции которой во времени описывается следующим оператором: t
y t K t , f d .
0
В первом предельном случае функция памяти системы K t , имеет ступенчатый характер: t 1 ,0 t; K t , 0, t 0. Тогда в процессе эволюции система будет проходить через все промежуточные состояния непрерывным образом без потерь и справедливо следующее соотношение: t F p 1 1 e pt y t f d F p , pt 1 t0 pt pt
что соответствует полной памяти (эквивалент «прямой»). Здесь F p – лапласов образ функции f t . Во втором предельном случае функция памяти системы представляет собой -функцию: K t , K t t . Тогда оператор эволюции системы во времени будет иметь следующий вид: t
y t t f d f t e pt F p .
0
Данный вид оператора эволюции системы, в свою очередь, означает, что в ходе эволюции система теряет все свои состояния, за исключением единственного с бесконечно большой плотностью (эквивалент «точки» в геометрическом смысле). Этот предельный случай соответствует марковскому процессу без последствия. Вполне естественно возникает вопрос: существуют ли физические системы, которые в процессе эволюции занимают промежуточное положение между описанными выше предельными случая-
105
ми, то есть между «прямой» и «точкой»? В [84] подробно исследуется данная проблема. Важно отметить, что классическая геометрия не дает на данный вопрос утвердительного ответа в силу того, что в ней не существует промежуточного геометрического объекта между точкой и прямой. Фрактальная геометрия дает утвердительный ответ на данный вопрос, так как такой объект в рамках фрактальной, неклассической геометрии существует и называется канторовым множеством. Ввиду важности опишем более подробно промежуточный случай эволюции физической системы и ее взаимосвязь с соответствующим объектом фрактальной геометрии. При рассмотрении взаимосвязи между дробным интегралом и фрактальным множеством Кантора используется ступенчатая функция следующего вида: 1, если t1 , t2 ; t1 t2 0, если t1 , t2 . Пусть длина временного интервала, в течение которого исследуется эволюция физической системы, составляет t. Данный интервал делится на три равные части. После удаления средней части интервала остаются два концевых временных отрезка, длина каждого из которых равна t 1 3 1 2 . Затем процедура повторяется. Подробно алгоритм построения канторова совершенного множества описан в [78]. Конечный вклад в интеграл от 2 N временных отрезков на N -м этапе разбиения записывается в виде: N t 2 1 N N y t tm tm 1 f d N 2 t 0 m1 с соответствующим преобразованием Лапласа 1 exp pt N p Qn pt 1 F p . pt N
Здесь функция Qn x определяется следующим образом: N 1
Qn 2 N
1 exp , n
n 0
106
pt 1 .
(2.36)
Функция Qn , определяемая выражением (2.36), удовлетворяет функциональному уравнению 1 exp Qn QN 1 , (2.37) 2 которое при условиях 1 pt N и 0 t 1 принимает следующий вид: 1 Qn QN 1 . 2 Переходя к пределу при N , можно получить уравнение Q
1 Q 2
с решением Q A ,
где DF ln 2 ln 1 – фрактальная (хаусдорфова) размерность канторова множества [78]. Таким образом, в [84] было показано, что в промежуточной области значений величины pt , которая определяется неравенствами 1 pt N , функция p принимает следующий вид:
p A 1 pt F p . (2.38) В свою очередь, соотношению (2.38) соответствует представление y t в виде дробного интеграла:
y t A t 1
A
t
1
t
f d
0
(2.39)
1
1 0
1
1
1 u
f ut du,
где 0 1, 0 t; коэффициент A 2 2. Для 1 2 показатель имеет целочисленное значение, при этом фрактальная раз-
107
мерность соответствующего геометрического объекта совпадает с его топологической размерностью: DF 1. На основании (2.39) можно сделать вывод, что величина y t связана с функцией f t через полный интеграл и соответствует первому предельному случаю (эволюция физической системы с полной памятью). Случай 0 v DF 0 соответствует линейной комбинации двух -функций одинаковой (половинной) интенсивности, локализованных на концах рассматриваемого интервала 0, t , то есть имеется эволюция физической системы с полным отсутствием памяти. Таким образом, на основании вышеизложенного можно сделать следующий важный вывод: множество Кантора, являющееся предельным случаем N описанного выше построения, соответствует дробному интегралу, показатель которого совпадает с фрактальной размерностью канторова множества, а также указывает на долю сохраняющихся состояний в процессе эволюции физической системы и охватывает предельные случаи полностью замкнутой 1 и марковской 0 систем. Ряд физических систем, которые могут быть описаны уравнениями в дробных производных, должны содержать каналы, входящие в состав некоторой ветвящейся фрактальной структуры [84]. В [84] такие системы классифицируются как системы с «остаточной памятью». Поэтому процессы переноса в перколяционных кластерах, фрактальных деревьях, пористых системах должны тщательно классифицироваться для того, чтобы получить корректные уравнения переноса для таких систем. Физический смысл показателя дробного интеграла заключается в том, что значение этого показателя соответствует доли каналов или ветвей, открытых для протекания в перколяционном кластере, фрактальном дереве и т.д. Для процессов с потерями, обусловленными столкновениями, также следует использовать уравнения в дробных производных. В
108
частности, для упругих сил в [84] получено обобщенное уравнение переноса в дробных производных1. Изучение взаимосвязи между операторами дробного интегродифференциального исчисления и фрактальной геометрией проводилось как с математической, так и физической точки зрения во многих работах, в частности, в [83, 85 – 112], в которых был получен ряд глубоких результатов с учетом регуляризации и устойчивых распределений2. Контрольные вопросы 1. Приведите примеры недифференцируемых функций. 2. Дайте определение интегрального уравнения Абеля. 3. Приведите определения лево- и правосторонних дробных операторов и дробных производных Римана – Лиувилля. 4. Обобщенная формула Лейбница: определение и основные свойства. Рекомендуемая литература 2.1. Хилле Э., Филипс Р. Функциональный анализ и полугруппы. Пер. с англ. М., 1962. 2.2. Джрбашян М.М. Интегральные преобразования и представления функций в комплексной области. М., 1966.
1
Можно отметить, что там же обсуждается применимость таких уравнений для описания процессов релаксации наведенной электрической поляризации в диэлектриках. 2 Более подробно устойчивые по Леви распределения и их применения при исследовании корреляционных эффектов в процессах множественного образования частиц при высоких энергиях рассматриваются ниже (гл. 6, 8).
109
Глава 3 ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ И СЛУЧАЙНЫЕ ПРОЦЕССЫ
§1. Вводные замечания Случайность присуща в той или иной степени подавляющему большинству протекающих в природе процессов. В классической физике, как правило, она присутствует там, где существенное влияние на ход процесса оказывает очень большое число незначительных по отдельности факторов, особенно в том случае, когда система динамически неустойчива. В квантовой физике ситуация принципиально другая: статистический характер имеют сами законы, соотвественно, случайность, статистическая интерпретация являются ключевыми и неотъемлемыми понятиями квантовой теории. Теория вероятностей – раздел математической науки, занимающийся построением и изучением математических моделей случайных явлений. Внешне случайность проявляется как недостаточная регулярность в массовых явлениях, которая не позволяет с достоверностью предсказывать наступление определенных событий, то есть не допускает описания изучаемых явлений в рамках детерминированных моделей. Аппарат теории вероятностей позволяет по вероятности одних случайных событий находить вероятности других случайных событий, связанных каким-либо образом с первыми. Это изучение основано на том, что массовые случайные явления в стационарных условиях обладают закономерностью, называемой статистической устойчивостью частот, суть которой на интуитивном уровне можно пояснить следующим образом. Пусть некоторое случайное событие A может произойти или не произойти при осуществлении совокупности некоторых вопроизводимых условий S . Если данная совокупность условий осуществляется N раз, то говорят, что было произведено N испытаний. Пусть N A – число появлений собы-
110
тия A при N испытаниях; число N A называется частотой события A в N испытаниях, отношение N A N – относительной частотой. При больших N относительная частота обычно колеблется около некоторого фиксированного числа, называемого вероятностью события A и обозначаемого P A . Например, в классическом случае бросания правильной монеты событие «выпадение «герба» наблюдается примерно в половине случаев, поэтому вероятность появления фиксированного события можно считать равной 1 2 [113]. Таким образом, для описания взаимосвязи случайных событий с совокупностью условий возникновения данных событий вместо обычного для классического естествознания утверждения «при совокупности условий S наступает событие A » необходимо ограничиваться утвеждением «при совокупности условий S событие A имеет вероятность P A ». Именно для таких случайных событий, имеющих определенную вероятность, удалось построить содержательную математическую теорию, которая и носит название «теория вероятностей» [114]. Важно отметить, что статистические закономерности возникают и в неслучайных схемах, что используется при моделировании случайных явлений, например, методом Монте-Карло. В ряде физических и химических исследований в середине XX века возникла потребность наряду со случайными величинами рассматривать случайные процессы, то есть процессы для которых определена вероятность того или иного течения. Одним из наиболее известных и важных примеров случайного процесса является броуновское движение частицы, подробно рассматриваемое ниже. Наиболее важные и интересные конкретые результаты теории случайных процессов получены в двух специальных направлениях – марковские процессы (см. ниже) и стационарные случайные процессы. Элементарная теория вероятностей оказалась недостаточной для описания случайных явлений уже в достаточно простых ситуациях. Например, модель с конечным числом исходов непригодна для понятия «случайно выбранной на отрезке точки» [114]. Многие трудности, в том числе и приведенные выше, позволяет преодолеть
111
схема, предложенная А.Н. Колмогоровым в 1933 г. и ставшая с тех пор общепризнанной. В рамках настоящей книги при изложении элементов теории вероятностей авторы используют аксиоматический подход Колмогорова с привлечением фундаментальных понятий теории множеств и теории меры. §2. Основные понятия теории множеств Ниже приводятся некоторые, необходимые для дальнейшего изложения, элементы теории множеств в приложении к теории вероятностей. Определение 3.1. Вероятностным пространством называется упорядоченная тройка (пространств) , A, P , где – пространство элементарных событий – некоторое произвольное множество (элементами данного пространства являются элементарные события, обозначаемые ниже ), A – -алгебра подмножеств пространства элементарных событий, элементы которой называются (случайными) событиями, P – мера на , A , такая, что выполнено P 1. Ввиду важности и нетривиальности введенных выше пространств, остановимся подробнее на понятии -алгебры. 2.1. -Алгебра Пусть – множество (пространство) элементарных событий. Введем два события специальным образом: невероятное событие, обозначаемое , и достоверное событие, обозначаемое . Каждому событию A множества элементарных событий поставим в соответствие дополнительное событие, обозначаемое Ac . По определению событие Ac реализуется тогда, когда событие A не реализуется. Введем как аксиомы следующие свойства этой операции:
1) Ac
c
A;
112
2) c ; 3) c . Далее, каждой упорядоченной паре событий A и B поставим в соответствие следующие два события: объединение событий A и B, понимаемое как «реализация или события A, или события B » и обозначаемое в дальнейшем A B или sup A, B ; пересечение событий A и B, понимаемое как «реализация и события A, и события B » и обозначаемое в дальнейшем A B или inf A, B . Подчеркнем еще раз, что по определению событие A B происходит тогда и только тогда, когда происходит по крайне мере одно из событий A, B; событие A B происходит тогда и только тогда, когда происходят оба события A и B. Введенные таким образом бинарные операции объединения и пересечения событий обладают следующими свойствами: 1) A, B из : A B B A, A B B A – коммутативность; 2) A, B, C из : A B C A B C , A B C A B C – ассоциативность;
3) A A A, A A A; A Ac , A Ac ; A , A ; A , A A. Для всякого конечного непустого семейства событий определено объединение
A sup A i
i
i
Ai , i I
и пересечение событий се-
i
A inf A . Как аксиомы вводятся также следующие со-
мейства
i
i
i
i
отношения для произвольного конечного непустого семейства событий Ai , i I : 1) 2)
c
i
Ai
A ; c i
i
c
A A . i
i
i
i
113
Операции объединения и пересечения дистрибутивны по отношению друг к другу: B и Ai , i I , Ai , i 1,2, выполнено B Ai B Ai , B Ai B Ai . i i i i Определение 3.2. Структура, которая образуется на множестве событий введенными выше аксиомами и определениями, называется структурой булевой алгебры. Определение 3.3. Пусть – булева алгебра. Два события A и B такие, что A B , называются взаимно исключающими или непересекающимися. Определение 3.4. Объединение двух непересекающихся событий называется суммой и обозначается A B вместо A B.
Аналогично, если Ai , i I – заданное конечное непустое семейство попарно непересекающихся событий, то их объединение называется «суммой событий Ai iI », то есть «суммой событий данного семейства», и обозначается
A
i
вместо
A. i
i
i
Определение 3.5. Разностью двух событий A, B называется событие A B c , которое обозначается A B. Определение 3.6. Симметрической разностью двух событий A и B называется событие A B B A и оно обозначается как A B. По определению, событие A B происходит тогда и только тогда, когда событие A происходит, а событие B не происходит; событие A B происходит тогда и только тогда, когда происходит лишь одно из событий A, B. Обозначения
A , A , A i
i
i
i
i
удобно распространить и на тот
i
случай, когда i I , I – пусто. При этом полагают, что справедливы следующие соотношения:
A , A , A . i
i
i
i
114
i
i
В силу данного естественного соглашения все приведенные выше формулы, относящиеся к конечному семейству событий, справедливы также и для пустого семейства событий. Кроме того, это соглашение позволяет, например, записать в простом виде формулу, составляющую содержание следующей леммы. Лемма 3.1. Для всякого семейства Ai ,1 i n, состоящего из n n 1 событий, справедлива следующая формула: i 1 Ai Aj . i 1 i 1 j 1 Доказательство. Данная лемма будет доказана с помощью метода математической индукции. При n 1 справедливость утверждения леммы очевидно. Предположим, что утверждение леммы справедливо при n k , то есть выполняется следующее равенство: n
n
Ai
i 1 Ai Aj . i 1 i 1 j 1 Покажем, что данная формула справедлива для n k 1. Положим k
k
Ai
k
A
A, B A
k 1.
i
Лемма будет доказана, если установить, что для
i 1
любых событий A и B справедливо A B A B A , то есть с учетом введенных выше обозначений справедливы равенства k
k Ai Ak 1 Ai Ak 1 Ai i 1 i 1 i 1
k
k
c
k Ai Ak 1 Ai i 1 i 1
k
i 1
A A . i
i 1
j
j 1
Но
для любых двух событий A и B искомое соотношение A B A B A следует непосредственно из определений объединения, суммы и разности двух событий. В силу показанной выше эквивалентности равенства A B A B A и утверждения леммы, лемма 3.1 доказана. ▲ Необходимо отметить, что предыдущая лемма 3.1 утверждает тот факт, что одно из событий семейства Ai ,1 i n происходит тогда и только тогда, когда существует первое происходящее собы-
115
i 1 тие в этом семействе. Другими словами, событие Ai A j про j 1 исходит тогда и только тогда, когда Ai является первым происходящим событием в семействе.
2.2. Классы подмножеств Определение 3.7. Говорят, что событие A влечет событие B и пишут соответственно A B или B A, если A A B или, что равносильно, B A B. Определение 3.8. Два события A, B, для которых справедливо A B и B A, называют эквивалентными и пишут A B. Ниже, если специально не оговорено, эквивалентные события считаются неразличимыми. Отношение «влечет» является отношением порядка в множестве событий. Это означает, что A, B, C справедливы следующие соотношения: A A; A B, B A A B; A B, B C A C , выражающие свойство транзитивности. Важно отметить, что объединение A B (пересечение A B ) двух событий A и B является точной верхней (соответственно, точной нижней) гранью этих событий, относительно рассматриваемого порядка. Кроме того, A B B c Ac . Определение 3.9. Класс подмножеств E множества называется замкнутым относительно некоторой операции над множествами, если при применении этой операции к любым подмножествам множества , принадлежащим классу E, в результате получается подмножество множества , также принадлежащее классу E. Булева алгебра подмножеств множества есть класс подмножеств , содержащий в качестве элементов , и замкнутый относительно операций образования дополнений, конечных объединений и конечных пересечений. В силу соотношений
A1 A2 An A1c A2c Anc
116
c
,
A1 A2 An A1c A2c Anc
c
для того, чтобы класс A был булевой алгеброй, достаточно, чтобы он содержал , и был замкнут относительно дополнений и конечных объединений (или, дополнений и конечных пересечений). Для всякого класса E подмножеств множества существует наименьшая булева алгебра A подмножеств множества , содержащая E. Такой булевой алгеброй является класс всех подмножеств множества , принадлежащих всем булевым алгебрам (подмножествам множества ), содержащим E. Данная наименьшая булева алгебра называется булевой алгеброй, порожденной классом E. Рассмотрим более подробно простейший случай конечных булевых алгебр. Определение 3.10. Конечным разбиением P Ai , i I множества называется конечное семейство непустых попарно непересекающихся подмножеств множества , в объединении дающих все множество . Без доказательств приведем несколько важных предложений. Предложение 3.1. Булева алгебра A, порожденная конечным разбиением P множества , состоит из объединения всевозможных подсемейств семейства P (если P имеет n элементов, то булева алгебра A состоит из 2n элементов). Обратно, если A является конечной булевой алгеброй подмножеств множества , то множество ее атомов (то есть непустых подмножеств алгебры A, являющихся одновременно подмножествами множества , и для которых справедливы следующие соотношения: B A, B A, B A ) образуют конечное разбиение множества , порождающее A. Предложение 3.2. Пусть E является произвольным классом подмножеств множества . Образуем последовательно следующие классы: 1) класс E1 , состоящий из множеств , и из A таких, что либо AE, либо Ac E;
117
2) класс E2 конечных пересечений подмножества из E1; 3) класс E3 конечных объединений попарно непересекающихся подмножеств из E2 . Построенный таким образом класс E3 совпадает с булевой алгеброй, порожденной классом E. Важно отметить, что предложение 3.2 дает конкретную конструкцию булевой алгебры, порожденной классом E. §3. Пространства, классы и алгебры в теории вероятности Определение 3.11. Вероятность P на булевой алгебре A подмножеств множества есть отображение булевой алгебры A в множество действительных чисел, удовлетворяющее следующим аксиомам: 1) AA : 0 P A 1, P 1; 2) для любого конечного семейства Ai , i I попарно непересе кающихся событий справедливо P Ai P Ai – свойство i i аддитивности; 3) для любой последовательности событий An , n 1 монотонно
стремящейся к , такой, что A1 A2 An и
A
n
,
n
справедливо lim P An 0 – свойство непрерывности в относиn
тельно монотонных последовательностей. Ниже приведены свойства вероятности, являющиеся простыми следствиями аксиом 1) и 2)1: а) P 0; б) если A1, A2 A и A1 A2 , то P A1 P A2 – свойство монотонности;
1
Ими обладают, естественно, также те функции множеств, которые не удовлетворяют аксиоме 3) в определении 3.11.
118
в) A1 , A2 A : P A1 P A2 P A1 A2 P A1 A2 – свойство сильной аддитивности; г) конечного семейства событий Ai , i I справедливо соот ношение: P Ai P Ai – свойство полуаддитивности. i i Определение 3.12. Булевой -алгеброй (или борелевским полем) подмножеств множества называется класс A подмножеств множества , содержащий , и замкнутый относительно операций дополнения, счетного объединения и счетного пересечения. Определение 3.13. Пара , A , состоящая из множества и (булевой) -алгебры A подмножеств множества , называется измеримым пространством. Необходимо отметить, что для того чтобы класс A подмножеств множества был -алгеброй, достаточно, чтобы он содержал , и был замкнутый относительно операций дополнения и счетного объединения. Определение 3.14. Измеримое пространство , A называется фазовым пространством, если -алгебра A содержит все подмножества , состоящие из одной точки. Определение 3.15. Пусть E1 и E 2 являются непустыми множествами и определено преобразование : E1 E 2 . Пусть F – некоторая система подмножеств множества E 2 . Полным прообразом
1 F называется множество 1 , F 1 F . Замечание. Определение 3.15 применимо и в том случае, когда отображение определено лишь на некотором подмножестве E множества E . Пусть даны измеримые пространства E1 , A1 ,, E n , An . Можно образовать топологическое произведение, определяемое следующим образом: E1 E 2 E n x1 ,, xn ; i 1,n : xi Ei . Будем обозначать -алгебру в построенном выше топологическом произведении E1 E 2 E n , которая порождается множествами
119
вида 1 2 n i Ai , i 1,, n , через A1 A2 An . В частном случае, если E1 = E 2 E n E , будем писать E n вместо E1 E 2 E n . В случае, когда A1 = A2 An A, будем писать A n вместо A1 A2 An соответственно. Предположим далее, что задана бесконечная последовательность измеримых пространств E n , An , n 1,2, Условимся обозначать через E1 E 2 E n множество всех последовательностей
x1,, xn , ,
где n 1,2, : xn E n и обозначать через
A1 A2 An -алгебру в этом множестве, порожденную подмножествами вида A1 An E n 1 E n 2 , n 1,2,, где i 1,n : Ai Ai . В частном случае одинаковых сомножителей указанные выше объекты будут обозначаться E и A соответственно. Определение 3.16. Отображение : E1 , A1 E 2 , A2 измеримого пространства E1 ,A1 в измеримое пространство E 2 ,A2 называется измеримым отображением, если 1 A2 A1 . Определение 3.17. Для всякой монотонно возрастающей последовательности An , n 1 A1 A2 An подмножеств множества положим lim An An .
n
n
Определение 3.18. Для всякой монотонно убывающей последовательности An , n 1 A1 A2 An подмножеств множества положим lim An An .
n
n
Определение 3.19. Класс E подмножеств множества называется монотонным, если он замкнут относительно операций lim и lim 1. 1
Здесь имеются в виду пределы по последовательностям.
120
Предложение 3.3. Для того, чтобы булева алгебра A была алгеброй, необходимо и достаточно, чтобы она была монотонным классом1. Определение 3.20. Множество N в вероятностном пространстве , A, P называется нулевым (относительно вероятности P ), если существует множество AA, такое, что N A, P A 0. Определение 3.21. Вероятностное пространство , A, P называется полным, если A содержит все P -нулевые подмножества множества . Для дальнейшего рассмотрения представляется важным напомнить понятие булевой полуалгебры, являющееся вспомогательным понятием, которое оказывается особенно полезным при изучении вероятностей на действительной прямой и в произведении пространств. Определение 3.22. Класс J подмножеств множества называется булевой полуалгеброй, если он удовлетворяет следующим условиям: 1) , J; 2) класс J замкнут относительно конечных пересечений; 3) дополнение S c каждого множества SJ есть объединение конечного семейства попарно непересекающихся подмножеств множества из класса J. Теорема 3.1. Булева алгебра A, порожденная булевой полуалгеброй J подмножеств множества , состоит из сумм A
S
i
i
конечных семейств Si , i I попарно непересекающихся подмножеств множества , принадлежащих классу J. Для каждой аддитивной функции множеств P, отображающей класс J в отрезок 0,1 , и такой, что P 1, равенство
P ' A
P S i
i
1
Доказательство данного предложения предоставляется читателю.
121
(корректно) определяет единственное аддитивное продолжение P ' функции P на алгебру A. Если функция P является - аддитивной на классе J, то функция P ' является вероятностью на алгебру A; в этом случае существует единственная продолжающая вероятность P на -алгебре, порожденной на классе J (совпадающая с -алгеброй, порожденной A ). Si есть булева алгебра подДоказательство. Класс S сумм
i
множеств множества . Действительно, данный класс содержит в качестве элементов и ; является замкнутым относительно ко нечных пересечений: Si S 'j Si S 'j ; является замкну iI jJ I J тым относительно образования дополнений, то есть справедливо:
c
c c Si Si и Si S в силу аксиомы (3) определения булевой iI i I полуалгебры (определение 3.22). Очевидно, что класс J порождает S. Для доказательства корректности определения P ' на S необхо-
димо показать, что если
S S , то P S P S . ' j
i
iI
Используя Si
Si S 'j
jJ
,
S 'j
jJ
' j
i
iI
Si S 'j
jJ
,
а также свойство
iI
аддитивности рассматриваемой функции множеств P и булевой полуалгеброй J, можно получить следующие равенства:
P S P S S P S . i
iI
i
I J
' j
' j
Таким образом, корректность
jJ
доказана. Докажем ниже аддитивность (а именно, -аддитивность) продолжения функции множеств P P ' на классе S. Если конечное (счетное) семейство множеств A j Si j из класса S ( Si j J,
iI j
множество I j конечно), пронумерованных индексами j J , есть
122
разбиение некоторого множества A
S
из S, то используя
k
kK
разложения Sk
S
j i
S k , k K ; Si j
jJ iI j
S
j i
Sk , i I j , j J
k K
и свойство аддитивности ( -аддитивности) функции множеств P на классе S, можно последовательно получить следующие равенства: P' A
P S P S k
i
kK
j
P S
Sk
kK jJ iI j
j i
Sk
jJ iI j kK
P S P A . Таким образом, аддитивность доказана. j
'
j
i
jJ iI j
jJ
Единственность продолжения функции P ' очевидна. Последнее утверждение данной теоремы есть следствие из теоремы о продолжении. Теорема доказана. ▲ В теории вероятности нередко бывает трудно, а иногда и вообще невозможно доказать, что построенная некоторым образом функция множеств обладает свойством -аддитивности, даже если эта функция аддитивна по построению. Тем не менее в довольно широком классе случаев можно установить -аддитивность аддитивной функции множеств, доказав, что рассматриваемое пространство удовлетворяет некоторому дополнительному условию компактности. Введем данное условие в наипростейшей возможной форме. Определение 3.23. Класс E подмножеств множества назы
вается компактным, если для любой последовательности Cn n 1
множеств из класса E, для которых
C
n
, существует целое
n 1
число N , такое, что
C
n
.
n N
§4. Меры и интегралы Определение 3.24. Пусть E ,A – измеримое пространство. Неотрицательная функция
123
: A R , где A – -алгебра на E , R 0, , называется мерой, если для любого конечного или счетного набора 1, 2 ,, n , попарно непересекающихся множеств из A справедливо равенство i i . i i Определение 3.25. Пусть – мера в измеримом пространстве
E , A .
Если E , то и A : . В этом случае рассматриваемая мера называется конечной. Подкласс класса конечных мер образуют так называемые вероятностные меры, для которых E 1. Определение 3.26. Мера называется -конечной, если най-
n n 1 , n, n 1,2, : n A и n, n 1,2, : n .
дется последовательность множеств такая, что
n
E
n
Пусть – мера в измеримом пространстве E , A . Положим A , если найдутся множества 1, 2 из A такие, что справедли-
во 1 2 и 1 2 . Система A является -алгеброй в пространстве E , A . Определение 3.27. Система A называется пополнением по мере . Если положить 1 2 , коль скоро справедливы соотношения: 1 2 , 1 , 2 A и 1 2 , то можно получить некоторую меру на -алгебре A , являющуюся продолжением первоначальной меры, заданной на -алгебре A. Определение 3.28. Продолженная указанным выше образом мера на -алгебру A называется пополнением меры . Из включения A A следует, что всякая A -измеримая функция является также A -измеримой.
124
Предположим теперь, что в измеримом пространстве E ,A задана совокупность мер M . Пересечение всех -алгебр, получающихся пополнением A по мерам M , также является алгеброй. Определение 3.29. Полученная указанным выше способом алгебра называется пополнением -алгебры A по системе мер M . На эту -алгебру естественно продолжаются все меры M. Необходимо заметить, что если A является пополнением A по некоторой системе мер M , то пополнение A по системе мер M совпадает с A . Лемма 3.2 (Бореля – Кантелли). Пусть E ,A – измеримое пространство, – мера на данном измеримом пространстве
E , A ,
и задана
An n1
– последовательность элементов An A
такая, что числовой ряд
A
n
сходится. Тогда мера множества
n 1
точек x , принадлежащих одновременно бесконечному числу элементов последовательности An n1 , равна нулю. К данной лемме мы вернемся позже, переформулировав ее на языке вероятностей и обсудив ее значение для эксперимента1. Определение 3.30. Пусть – мера на измеримом пространстве
E , A ,
пусть также заданы некоторая функция f x и последова-
тельность функций
f n x n1 ,
являющихся A -измеримыми функ-
циями. Если 0 : lim x; f n x f x 0, то говорят, n
что последовательность функций
f n x n1
сходится к функции
f x по мере и пишут f n x f x . n
1
Данное обсуждение будет выполнено в §5, переформулированная на языке вероятности лемма будет обозначена как лемма 3.6 соответственно.
125
Лемма 3.3. Пусть E ,A – измеримое пространство, каждой паре натуральных чисел m n поставлена в соответствие неотрицательная A -измеримая функция f nm x , xE , и пусть при некотором l m n : f nl x f ml x f nm x и для каждого 0 выполнено
lim x; f nm x 0. Тогда из любой стремящейся к
m ,n
последовательности чисел можно выбрать подпоследовательность mk k 1 такую, что lim f nml k x 0 для почти всех (отноk ,l
сительно ) xE , то есть для всех xE , не входящих в некоторое множество A, для которого 0. Данная лемма приводится без доказательства, которое можно найти в [115, 116]. На основе сформулированной леммы можно доказать следующие предложения. Предложение 3.4. Пусть E ,A – измеримое пространство, если для последовательности функций
f n x n1
присутствует сходи-
мость по мере : f n x f x , то найдется подпоследовательn
f nk
x k 1 f n x n1 такая, что имеет место сходимость f x для почти всех (относительно ) xE . x k
ность
f
nk
Предложение 3.5. Пусть – мера на измеримом пространстве
E , A ,
если 0 : lim x; f n x f m x 0, то последоm ,n
вательность функций
f n x n1
сходится по мере к некоторой
функции f x , то есть f n x f x . n
Предложение 3.6. Пусть – мера на измеримом пространстве
E , A , если данная мера конечна и последовательность функций f x, f n x n1 сходится к некоторой функции f x , f n x n 126
для почти всех (относительно ) xE , то имеет место и сходи
мость по данной мере: f n x f x . n
Определение 3.31. Пусть – мера на измеримом пространстве
E , A .
Пусть f x – A -измеримая функция, определенная на не-
котором подмножестве E f E и пусть A E f . Говорят, что функция f x является -суммируемой функцией на A , если существуют следующие конечные пределы: k k k 1 lim x : x A, f x , n n n k 0 n
lim
n
k 1 k k 1 x : x A , f x . n n k 1 n
Сумма данных пределов называется интегралом функции f x по мере и обозначается следующим образом:
f x dx . A
Если один из указанных пределов бесконечен, а другой имеет конечное значение, то интегралу приписывают значение (если бесконечен первый предел) или (если бесконечен второй предел). Замечание. В тех случаях, когда говорится о -суммируемой функции без указания какого-нибудь конкретного множества A , имеется в виду функция, -суммируемая на всей области определения. Перечислим некоторые важные свойства определенного выше интеграла1. 1. Лемма Фату.
1
Во избежание излишнего загромождения изложения, данные свойства приводятся без доказательств, которые являются несущественными для дальнейшего рассмотрения.
127
Если для всех xA и n, n 1,2, : f n x C , то справедливо следующее неравенство: lim n
f x dx lim A
A
n
f n x dx .
2. Если для всех xA и n, n 1,2, выполнены неравенства f n x C и для почти всех (относительно ) xA выпол-
нено f n x f x , то lim
n
f
n
x dx f x dx .
A
A
3. Если функция g x является -суммируемой функцией на A ; для почти всех (относительно ) xE имеет место сходимость
f n x n1
последовательности функций
к некоторой функции
f x : f n x f x ; n 1,2, справедливо n
выполняется равенство lim
n
f
n
f n x g x , то
x dx f x dx .
A
A
4. Теорема Фубини. Пусть i – -конечные меры на измеримых пространствах
Ei , Ai , i 1,2
и пусть
f x1 , x2 является
A1 A2 -измеримой
функцией на E1 E 2 такой, что выполнено условие абсолютной f x1 , x2 2 dx2 1 dx1 . Тогда E1 E 2 1 справедливо следующее равенство : f x1 , x2 2 dx2 1 dx1 f x1 , x2 1 dx1 2 dx2 . E1 E 2 E 2 E1
сходимости интеграла:
1
Если рассматриваемая функция f x неотрицательна, то дополнительное условие об абсолютной сходимости интеграла является излишним.
128
5. Пусть задано отображение : E1 , A1 E 2 , A2 , причем является измеримым отображением, и пусть задана мера на измеримом пространстве E1 , A1 . Тогда формула
1 , A1 определяет меру на пространстве E 2 , A2 . Для любой A2 - измеримой функции f справедливо следующее равенство:
f x dx f x dx . 2
2
E2
1
1
E1
Точнее, если хотя бы один из указанных двух интегралов существует, то существует и другой интеграл, причем эти интегралы равны между собой. 6. Пусть U , AU , V , AV , Z , AZ – три измеримых пространства, F u, z uU , zZ – AU AZ -измеримая числовая функция. Пусть определены v v V – меры на Z , AZ , причем v есть AV -измеримая функция от v при любом AZ . Если интеграл G u, v F u, z v dz сходится при всех uU , v V , то он
Z
определяет AU AV -измеримую функцию от u и v. Определение 3.32. Пусть
E ,A
– измеримое пространство.
Функция , определенная на некоторой подсистеме A системы A и принимающая значения из промежутка , или из интервала , , называется счетно-аддитивной, если для любого конечного или счетного набора множеств 1, 2 , из A такого, что 1 2 A , 1 выполняется следующее равенство:
1 2 .
Запись 1 2 означает, что множества 1 , 2 , попарно не пересекаются и их сумма равна множеству . 1
129
Важно отметить, что каждую меру на измеримом пространстве E ,A можно рассматривать как счетно-аддитивную функцию на A A. Пусть – счетно-аддитивная функция и – мера, определенные на одной и той же -алгебре A, то есть на одном и том же измеримом пространстве E , A . Определение 3.33. Говорят, что определенная выше функция дифференцируема относительно меры , если существует A - измеримая функция f x такая, что для всех : A выполняется равенство
f x dx .
Функция f x называется производной от функции по мере
и обозначается d d . Важно отметить, что она определена лишь с точностью до множества точек, имеющих меру , равную нулю. Для любой -суммируемой функции g x 1 с учетом указанных выше определений и условий справедливо следующие равенство: d g x dx g x dx . d E E
§5. Вероятности 5.1. Вероятности на прямой R1 Вероятности на прямой обычно вводятся с помощью функций распределения.
1
Здесь подразумевается, что функция g x является суммируемой не по
мере , а по другой структуре, которой в данном случае является алгебра.
130
Определение 3.34. Пусть некоторая функция F x определена на прямой , и F x : R1 R1 . Функция F x называется функцией распределения, если она не убывает, непрерывна слева и удовлетворяет следующим предельным условиям: lim F x 0, lim F x 1. (3.1) x
x
Покажем, что между функциями распределения и вероятностями на действительной оси существует взаимно однозначное соответствие. Рассмотрим класс J всех промежутков на числовой оси (интервалов, полуинтервалов, отрезков). Класс J образует булеву алгебру и порождает булеву алгебру конечных объединений непересекающихся интервалов. Обозначим через R булеву -алгебру, порожденную классом J. В силу того, что каждый промежуток на R1 есть счетное пересечение и каждое открытое множество есть счетное объединение открытых промежутков, то R является также наименьшей -алгеброй, содержащей все открытые множества. Определение 3.35. Подмножества R, принадлежащие введенной выше -алгебре R, называются борелевскими множествами. Теорема 3.2. Пусть P – вероятность на R, R , F x : R1 R1 – функция распределения на прямой R1 , I x , x , x R1. Тогда формула P Ix F x (3.2) устанавливает взаимно однозначное соответствие между вероятностью P на R, R и функцией распределения F x на R1. Доказательство. Пусть P – вероятность на R, R . Тогда, согласно определению вероятности x , y R1 , x y : I x I y и для произвольной последовательности
xn , n 1 R1
выполнены сле-
дующие предельные соотношения: I xn I x при xn x; I xn n
1
при xn ; I xn R при xn . В силу справедливости n
n
указанных соотношений F x P I x – функция распределения.
131
Проведем доказательство в обратную сторону. Пусть задана некоторая функция F x : R1 R1 и F x является функцией распределения. Определим функцию множеств P на классе J, положив a , b R, a b выполнение следующих соотношений: P a, b F b F a ; P a , b F b F a 0 ; P a, b F b 0 F a ; P a, b F b 0 F a 0 .
Тогда определенная таким образом функция множеств P есть аддитивная функция множеств, отображающая класс J в отрезок 0,1 и удовлетворяющая условию P R 1. Таким образом, согласно определению P – вероятность. Теорема доказана. ▲ Обозначим через E класс всех компактных (замкнутых ограниченных) промежутков на R. Тогда класс E компактен. Лемма 3.4. Если класс E подмножеств множества компактен, то также компактен и наименьший класс E ' , содержащий E и замкнутый относительно операций конечного объединения и счетного пересечения. Предложение 3.7. Пусть A – булева алгебра или полуалгебра подмножеств множества и пусть E – компактный подкласс A. Всякая аддитивная функция P, отображающая A в отрезок 0,1 и такая, что P 1, AA : P A supP C ; C A, C E, является вероятностью. Следовательно, функция P является -аддитивной, и поэтому имеет единственное продолжение до вероятности на R, R . 5.2. Действительные случайные величины Пусть , A – измеримое пространство. Определение 3.36. Действительной ступенчатой случайной величиной на , A называется отображение X множества в действительную прямую R1 вида X xi при Ai i I , где
132
Ai , i I
– конечное разбиение измеримого пространства , A и
действительные числа xi i I попарно различны. Теорема 3.3. Для того чтобы отображение X множества в действительную прямую R1 было ступенчатой действительной случайной величиной, необходимо и достаточно, чтобы класс X 1 R был конечной -полуалгеброй -алгебры A. Доказательство. Необходимость: класс X 1 R совпадает с булевой -алгеброй, порожденной семейством Ai i I . Достаточность: рассмотрим конечное разбиение Ai , i I множества на множества из -алгебры A, порождающее класс X 1 R , согласно предложению 3.1. Отображение X постоянно
на каждом множестве Ai данного разбиения. Действительно, пусть
, ' в некотором множестве Ai , для которых X X ' .
Тогда можно было бы выбрать борелевское множество S в R, со-
держащее X и не содержащее X ' . Тогда были бы справедливы соотношения X
1
S Ai , X 1 S Ai X 1 R
и вы-
бранное борелевское множество строго содержалось бы в Ai , что невозможно. Таким образом, наше предположение неверно и отображение X действительно постоянно на каждом множестве Ai данного разбиения. Наконец, значения отображения X на множестве Ai попарно различны, поскольку в противном случае множества Ai не могли бы все принадлежать классу X 1 R . Теорема доказана. ▲ Каждому множеству AA поставим в соответствие ступенчатую действительную случайную величину.
133
5.3. Распределение действительной случайной величины Определение 3.37. Пусть – случайная величина, то есть измеримое отображение вероятностного пространства измеримое пространство
X , B ; : , A , P X , B .
, A, P
в
Распреде-
лением случайной величины называется вероятностная мера на измеримом пространстве X , B , определяемая следующим соотношением: BB : B P B, (3.3) где, более подробно, P B P ; : B. Определение 3.38. Совместным распределением случайных величин , , , где
: , A, P X , B , : , A, P Y , C ,
: , A, P Z , G , называется вероятностная мера A , где AB C G, соответствующая распределению случайного вектора , ,, и определяемая следующим соотношением: AB C G : A P , ,, A. (3.4) Определение 3.39. Случайные величины , , называются независимыми, если для них справедливо соотношение: . (3.5) Определение 3.40. Случайные величины из бесконечного семейства называются независимыми, если для любого конечного числа отличных друг от друга значений 1, 2 , n случайные величины 1 , 2 ,, n являются независимыми. Как отмечали А.Н. Колмогоров и ряд других авторов, именно понятие независимости в большей мере, чем что-либо другое, вы-
134
деляет теорию вероятностей среди других ветвей математического анализа и составляет ее характерную особенность. 5.4. Моменты и семиинварианты Распределение случайной величины принято характеризовать различными числовыми характеристиками, называемыми моментами. В данном разделе ниже, если другое не оговорено специально, рассматриваются случайные величины и , являющиеся измеримыми отображениями : , A, P X , B , : , A, P Y , C . Определение 3.41. Математическое ожидание (обозначается ) действительной случайной величины определяется как интеграл Лебега по следующей формуле: P d .
(3.6)
Если определена функция распределения F x случайной величины , то математическое ожидание может быть вычислено и как интеграл Лебега – Стилтьеса (Римана – Стилтьеса)
xdF x ,
при этом интегрируемость в смысле (3.6) равносильна конечно
сти интеграла
xdF x .
Определение 3.42. Моментом порядка k ( k 0, k – целое) случайной величины называется математическое ожидание k , если оно существует. Если F x – функция распределения данной случайной величины, то
mk k k P d
x dF x . k
(3.7)
Важно отметить, что при определении моментов в теории вероятностей используется прямая аналогия с соответствующим поня-
135
тием, играющим существенную роль в механике: формулой (3.7) определяются моменты распределения масс. В соответствии с (3.6) и (3.7) момент первого порядка является собственно математическим ожиданием случайной величины (статический момент в механике). k
Определение 3.43. Величина называется абсолютным моментом порядка k (момент данного типа определяется и для неk
целых k ). Величина a называется моментом k -го порядk
ка относительно a. Величина называется центральным моментом k -го порядка. Центральный момент второго порядка имеет специальное название – «дисперсия» (соответствует моменту инерции в механике). Дисперсия случайной величины (обозначается D ) определяется в общем случае (комплексная случайная величина) по следующей формуле: 2
D . (3.8) Аналогично определяются моменты совместного распределения случайных величин , , . Определение 3.44. Для любых целых ki 0, i 1,, n таких, что n
k
i
k математическое ожидание k1 k2 kn называется сме-
i 1
шанным моментом порядка k . Смешанным центральным моменk
k
k
том порядка k называется 1 2 n . Определение 3.45. Смешанный момент второго порядка для двух случайных величин и при k1 k2 1 называется ковариацией и является одной из основных характеристик зависимости между данными случайными величинами. Ковариация случайных величин и (обозначается cov , ) в общем случае определяется по следующей формуле: cov , . (3.9) В случае действительных случайных величин и соотношения (3.8) и (3.9) переходят соответственно в следующие формулы:
136
2
D ,
(3.10)
cov , . (3.11) 1 Аналитический аппарат теории вероятностей позволяет определять моменты случайной величины другим образом и вводить дополнительные важные характеристики. В частности, моменты случайной величины определяются значениями соотвествующих производных характеристической функции: k k d f t mk i , k 1. k dt t 0 Если существует абсолютный момент a N , то справедливо следующее разложение: N
f t 1
it
k
mk o t N .
k 1 k ! Определение 3.46. Семиинвариантом (кумулянтом) порядка n называется числовая характеристика случайной величины , равная коэффициенту разложения соответствующей характеристической функции в ряд Тэйлора:
d n ln f t K n i (3.12) . n dt t 0 Понятие семиинварианта родственно понятию момента и взаимосвязь семиинвариантов и моментов выражается формулой j1 jr n K lr n ! K l1 mn , r 0 j ,l j1 ! jr ! l1 ! lr ! где внутренняя сумма распространяется на все неотрицательные n
r
значения j и l , для которых
jl
i i
n, и наоборот
i 1
1
Вследствие важности более подробно некоторые аналитические методы теории вероятности (характеристическая и производящая функции) рассмотрены в приложении 3.
137
j 1
1 j 1 ml
j
j
1 r mlr , j1 ! jr ! l1 ! r 0 j ,l lr ! где внутреннее суммирование производится по всем неотрицательным целым числам j и l , удовлетворяющим следующим услови-
n
K n n !
r
ям:
1
r
jl
i i
j
n и
i
i 1
j.
i 1
Необходимо отметить, что, учитывая взаимосвязь характеристической и производящей функций (П3.7), можно переписать определение семиинварианта (3.12) с использованием производящей функции следующим образом: n d n ln f t n d ln exp it K n i i n dt n t 0 dt t0 n
d n ln u d n u d n ln u i , du n dt n du n u 1 t 0 где u t exp it . В многомерном случае семиинвариант определяется аналогично (3.12). Точнее, пусть 1 , r – r -мерный случайный вектор, n
то есть набор из r случайных величин, f t1 ,tr – соответствуюn
щая характеристическая функция. Если i 1, r : i для n 1, то логарифм ln f t1 ,tr (ветвь, равная нулю в нуле) имеет в
некоторой окрестности точки t1 tr 0 непрерывные частные производные до порядка n включительно. Величины k1 k r k kr K k1kr i 1 t k1 t kr ln f t1 ,tr , 1 r t 0 r
где i 1, r : ki 0, ki n называются семиинвариантами поi 1 r
рядка k ki случайного вектора . i 1
138
Определение 3.47. Факториальным моментом поряка k ( k 1 – целое) случайной величины называется числовая характеристика данной величины, равная математическому ожиданию (если оно k существует) случайной величины 1 k 1 : Fk 1 k 1 . (3.13) Факториальные моменты могут быть выражены через моменты случайной величины и наоборот. Факториальные моменты используются, как правило, для целочисленных случайных величин и этом случае они достаточно просто выражаются через производные соответствующей производящей функции: k
dkz Fk (3.14) , k 1. k dz z 1 Необходимо отметить, что для любой случайной величины : , A, P X , B ; 0 и для любой неотрицательной B измеримой функции f справедливо следующее неравенство: P A f , где A x; f x .
(3.15)
Неравенство (3.15) называется неравенством Чебышева. Скалярное произведение на линейном пространстве случайных величин вводится следующим образом: для двух любых случайных величин : , A, P X , B и : , A, P X , B скалярное произведение равно , . Таким образом, для действительных случайных величин получается евклидово пространство интегрируемых с квадратом случайных величин L2 , A, P . На языке вероятностей общее определение 3.39 можно переформулировать следующим, более простым и распространенным, образом. Определение 3.48. Две случайные величины и называются независимыми, если для любых вещественных чисел x и y : P x, y P x P y .
139
Подобное утверждение справедливо и для конечномерного набора 1 , 2 ,, n случайных величин. Важным следствием независимости случайных величин является следующее соотношение для математического ожидания произведения независимых случайных величин: n
n
i i . i 1
i 1
5.5. Счетные вероятности В теории, посвященной счетным вероятностям и основанной на работе Э. Бореля, речь идет об изучении бесконечной последовательности экспериментов. Важно отметить, что “по Бернулли” всегда рассматривают только вероятности событий, зависящие от конечного числа n экспериментов, даже если в дальнейшем происходит неограниченное увеличение n. Данный случай принципиально отличается от случая, когда изучаются, следуя Э. Борелю, вероятности событий, зависящих от бесконечной последовательности экспериментов. При таком подходе часто рассматриваются события, теоретически возможные, но имеющие нулевую вероятность. Например, таким событием является постоянное выпадение «орла» при подбрасывании монеты. Соответственно, событие, противоположное событию с нулевой вероятностью, будет иметь единичную вероятность. Такие события называют «почти достоверным» или происходящим «почти наверное». Лемма 3.5. (Бореля) Если последовательность независимых экспериментов дает для наступления события E следующие вероятности: 1, 2 ,, n ,, то вероятность осуществления события E бесконечное число раз может быть только нулем или единицей.
Данная вероятность равна нулю, если ряд
n 1
единице, если указанный ряд расходится.
140
n
сходится, и равна
Лемма 3.6. (Кантелли) В случае сходимости ряда
, n
рас-
n 1
сматриваемого в лемме 3.5 (Бореля), утверждение Э. Бореля справедливо и тогда, когда эксперименты не являются независимыми. Последнее утверждение часто называют также леммой Бореля – Кантелли1, подчеркивая тем самым, что оно является расширением леммы 3.5 (Бореля). Лемму 3.6 удобно использовать даже в тех n
случаях, когда вероятности i i 1 являются независимыми друг от друга, так как в этом случае не надо доказывать специально эту независимость. §6. Случайные процессы Определение 3.49. Случайной функцией называется семейство случайных величин , зависящих от некоторого параметра t, значения которого пробегают произвольное множество T . Ниже случайная функция обозначается общепринятым способом, а именно, либо t , t T (параметр t записывается в виде индекса), либо t , t T . Поскольку случайная величина является измеримым отображением основного вероятностного пространства , A, P в измеримое пространство X , B , то случайная функция t , t T – это, если записать определение 3.42 более подробно, функция t от двух параметров t T , , которая при каждом значении t является измеримой по . Ниже, если специально не оговорено, в случае, когда рассматриваются числовые случайные функции, в качестве измеримого пространства X , B подразумевается числовая прямая R1 с соот1
В данном случае лемма Бореля – Кантелли сформулирована на языке вероятности, более удобном с точки зрения эксперимента. Формулировка данной леммы на языке меры представлена выше в §4 и обозначена как лемма 3.2.
141
ветствующей -алгеброй борелевских множеств B1 (или комплексная плоскость C 2 с соответствующей -алгеброй борелевских множеств C 2 ). Когда T – подмножество действительной прямой, а параметр t интерпретируется как время, вместо термина «случайная функция» употребляется термин «случайный процесс» (когда подмножество T состоит из целых чисел, говорят также о случайной последовательности). Иногда вместо термина «случайный процесс» используют термины «вероятностный процесс» или «стохастический процесс». В случае когда t описывает некоторую совокупность параметров, то есть является многомерным параметром вводится термин «случайное поле». Качественно случайный процесс можно определить как процесс (то есть изменение во времени состояния некоторой системы), течение которого зависит от случая и для которого определена вероятность того или иного его течения. Если случайная функция t интегрируема в квадрате, то определено скалярное произведение t, sT : t , s t s , являющееся функцией двух переменных t, s . Данная функция двух переменных, в свою очередь, позволяет однозначно задать случайную функцию t , t T с точностью до изометрического линейного преобразования пространства L2 , A, P . По-видимому, не имеет смысла рассматривать только моменты второго порядка t s , не рассматривая моменты первого порядка. Поэтому в качестве характеристик интегрируемой в квадрате случайной функции вводится математическое ожидание t и корреляционная функция t, s 1, которая определяется как ковариация случайных величин t и s , t , sT согласно следующему равенству: t, sT : t, s cov t , s . В соответствии с данным определением при s t можно получить не что иное как диспер1
В литературе для корреляционной функции также встречаются следующие обозначения: t , s или t , s .
142
сию случайной функции t , то есть t, t D t . Важно отметить, что корреляционная функция довольно простым образом связана с моментами низших порядков: t , s t s t s или, переписывая данную формулу через скалярное произведение, t, s t , s t ,11, s . Важно отметить, что математическое ожидание и корреляционная функция задают случайную функцию t однозначно с точностью до изометрического линейного преобразования пространства L2 , A, P , оставляющего неподвижным вектор 1. §7. Распределения случайной функции В данном параграфе рассматриваются распределения случайной функции, то есть параметр t имеет общий смысл и не отождествляется со временем, если другое не оговорено специально. Таким образом, рассмотрение, представленное ниже, носит общий характер. При выполнении отождествления параметра t со временем изложенные ниже результаты оказываются справделивыми для случайных процессов. 7.1. Конечномерные распределения случайной функции Пусть t является случайной функцией для t T , то есть для каждого t T :t – случайная величина. Тогда t1 , t2 ,, tn T вектор
t1 , t2 ,, t n
является случайным вектором, принимающим
значения в измеримом пространстве X n , Bn . Определение 3.50. Распределением произвольного случайного
конечномерного вектора t1 , t2 ,, tn
называется вероятностная
мера, определяемая по следующей формуле: def
t
tn 1 t2
A t t t A P t , t ,,t 1 2
n
1
143
2
n
A,
(3.16)
где A – произвольное, ABn . Определение 3.51. Распределение t
1 t2
tn
A t t t A , 1 2
n
определенное при указанных выше условиях, называется конечномерным распределением случайной функции t , t T . Замечание 1. Конечномерные распределения имеет смысл рассматривать как для всех различных t1 , t2 ,, tn , так и в случае, когда некоторые из них совпадают друг с другом. Однако распределения t1 t2 tn , для которых какие-то из t1 , t2 ,, tn совпадают, можно выразить через конечномерные распределения, соответствующие попарно различным элементам T . Так, например, t1 t1 t2 A t1 t2 B , где B x , y : x , x, y AB2 ; t1 , t2 T , t1 t2 , AB3 . Замечание 2. Если две случайные функции стохастически эквивалентны, то их конечномерные распределения совпадают. Исключительно важно отметить, что обратное утверждение не верно. Замечание 3. Важно отметить, что реализации стохастически эквивалентных случайных функций могут быть совершенно различны. Пример 3.1. Пусть T 0,1 и пусть дана случайная величина , 0 1 с непрерывным распределением. Рассмотрим две случайные функции t и t , t T . Положим t 0,1 : t 0 и 0, t ; t 1, t . Случайные функции t и t являются стохастически эквивалентными, так как P t t P t 0. С другой стороны, траектория t имеет разрыв в точке t , в то время как траектория случайной функции t – тождественный нуль.
144
7.2. Основные типы случайных процессов Определение 3.52. Говорят, что числовой (или векторный) случайный процесс t , t T R1 является процессом с независимыми приращениями, если его приращения на непересекающихся отрезках не зависят друг от друга, то есть если t0 , t1 ,, tn T таких, что t0 t1 tn , случайные величины t1 t0 ,, tn tn 1 являются независимыми. Определение 3.53. Случайный процесс t , t T называется стационарным (однородным во времени), если h R1 конечномерное распределение данного случайного процесса не меняется при сдвиге на h : t1 tn t1 htn h , для t1 ,tn , t1 h, tn hT . В той мере, в какой теория случайных процессов отражает какие-либо явления реального мира, понятие стационарности случайного процесса отражает идею неизменности совокупности условий, в которых протекает данный случайный процесс. Стационарность процесса, то есть, согласно определению 3.53, неизменность во времени его вероятностных закономерностей, налагает сильное ограничение на процесс и позволяет из одного этого допущения извлечь ряд важных следствий. Для большей части как самой теории случайных процессов, так и ее приложений достаточно предположения о стационарности в широком смысле, то есть требования независимости от t математических ожиданий t и tt h . Из данного предположения вытекает возможность так называемого спектрального разложения стационарного случайного процесса
t
exp it dZ ,
где Z – случайная функция с некоррелированными приращениями [113].
145
Определение 3.54. Гауссовским называется действительный случайный процесс t , t T , любые конечномерные распределения которого являются гауссовскими, то есть характеристические функции совместных распределений вероятностей случайных величин t1 ,, tn при любых t1 ,, tn T имеют вид: n 1 n t1 ,,tn u1 ,, un exp i uk tk tk , t j uk u j , 2 k , j 1 k 1 где t – математическое ожидание и t, s , t, s T – корреляционная функция1. Распределение вероятностей гауссовского процесса t полностью задается его математическим ожиданием и корреляционной функцией. Для любой функции f t и любой положительно - оп-
ределенной функции f t , s существует гауссовский процесс t , у которого среднее значение и корреляционная функция суть именно f t и f t , s . Многомерный случайный процесс с векторными значениями t 1 t ,, m t называется гауссовским, если гауссовскими являются совместные распределения вероятностей любых величин i1 t1 ,, in tn . Комплексным гауссовским процессом t , t T называется случайный процесс вида t 1 t i 2 t , где действительные 1 t , 2 t в совокупности образуют двумерный гауссовский процесс. Иногда, говоря о комплексном гауссовском процессе t 1 t i 2 t , считают, что выполняется одно дополнительное условие: s t s t .
1
Вследствие важности более подробно основные свойства гауссовского распределения описаны в приложении 4.
146
Данное условие вводится для того, чтобы сохранить то свойство обычных гауссовских случайных величин, согласно которому некоррелированность равносильна независимости; его можно переписать следующим образом: i 1,2 : i t it i s is Re t , s 2, 1 t 1t 2 s 2s Im t , s 2,
где для краткости введено обозначение it i t , i 1,2, корреляционная функция комплексного гауссовского процесса t определяется по формуле (3.9). Определение 3.55. Винеровским процессом называется однородный действительный гауссовский процесс wt , t 0 с независимыми приращениями, для которого справедливо: 1) wt 0 0; 2) wt ws 0; 3) D wt ws 2 t s . Важно отметить, что винеровский процесс имеет несколько эквивалентных определений, отражающих его свойства. Именно, гауссовский случайный процесс wt , t 0 с нулевым средним и корреляционной функцией wt ws w t , s min t , s является винеровским процессом. В частном случае 2 1 винеровский процесс называют стандартным винеровским процессом. Винеровский процесс w , 0 t допускает следующее каноническое представление:
w k uk , k 0
где коэффициенты разложения k – независимые гауссовские случайные величины такие, что k : k 0, wk wl k kl . Здесь k – собственные числа, uk – собственные функции интегрального оператора с ядром w t, s min t , s , определяемые в соответствии с уравнением
147
t
ds , s u s u . w
k
k k
0
Решением данного уравнения являются 2
t k : k , uk sin 2k 1 . k 1 2 2 t Вероятность того, что wt имеет, по крайне мере, один нуль в
интервале t0 , t1 , при условии wt 0 0, равна: 2 t arccos 0 . t1 Аналогом винеровского процесса для векторного параметра t t1 ,, tn являются случайные поля, введенные П. Леви. Многомерный винеровский процесс wt wt1 ,, wt n опредеP
ляется как совокупность одномерных винеровских процессов, удовлетворяющая следующим свойствам:
wti 0, wti , ws j ij min t , s .
Необходимо отметить, что вероятностная мера, являющаяся распределением винеровского процесса wt , t 0,1 на борелевской
-алгебре пространства C 0,1 непрерывных действительных функций, играет важную роль в теории меры в бесконечномерных функциональных пространствах и называется винеровской мерой. Определение 3.56. Случайным процессом белого шума или белым шумом называется стационарный случайный процесс nt , t 0 с постоянной спектральной плотностью и корреляционной (обобщенной) функцией следующего вида: n t , s 2 t s , где 2 – некоторая положительная постоянная, x – (обобщенная) сингулярная функция Дирака ( -функция). Процесс белого шума широко используется в физических приложниях для описания случайных возмущений с очень малым временем корреляции. Одним из примеров таких явлений является
148
«тепловой шум» – пульсации силы тока в проводнике, вызываемые тепловым движением электронов. В спектральном разложении белого шума
nt
exp i t dZ
«элементарные колебания» exp i t dZ при всех частотах имеют в среднем одинаковую интенсивность или, точнее, средний квадрат их амплитуды имеет следующий вид: 2 2 dZ d , , . 2 Указанное выше спектральное разложение означает, что для любой интегрируемой со своим квадратом функции t справедливо
n ,
t nt dt
dZ ,
где – фурье-образ функции t . Необходимо отметить, что более явная зависимость обобщенного случайного процесса n, от функции t может быть описана с использованием
понятия меры в виде n,
t dZ t ,
где dZ t – стохастиче-
ская мера того же типа, что и dZ , представляющая собой фурье-образ стохастической меры dZ . Определение 3.57. Автомодельным случайным процессом (полуустойчивым процессом, скейлинг-процессом) называется случайный процесс at , t 0, для которого k 0 найдется Ak такое, что совпадают все конечномерные распределения процесса akt Ak at . На качественном уровне это означает, что изменение временной шкалы t kt приводит к тому же результаты, что и изменение фазовой шкалы
at Ak ak .
Автомодельный случайный процесс
имеет стационарные приращения, равные at as a. Если выпол-
149
нено at2 , то t 0 : at a и если Ak k H , где H – некото2H
рый параметр такой, что 0 H 1, то D at as 2 t s . Корреляционная функция процесса зависит, таким образом, от параметра H . При условии 0,5 H 1 корреляционная функция приращения at as 0 s t неинтегрируема, это, в свою очередь, означает, что автомодельный процесс с указанным H имеет бесконечную память. Если H 0,5, то автомодельный процесс является случайным процессом с независимыми приращениями, если H 1, то at a At , где A имеет распределение с A 0 и
DA 2 . Автомодельные процессы являются важными и представляют интерес для дальнейшего рассмотрения, поскольку частный случай атомодельного процесса, а именно, гауссовский автомодельный процесс с ak k H является математической моделью фрактального броуновского движения (см. ниже). Теорема 3.4. (Колмогорова) Пусть t , t a , b – случайный процесс на вероятностном пространстве , A, P с полной относительно вероятностной меры основной -алгеброй. Пусть существуют положительные константы C , и такие, что для всех s, t a, b выполняется следующее неравенство:
1
t s C t s . (3.17) Тогда существует стохастически эквивалентный данному процесс t , почти все траектории которого непрерывны по t. Доказательство. Во-первых, из неравенства (3.17) следует непрерывность случайного процесса t .
Рассмотрим на отрезке a , b подмножество T0 , состоящее из точек вида k 2n , где k , n – целые числа, причем n 0. Применяя к (3.17) неравенство Чебышева, можно записать следующее соотно-
шение: P k 1 q 2
2
2n
k
2n
n 1 q n 2 Cq n . Выбирая значение
1, можно получить неравенство:
150
P k 1 2n k 2n qn 2 n Cr n , r 2 2 1. (3.18) Из (3.18) следует, что при любом n 0 справедливы соотношения: P max n k 1 2n k 2n q n n a k 2 k 1 2 b P a k
2n k 1 2n b
a k 2n k 1 2n b
k 1
P k 1
2
2n
n
k
k
2
2n
n
qn
(3.19)
qn
b a 2n C 2 n r n b a Cr n . Ряд из указанных выше вероятностей сходится, поэтому, согласно лемме 3.6 (Бореля – Кантелли), с вероятностью равной единице, начиная с некоторого n n0 для всех модулей разностей вы-
полнено k 1 2n k 2n q n . Докажем, что для , для которых выполняется указанное выше неравенство для модуля разности, функция t равномерно непрерывна на T0 . На первом этапе докажем, что если s, t – произвольные двоично-рациональные числа, s t 2 n , s t , со знаменателями, не превосходящими 2m m n n0 , то справедливо неравенство: m
t s 2 qi .
(3.20)
i n 1
Доказательство данного утверждения выполним по методу математической индукции. Пусть при m n справедливо s t 2 n , тогда s и t совпадают в силу того, что обе части неравенства (3.20) обращаются в нуль. Предположим, что для значений m m0 неравенство (3.20) верно. Докажем справедливость данной формулы для m m0 . Обозначим через s ' ближайшее справа к s двоично-
151
рациональное число со знаменателем меньше 2m0 1. Аналогично определим t ' – ближайшее к t слева двоично-рациональное число со знаменателем меньше 2m0 . Имеем s ' t ', s ' t ' s t 2 n. Используя неравенство (3.20) при m m0 1 для s ', t ' и неравенства
t ' t q m0 , s ' s q m0 , можно получить выполнение неравенства (3.20) для s и t. Теперь для двоично-рациональных s t , t s 2 n0 выберем значение n n0 , такое, что выполняется 2 n 1 t s 2 n ; или, иначе говоря, n log2 t s n 1 . Тогда из (3.20) получаем следующие соотношения:
t s 2 qi i n 1
2q q 2 2 1 q 1 q n 1
log t s
2 ts , 1 q
где показатель log 2 q 0 называется показателем Гельдера. Это означает, что функция t равномерно непрерывна на
T0 , следовательно, ее можно продолжить по непрерывности с двоично-рациональных значений аргумента на все значения t a, b (существование конечного предела во всех иррациональных точках следует из критерия Коши). Во-вторых, положим теперь t t для t T0 , а для остальных значений t a, b определим как предел lim , пробегая t
t
st
s
двоично-рациональные значения, если указанный предел существует, и как t 0, если предел не существует. Можно проверить, что так определенная функция будет измерима относительно t
указанной в условии теоремы -алгебры. С вероятностью равной единице для всех t a, b одновременно осуществляется первая
1
Необходимо отметить, что s ' s, если знаменатель s после сокращения
меньше, чем 2m0 , и s ' s 2 m0 , если он равен 2m0 .
152
возможность – существование предела, и выборочная функция непрерывна по t. В-третьих, остается доказать, что P 1. Для двоично-
t
t
рациональных значений t данное утверждение справедливо в силу определения ; для остальных почти наверное справедливо: t
t lim s lim P s t , s t s T0
st sT0
так как процесс стохастически непрерывен. Теорема доказана. ▲ Замечание 1. Если t является случайным процессом, определенным на неограниченном промежутке времени, то для существования эквивалентного ему процесса с непрерывными траекториями достаточно, чтобы условие (3.17) было выполнено для t s h, где h – положительная константа. Действительно, неограниченный промежуток всегда можно разбить на счетное число отрезков длины, не превышающей h h , и на каждом из них определить отдельно, при этом вероятность t
того, что выборочная функция t будет всюду непрерывна, равна вероятности пересечения счетного числа событий вероятности единица, а следовательно, и сама рассматриваемая вероятность равна единице. В частности: а) любой стационарный в широком смысле процесс имеет модификацию с непрерывными траекториями, если только он дифференцируем в среднеквадратичном; в данном случае можно взять 2, что позволяет получить следующее соотношение: 2
2
t s 2 Re K K t s O t s ; если процесс является дважды дифференцируемым в среднеквадратичном, то его траектории можно считать один раз непрерывно дифференцируемыми и т.д.; б) существует винеровский процесс с непрерывными траекториями потому, что для винеровского процесса wt справедливо 4
2
wt ws 3 t s .
153
Замечание 2. Из условия выполнения неравенства (3.17) вытекает существование случайного процесса t не просто с непрерывными на отрезке a , b траекториями, а с траекториями, удовлетворяющими условию Гельдера: K t s , 0. t
s
Константа K здесь является случайной величиной1. Для дальнейшего рассмотрения важно отметить, что обозначение f x является двусмысленным: оно применяется как для обозначения непосредственно значения рассматриваемой функции f в точке x , так и для обозначения собственно функции. Поэтому в случае, когда необходимо подчеркнуть, что речь идет именно о функции, а не о ее значении в какой-либо фиксированной точке, будет использоваться обозначение f или f , соответственно, для значения функции в некоторой произвольной фиксированной точке x будет использоваться обозначение f x . Вернемся к рассмотрению случайной функции t . В данной функции можно зафиксировать элементарное событие и получить функцию . Последняя уже не является случайной функцией от t T ; функция называется «реализацией случайной функции»2. Наоборот, зафиксировав t T , можно получить случайную величину. Определение 3.58. Случайные величины и называются эквивалентными, если для них P 0.
1
Или можно взять неслучайную константу K , но тогда неравенство (условие Гельдера) будет выполняться только при t s h, где h 0 – случайная величина. 2 Или «выборочной функцией», для случайных процессов функция также может называться «траекторией».
154
Определение 3.59. Случайные функции t и t , определенные на одном и том же множестве T , на одном и том же вероятностном пространстве , A, P и принимающие значения в одном и том же измеримом пространстве X , B , называются стохастически эквивалентными, если они совпадают почти наверное при любом фиксированном t , то есть справедливо t T : P t t 0. Важно отметить, что согласно общему подходу и духу теории вероятностей, пренебрегающей событиями, имеющими нулевую вероятность, считается, что замена изучения некоторой случайной функции изучением какой-либо другой, эквивалентной исходной, случайной функции не наносит никакого ущерба теории и не влияет на практические применения.
7.3. Бесконечномерные распределения случайной функции В случае бесконечномерных распределений существует несколько групп различных задач. Известно, что в конечномерном случае вероятности определяются однозначно заданием функции распределения, то есть вероятность P U , где U – любое борелевское множество, определяется вероятностями событий вида 1 x1 , 2 x2 , n xn . Возникает закономерный вопрос: будут ли конечномерные распределения играть аналогичную роль для бесконечномерного случая? Ответ оказывается положительным для бесконечномерных борелевских множеств. Однако необходимо заметить, что многие представляющие интерес множества в пространстве функций оказываются не борелевскими. Пример 3.2. Рассмотрим множество всех функций, определенных на отрезке 0,1 с верхней гранью, не превосходящей некоторой произвольной константы C .
155
Данное множество не является борелевским. Действительно, пусть C 1 2. Для случайных процессов t и t , определенных выше в примере 3.1, справедливы следующие соотношения для вероятностей: P sup t 1 2 1, P sup t 1 2 0. t0,1 t0,1 Но у случайных процессов t и t одни и те же конечномерные распределения. Если бы рассматриваемое множество функций с верхней гранью, не превосходящей C 1 2, было борелевским, этого не могло бы быть. Для произвольного случайного процесса t , t T и константы
C множество sup t C может вообще не быть случайным собыtT
тием и не иметь вероятности. С другой стороны, случайную функцию t можно рассматривать как функцию от элементарного случайного события , принимающую значения в пространстве функций, и изучать данную функцию теми же методами и с тех же точек зрения, как это делается в теории обычных случайных величин или случайных векторов. Двумя основными группами понятий являются понятия, касающиеся - распределений, - независимости и зависимости. Для случайных функций можно рассматривать вероятности вида P A, A – множество в бесконечномерном пространстве функций. Частным случаем таких вероятностей являются именно конечномерные распределения. Важно отметить, что конечномерная вероятность вида P t1 , t2 ,, tn 1 2 n представляет
собой вероятность события, заключающего в том, что траектория случайной функции пройдет ряд вертикальных интервалов (рис. 3.1).
156
Рис.3.1. Траектория некоторой случайной функции, проходящая через вертикальные пределы и соответствующая конечномерной вероятности (подробнее – см. текст)
Важно отметить, что некоторые разделы математики (теории вероятности) имеют дело только с конечномерными распределениями не выше определенного порядка1. §8. Инфинитезимальные операторы переходных функций Определение 3.60. Пусть , A является фазовым пространством. Функция t , x , , где t 0, x , A, называется переходной функцией, если выполнены следующие условия: 1) при фиксированных t и x функция t, x, является мерой на -алгебре A; 1
Например, корреляционная теория, а также значительная часть теории марковских процессов, связанная с теорией полугрупп, имеют дело с не более чем двумерными (то есть с порядком n 2 ) распределениями.
157
2) при фиксированных t и функция t, x, является A измеримой функцией точки x; 3) t, x, 1; 4) t , x , \ x 0; 5) t s, x , s, x, dy t , y , ,
s, t 0 .
Из условий 3) и 5) следует, что t 0, s 0 справедливы соотношения t s, x , s, x , dy s, x, . Отсюда следует,
что переходная функция является невозрастающей функцией от t и существует предел 0, x, . Определение 3.61. Переходная функция t, x, называется нормальной, если x : 0, x, 1. Определение 3.62. Переходная функция называется консервативной, если t 0, x : t, x, 1. Пусть A – пополнение -алгебры A по системе всех конечных мер . Каждая мера t , x , однозначно продолжается на алгебру A. При таком продолжении получается переходная функция1 в фазовом пространстве , A . Поэтому, всюду, где это удобно, можно считать, что A A. Определение 3.63. Пусть – некоторая мера в фазовом пространстве , A . Функция p t , x , y , где t 0, x, y называется переходной плотностью, если выполнены следующие условия: 1) t 0, x, y : p t , x , y 0; 2) при фиксированном t функция p t , x , y является A A - измеримой функцией двух переменных x, y ; 3) t 0, x : p t, x, y dy 1;
1
Подробнее – см. упражнение 16 в разделе «Упражнения».
158
4) s, t 0, x , z : p s t , x , z p s, x , y p t , y , z dy.
Пусть p t , x , y является переходной плотностью, тогда формула p t , x , y dy , при t 0; t, x, x , при t 0
определяет переходную функцию t, x, для множества . 1, x ; Здесь x , A , x – индикатор множества (или 0, x характеристическая функция). Определенная таким образом переходная функция будет нормальной, если для x выполнено ра-
венство lim p t , x, y dy 1, и консервативной, если для t 0 и t 0
E
x справедливо
p t, x, y dy 1.
Доказательство данных ут-
E
верждений предоставляется читателю1. Ниже подробно рассматриваются примеры некоторых важных переходных функций. Пример 3.3. Пусть – конечное или счетное множество, A – совокупность всех подмножеств данного множества, и пусть pij t , где
t 0, i, j представляет собой набор функций, удовлетворяющих следующим условиям: 1) pij t 0; 2)
p
ij
t 1;
j
3) pij 0 0 при i j;
1
Подробнее – см. упражнение 17 в разделе «Упражнения».
159
4) для s, t 0, i, j, k :
p
ij
s p jk t pik s t .
p
xy
t , x, t 0,
j
Тогда формула t, x ,
y
определяет переходную функцию, для которой условия нормальности и консервативности можно записать, соответственно, в следующей форме: pij 0 1, i и pij t 1, i.
j
j
Пример 3.4. Пусть , A является фазовым пространством, и пусть функция x , , x , A удовлетворяет следующим условиям: 1) x : x , – вероятностная мера на A; 2) A : x , – A -измеримая функция на . Для целых n 0 определим набор функций n x, следующим образом: 0 x, x , n 1: n x , x , dy n 1 y , .
Положим
n t n t e n x , , (3.21) n 0 n ! где – некоторая положительная константа. Можно показать, что ряд в правой части выражения (3.21) сходится и определяет переходную функцию, соответствующую некоторому распределению вероятностей. Определение 3.64. Переходная функция t , x , , определенная формулой (3.21), называется переходной функцией Пуассона. Данная переходная функция может использоваться в различных приложениях, для которых оказывается применимым, в частности, распредление Пуассона. Пример 3.5. Пусть – числовая прямая, то есть R1 , A является алгеброй, порожденной совокупностью всех интервалов на данной прямой, v – некоторая постоянная. Формула t, x,
160
t, x , x vt (3.22) задает консервативную переходную функцию. Определение 3.65. Говорят, что переходная функция t , x , , определенная формулой (3.22), соответствует равномерному движению со скоростью v. Пример 3.6. Пусть – n -мерное евклидово пространство, A является алгеброй всех борелевских множеств данного пространства, x, y – n -мерные вектора в рассматриваемом евклидовом пространстве: x , y. Положим n 2
2
exp x y 2t . (3.23) Можно проверить, что функция p t , x , y , определенная выше, является переходной плотностью (по отношению к мере Лебега)1. Определение 3.66. Функция p t , x , y , определенная формулой (3.23), называется винеровской переходной плотностью или переходной плотностью винеровского случайного процесса. p t , x , y 2 t
Контрольные вопросы 1. Дайте определения основных типов случайных процессов. 2. Дайте определение переходной функции (плотности). Рекомендуемая литература 3.1 2. 3.2.
1
Колмогоров А.Н. Основные понятия теории вероятностей. М., 1974. Феллер В. Введение в теорию вероятностей и ее приложения. М., 1984.
2
В приведенной формуле (3.23) множитель x y означает скалярный
квадрат (в общем случае, с произвольной размерностью) вектора x y . 2 Данная монография будет полезна для более углубленного изучения аксиоматического подхода в теории вероятностей.
161
Глава 4 МАРКОВСКИЕ ПРОЦЕССЫ
В данной главе более подробно рассматривается один из наиболее важных типов случайных процессов, а именно, марковские процессы и инфинитезимальные операторы. Представлено также математическое описание процессов диффузии как частного случая марковских процессов. §1. Марковские процессы и марковские семейства Пусть имеется измеримое пространство X , B , в котором все одноточечные множества измеримы. Данное пространство будем называть фазовым пространством. Соответственно, точки фазового пространства будем называть состояниями. Необходимо подчеркнуть, что терминология взята из физики; значение случайной функции t , t T интерпретируется как состояние, в котором находится некоторая физическая система в момент времени t. 1. t : , F, P X , B . Рассмотрим -алгебры, связанные с данной случайной функцией. Введем -алгебру, порожденную случайной функцией t , t T – наименьшую -алгебру, содержащую все события следующего вида: t B, t T , B B. Обозначим данную -алгебру через FT (или через Ft , t T в случае, если необходимо будет указать к какой именно случайной величине данная наименьшая -алгебра относится). Таким образом, можно записать следующее равенство: FT T , t T t B, t T , B B. Рассматриваемая -алгебра имеет смысл совокупности всех событий, о наступлении которых можно узнать, наблюдая случайную функцию t , t T .
162
2. Если T R1 , то есть если речь идет о случайном процессе, мы будем рассматривать также следующие -алгебры: Ft s , s T , s t; Ft s , s T , s t; F s ,t u , uT , s u t; Ft t .
Необходимо отметить, что последняя, из указанных выше, алгебра состоит из всех событий t B, BB. Замечание. На языке теории вероятностей, если какое-либо свойство выполняется для каждой точки множества, исключая, быть может, лишь множество меры нуль, то говорят, что данное свойство выполняется на данном множестве «почти всюду» или «почти наверное». 1.1. Определение марковского процесса Определение 4.1. Случайный процесс t называется марковским, если для любого t T и для любых AFt , B Ft почти наверное выполняется следующее равенство: P AB Ft P A Ft P B Ft . (4.1) Необходимо отметить, что в силу симметрии определения (4.1) из того факта, что t , t T является марковским процессом вытекает, что тот же случайный процесс с обращенным направлением времени, то есть t , t T , также является марковским. Определение 4.2. Марковский процесс, определенный на множестве T называется цепью Маркова (или марковской цепью). Определение 4.3. Цепью Маркова с непрерывным временем называется марковский процесс, для которого множество X является конечным или счетным, T 0, или T , 1.
1
Более подробно определения и описания для марковских процессов и цепей представлены в [117].
163
Частным случаем марковского процесса является винеровский случайный процесс и справедливо следующее определение на основе понятия марковского процесса [118]. Определение 4.4. Винеровским процессом называется однородный марковский процесс wt , t 0, для которого wt 0 0 и переходная плотность p t , x , y есть фундаментальное решение параболического дифференциального уравнения p 1 2 p t 2 x 2 и задается формулой x y 2 1 p t , x, y exp . 2t 2 t Обобщение на многомерный случай дается формулой (3.23). Важно отметить, что стандартный винеровский процесс является марковским процессом wt со следующими свойствами: а) wt 0 0, wt ws 0, D wt ws t s, t s; б) для любых двух непересекающихся временных интервалов t1 , t2 и t3 , t4 , t1 t2 t3 t4 приращения wt4 wt3 и wt2 wt1 – независимые случайные величины со свойствами, указанными в предыдущем пункте. Аналогичное свойство имеет место и для n непересекающихся интервалов. Свойство независимости приращений позволяет использовать винеровский процесс для построения описания любых диффузионных процессов, в частности, броуновского движения. Пример 4.1. Необходимо отметить, что одним из важнейших примеров марковского процесса в физике является броуновское движение – движение малой частицы в жидкости под действием (ударами) молекул среды. Ввиду важности данного явления для дальнейшего изложения, рассмотрим броуновское движение как марковский процесс более подробно. В качестве фазового пространства состояний выберем простран-
ство R 3 , B3 . Если инерция частицы пренебрежимо мала, то опи-
164
сание случайных блужданий данной частицы при помощи марковского процесса оказывается достаточно точным: будущее движение частицы зависит только от положения (пространственной точки), которое она (частица) занимает в настоящее время, и не зависит от того, как и откуда частица попала в это положение. Данный вывод является следствием того, что удары молекул, которые предстоит испытать частице – это удары молекул, отличных от тех, которые ударяли ее в прошлом, или тех же самых молекул, но изменивших свое движение (и соответствующие параметры) в результате многочисленных столкновений. В более сложном случае, когда нельзя пренебречь инерцией частицы (например, при движении одной молекулы в разряженном газе), уже нельзя считать изменение пространственных координат t ,t , t протекающим в соответствии с марковским процессом. В данном случае будущее движение зависит не только от положения частицы в данный момент времени, но также и от значения скорости частицы t ,t , t в настоящий момент времени. Но если
ввести в рассмотрение фазовое пространство большего числа изме-
рений (размерности), а именно R 6 , B6 , то есть фиксировать положение частицы и ее скорости, то марковское приближение будет хорошо подходить и к данному случаю. Пусть теперь броуновская частица находится не в жидкости, а в нагретом газе, и в определенный момент времени частица вспыхивает и сгорает (исчезает). Данный процесс может быть описан с помощью фазового пространства, измененного следующим образом.
Добавим к фазовому пространству R 3 , B3 , если рассматрива-
ется безынерционная частица, или к пространству R 6 , B6 , если массой частицы не пренебрегается, соответственно, одну точку, обозначаемую ниже « * ». Снабдим полученное пространство (без ущерба для общности далее будем рассматривать случай безмассовой частицы) -алгеброй
R ,B , * и будем в рамках иде3
3
альной модели считать, что частица, вместо того чтобы исчезать,
165
попадает в дополнительное состояние « * » и остается там навсегда. Очевидно, что при этом выполняется следующее равенство: P s,*, t, * , где * – -функция Дирака. Таким образом, при помощи введенного специальным способом дополнительного состояния удается избежать рассмотрения марковских процессов, определенных лишь до какого-то случайного конечного момента времени. Замечание. Необходимо отметить, что в [115, 116] приняты и использованы другие определения, согласно которым марковский процесс может быть определен лишь до некоторого случайного конечного момента времени, в котором он обрывается; это условие усложняет соответствующие определения, но позволяет обойтись без введения дополнительного состояния для процессов с исчезновением частицы. При такой концепции процессы, обрывающиеся с положительной вероятностью, называются неконсервативными. 1.2. Марковские семейства случайных процессов Для дальнейшего рассмотрения необходимо ввести переходную функцию марковского процесса. Определение 4.5. Говорят, что функция P s, x , t , , определенная для всех s, t T : s t; x X ; B, является переходной функцией марковского процесса t , t T , если выполняются следующие условия: а) при фиксированных s, x, t функция P s, x , t , является вероятностной мерой на -алгебре B, то есть справедливо P s, x , t, X 1; б) при фиксированных s, x, функция P s, , t , измерима относительно -алгебры B; в) выполняется равенство P s, x , t, x , то есть функция P s, x , t , – это мера, равная единице, когда x и нулю, в случае, если x;
166
г) для любых s, t T : s t; x X ; B почти наверное выполняется следующее равенство: P t p s, s , t, . Замечание. Необходимо помнить, что требования а) – в) налагаются только на функцию P , , , и не касаются случайного процесса t , тогда как требование г) говорит о связи между собой этих двух объектов. Важно отметить, что основное внимание в теории марковских процессов уделяется однородным (по времени) марковским процессам. Для однородных марковских процессов переходная функция однородна, то есть зависит лишь от разности аргументов: P s , x , t , P t s , x, . Строгое формальное определение однородного марковского процесса достаточно громоздко [119] и не существенно для дальнейшего рассмотрения. Понятие марковского семейства связано с представлением о возможности начать случайное движение системы в произвольно выбранной любой точке фазового пространства. В силу этого определение, приводимое ниже, будет достаточно сложным, но эта сложность оправдана. Пусть фиксировано некоторое множество T на числовой оси и фазовое пространство X , B и задана функция P s, x , t , , удовлетворяющая условиям а) – в) определения 4.5. Пусть имеется пространство элементарных событий , на T задана произвольная функция t , принимающая значения в X . Важно отметить, что это еще не случайный процесс, так как на пространстве событий не только не определено никакой вероятностной меры, но даже еще и не задано никакой -алгебры. Поэтому свяжем с данной функцией t -алгебры FT , Ft , Ft , F s ,t , определенные выше. Далее предположим, что sT и x X на -алгебре F s определена вероятностная мера Ps , x .
167
Определение 4.6. Говорят, что упорядоченный набор элементов t , Ps,x является марковским семейством с переходной функцией P s, x , t , , если s, x выполнены следующие условия: а) случайный процесс t , t T s, на вероятностном пространстве , F s , Ps , x является марковским; б) данный марковский процесс обладает указанной выше переходной функцией, а именно P s, x , t , ; в) справедливо равенство Ps , x s x 1. Более подробно, от семейства процессов t , t T 0, на вероятностных пространствах , F s , Ps , x требуется следующее. Во-первых, это должно быть семейство марковских процессов, то есть для любых s, x, t s; A F s ,t , B Ft почти наверное Ps , x должно выполняться следующее равенство: Ps , x AB t Ps , x A t Ps , x B t . Необходимо отметить, здесь берутся условные вероятности, соответствующие исходной вероятностной мере Ps , x на -алгебре F s ; соответственно, мы должны пояснить, относительно какой вероятностной меры почти наверное имеет место равенство. Во-вторых, рассматриваемое семейство процессов должно быть семейством марковских процессов с общей переходной функцией P , , , , то есть для s t u из T , для любого x X и для любого из B почти наверное Ps , x должно выполняться следующее равенство:
Ps , x u F s ,t P t, t , u, .
Необходимо подчеркнуть, что данное выражение не зависит не только от поведения процесса на отрезке s, t , за исключением последней точки, но также и от s, и от x. Требование в) определения 4.6 не нуждается в более подробной расшифровке: оно означает, что вероятность Ps , x берется в предпо-
168
ложении, что процесс в момент s выпускается из точки x (с этим связано также то, что рассматривается процесс только на значениях t s и берутся события только из -алгебры F s ). Пример 4.2. Рассмотрим семейство винеровских процессов, выходящих из всевозможных начальных пространственных точек, – марковское семейство t , Ps , x с плотностью вероятностей перехода (в n мерном случае) p s, x, t, y 2 t s
n 2
exp y x
n2
t s ,
то есть с переходной функцией P s, x , t, 2 t s
n 2
exp y x t s dy.
Учитывая определение условных вероятностей относительно -алгебры, можно записать следующую интегральную форму, справедливую AF s ,t : Ps , x A u P t , t , u, Ps , x d .
A
Из данного выражения, если вместо A взять все пространство элементарных событий , положить t s, а вместо u взять t, можно получить следующее равенство: Ps , x u P s, s , t, Ps , x d .
В силу того, что почти наверное для Ps , x справедливо равенство Ps , x s x 1, то подынтегральная функция почти всюду равна P s, x, t, . Значит, выполняется следующее равенство: Ps , x s P s, x, t, . Соответственно, из последнего равенства следует, что в случае марковского семейства, а не отдельного марковского процесса, переходная функция определяется однозначно (а не почти однозначно). Замечание. Эту же самую идею о возможности выпустить марковский процесс из любой точки можно выразить другим спосо-
169
бом. А именно, можно рассмотреть семейство марковских процессов ts , x , причем ss , x x; но вероятность P в данном случае можно взять не зависящей от x. На такой концепции строится изложение, например, в [120]. Как оказалось, семейства такого вида можно свести к марковским семействам. 1.3. Семейство операторов, связанное с марковскими процессами Пусть X , B является измеримым пространством. Свяжем с данным пространством два банаховых пространства. Первое, H, – банахово пространство всех ограниченных B -измеримых числовых функций f x , определенных на множестве X с нормой, f x sup f x . Необходимо от-
введенной согласно формуле
X
метить, что сходимость в смысле указанной нормы является равномерной сходимостью. Второе, K, – банахово пространство всех счетно-аддитивных числовых функций множества1, определенных на -алгебре B; в качестве нормы элемента vK возьмем его полную вариацию на всем пространстве v v X [121]. Можно показать, что для определенной таким образом v выполнены все свойства нормы. Необходимо отметить, что банахово пространство K – полно [115]. Положим v, f
f v dx . X
Отметим, что интеграл в данном выражении определяется следующим образом:
f x K dx f x K dx , X
где используется
X
разложение Жордана v K K [121]. Можно записать следующие соответствия: v K : v v, – линейный функционал на
1
В литературе данные функции могут называться «обобщенными мерами», «мерами со знаком», или «зарядами». Более подробно – см. [120].
170
пространстве H, f H : f , f – линейный функционал на пространстве K. Таким образом, получается естественное вложение пространства K в H* (то есть в пространство, сопряженное H ), а H – соответственно, в K*. Норма элемента и норма соответствующего линейного функционала совпадают друг с другом: v sup v , f ; f sup v, f . f x 1
v 1
Данное утверждение нуждается в доказательстве, которое авторы предоставляют читателю. §2. Элементы теории групп Типичной для марковских процессов является такая ситуация, когда известны переходные вероятности за малый промежуток времени t с точностью до O t при t 0 и данной информации, при некоторых условиях регулярности, оказывается достаточно для того, чтобы восстановить всю переходную функцию. Ниже будет введен инфинитезимальный оператор, как раз такая характеристика, которая позволяет выполнять указанную процедуру, и затем будет показано, как данная характеристика связана с переходной функцией. Пусть E – банахово пространство и пусть P t является линейным ограниченным оператором таким, что P t : E E, t 0. Определение 4.7. Семейство P t , t 0 линейно ограниченных операторов, действующих в E, называется однопараметрической полугруппой (или просто полугруппой), если s, t 0 справедливо следующее равенство: P s t P s P t . Определение 4.8. Полугруппа P t , t 0 называется сжимающей, если t 0 : P t 1, то есть t 0, f E : P t f f . Определение 4.9. Пусть P t , t 0 является полугруппой линейных ограниченных операторов в банаховом пространстве E и пусть DA – подмножество в E. Оператор A : DA E называется
171
инфинитезимальным оператором, если f DA lim t 1 P t f f t 0
и
f DA : Af lim t 1 P t f f , где сходимость является сходимоt 0
стью по норме рассматриваемого пространства E. Из определения 4.9 следует, что если – поле, над которым рассматривается линейное пространство E, то f1, f 2 DA и для любых 1, 2 справедливы соотношения: 1 f1 2 f 2 DA и A 1 f1 2 f 2 1 Af1 2 Af 2 . Это означает, что DA является линейным подпространством линейного пространства E, A – линей-
ный оператор и Af является (правой) производной P t f в точке «нуль»: d P t f Af . dt Определение 4.10. Инфинитезимальный оператор A, связанный с марковским семейством, называется инфинитезимальным оператором марковского семейства1. Выше с любым марковским семейством были связаны два банаховых пространства H и K. Как было указано выше, норма в банаховом пространстве H вводится как f H : f sup f x . Тогда xX
определение 4.9 для Af , f H можно переписать в виде
Af x lim t 1 P t f x f x lim t 1 x f t f x , t 0
t 0
причем выполнено условие f DA , если данный предел равномерен по x. Важно отметить, что полученная формула определяет инфинитезимальный оператор для однородного марковского процесса. Для неоднородного марковского процесса t , Ps , x инфинитезимальный оператор определяется следующим образом [122]: 1 At f x lim t ' t t , x f t ' f x , t ' t
1
Иногда в литературе вместо термина «инфинитезимальный оператор» используют термин «производящий оператор».
172
причем вопросы существования и единственности в данном случае сложнее. Пример 4.3. С детерминированным процессом движения «вправо» с единичной скоростью на прямой связана полугруппа сдвигов P t f x f x t . Справедливо следующее равенство: d f x . (4.2) t 0 dx Однако не следует забывать, что указанная правая производная должна существовать равномерно по x. Из того факта, что предел (4.2) существует равномерно по x , следует равномерная непрерывность функции f x на X . Более Af x lim t 1 f x t f x
того, функция t 1 f x t f x тоже является ограниченной и равномерно непрерывной, и равномерный предел d f x dx ограничен и равномерно непрерывен. Отсюда следует, что функция f x – дифференцируема не только справа, но и слева. На основе приведенных рассуждений можно сделать окончательный вывод, что подмножество DA банахова пространства E состоит из тех и только тех функций f x , которые ограничены и равномерно не1 прерывны вместе с первой производной, то есть f x Cравн , и для
них Af x f ' x . Пример 4.4. Рассмотрим более подробно еще один важный детерминированный процесс, а именно, решение системы обыкновенных дифференциальных уравнений dxt dt b xt в r -мерном пространстве. В данном случае не будем находить в точности область определения инфинитезимального оператора DA : заранее ограничим наше рассмотрение непрерывно дифференцируемыми финитными функциями f x Cфин . Для функций данного типа при t 0 спра1
ведливо, что функция f xt x f x b x t O t f x
173
r
f
x
i
x bi x O t
равномерно сходится по x , f DA и дейст-
i 1
вие инфинитезимального оператора на функцию определяется слеr f дующим образом: Af x bi x . i i 1 x Рассмотрим важное понятие, связанное с полугруппами и инфинитезимальными операторами, при этом ограничимся случаем сжимающей полугруппы на пространстве H ограниченных измеримых функций. Введем в H подпространство H0 , состоящее из функций, для
которых P t f f 0 при t 0. Это функции, для которых полугруппа P t сильно непрерывна справа в нуле. Важно отметить, что линейное подпространство H0 пространства H является замкнутым, а следовательно, H0 является банаховым пространством. Докажем этот важный факт. Пусть имеется последовательность функций
f n n1 ,
для кото-
рой f n f при n и n 1,2, : f n H0 . Для данной последовательности функций справедливо следующее соотношение: lim P t f f lim P t f P t f n lim P t f n f n f n f . t 0
t 0
t 0
(4.3)
Второй член в правой части неравенства (4.3) равен нулю, а для первого слагаемого lim P t f P t f n lim P t f f n f f n . В t 0
t 0
силу того, что норма f f n 0 при n , то левая часть неравенства (4.3) равна нулю и f H0 , что и требовалось доказать. Оказывается, что если f H0 , то функция P t f , значения которой принадлежат банаховому пространству H0 , равномерно непрерывна по t на всей полупрямой 0, , то есть s, t 0, s t :
P t f P s f P s P t s f f
P
t s
f f 0 в пределе t s 0.
Отсюда, в частности, следует, что банахово пространство H0 будет
174
инвариантно относительно оператора P t : f H0 P t f H0 , так как справедливо: P hP t f P h t f P t f при h 0. С инфинитезимальным оператором A пространство H0 связано следующим образом: DA H0 и f DA : P t f H0 . Известно, что
Af – правая производная P t f в нулевой точке в смысле сильной сходимости. Докажем, что если f DA , то P t f DA и справедливо следующее равенство: d AP t f P t Af P t f (4.4) dt в смысле той же сходимости. По определению 4.9 справедлива следующая цепочка равенств: AP t f lim h 1 P hP t f P t f lim h 1 P t h f P t f 1, то есть AP t f t 0
t 0
– правая производная от P t f (важно отметить, что существование AP t f равносильно существованию d P t f dt , и если они существуют, то равны). Воспользовавшись полугрупповым свойством еще
раз можно получить P hP t f P t f P t h f P t f P t P h f f . До-
кажем, что lim P t h 1 P h f f P t Af . С учетом того, что рассматh0
ривается сжимающее отображение справедливы следующие соотношения: P t h 1 P h f f P t Af P t h 1 P h f f Af
h 1 P h f f Af 0 при h 0. Для того, чтобы доказать спра-
ведливость (4.4) осталось доказать, что и левая производная от P t f равна тому же выражению. Действительно, справедливо
h 1 P t h f P t f P t Af P t h h
1
f P f P h
t h
Af
P t h Af P t Af . Первое слагаемое в правой части данного нера-
1
Второе равенство выполняется согласно полугрупповому свойству.
175
венства не превосходит h 1 P h f f Af 0 при h 0; второе слагаемое стремится к нулю в силу того, что Af H0 . Таким образом, справедливость (4.4) доказана. Замечание. Если обозначить P t f через ut , то для ut получаем дифференциальное уравнение dut dt Aut с начальным условием u0 f . Переводя (4.4) в интегральную форму, можно получить t
t
P t f f AP s fds f P s Afds.
0
0
(4.5)
Для полугрупп на пространстве H, связанных с марковскими семействами, имеет место очень важный принцип. Теорема 4.1 (принцип максимума). Если функция f x имеет абсолютный максимум в точке x , то есть y X : f x f y , и
f DA , то Af x 0. Для любого марковского семейства t , Px имеем выполнение неравенства x f t f x . Отсюда следует справедливость следующего соотношения: Af x lim t 1 x f t f x 0. t 0
Определение 4.11. Резольвентой полугруппы операторов P t называется семейство операторов R , определяемых формулой
R f
exp t P
t
fdt.
(4.6)
0
Данная формула представляет собой преобразование Лапласа полугруппы P t . В силу важности, уточним это определение. Интеграл (4.6) можно определить для полугруппы в любом банаховом пространстве, но в данном случае рассмотрение ограничится случаем пространства H, определенном выше. Пусть t ,0 t ; Px – марковское семейство, причем процесс t прогрессивно измерим относительно семейства -алгебр
176
Ft . Тогда функция P t f x измерима по t , x для любой функции
f H. Предположим, что для f x H, x X справедливо выражение (4.6), то есть
R f x
exp t P
t
f x dt.
0
Данный интеграл сходится, во всяком случае при 0 1. Сходимость следует из неравенства P t f x f x . Функция R f x является измеримой (по теореме Фубини) и ограниченной в силу справедливости следующего неравенства: R f x 1 f x , то есть R f x H. Представляется достаточно очевидным, что R , 0 являются линейными операторами и они ограничены: R 1 . Определение 4.12. Семейство R называется резольвентой полугруппы P t или соответствующего марковского семейства. При любом x X функция R f x является преобразованием Лапласа функции P t f x , t 0, . Знание R f x при всех
0 позволяет восстановить функцию P t f x , t 0 с точностью до функции, отличной от нуля лишь на множестве значений t лебеговой меры «нуль» [121, 123]. Если f H0 , то функция P t f x непрерывна по t и она восстанавливается на основе знания R f x при всех 0 в точности однозначно. Отсюда следует очень важный вывод: по резольвенте R f x , известной при всех
0, однозначно восстанавливается полугруппа P t на пространстве H0 ее сильной непрерывности. Пусть пространство H0 содержит достаточно много функций – настолько много, что из справедливости равенства нулю скалярно1
В рамках данной главы мы не будем рассматривать резольвенту при комплексных .
177
го произведения – , f 0 – для всех f H0 следует 0; например, в случае, когда фазовое пространство X , B является компактным метрическим пространством с -алгеброй BX его борелевских подмножеств в качестве B, для выполнения указанного выше условия достаточно чтобы H0 C или даже H0 C равн . Тогда по резольвенте однозначно восстанавливается переходная функция, а значит, и все конечномерные распределения марковского семейства. Пользуясь теоремой Фубини и полугрупповым свойством можно получить следующие соотношения:
P hR f x R P h f x
e t P t h f x dt eh
0
e
s
P s f x ds; (4.7)
0
1
, 0, : R R f x R f x R f x . (4.8) В частности, операторы P t ,R ,R перестановочны. Определение 4.13. Выражение (4.8) называется резольвентным уравнением; его можно переписать в следующем компактном виде: 1 R R R R R R . (4.9) Резольвентное уравнение дает возможность установить, что область значений оператора R является одной и той же для всех 0 : R H R H. Вообще говоря, не любую функцию из банахова пространства H можно представить в виде R f x ; но если такое представление возможно, то данная функция представима также в виде R f x R f x . Оказывается, что оператор R , если его рассматривать только на подпространства H0 , является обратным к оператору I A , определенному на DA. Здесь I – тождественный оператор. Иначе говоря, эти операторы осуществляют обратные по отношению друг к другу взаимно-однозначные отображения H0 на DA и обратно (рис. 4.1).
178
Рис.4.1. Взаимно-однозначные отображения H0 на DA и обратно
Докажем сформулированное утверждение. Для этого необходимо доказать, что f x H0 функция R f x DA и выполнено равенство I AR f x f x ; и что f x DA будет справедливо равенство R I A f x f x . Для произвольной функции f x H0 в силу определения 4.9 инфинитезимального оператора
справедлива
следующая
AR f x lim h 1 P hR f x R f x h 0
цепочка соотношений: lim h 1 e h e t P t f x dt h 0 h
e P f x dt . Вычитая и прибавляя e t P t f x dt , можно 0 h получить требуемое равенство AR f x f x R f x . Для
t
t
произвольной функции f x DA в силу определения 4.9 инфинитезимального оператора справедливы следующие равенства:
R Af x
0
e t P t Af x dt
e t
0
179
d t P f x dt e t P t f x 0 dt
P t f x
0
d e t dt f x R f x , что и требовалось докаdt
зать. Следствие 1. Оператор A однозначно задает полугруппу на подпространстве H0 . Действительно, по известному оператору A находятся операторы I A, 0, по которым находится резольвента, а по найденной резольвенте однозначно восстанавливается полугруппа. В частности, отсюда следует, что для равномерного стохастически непрерывного марковского семейства на -компактном фазовом пространстве конечномерные распределения однозначно определяются инфинитезимальным оператором A. Следствие 2. Область определения DA всюду плотна в H0 . Данное утверждение вытекает из того, что DA R H0 и согласно определению 4.9 f H0 существует равномерно сходящаяся к ней последовательность функций R H0 . Следствие 3. Оператор A замкнут1. Доказательство данного утверждения предоставляется читателю. Следствие 4. Не может быть двух полугрупп с одним и тем же пространством H0 , таких, что инфинитезимальный оператор A одной из них является расширением инфинитезимального оператора другой. Ниже без доказательства приводится теорема Хилле – Иосида2. Теорема 4.2 (Хилле – Иосид). Для того, чтобы линейный оператор A с областью определения DA в банаховом пространстве E был инфинитезимальным оператором сильно непрерывной полугруппы сжимающих операторов P t (сильная непрерывность озна1
Необходимо напомнить, что оператор A (вообще говоря неотрицательный) называется замкнутым, если его график – множество пар f , Af – замкнуто. 2 Подробное доказательство данной теоремы можно найти в [124].
180
чает, что f E P t f f при t 0 ) необходимо и достаточно выполнение следующих условий: 1) DA всюду плотно в E; 1
2) 0 определенный всюду на E оператор I A ; 3)
I A 1
1 .
В случае полугруппы на подпространстве пространства H ограниченных измеримых функций выполнение условия, что операто1
ры I A сохраняют положительность необходимо и достаточно для того, чтобы рассматриваемая полугруппа сохраняла положительность; выполнение условий 1DA и A1 0 – для того, чтобы P t 1 1. §3. Диффузионные процессы Следуя [124], под диффузионным процессом будем понимать (строго говоря) не единичный случайный процесс, а некоторое марковское семейство случайных процессов. Соответственно, более точными и более адекватно отражающими суть были бы термины «диффузионное семейство» или «семейство диффузионных процессов». Однако первый термин был бы не понятен никому из физиков, знакомых с теорией диффузионных процессов. Термин «семейство диффузионных процессов» являлся бы хорошим термином, но только для множества диффузионных процессов, чьи переходные вероятности зависят от некоторого произвольного параметра u : Pu t, x, . Диффузионные процессы – это, упрощенно, те марковские семейства, инфинитезимальные операторы которых суть дифференциальные операторы; строго говоря, это марковские семейства, траектории которых непрерывны. Примером диффузионного процесса может служить семейство винеровских процессов, выходящих из всевозможных начальных точек. Почему выше было указано «упрощенно»? Дело в том, что даже для такого случая, как семейство винеровских процессов в про-
181
странстве R n n 1 , инфинитезимальный оператор в точности не совпадает с 2, – оператор Лапласа, так что соотношение между инфинитезимальным и дифференциальным операторами требует дополнительного уточнения. Можно по-разному уточнять (ослаблять / усиливать) требование непрерывности траекторий. Кроме того, в уточнении нуждается и то, требуется ли в определении выполнения какого-либо одного условия (свойства инфинитезимального оператора или непрерывности траектории), или требуется наличие обоих указанных свойств. Важно отметить, несмотря на то, что свойства инфинитезимального оператора и непрерывности траектории близки друг другу, все же они не совпадают; поэтому можно, варьируя их сочетания, получать близкие друг другу, но все же различные по сути определения. Таким образом, можно констатировать, что единого стандартного определения диффузионного процесса в настоящее время не существует, а есть различные рабочие определения, или, можно сказать по-другому, имеются определения различных классов диффузионных процессов. Название «диффузионные процессы» объясняется тем, что они являются математическими моделями движения отдельной частицы в процессе диффузии – проникновения одного вещества в другое за счет беспорядочного движения молекул – и в ряде других, схожих с диффузией физических процессов. Известно, что количественная сторона таких процессов хорошо описывается с помощью дифференциальных уравнений с частными производными; с другой стороны, пространственно-временные траектории реальных физических процессов, естественно, непрерывны. Понятия теории диффузионных процессов оказываются полезными также при изучении явлений совершенно другого порядка реального физического мира, в частности, уравнения диффузионных процессов возникают как предельный случай для дискретных моделей, описывающих различные биологические явления, такие, как, например, изменение с течением времени численности особей определенного биологического вида или концентрации вида в популяции. Важно отметить, что связь диффузионных процессов с дифференциальными уравнениями двусторонняя. С одной стороны, ре-
182
зультаты из теории дифференциальных уравнений с частными производными можно достаточно успешно применять к описанию диффузионных процессов, с другой – рассмотрение диффузионных процессов позволяет получить некоторые результаты, касающиеся теории дифференциальных уравнений. Одно из применений исследования диффузионных процессов к теории дифференциальных уравнений заключается в приближенном решении уравнений методом Монте–Карло: процесс моделируется при помощи той или иной стохастической процедуры, математические ожидания функционалов от реализации процесса находятся приближенно как среднее арифметическое по большому числу независимых реализаций. С диффузионными процессами могут быть связаны дифференциальные операторы не выше, чем второго порядка (подробное обоснование данного утверждения приведено ниже). Далее, если специально не оговорено, изложение будет ограничено рассмотрением диффузионных процессов во всем пространстве R n . На основе всего вышеизложенного можно дать точное определение диффузионного процесса, используемое в дальнейшем. Определение 4.14. Марковское семейство t , Px на фазовом пространстве
R ,B n
n
называется диффузионным процессом в
R n , если оно (семейство) обладает следующими свойствами: 1) его инфинитезимальный оператор L определен на классе Cфинит всех финитных дважды непрерывно дифференцируемых 2
функций f x и существуют непрерывные векторная, bi x , и матричная, a ij x , функции (причем матрица a ij x при любом x 1 симметрична и неотрицательно определена) такие, что f Cфинит 2
выполнено следующее соотношение:
2 То есть для любых функций из рассматриваемого класса Cфинит ограниченных и равномерно непрерывных вместе со своими частными производными первого и второго порядков функций. 1
183
Lf x Lf x
2 f x 1 n ij a x i j 2 i , j 1 x x
n i
f
b x x
i
,
(4.10)
i 1
где L – дифференциальный оператор1; 2) все траектории данного семейства непрерывны. Дифференциальный оператор L, определяемый уравнением (4.10) называется производящим оператором диффузионного процесса2. Замечание. Возможность удовлетворить условию 2) почти следует из выполнения условия 1). Действительно, компактифицируя R n добавлением одной точки , можно получить марковское семейство, удовлетворяющее условиям теоремы 4.2, его (семейства) траектории могут быть выбраны непрерывными. Но непрерывность траекторий в построенном компакте R n не означает непрерывности траекторий первоначального процесса в R n ; траектория может уйти на бесконечность и прийти из бесконечности. Таким образом, сущность строгого требования непрерывности 2) состоит в запрещении ухода на бесконечность, то есть выхода на границу области, в которой задан процесс. Как было указано выше, с диффузионными процессами могут быть связаны дифференциальные операторы не выше, чем второго порядка. Можно показать, что если дифференциальный оператор содержит с ненулевым коэффициентом, например, производную третьего порядка f ''', то он не удовлетворяет принципу максимума: можно найти функцию, имеющую в некоторой точке x0 абсолютный максимум, в то время как значение оператора в этой точке положительно. Следовательно, рассматриваемый дифференциальный оператор может содержать производные лишь первого и вто1
Уравнение (4.10) подразумевает также, что, как было указано выше, для процесса, называемого диффузионным, инфинитезимальные операторы являются дифференциальными. 2 Часто, говоря о виде производящего оператора, указывается результат действия данного оператора на функцию, то есть приводится формула не для L непосредственно, а для Lf . Это соглашение используется ниже.
184
рого порядков1, то есть иметь в одномерном случае следующий вид: a x f '' x b x f ' x 2, или в многомерном случае – вид (4.5)2. Принцип максимума не позволяет также коэффициентам в (4.10) быть произвольными, а именно в одномерном случае должно быть x R1 : a x 0; в многомерном случае (как указано в определении 4.14) – x R n матрица a ij x должна быть неотрицательно определенной. Таким образом, дифференциальный оператор, связанный с диффузионным процессом, должен быть эллиптическим оператором второго порядка или вырождающимся эллиптическим оператором того же порядка, то есть оператором, обращающимся в каких-то точках или даже всюду в параболический, или в гиперболический, или даже, вообще, в оператор первого порядка. Пусть в пространстве R n заданы непрерывные функции a ij x , bi x , i, j 1, n и f : f Cфинит – соответствующий им диффе2
ренциальный оператор L, определяемый в соответствии с (4.10). Теорема 4.3. Пусть задано марковское семейство t , Px на фа-
зовом пространстве R n , Bn
такое, что 0 равномерно по x
выполняются следующие соотношения: P t , x ,V x o t ,
(а)
y
i
x i p t , x , dy bi x t o t ,
y
i
xi
(б)
(4.11)
U x
y
j
x j p t , x , dy a ij x t o t , (в)
U x
1
Необходимо отметить, что члена вида C x f x не должно быть потому, что инфинитезимальный оператор должен удовлетворять следующему условию: L 0. 2 Появление множителя 1 2 для одномерного случая обосновывается ниже.
185
i, j 1, n при t 0, U x – -окрестность точки x , а V x – ее дополнение. Тогда инфинитезимальный оператор рассматриваемого марков ского семейства определен на всех функциях f : f Cфинит и на них 2
он равен производящему оператору диффузионного процесса L. Прежде чем доказывать данную теорему, необходимо прояснить смысл условий (4.11). Первое из них – это достаточное условие для существования марковского семейства с данными переходными вероятностями и с непрерывными траекториями. Достаточно легко доказать, что при справедливости условия (4.11а), если условия (4.11б) и (4.11в) выполнены при каком-нибудь одном положительном , то они выполнены и 0. Выражения в левых частях (4.11б) и (4.11в) – это не что иное, как «урезанные» математиче-
ские ожидания и ковариации x ti x i
и x ti x i t j x j
1
соответственно . Условия (4.11б) и (4.11в) означают, что эти величины имеют первый порядок относительно t при t 0. Коэффициенты пропорциональности bi x и a ij x поэтому называют локальными математическими ожиданиями (локальными средними) и локальными ковариациями (в одномерном случае, а также при i j – локальными дисперсиями) соответственно2. Приведенные названия связаны с физической интерпретацией диффузионных процессов. Для простейшего случая броуновского движения в однородной изотропной среде, когда на частицу не действуют никакие посторонние силы, кроме ударов молекул, есте1
Необходимо отметить, что для получения ковариации нужно еще вычесть произведение математических ожиданий, но им можно пренебречь в
силу того, что оно имеет порядок O t 2 o t . 2
Важно отметить, что для рассматриваемых коэффициентов в литературе встречаются и другие названия: для коэффициентов bi x – коэффици енты переноса (сноса, дрейфа), или вектор b x называют вектором переноса; для матрицы a ij x – матрица диффузии (в одномерном случае – коэффициент диффузии).
186
ственно считать коэффициенты диффузии и переноса не зависящими от x и инвариантными относительно вращений, то есть в дан ном случае справедливо b x 0, a ij x aE , E – единичная
матрица на R n . Это означает, что такое однородное симметричное броуновское движение является, с точностью до множителя, винеровским процессом. Доказательство. Пусть взяты f Cфинит и 0. Выберем 0 такое, чтобы приращения всех вторых частных производных функции f на отрезках длины, меньшей , были меньше . Для выбранного таким образом 0 выберем h 0 так, чтобы при t h 2
все o t в условиях (4.11) были по абсолютной величине меньше, чем t для всех x R n . Воспользуемся следующим разложением
Тейлора (здесь x x1, x n , y y1 , y n – точки в R n ): f y f x n
f x x
i 1
i
y
i
xi
2 1 n f x i y xi 2! i , j 1 x i y j
y
j
2
xj y x ,
где x, y n 2 2 при y x . Согласно условию теоремы R n U x V x , справедлива следующая цепочка равенств: Pf x
P t , x, dy f y P t , x, dy f y P t, x, dy f y .
Rn
U x
V x
Подставляя в первое слагаемое правой части разложение в ряд Тейлора, и учитывая, что в пространстве R n для выбранной функ ции f x Cфинит также справедливо интегральное представление 2
f x
P t , x, dy f x P t , x, dy f x P t, x, dy f x ,
Rn
U x
V x
можно получить следующее равенство: Pf x f x
f y f x P t , x, dy
V x
187
n f x i y xi i x U x i 1
2 1 n f x i y xi 2 i , j 1 x i x j
y
j
2 x j y x P t, x, dy .
Первый интеграл в правой части полученного равенства в силу условия (4.11а) теоремы оценивается по модулю величиной 2 f x o t и при малых t 0 он не превосходит k ; k – конечный множитель (то есть нескольких ). В силу того, что можно взять сколь угодно малым, то получается, что данное слагаемое равномерно стремится к нулю при t 0. В силу условий теоремы (4.11б) и (4.11в) второй интеграл будет 2 n f x i 1 n f x ij равен b x t a x t o t и плюс слагае i 2 i , j 1 x i x j i 1 x
мое, не превосходящее величины
n 2 n ij a x t o t при t 0 2 i , j 1
t 0. В силу выбора n данное слагаемое будет отличаться от произведения t Lf x менее, чем на величину
2 f x n2 n2 max 2 i , j x i x j 2
n
a ii
i
f x t n max i x i
n3 . 2
Таким образом, f Cфинит , f DL Lf x Lf x , где DL – об2
ласть задания оператора L. Теорема доказана. ▲ Следствие. Если сделать траектории рассматриваемого марковского семейства непрерывными, то в условиях теоремы 4.3 t , Px оказывается диффузионным процессом. Важно отметить, что условия теоремы 4.3 являются слишком ограничительными, жесткими. Как утверждал А. Вентцель, настолько ограничительными, что ему не удалось привести красивого или интересного с точки зрения реальных приложений примера, удовлетворяющего условиям данной теоремы, кроме винеровского процесса [125].
188
Из условий теоремы 4.3 вытекает, что коэффициенты a ij x и bi x ограничены во всем пространстве1. Указанные выше условия теоремы 4.3 можно сделать более мягкими, если ограничиться финитными функциями. Теорема 4.4. Пусть задано марковское семейство t , Px на
фазовом пространстве
R ,B n
n
такое, что условия (4.11) выпол-
няются при t 0 равномерно по x в пределах каждого ограниченного множества и для каждого ограниченного множества K R n существует ограниченное множество K ' K такое, что P t , x, K o t
(4.12)
t 0
равномерно по x R n \ K ', K ' R n . Тогда инфинитезимальный оператор данного марковского семейства определен на всех функциях f Cфинит и на них он равен L, то есть производящему оператору 2
диффузионного процесса. Доказательство. Пусть множество K является компактом в пространстве R n и f x – гладкая финитная функция, обращающаяся в нуль всюду вне компакта K . Выбираем K ' K , удовлетворяющее условию теоремы. Тогда нужно доказать, что справедлив предельный переход t 1 Pf x f x Lf при t 0 равномерно по x R n . В случае, если x K ', действует теорема 4.1 и, следовательно, теорема 4.4 справедлива; в противном случае, если x R n \ K ' x K ' , действует условие (4.12) и теорема 4.4 справедлива. Таким образом, теорема 4.4 справедлива для всех x R n . Теорема доказана. ▲
1
В противном случае, для некоторых f Cфинит оператор L будет давать 2
неограниченную функцию Lf .
189
Пример 4.5. Для однородного гауссовского марковского семейства переходная плотность вероятности задается следующей формулой: y m t x 2 1 , t 0, p t , x, y exp 2 2 t 2 t где параметр m t удовлетворяет уравнению m t s m t m s , а параметр 2 t связан с функцией m t следующим условием:
2 t s m 2 t 2 s 2 s . Можно доказать, что общее непрерывное решение системы приведенных выше уравнений для m t , t имеет вид:
ab1 e bt 1 , при b 0, bt m t exp , t 2 при b 0. at , Достаточно легко проверить выполнение условий (4.11) равномерно на каждом компакте по x и условия (4.12). Тогда локальное среднее и локальная дисперсия оказываются равными (соответственно): b x lim t 1 x t x , t x lim t 1 x t x t0
lim t t 0
t 0
1
m t x x bx 2; 2
a x lim t 1 x t x , t x lim t 1 2 t a. t0 t 0
Здесь , t x – ступенчатая функция, отличная от нуля только на интервале , . Производящий оператор в данном случае имеет следующий вид: Lf x af '' x bxf ' x 2. Пример 4.6. Рассмотрим более сложный случай двумерного гауссовского t
марковского семейства
t , wt , t 0 ws ds, 0
ский процесс.
190
где wt – винеров-
Распределение в момент t в начальной точке w0 x , 0 y – нормальное с математическим ожиданием
x, y t x
и матрицей
t t2 2 ковариаций 2 . Локальные математические ожидания и t 2 t 3 3 локальные ковариации равны производным соответствующих функций в нуле: интеграл по U x , y отличаются от интегралов
по всей плоскости лишь на величину o t ; отсюда можно получить 1
2
11
12
t 0 21
b x, y 0, b x , y x; a 1, a a a 22 0.
Производящий
1 2 x , соответственно, действие 2 2 x y данного оператора на функцию f x , y определяется следующим оператор имеет вид L
1 2 f f x . 2 2 x y Важно отметить, что в данном случае производящий оператор оказывается не эллиптическим, а вырождается в параболический; соответствующий процесс, как можно видеть, тоже в каком-то смысле является вырожденным: случайность не проявляется в полной мере – вторая координата полностью определяется первой и фиксацией начальной точки. Пример 4.7. Пусть случайный процесс задан в виде сложной случайной функцией t wt , где x – гладкая возрастающая функция образом: Lf x, y
на , ' x 0, x , , причем растущая на бы-
стрее, чем exp Cx 2
при любой константе C; wt – винеровский
случайный процесс. В данном случае математическое ожидание xt не существует при t 0, но в то же время локальное среднее и локальная дисперсия существуют и равны, соответственно,
b x '' 1 x 2, a x ' 1 x
191
2
. Производящий опера-
2 1 1 ' x f '' x '' 1 x f ' x . Для рас 2 сматриваемого случая производящий оператор может быть пред1 d2 f ставлен в виде Lf x , u 1 x . Доказательство данного 2 du 2 соотношения предоставляется читателю. Пример 4.8. В данном примере будет определен диффузионный процесс, который (приближенно) описывает процесс изменения численности особей некоторого вида. Пусть коэффициенты рождаемости и смертности1 зависят от общего числа n особей в популяции2 и равны соответственно r n и l n . На малом отрезке времени
тор: Lf x
можно считать n t n const, следовательно, коэффициенты r, l тоже можно считать приближенно постоянными. При этом естественное приближение к реальности состоит в том, чтобы считать процессы рождений и смертей на малом интервале времени независимыми пуассоновскими процессами с параметрами nr n и nl n . Отсюда, справедливы следующие (приближенные) равенст-
ва:
n n t n n r n l n t , Dn n t n n r n l n t .
Соответственно, для коэффициентов дифференциального оператора можно получить: b n n r n l n , a n n r n l n и дифференциальный оператор рассматриваемого диффузионного процесса будет записываться в следующем виде: Lf n 1 d2 f df n r n l n 2 n r n l n . 2 dn dn Функцию uN t , n , выражающую вероятность того, что в момент t (причем произвольный, не обязательно малый) число осо
1
То есть средние числа рождающихся и погибающих в единицу времени особей в расчете на одну особь соответственно. 2 Простейший аргумент в пользу подобного предположения – от общего числа особей зависит хватит ли всем пищи и, следовательно, увеличение или вырождение данной популяции.
192
бей данного вида будет не больше N , если в начальный момент времени t0 0 число особей было n, можно найти как решение uN t, n LuN t , n , задачи Коши: t uN 0, n 1, при n 0 и n N .
§4. Результаты Колмогорова. Прямое и обратное уравнения Колмогорова Теорема 4.5. Пусть инфинитезимальный оператор диффузионного процесса определен и совпадает с производящим оператором L на всех непрерывно дифференцируемых функциях f , убывающих вместе с производными f x i , 2 f x i x j , i, j 1,, n на бесконечности не медленнее, чем некоторая функция x , причем x 0 при x . Предположим, что переходные вероятности диффузионного процесса определяются соответствующей переходной плотностью вероятности по формуле P t , x , p t , x, y dy ,
где функция p t , x , y , определенная на 0, R n R n , непрерывна по всем трем своим аргументам вместе с первой частной производной по t и частными производными первых двух порядков по x i , x j . Пусть имеют место следующие оценки: p,
p p 2 f , i , i j C t, y x , t x x x
(4.13)
где C t, y – непрерывная положительная функция на пространстве 0, R n . Тогда переходная плотность вероятности удовлетворяет следующему уравнению: p t , x , y 1 n ij 2 p t , x, y n i p t , x, y a x b x (4.14) i j t 2 i , j 1 x x x i i 1
193
или, в более короткой форме1 p t , x , y Lx p t, x, y . t Замечание. Условия данной теоремы довольно громоздкие. Например, требуется, чтобы плотность вероятности и ее производные оценивались функцией C t , y x , а не просто C y x . Однако упрощения здесь недопустимы потому, что соответствующее распределение при t 0 сходится к распределению, целиком сосредоточенному в одной точке, то есть на языке обобщенных функций x R n : lim p t , x , y y x , и плотность вероятности t 0
не может не расти, когда t приближается к нулю. Доказательство. Необходимо отметить, что оценки (4.13) в условии теоремы обеспечивают возможность производить дифференцирование под знаком интеграла в следующей формуле: P t f x p t , x , y f y dy ,
Rn
где f x – произвольная ограниченная измеримая функция, обращающаяся в нуль вне некоторого компакта. Таким образом, можно получить следующие соотношения: P t f x p t , x , y f y dy , t t Rn
P t f x x 2
i
R
p t , x , y
n
t
P f x x i x j
Rn
x i
f y dy ,
2 p t , x, y x i x j
(4.15)
f y dy.
При этом, в силу требований, наложенных на рассматриваемую плотность, полученные функции при любом фиксированном t 0 будут убывать на бесконечности не медленнее, чем const x , 1
Здесь индекс « x » означает, что оператор применяется к плотности вероятности p t , x , y при фиксированных t , y как к функции от x.
194
следовательно, P t f x будет принадлежать DA. Теперь в качестве f x возьмем функцию из пространства Cфинит ; данная функция 2
также будет принадлежать DA , а для таких функций справедливо P t f x t AP t f x . По условию теоремы применение операто-
ра A к функции P t f x , убывающей вместе с производными с указанной в условии теоремы скоростью, равносильно применению производящего оператора L. С учетом данной эквивалентности в применение операторов и используя формулы (4.15), последнее соотношение можно переписать в следующем виде: p t , x , y f y dy t Rn
2 p t , x, y 1 n ij a x f y dy i j 2 i , j 1 x x n R
n i
b x i 1
R
n
p t, x, y x i
f y dy
или p t , x, y 1 n ij 2 p t , x, y n i p t , x, y a x b x f y dy 0. i j n t 2 i , j 1 x x x i i 1 R Функция в квадратных скобках является непрерывной по y. В силу того, что интеграл от ее произведения на произвольную гладкую функцию равен нулю, сама рассматриваемая функция тождественно равна нулю. Теорема доказана. ▲ Теорему 4.5 можно перевести на язык дифференциальных уравнений с помощью общего соотношения из теории полугрупп dP t f AP ' f ; dt приведенная ниже теорема выводится из соотношения dP t f P t Af . dt Введем некоторые дополнительные ограничения на коэффициентные функции a ij x и bi x в дифференциальном операторе:
195
пусть функция a ij x дважды, а bi x один раз непрерывно дифференцируемы (ограниченность производных не предполагается). Тогда для дифференциального оператора определен (на гладких функциях) формально сопряженный оператор L* : n 1 n 2 ij bi x g x . L* g x a x g x i j i 2 i , j 1 x x x i 1
Теорема 4.6. Пусть t , Px – диффузионный процесс с производящим оператором L. Предположим, что плотность вероятности перехода обладает непрерывными частными производными первого порядка по t и первых двух порядков по y i , y j . Тогда переходная плотность удовлетворяет следующему уравнению: 2 ij n bi y p t , x , y p t , x , y 1 n a y p t, x, y (4.16) t 2 i , j 1 y i y j y i i 1
или, в более короткой форме1 p t , x , y
L*y p t , x, y .
t (2) Доказательство. Пусть взята произвольная функция f Cфинит .
Тогда f DA и справедлива следующая цепочка соотношений: P t f x
P t Af x P t Lf x .
t Записывая данные равенства через плотность вероятности и ее частную производную по t, можно получить следующую формулу: p t , x , y f y dy t Rn
Rn
1
1 n ij 2 f y p t , x, y a y i j y y 2 i , j 1
n
i 1
bi y
f y dy. y i
Здесь индекс « y » означает, что оператор применяется к плотности ве-
роятности p t , x , y при фиксированных t , x как к функции от y.
196
Разобьем интеграл, стоящий в правой части, на n 2 интегралов со вторыми частными производными и на n интегралов с первыми производными. Далее, в каждом из полученных интегралов выполним интегрирование по частям. Для финитной функции f y внеинтегральные члены будут исключены, в результате можно получить следующее равенство: n bi y p t , x , y p t, x, y 1 n 2 a ij y p t, x , y i j i t 2 y y y n i , j 1 i 1 R f y dy 0. Аналогично рассмотренному выше доказательству теоремы 4.5, в данном случае функция в квадратных скобках является непрерывной по y. В силу того, что интеграл от ее произведения на произвольную гладкую функцию равен нулю, сама рассматриваемая функция тождественно равна нулю. Теорема доказана. ▲ Пример 4.9. Для процесса диффузии справедливо следующее равенство для плотности вероятности: p 1 2 p p a 2 b bp . t 2 y y
Полагая p t 0, из (4.16) получается уравнение плотности меры инвариантной относительно меры Лебега: L*y p 0. Уравнение (4.14) называется обратным уравнением Колмогорова, уравнение (4.16) – прямым уравнением Колмогорова или уравнением Фоккера – Планка. Поясним более подробно, с чем именно связаны названия «обратное» и «прямое» уравнение. Для неоднородного по времени процесса t , Ps , x можно доказать соответствующие аналоги теорем 4.5 и 4.6, в которых будут участвовать локальные ковариации a ij s, x и локальные средние
197
bi s, x , зависящие от времени 1. Таким образом, для неоднородных по времени случайных процессов уравнение (4.14) примет вид
p s , x , t , y s (4.17) 2 p s, x , t , y n i p s, x, t, y 1 n ij a s, x b s, x 2 i , j 1 x i x j x i i 1
и уравнение (4.16) – следующий вид:
p s, x, t, y t 2 ij i 1 n a t , y p s, x , t , y n b t , y p s, x, t, y . 2 i , j 1 y i y j y i i 1
(4.18)
Уравнение (4.17) связано с дифференцированием по левому концу временного промежутка, уравнение (4.18) – соответственно, по правому концу временного интервала. Важно отметить, что с точки зрения дифференциальных уравнений уравнение (4.17) означает, что плотность вероятностей перехода есть фундаментальное решение уравнения параболического типа n u 1 n ij 2 u u a 0. i j i s 2 i , j 1 x x i 1 x
Действительно, фундаментальным решением называется функция p s, x, t, y , s t , x , y R n , удовлетворяющая при каждом фиксированном y уравнению (4.17), требованию регулярности того типа, что был указан выше в условии (4.13), стремящаяся к y x при s t, что можно сформулировать так: f Cфинит
p s, x, t, y f y dy f x
Rn
при s t. 1
При доказательстве данных теорем можно использовать сведение неоднородных марковских семейств к однородным.
198
Приведенное определение можно переформулировать следующим образом: фундаментальным решением является функция p s, x, t , y , при помощи которой возможно представление в виде u s, x
p s, x, t, y f y dy , s t
Rn
единственного ограниченного решения задачи Коши для рассматриваемого параболического уравнения с «конечным» условием вида u t , x f x 1. Уравнение (4.17) означает, что переходная плотность вероятностей является также фундаментальным решением уравнения вида v t L*v. Важно отметить, что одна и та же функция p s, x , t, y является фундаментальным решением различных уравнений. Однако данное обстоятельство не должно вызывать удивления: в теории дифференциальных уравнений тот факт, что одна и та же функция p s, x , t, y при изменении ее аргументов служит фундаментальным решением двух сопряженных друг другу параболических уравнений, хорошо известен. Пример 4.10. Свойство независимости приращений позволяет использовать винеровский процесс для построения любых диффузионных процессов. В данном случае уравнение Фоккера – Планка и обратное уравнение Колмогорова для переходных плотностей вероятности совпадают и сводятся к классическому уравнению диффузии: p t , x , y a 2 p t , x , y . 2 x 2 Переходная плотность одномерного винеровского процесса p t , x , y , являющаяся фундаментальным решением данного уравнения, определяется как
1
Здесь говорится именно о «конечном» условии, а не о начальном, так как уравнение вида u s Lu 0 решается «вниз», в отличие от уравнения вида u s Lu.
199
x y 2 1 exp . 2 at 2 at Переходная плотность многомерного винеровского процесса подчиняется, соответственно, многомерному уравнению Фоккера – Планка, имеющему следующий вид (при t0 0 и a ij 1 ): p t , x , y 1 2 2 p t, x , y , t 2 i yi фундаментальное решение которого имеет вид: y x 2 n 2 p t , x , y 2 t exp 2t (см. также (3.23) выше). Необходимо отметить, что уравнение Фоккера – Планка является частным случаем более общего уравнения Колмогорова – Чепмена. Данное уравнение имеет следующий вид: P t1 , t3 , x , z dyP t2 , t3 , y , z P t1 , t2 , x , y (4.19) p t , x, y
и представляет собой уравнение для переходной функции марковского процесса, отражающее марковское свойство независимости будущего от прошлого при известном настоящем. Уравнение (4.19) может быть интерпретировано следующим образом. Вероятность перехода (переходная функция) из точки x при t1 в точку z в мо мент времени t3 равна переходной функции из точки x при t1 в точку y в момент времени t2 , умноженной на вероятность перехо да переходной функции из точки y при t2 в точку z в момент времени t3 при всех возможных значениях y . Уравнение (4.19) может быть переписано и для соответствующих плотностей вероятностей. Контрольные вопросы 1. Дайте определения марковского случайного процесса, марковского семейства.
200
2. Дайте определение диффузионного процесса. Приведите явный вид производящего оператора диффузионного процесса. 3. Приведите явный вид прямого и обратного уравнения Колмогорова. 4. Дайте формулировки теоремы 4.5 и 4.6 для обратной и прямой переходной плотности соответственно. Приведите доказательства данных теорем. 4. Приведите явный вид уравнения Колмогорова – Чепмена и поясните его смысл. Рекомендуемая литература 4.1.
4.21.
Портенко Я.И., Скороходов А.В., Шуренков В.М. Марковские процессы. Итоги науки и техн. Современные пробл. матем. Новейшие достижения. ВИНИТИ. 1989. Т.46. С.5. Холево А.С. Квантовое стохастическое исчисление. Итоги науки и техн. Современные пробл. матем. Новейшие достижения. ВИНИТИ. 1989. Т.36. С.3.
1
Данный обзор может использоваться в качестве введения в квантовое вероятностное исчисление.
201
Глава 5 БРОУНОВСКОЕ ДВИЖЕНИЕ
§1. Вводные замечания С точки зрения физики для броуновского движения справедливо следующее определение Определение 5.1. Процесс броуновского движения – это непрерывное хаотическое движение малых частиц (размерами в несколько микрометров и менее), взвешенных в жидкости или газе, происходящее под действием молекул (конституентов) окружающей среды. Физическое явление, которое получило название «броуновское движение», впервые наблюдал шотландский биолог Р. Броун (1773 – 1859 г.г.), именем которого оно и было названо. Р. Броун в 1827 г. наблюдал в микроскоп движение цветочной пыльцы, взвешенной в воде, и описал наблюдаемый им эффект именно как физическое явление. Видимые лишь под микроскопом взвешенные частицы (броуновские) размером в несколько микрометров движутся независимо друг от друга, описывая сложные и сильно нерегулярные траектории. Наблюдаемое движение не ослабевает со временем, не зависит от химических свойств среды, его интенсивность увеличивается с ростом температуры среды и с уменьшением ее вязкости и размеров частиц. Качественное объяснение данного явления основывается на том факте, что взвешенная частица испытывает очень большое («бесчисленное») число столкновений со случайно движущимися молекулами окружающей жидкости; каждое отдельное столкновение оказывает пренебрежимо малое действие на частицу, но вместе они производят наблюдаемое движение. Таким образом, причиной броуновского движения является тепловое движение молекул среды и отсутствие точной компенсации ударов, испытываемых взвешенной частицей со стороны окружающих ее конституентов среды (молекул), то есть броуновское движение обусловлено флуктуациями давления. Удары молекул среды приводят броунов-
202
скую частицу в состояние хаотического непрерывного движения: скорость частицы быстро меняется по величине и направлению. Если фиксировать положение частицы через небольшие равные промежутки времени, то построенная таким методом траектория – броуновская кривая – оказывается исключительно сложной и запутанной (см. ниже). Простейшей физической моделью броуновского движения является модель Эйнштейна – Смолуховского, созданная ими в 19051906 г.г. В рамках данной модели для была получена следующая формула: x 2 2 Kd t, называемая законом Эйнштейна. Здесь x 2
– средний квадрат
проекции смещения броуновской частицы на некоторую ось, K d – коэффициент диффузии, t – промежуток времени наблюдения. Формула Эйнштейна справедлива при условии, что данный временной промежуток достаточно велик, чтобы силы, действующие на частицу со стороны молекул среды, много раз поменяли свое направление. Для сферической частицы радиуса a коэффициент диффузии определяется на основе закона Стокса для гидродинамического сопротивления движению сферы заданного радиуса в вязкой жидкости и выражается формулой Kd kT 6a , где T – температура, – динамическая вязкость среды. Важно отметить, что при выводе закона Эйнштейна помимо равновероятности смещения частицы в любом направлении пренебрегалось инерцией броуновской частицы по сравнению с влиянием сил вязкого трения (это допустимо только при достаточно больших t или в среде с большой вязкостью). Кроме поступательного броуновского движения существует также вращательное броуновское движения, которое можно определить как хаотическое вращение броуновской частицы под влиянием ударов молекул среды. В рамках модели Эйнштейна – Смолуховского среднеквадратичное угловое смещение броуновской частицы определяется следующим образом: 2 2 K dврt ,
203
где Kdвр – коэффициент диффузии для вращательного броуновского движения. При указанных выше допущениях для сферической частицы Kdвр kT 8 a 3 . Опыты Ж.-Б. Перрена (1870 – 1942 г.г.) подтвердили справедливости представленных формул как для поступательного, так и для вращательного броуновского движений, хотя последний эффект наблюдать значительно сложнее, чем поступательное движение. Применив к наблюдаемому под микроскопом блужданию частиц закон больших чисел, Ж.-Б. Перрен сумел экспериментально оценить постоянную Больцмана k и число Авогадро N A . Ж.-Б. Перрен в 1926 г. был удостоен Нобелевской премии за свою работу, посвященную броуновскому движению. Великий математик Н. Винер (1874 – 1964 г.г.) и его коллеги продолжили исследование броуновского движения частицы. В 1923 г. Н. Винеру удалось построить первую, удовлетворительную с математической точки зрения, модель вторичных реализаций и доказать свойство их «почти наверное» непрерывности. Как известно, закономерности броуновского движения послужили наиболее наглядным экспериментальным подтверждением фундаментальных положений молекулярно-кинетической теории. Теория броуновского движения имеет принципиальное значение, она проясняет статистическую природу второго начала термодинамики и показывает границы его применимости. Однако несмотря на солидный «возраст» открытия, многие сложные вопросы, связанные с броуновским движением, на протяжении многих лет оставались без ответа. В настоящее время броуновскому движению посвящена обширная литература. В рамках настоящей книги авторы используют работы [78, 123, 124, 126, 127], в которых дано более или менее строгое изложение данного вопроса. §2. Линейное (одномерное) броуновское движение В основе традиционного подхода к анализу случайных сигналов лежит спектрально-корреляционная теория. Однако за исключением только класса гауссовских процессов, полное статистическое описание случайных сигналов требует оценки моментов высших
204
порядков с учетом многоточечных корреляций. Резкое возрастание сложности и объема вычислений при ухудшении их точности ставит под сомнение само описание случайных процессов такими характеристиками. Альтернативный подход заключается в оценке фрактальных размерностей различных связанных с исследуемым процессом геометрических объектов. Распределения фрактального типа во времени и пространстве могут иметь плотности распределений случайных величин, графики сигналов, множества экстремумов случайных процессов и так далее. Математической моделью одномерного броуновского движения, соответствующей физической модели Эйнштейна – Смолуховского, является винеровский процесс, который часто в литературе называется процессом броуновского движения. Одним из важнейших примеров случайного процесса, обладающего фрактальными свойствами, является именно классический процесс броуновского движения. 2.1. Дискретная аппроксимация Простейшей дискретной аппроксимацией броуновского движения служит одномерное случайное блуждание. В данном случае рассматриваемая частица первоначально располагается в точке x0 0 на прямой. Частица совершает единичный шаг вправо или влево в зависимости от случайного выбора, определяемого, например, бросанием монеты. Случайное блуждание происходит итеративно. Для каждого n 1, 2, 3, положим xn xn 1 1. Более точным приближением к реальному броуновскому движению является замена шагов величиной 1, шагами, величина которых является случайной величиной gn , имеющей гауссово (нормальное) распределение. После первого шага итерационной процедуры частица будет находиться в положении x1 x0 g1 , а после n шагов, соответственно, – в положении xn xn 1 gn . На рис. 5.1 изображена типичная реализация гауссовского случайного блуждания. Гауссовское случайное блуждание достаточно легко может быть реализовано с помощью компьютерного моделирования. Существует несколько способов генерирования случайных чисел, распре-
205
деленных по нормальному закону. В рамках одного из них используется генератор равномерно распределенных на отрезке 0,1 случайных чисел. Тогда из выборки k полученных случайных чисел можно получить выборку нормально распределенных величин, 12 n используя следующую формулу: gn i 3n . Справедлиn i 1 вость данной аппроксимации следует из применения центральной предельной теоремы.
Рис.5.1. График реализации одномерного гауссовского случайного блуждания. Для получения более реалистичного графика соседние точки соединены линиями
Определение 5.2. Гауссовский процесс называется одномерным броуновским движением или классическим винеровским процессом на отрезке a, b и обозначается B t , если он обладает следующими свойствами: 1) B 0 0 и функция B t почти всюду непрерывна на a , b ; 2) (свойство гауссовости приращений) t2 t1 случайная величина B B t2 B t1 имеет гауссово (нормальное) распределение с нулевым математическим ожиданием и дисперсией равной 2 t2 t1 , где – положительная константа, то есть P B x
x
u2 exp du. 2 2 2 t2 t1 2 t2 t1 1
206
(5.1)
В частном случае 1 процесс B t называется стандартным процессом броуновского движения (или, как было указано выше в гл. 3, стандартным винеровским процессом). Необходимо отметить, что данный тип случайных процессов занимает центральное место в теории случайных процессов. 2.2. Основные свойства Закон дисперсии и стационарность. Из свойства 2) определения 5.1 следует закон дисперсии для броуновского движения: t1 , t2 a , b : D B t2 B t1 2 t2 t1 . В силу того, что дисперсия зависит только от разности t2 и t1 , а не от самих значений, то говорят, что приращения в случае броуновского движения стационарны. Свойство независимости приращений. Броуновское движение обладает независимостью приращений в том смысле, что если 0 t1 t1' t2 t2' tk tk' 1, то приращения B t 'j B t j , j 1,, k являются независимыми случайными величинами. Необходимо отметить, что, как и случае винеровского процесса, существует несколько эквивалентных определений процесса броуновского движения. Например, указанное выше свойство независимости приращений включается непосредственно в определение, которое может быть сформулировано следующим, более развернутым, образом [128]. Определение 5.3. Стандартным процессом броуновского движения (стандартным винеровским процессом) называется случайный процесс Bt , t 0, удовлетворяющий следующим условиям: 1) B0 0 почти наверное; 2) если 0 t0 t1 tn , то приращения Bti 1 Bt , i 0,n 1 являются независимыми случайными величинами; 3) s, t 0 приращение B Bt s Bt распределено нормально со средним 0 и дисперсией s;
207
4) для почти всех функция Bt непрерывна по t. Таким образом, на качественном уровне классический процесс броуновского движения B t можно определить как начинающийся в начале координат случайный процесс t , приращения которого на непересекающихся интервалах времени t являются независимыми и величины этих приращений имеют гауссово распределение. Дисперсия данного процесса определяется формулой 2 D t , где 2 K d – коэффициент диффузии. Марковское свойство. Броуновское движение, как и любой случайный процесс с независимыми приращениями, является марковским процессом. Это означает, что условная вероятность следующего события « B t2 достигает определенного значения при заданном значении B t1 », где t1 t2 зависит только от t1 и t2 . Данная условная вероятность не зависит от поведения B t при t t1 , то есть в процессе случайного блуждания каждый шаг делается без какой-либо информации о том, каким именно образом процесс достигает текущего значения. Учитывая формальные определения и свойства марковского процесса и марковского семейства, приведенное выше утверждение для броуновского движения можно записать как t1 tk : P B tk xk B tk 1 xk 1 ,, B t1 x1
P B tk xk B tk 1 xk 1 . Абсолютная величина приращений. Теорема 5.1. Пусть B t – броуновское движение на отрезке
a , b .
Тогда математическое ожидание модуля приращения равно:
2 t2 t1 . Доказательство. Если случайная величина имеет плотность M B t2 B t1
вероятности f t , то математическое ожидание функции случай-
208
ной величины r равно: M r
r t f t dt.
Соответст-
венно, при t2 t1 для приращения броуновского движения справедливо M B t2 B t1
2 2 t2 t1
2
su
2
0
1 u2 u exp du 2 2 2 t2 t1 2 t2 t1
u2 u exp 2 du. Используя подстановку 2 t2 t1
t2 t1
M B t2 B t1
и необходимые упрощения, можно получить 2 t2 t1
2s exp s ds 2
0
2 t2 t1 . Тео
рема доказана. ▲ В соответствии с данной теоремой среднеквадратичное смещение броуновской частицы возрастает линейно во времени ( 2 t см. выше). Такая скорость роста характерна для процесса диффузии. Недифференцируемость. Из доказанной теоремы 5.1 следует недифференцируемость броуновского движения B t в каждой точке t a, b . Предположим, что существует B ' t . Тогда, рассуdef
ждая нестрого, можно получить B ' t lim h 0
lim h 0
h h
B t h B t h
2
. Таким образом, траектория винеровского процесса,
с вероятностью равной единице, является нигде не дифференцируемой функцией, то есть скорость броуновской частицы не определена. Это обстоятельство является идеализацией, отражающей тот факт, что траектории реальной броуновской частицы сильно «нерегулярные» и не могут быть прослежены в деталях.
209
Важно отметить, что в [129] представлено полное доказательство не только для классического, но также и для обобщенного (фрактального) броуновского движения, рассматриваемого ниже. Масштабная инвариантность. Из (5.1) следует, что траектория классического винеровского процесса – броуновского движения – B t обладает свойством масштабной инвариантности или скейлингом. Действительно, для плотностей вероятностей процессов B t и b1 2 B bt при любом коэффициенте b 0 справедливо следующее соотношение: p b , b b 1 2 p , , (5.2)
которое означает инвариантность рассматриваемых процессов в смысле распределения. Соотношение (5.2) показывает, что график броуновского случайного процесса относится к классу самоаффинных фрактальных функций1. Вероятностные свойства броуновского процесса не изменяются при одновременном изменении масштаба временной переменной в b раз и масштаба пространственной переменной в b раз. Статистические свойства Вероятностные (статистические) характеристики броуновского движения могут быть описаны в терминах распределения вероятностей max ws : 0 s t
P max ws a 2 P ws a 0 s t
x2 2 dx exp , t a 2t
где 0 a , t – фиксировано; или в терминах распределения вероятностей времени 0 достижения винеровским процессом фиксированной точки a 0 в рассматриваемом (одномерном) пространстве: a t x2 2 P a t dx exp , 0 2t где 0 t , a – фиксировано. 1
Строгие определения и подробное рассмотрение самоаффинных функций представлено в данной главе ниже.
210
Размерность реализации. Результат теоремы 5.1 может быть использован для вычисления фрактальной размерности реализации броуновского движения B t . Без потери общности можно считать, что областью определения B t является 0,1 . Данный отрезок делится на n равных частей, длина каждой составляет t 1 n . Ось ординат OY декартовой прямоугольной системы координат также делится на отрезки соответствующей длины t. Отношение B t служит в качестве оценки числа квадратов со стороной t , необходимых для покрытия части графика функции y B t , расположенной над одним из фиксированных отрезков по оси абсцисс Ot длиной t. В силу того, что M B t , число необходимых квадратов для одного отрезка N1 1 t . Всего имеется n 1 t отрезков по оси Ot, и поэтому общее число необходимых 3 2
квадратов N t t . Учитывая определение фрактальной размерности [1], можно получить для размерности реализации классического броуновского движения следующее значение: log N t d lim 1,5. Отсюда видно, что реализация даже t 0 log t классического броуновского движения представляет собой кривую с дробной размерностью, то есть обладает фрактальными свойствами. Статистическое самоподобие. Приращение реализации броуновского движения B t обладает свойством статистического самоподобия, то есть r 0 справедливо следующее соотношение: 1 B t t B t B t rt B t 1. r
1
Символ означает, что две случайные величины имеют одинаковое распределение и, в частности, одни и те же математические ожидания и дисперсии.
211
Для доказательства представленного равенства необходимо доказать, что
P B t t B t x P B t rt B t r x . (5.3) По свойству 2) определения броуновского движения левая часть x 1 s2 (5.3) равна: P B t t B t x exp 2 2t ds, 2 2 t
а правая –
rx
s2 exp 2r 2t ds. Выполняя замену пере2 r 2 t 1
менных s u r во втором интеграле, можно свести его к предыдущему интегралу. Свойство доказано. Важно отметить, что случайный процесс, являющийся обобщенной производной по времени от броуновского движения, то есть производной от винеровского процесса, называется процессом гауссовского белого шума gt dwt dt . Гауссовкий белый шум служит основой для построения стохастических диффузионных процессов Y t , «управляемых» стохастическими дифференциальными уравнениями1, записанными в форме дифференциалов: dY t a t , Y t dt b t ,Y t dwt . Резюмируя изложенное выше, можно утверждать, что рассмотренное классическое броуновское движение представляет собой хорошую модель марковских случайных фракталов, для которых, как было указано выше, условная вероятность того, что B t2 достигает определенного значения при заданном значении B t1 , где
t1 t2 зависит только от t1 и t2 , а не от поведения B t при t t1. Представляется достаточно очевидной необходимость введения такого случайного процесса, который обладал бы некоторой памятью. Такой процесс получил название обобщенного (фрактального) броуновского движения и был впервые исследован в 1968 г. [129]. Важно отметить, однако, что фрактальное броуновское дви1
Одним из наиболее известных примеров стохастических дифференциальных уравнений является уравнение Ланжевена (см. ниже).
212
жение в неявном виде рассматривалось А.Н. Колмогоровым еще в 1940 г. [125]. Вследствие важности, в том числе и для приложений в фундаментальной физике процесс фрактального броуновского движения будет рассмотрен более подробно ниже. §3. Траектория линейного броуновского движения Случайный – винеровский – процесс, который в дальнейшим будет называться «линейное броуновское движение», есть математическая модель, хорошо передающая свойства реального физического броуновского движения, наблюдаемого на достаточно малой (но не бесконечно малой) временной шкале и предполагающая, что такие же свойства имеют место на любой шкале. В данном случае исчезает понятие свободного пробега, в течение которого движение отдельной произвольно выбранной частицы (молекулы), рассматриваемое независимо от движения других частиц, является существенным образом прямолинейным и равномерным. Каждая частица (молекула) за конечное время пробегает бесконечный путь, а любая из ее координат есть функция, не имеющая производной и принимающая бесконечное число раз максимальные и минимальные значения в любом интервале. Исключительно важно отметить наличие свойства принципиального подобия процесса на различных временных и пространственных (то есть при рассмотрении траектории движения с различным пространственным разрешением) масштабах. Данное свойство является неотъемлемой и важной характеристикой фракталов [1]. Таким образом, уже на данном этапе можно говорить о глубокой взаимосвязи случайных (стохастических) процессов, в частности, рассматриваемого линейного броуновского движения1 и таких важнейших понятий современной математики как «фрактал», «фрактальное множество», «фрактальная геометрия». Очевидно, указанная взаимосвязь просматривается пока на интуитивном, понятийном уровне, однако, при дальнейшем рассмотрении данные 1
Данный тип случайных (стохастических) процессов является простейшим случаем броуновского движения, а именно, одномерным классическим броуновским движением. Обобщенное броуновское движение будет рассмотрено ниже.
213
свойства случайных процессов будут рассмотрены подробно и установлены строго. При изучении линейного (одномерного) броуновского движения рассматривается только одна координата, обозначаемая, например X . Соответственно, винеровский процесс, являющийся моделью реального физического процесса броуновского движения, в данном случае и для удобства последующего геометрического рассмотрения кривых броуновского движения при большем числе измерений можно обозначить X t . Таким образом, далее (если специально не оговорено) будем рассматривать только одну из координат X t . Замечание. Если в определении 5.2 (с учетом новых обозначений) заменить требование X 0 0 на условие X 0 x0 , получается определение винеровского процесса, выходящего из некоторой произвольной начальной точки x0 , отличной от нуля. В дальнейшем будет выполнено рассмотрение одновременно всех винеровских процессов, выходящих из разных начальных точек, что является примером марковского семейства случайных процессов. Выпишем конечномерное распределение винеровского процесса. Для последовательности 0 t1 t2 tn совместное распределение случайных величин X t1 , X t2 ,, X tn будет иметь плотность распределения вероятностей pt1 t2 tn . Случайный вектор X t X t1 , X t2 ,, X tn получается с помощью невырожденного линейного преобразования A, которое действует на случайный вектор приращений, имеющий, в свою очередь, следующий вид: X X t1 X t0 0 , X t2 X t1 ,, X tn X tn1
и плотность распределения вероятности: n
pX x1 , x2 , xn
2 ti ti 1 i 1
214
1 2
xi2 exp . 2 t t i i 1
Для вычисления рассматриваемой плотности распределения вероятностей p X t1 X tn можно воспользоваться следующими свойствами: а) пусть вектор X получается из вектора линейным невырожденным преобразованием A, то есть X A . Тогда плотность распределения вероятностей вектора X , полученного из случайного вектора линейным невырожденным преобразованием, определяется следующей формулой: p A x det A
1
p A1 x , x x1 , x2 ,, xn ;
б) тот же результат можно получить, если использовать условные плотности распределений. §4. Кривая плоского броуновского движения Определение 5.4. Пусть Rx21 ,x2 – координатная плоскость. Кривой C плоского броуновского движения называется траектория подвижной точки A t (или просто A ) на плоскости Rx21 ,x2 с координатами X 1 t , X 2 t , являющимися независимыми случайными функциями линейного броуновского движения, то есть независимыми винеровскими функциями. Пусть параметр t 1 возрастает от некоторого начального значения t0 , принятого за нуль и для которого X i t0 0 0, i 1,2, на некоторую величину . Тогда перемещение точки A представляется вектором R X 1 , X 2 , распределенным по изотропному (или, как еще говорят, круговому) нормальному закону с параметром, определенным согласно следующей формулы: 2 2 (5.4) R 2 X 1 X 2 2 , 1
В физическом смысле и для случайных процессов, как было указано выше, параметр t – это время.
215
где i 1,2 : X i X i X i 0 . Отсюда следует, что если ввести длину перемещения стандартным образом R t R t , то
P R t t exp 2 2
0 .
(5.5)
4.1. Построение кривой плоского броуновского движения Выполним построение кривой C с помощью последовательности интерполяций. Пусть A0 A t0 , A1 A t1 . Тогда t t0 , t1 положение точки A t определяется следующим образом: t1 t OA0 t t0 OA1 OA t v , t1 t0
t t0 t1 t
где t
(5.6)
и вектор v – приведенный лапласов век-
t1 t0 тор, то есть вектор, распределенный по изотропному нормальному закону, определенному согласно (5.5), при t 1: P v
exp 2 2 , 0.
Действительно, для каждой компоненты вектор-функции OA t данные интерполяции приводят к построению случайной траектории линейного броуновского движения (подробнее см. выше §3). Из результатов, полученных выше, для линейного броуновского движения, следует, что предложенный алгоритм построения приводит к почти наверное непрерывной кривой, а коэффициент кор реляции между векторами OA0 и OA1 (при условии, если O A 0
и 0 t0 t1 ) определяется следующим образом: M OA0 OA1 M X 1 t0 X 1 t1 X 2 t0 X 2 t1 t 0. 2 2 t1 2 t0t1 M OA0 M OA0 Рассмотрим расстояние R OA . Для каждого заданного значения
параметра t величина R t распределена по закону, определяемо-
216
му согласно (5.5). Пусть задана последовательность tn , для которой n, n 1,2, : tn t0 q n , q 1, то есть последовательность значений параметра времени t, растущих в геометрической прогрессии. Тогда возможные значения отношения R tn n tn осуществляются с частотами, при n почти наверное стремящихся к своим теоретическим вероятностям. Более точно, посколь ку координаты вектор-функции OA t X 1 t , X 2 t независимы одна от другой, различные возможные значения отношения n очень вероятно будут реализовываться с частотами, почти пропорциональными их теоретическим вероятностям. Это следует из того, что при большой разности n n ' величины OAn и OAn ' , а следовательно, и величины n и n ' почти независимы. Таким образом, в последовательности n каждый член существенно коррелирован только с конечным числом соседних членов 1. В данных условиях справедлив закон больших чисел, из которого следует справедливость следующей теоремы. Теорема 5.2. Частота появлений значений n , превышающих некоторое фиксированное значение , почти наверное стремится к теоретической вероятности (5.5). Из данной теоремы следует, что усреднение случайной величины (или 2 ) по логарифмической шкале t почти наверное приводит к теоретическому среднему, то есть к соответствующему математическому ожиданию, определяемому из формулы (5.5) и равному 2 в случае , или 2 для 2 . Для величин tn , растущих в арифметической прогрессии, или для средних по t аналогичные приведенным выше утверждения 1
Точнее говоря, коэффициенты корреляции убывают в геометрической прогрессии по мере того как увеличивается удаление между коррелируемыми членами последовательности.
217
доказать не удалось бы. При попытках провести такое доказательство мы столкнулись бы с большими колебаниями и частот, и средних, поскольку при реализации большого значения величина
t продолжает оставаться большой в течение большого интервала на логарифмической шкале. Закон повторного логарифма1 для больших значений R t имеет ту же форму, что и для значений каждой компоненты случайно го вектора OA t . Таким образом, имеет место следующая теорема. Теорема 5.3. Если c 1, то почти наверное, что неравенство R t c 2t log log t
(5.7)
выполняется для всех достаточно больших t. Наоборот, если c 1, то почти наверное найдутся сколь угодно большие t, при которых реализуется неравенство, противоположное (5.7):
R t c 2t log log t .
(5.8)
Доказательство. Пусть c 0. Назовем событием A ситуацию, когда неравенство (5.7) оказывается несправедливым при хотя бы некоторых произвольно больших t, а событием B назовем ситуацию, когда для произвольно больших t одновременно выполняются следующие соотношения: 2 2 R t c 2t log log t , 1 , n n где – угол между вектором OA и осью Ox1 , меняющийся от нуля до 2 , n – некоторое сколь угодно большое целое число. Если событие A осуществилось, то осуществляется хотя бы одно из событий B . Поскольку, в силу изотропии процесса, все события B имеют одинаковую вероятность, величина P B положительна, если положительна величина P A . Таким образом, для сколь угодно больших значений t с положительной вероятностью справедливы следующие соотношения: 1
Формулировка и доказательство теоремы Хинчина (закона повторного логарифма) приведены в приложении 5.
218
2 2 c ' 2t log log t , c ' c cos . (5.9) n n Если c 1, то можно выбрать настолько большое число n, что будет также справедливо c ' 1 и неравенство (5.9) придет в противоречие с теоремой Хинчина1. Итак, если c 1, то P A 0. Пусть теперь c 1. Часть теоремы, соответствующая данному случаю, справедлива в силу того, что всякая нижняя грань функции X 1 t является нижней гранью R t и сформулированное свойстX 1 t R t cos
во следует непосредственно из теоремы Хинчина. Теорема доказана. ▲ Итак, по крайне мере в приближении теоремы Хинчина большие значения R t не превосходят больших значений X 1 t , хотя и появляются чаще, так что в данном случае на бесконечности график частот стремится к нулю не столь быстро. 4.2. Полярный угол: дискретный случай Обозначим через n An 1OAn , изменяющийся от до (поскольку вероятность значений равна нулю, не имеет значения, какое именно из этих значений указывать: или ), и поn
ложим n i . Тогда n – один из полярных углов точки An . i 1 Точка An A tn A q n является концом вектора An 1 An n
qn 1 q 1 , где n – приведенный вектор, распределенный по
нормальному закону и не зависящий от OAn 1 . Отсюда следует, что форма OAn 1 An , а следовательно, и значения угла n распределены по закону, зависящему от n 1 как от параметра. Поскольку различные величины параметра n 1 имеют частоты, почти наверное стремящиеся к своим теоретическим вероятностям, определяемым согласно (5.5), то для значений угла n в среднем справедлив неко1
Подробнее о теореме Хинчина – см. приложение 5.
219
торый априорный вполне определенный стационарный закон распределения, для которого M n 0, M n2 2 , 0, . Следовательно,
n n n , (5.10) где величина n распределена по закону, стремящемуся к приведенному нормальному закону при n . Более того, в некотором смысле приращения величины полярного угла n можно сравнить с выигрышем при игре в «орла и решку». Однако в данном случае различные возможные значения n осуществляются последовательно в тех же условиях, что и возможные значения величины n , а применение закона повторного логарифма показывает, что величина угла n колеблется между большими по модулю значениями 1 2n log log n , где – величина, стремящаяся к нулю при n . Как очень большие положительные, так и очень большие отрицательные значения редки и n , как правило, конечна. Данные рассуждения приводят к мысли, что ломаная A0 A1 An почти наверное обходит точку O весьма нерегулярным образом. 4.3. Полярный угол: непрерывный случай Обозначим t полярный угол точки A t , отсчитывае мый от направления, определяемого вектором OA0 . Данный угол меняется непрерывно при t 0, кроме случая возврата кривой C в точку O. Необходимо отметить, что в дальнейшем будет показано, что кривая C есть множество, имеющее плоскую меру нуль: вероятность того, что она проходит через заданную точку, равна нулю. Следовательно, возможностью возврата рассматриваемой кривой в точку O можно пренебречь. Определим угол n следующим образом:
n tn tn 1 .
220
Определенный таким образом угол отличается от соответствующего угла n на число, кратное 2 , которое, очевидно, может быть не равно нулю – замкнутый контур, составленный из дуги An 1 An и ее хорды, действительно может окружать начало O. Важно отметить, что любая дуга непрерывной кривой имеет положительную вероятность приближать, с любой заданной точностью , дугу An 1 An . Таким образом, если точка A tn 1 известна, то справедли-
во соотношение P n n 2 h A tn 1 A tn h n 1 0 и при n каждое событие n n 2 h h 0, 1, 2, осуществляется с частотой, почти наверное стремящейся к априорной положительной вероятности с математическим ожиданием n n 1 . Величина n2 бесконечна, откуда следует, что ожидаемый порядок величины t превышает порядок величины
t . Согласно
[130], отметим кратко, что доказательство данного утверждения основано на том факте, что справедливо следующее равенство: 2 d 1 OA0 exp 2 2 . 0
Если q 1 мало, то угол 1 A0OA1 или не мал, или не одного порядка со своим тангенсом, который определяется следующим q 1 образом: tg1 , OH 0 OA0 q 1, где и – незавиOH 0 симые друг от друга переменные, распределенные по приведенно му нормальному закону, OH 0 OH 0 . Математическое ожидание 2
2
величин 1 OH 0 и 1 OA0 равны бесконечности, откуда следует, что математическое ожидание величины 2 , очевидно, конечно и велико по отношению к q 1 log q при q 1 0. Пусть t0 1 и некоторое t – заданы. Положим t q n . В случае, если n неограниченно возрастает и q 1, угол 1 представляется
221
суммой n углов , не зависимых друг от друга, причем 2 будет велико по отношению к log q log t n . Поэтому средний квадрат данной суммы растет неограниченно вместе с n, то есть математическое ожидание квадрата полярного угла t равно:
2 t . 4.4. Характер кривой C в окрестности заданной точки На первом этапе рассмотрим окрестность точки O A 0 . Опираясь на локальное свойство винеровской функции X t , можно утверждать, что в плоском случае справедлива следующая теорема. Теорема 5.4. Стохастические свойства приведенной случайной вектор-функции OA t t инвариантны относительно замены t на обратную величину t 1. Как следствие можно получить, что вероятный ход кривой C в окрестности начала выводится из результатов, описывающих ее поведение на бесконечности1. Важно отметить, что предыдущие рассуждения столь же хорошо выполняются и для величин tn , образующих бесконечно убывающую геометрическую прогрессию. Таким образом, все, что было выше сказано относительно поведения полярного угла t без изменений справедливо для случая, когда t 0. Точка A t стремится к точке O , только вращаясь вокруг нее то в одном, то в другом направлении, так что угол t не ограничен ни снизу, ни сверху. Этот результат описывает также характер подхода точки A t к некоторой точке A t0 при t t0 (либо слева, либо справа), если только на t0 априрори не налагается особого условия, как напри1
Подразумеваются начальный и бесконечно удаленный моменты времени, в силу того, что параметр t в физическом смысле отождествляется со временем.
222
мер, требования быть точкой, в которой одна из координат достигает (локально) наименьшего или наибольшего значения. Исключительно важно отметить, что данное замечание показывает крайнюю сложность броуновской кривой C , в силу которой невозможно представить все бесконечно малые детали ее хода. Уже один только факт, что любая дуга кривой C имеет бесконечную длину, позволяет предвидеть эту сложность. Можно поставить вопрос о существовании у каждой дуги кривой C бесконечного множества двойных точек1. В [130] было указано, что «…применение точного математического закона может сделать то, чего не может сделать случайность…». Для того чтобы не было двойных точек, необходимо чтобы точка A t , постоянно перемещаясь в окрестности своих прежних следов, никогда бы их не пересекала. Полностью случайный механизм без наличия эффекта памяти такого поведения обеспечить не может. Ввиду важности рассмотрим данный момент более подробно и строго. Любая дуга произвольной непрерывной кривой имеет положительную вероятность быть приближением случайной дуги A t A t ' . Следовательно, вероятность существования двойной точки у дуги A t A t ' положительна и не зависит от соответствующей разности t ' t , поскольку процесс не изменяется при за мене t 2 t h и OA OA, где , h – некоторые величины. Рассмотрим теперь растущую последовательность значений n величины t, имеющую конечный предел lim n t. Различные дуги n
A n A n 1 имеют независимые друг от друга формы. Но тогда согласно лемме Бореля следует, что почти наверное у бесконечно большого числа этих дуг имеются двойные точки. Таким образом, почти наверное существует бесконечное множество двойных точек
1
Под двойной точкой подразумевается точка, в которой кривая пересекает саму себя один раз, то есть кривая проходит через двойную точку дважды.
223
на дуге A 1 A t ' , а следовательно, и на произвольной дуге At At '.
§5. Некоторые основные теоремы для кривой плоского броуновского движения В данном параграфе приводится строгое обоснование описанного выше возможного строения кривой плоского броуновского движения C . Теорема 5.5. Пусть L – произвольная конечная непрерывная кривая и AB – дуга данной кривой. Тогда AB рассматриваемой кривой L и 0 вероятность события «броуновская точка A t , выходящая из A, в заданный момент времени подойдет к точке B на расстояние, меньше , двигаясь все это время в - окрестности дуги AB » строго положительна. Доказательство. Возьмем произвольное 0 и зафиксируем его. Определим ломаную A0 A1 An , A0 A, описываемую точкой, расстояние от которой до точки, описывающей дугу AB , не будет превышать 2, то есть определим ломаную A0 A1 An в 2 окрестности дуги AB (рис. 5.2). Для доказательства теоремы достаточно доказать, что броуновская точка A t с точностью до 2 может описать определенную выше линию A0 A1 An , другими словами, поскольку замена на 2 ничего не меняет, сформулированную теорему достаточно доказать в случае ломаной. Обозначим через p , p 1,2,, n вероятность того, что броуновская точка A t , выходящая из точки Ap 1 , описывает отрезок Ap 1 Ap выбранной ломаной с точностью до n , то есть в своем
движении удаляясь от данного отрезка менее, чем на n , подходит к точке Ap ближе, чем на n . Тогда, согласно трансляционной инвариантности броуновского движения, вероятность того, что броуновская точка A t , в конце концов попадающая из начальной
224
точки A0 A в окрестность точки Ap , проходит свой путь, не отклоняясь от выбранной ломаной более, чем на , равна, по меньp
шей мере,
, p 1,2,, n. i
Следовательно, достаточно доказать
i 1
положительность всех p , p 1,2,, n, то есть, что сформулированная теорема верна в случае отрезка прямой AB длины l.
Рис.5.2. Рассматриваемые в рамках доказательства теоремы 5.5 окрестности выбранной дуги непрерывной кривой
Примем точку A за начало координат, а AB за ось x1. Тогда координаты X 1 0 X 2 0 0. Если при заданном T будет выполнено неравенство X 1 T l и при всех t 0, T выполняются неравенства X 1 t l , X 2 t , то будет иметь место интересующее событие для величины ' 2 0. Поскольку координаты X 1 t , X 2 t броуновской точки A t независимы, то возможность осуществления с положительной вероятностью данных неравенств можно проверять отдельно. Вероятность
P max X 2 t для очень больших значений T и очень малых t 0,T
225
0 имеет величину порядка exp cT 2 , c – некоторая постоянная. Видно, что данная вероятность быстро убывает, но всегда положительна, что и требовалось доказать. Теорема доказана. ▲ Рассмотрим теперь на траектории C плоского броуновского движения последовательность дуг A tn A tn 1 . Поскольку их формы не зависят друг от друга, то из доказанной теоремы следует, что среди них почти достоверно найдутся такие, которые после соответствующего передвижения (или, даже, параллельного переноса) будут сколь угодно мало отличаться от любой наперед заданной дуги. Это же замечание применимо к дугам A q n A qn 1 , q 0,1 при условии, что всякая дуга растягивается в q n 2 раз. Дуги, обладающие, с точностью до гомотетии, формой, сколь угодно близкой к форме заданной непрерывной и конечной кривой L , таким образом, почти достоверно находятся на любой дуге траектории C . Выберем в качестве L дугу с двойной точкой для того, чтобы доказать, что двойные точки образуют на кривой плоского броуновского движения C всюду плотное множество. Это означает также, что двойные точки образуют и в плоскости Rx21 x2 всюду плотное множество, ибо кривая плоского броуновского движения C , продолженная бесконечно1, всюду плотно заполняет всю плоскость. Данное рассуждение не переносится автоматически на тройные точки, существование которых не очевидно. Про точки пересечения данного типа почти очевидно лишь одно утверждение: двойная точка, выбранная на C , никогда не может оказаться тройной. Это следует из доказанного утверждения, что случайно выбранная точка кривой C имеет нулевую вероятность оказаться двойной. Однако если даже случится, что кривая пройдет через некоторую фиксированную точку второй раз, это не увеличит вероятность того, что кривая C попадет в эту точку третий раз: вероятность такого события остается равной нулю. Аналогично, если существуют 1
Здесь подразумевается кривая плоского броуновского движения, полученная в результате бесконечно долгого движения броуновской точки.
226
тройные точки на кривой плоского броуновского движения C и известно, что некоторая точка A кривой C – тройная, то A не имеет никаких шансов оказаться четвертной точкой пересечения, и так далее. Обобщая приведенные выше рассуждения, обозначим через E n множество n -кратных точек кривой C , то есть множество всех точек, в которых кривая C пересекает саму себя n раз. На первый взгляд, представляется очевидным следующий вывод: при увеличении n множества E n становятся все более и более разряженными и, вероятно, при достаточно больших n соответствующие множества становятся пустыми. Однако это неверно, что доказывает следующая ниже теорема, быть может, самая удивительная из теорем современного математического анализа. Теорема 5.6.1 Множества E n почти достоверно всюду плотны на кривой броуновского движения C , а следовательно, и в плоскости. Данное утверждение справедливо и для пересечения данных +
множеств E E n . n 1
Более того, на кривой C существуют точки кратности, имеющей мощность континуума, то есть для такой точки A кривой C множество значений t, при которых броуновская точка A t совпадает с A , имеет мощность континуума, и точки, обладающие указанной кратностью, также образуют всюду плотное множество! Это действительно примечательная особенность кривой плоского броуновского движения. §6. Замыкание плоской броуновской кривой C Лемма 5.1. Если в начальный момент времени t 0 подвижная броуновская точка находится в ограниченной области R 2 , то математическое ожидание случайного времени ее первого выхода
1
Данная теорема в литературе часто называется теоремой Дворецкого – Эрдеша – Какутани.
227
на границу области допускает конечную верхнюю грань, не зависящую от начального положения точки. Доказательство. Пусть – ограниченная область в R 2 . Тогда a diam sup p, p ' – некоторое действительное число, p , p '
где diam – диаметр рассматриваемой области, p, p ' – расстояние между двумя элементами области . Вероятность того, что точка A 1 является внутренней точкой области , меньше, чем величина k P A 0 A 1 a 1 exp a 2 2 1 (ибо a 0 ), где A 0 A t t 0 – точка, соответствующая положению подвижной броуновской точке A в начальный момент времени t 0 и A 1 A t t 1 – точка, соответствующая положению подвижной броуновской точке A в момент времени t 1. Тогда n 1,2, P T n P A 0 A 1 a ,, A n 1 A n a k n , следовательно,
математическое ожидание T k n , ибо возрастающая n0
(вследствие условия 0 k 1 ) ограниченная сверху последователь
n ность частичных сумм k s сходится в своей верхней грани. s 0 n 1 Лемма доказана. ▲ Замечание. Можно доказать, что
P T t cn exp n t ,
(5.11)
n 1
где cn – положительные постоянные, n – характеристические числа, при которых уравнение диффузии в частных производных имеет решения, не равные тождественно нулю и обращающиеся в нуль на . Теорема 5.7. Замыкание плоской броуновской кривой C , продолженной неограниченно, почти наверное совпадает со всей плоскостью R 2 .
228
Другими словами: пусть D – произвольная открытая квадрируемая область в R 2 , площадь которой отлична от нуля. Вероятность того, что C содержит точки области D равна единице. Доказательство. Теорему достаточно доказать для открытого круга BR 0 радиуса R с центром в начале координат O 0,0 . Пусть положение подвижной броуновской точки A t в некото-
рый момент t 0 A 0 A t t 0
известно и r A 0 , O . Ве-
роятность того, что C содержит внутренние точки круга BR 0 выражается некоторой функцией r и она равна единице при r R, убывая с ростом r. Поэтому предположим, что r R. Рассмотрим в качестве области круг радиуса r с центром в точке O и различные интервалы tn' , tn'' , n 1,2, такие, что: 1) точки A tn' и A tn'' лежат на – границе области , представляющей собой окружность; 2) t tn' , tn'' броуновская точка A t \ , то есть для указанных моментов времени A t пребывает внутри области ; 3) t tn' , tn'' : A t BR O или A t BR O , то есть за время tn' t tn'' хотя бы однажды точка A t попадает в круг BR O или
на его границу – окружность BR O (рис.5.3). Обозначим через Tn полное время пребывания подвижной броуновской точки внутри круга BR O в промежутке tn' t tn'' , являющееся суммой длин интервалов пребывания, а через T обозначим Tn , конечную или бесконечную. Если удовлетворяющий указанным выше условиям временной интервал tn' , tn'' существует, то точка A tn'' находится на расстоянии r от точки O. Следовательно, t tn'' вероятность возвращения A t в круг BR O равна . Поскольку A t с вероятностью единица не остается неограниченно долго на конечном расстоянии,
229
то утверждение, что подвижная броуновская точка A t возвращается в BR O равносильно утверждению о существовании интервала tn' 1 , tn'' 1 .
Рис.5.3. Движение подвижной броуновской точки A t в рамках построений для доказательства теоремы 5.7
Таким образом, вероятность существования каждого последующего интервала tn' , tn'' при условии существования предыдущего равна , следовательно, вероятность существования n -го интервала равна n . Необходимо отметить, что даже, если существует интервал tn' , tn'' , математическое ожидание Tn , согласно лемме 5.1, имеет конечную верхнюю грань, не превышающую некоторого числа m. Следовательно, справедливо следующее соотношение: T Tn m n . (5.12) n
n
230
С другой стороны, вероятность того, что точка A t при броуновском движении находится внутри круга BR O определяется следующими соотношениями: A 0 Q 2 1 dS P A t BR O p t exp 2 t BRO 2t (5.13) 2 mes BR O R , t 2 t 2t где Q – текущая точка круга, по которому ведется интегрирование, mes BR O R 2 – мера открытого круга BR O . Тогда справедливо
T
p t dt .
(5.14)
0
Однако, если 1, то величина T будет конечной в соответствии с формулой (5.12). Таким образом, 1, что и требовалось доказать. Теорема доказана. ▲ Доказанная теорема хорошо демонстрирует необычайную сложность кривой C , проходящей бесконечно много раз вблизи всякой точки плоскости. Величина OA t
t также претерпевает
сложные изменения в малом интервале 0, t0 , ибо процесс стохастически не меняется при замене t t02 t , и кривая в окрестности любой точки обладает теми же свойствами, что и в окрестности начальной точки. Невозможно представить себе все эти бесконечно малые зигзаги. Исключительная сложность кривой плоского броуновского движения C хорошо подчеркивается словами П. Леви «…Notre imagination se lassera plutót de conservoir que la nature de fournir …»1 [126] и иллюстрируется на рис. 5.4. В завершении данного параграфа приведем формулировки некоторых основных теорем, относящихся к кривой плоского броуновского движения. 1
«… Наше воображение утомляется быстрее, нежели иссякает природа, питающая его …».
231
Теорема 5.8. Кривая C почти наверно является множеством точек с нулевой плоской мерой, то есть с нулевой площадью по Лебегу. Теорема 5.9. Если кривая C выходит из данной точки, то вероятность ее попадания в другую заданную точку равна нулю.
Рис. 5.4. Траектория плоского броуновского движения, полученная с помощью компьютерного моделирования [8, 10]
Из данной теоремы следует, в частности, что вероятность повторного попадания кривой C плоского броуновского движения в точку A t , соответствующую некоторому произвольно заданному значению времени t, равна нулю. Другими словами, вероятность того, что заранее заданная точка A t является двойной точкой плоского броуновского движения, равна нулю. Следовательно, двойные точки почти наверное образуют на оси t множество меры нуль. Необходимо отметить важный результат, относящийся к одномерной винеровской функции X t и сформулированный в виде следующей теоремы.
232
Теорема 5.10. Пусть X t – одномерная винеровская функция. Данная функция, почти наверно ограниченная и не имеющая ограниченной вариации ни в каком интервале, обладает счетными всюду плотными множествами как минимумов, так и максимумов. §7. Броуновское движение в пространстве В трехмерном пространстве, тем более, в пространстве с большим числом измерений, свойства кривой C броуновского движения будут совершенно иными. Выражение (5.13) для p t заменяется на аналогичное выражение, но содержащее множитель t 3 2 , так что интеграл от полученного выражения оказывается уже сходящимся. Двумерный шар BR2 O заменяется трехмерным шаром BR3 O объема V соответственно. Обозначим через n вероятность появления броуновской точки A t внутри шара BR3 O в течение интервала времени n 1, n . Если A t в некоторый момент времени t, находящийся между моментами t n 1 и t n, достигает поверхности, то есть границы, BR3 O , то соответствующая условная вероятность найти данную броуновскую точку в момент времени t n внутри шара BR3 O , по меньшей мере (как вытекает из факта выпуклости шара) равна:
k P A t BR3 O A BR3 O 0. Отсюда для безусловной вероятности данного факта справедливо неравенство P n k n и, следовательно, выполняется соотношение
n
n
1 k P n . Тогда по лемме Бореля – Кантелли n
почти наверное существует такое число N , что n N рассматриваемое событие больше не произойдет, то есть броуновская точка A t больше не войдет в область BR3 O . Таким образом, справедлива следующая теорема.
233
Теорема 5.11. Какова бы ни была рассматриваемая ограниченная область многомерного пространства R d , d 3, все точки A t , попавшие в , почти наверно лежат на конечной дуге кривой броуновского движения C . Следовательно, в данном случае кривая C является замкнутым множеством. Мера этого множества почти наверно равна нулю, а по теореме 5.11 и проекция рассматриваемого множества на любые плоскости также почти наверно имеют нулевые меры. Если взять шар радиуса r, центр которого находится на расстоянии a r от начального положения подвижной броуновской точки A t , то вероятность того, что кривая C содержит внутренние точки данного шара будет непрерывной возрастающей функцией от r a , равной нулю при r 0 и равной единице при r a.
§8. Процесс Орнштейна – Уленбека Для описания процесса классического броуновского движения в качестве альтернативы винеровскому процессу Л. Орнштейном и Дж. Уленбеком в 1930 г. был предложен однородный диффузионный процесс vt , названный впоследствии процессом Орнштейна – Уленбека [131]. Необходимо отметить, что позже в 1934 г., используя другие, чем в [131] методы, та же теория была выдвинута С.Н. Бернштейном [132] и А.Н. Колмогоровым [133]. Определение 5.5. Процессом Орнштейна – Уленбека называется гауссовский стационарный случайный процесс vt с нулевым математическим ожиданием vt 0, дисперсией Dvt 2 1 e 2 t и экспоненциально затухающей корреляционной функцией следующего вида: v t , s 2 exp t s , 0. Для вычисления указанных характеристик следует выполнить усреднение по начальным данным v0 процесса Орштейна – Уленбека со стационарной функцией распределения
234
v2 exp 0 2 . 2 2 2 Поскольку винеровский процесс, описывающий физическую модель Эйнштейна – Смолуховского броуновского движения, недифференцируем, то в теории модель Эйнштейна – Смолуховского частица, совершающая броуновское движение не имеет нигде конечной скорости. В подходе Л. Орнштейна и Дж. Уленбека основной случайной величиной является не координата, а скорость vt блуждающей частицы. При этом предполагается, что силу, действующую на взвешенную в среде частицу, можно разложить на две компоненты – систематическую (сила трения) и стохастическую – обусловленную случайными толчками молекул среды. Таким образом, процесс Орштейна – Уленбека может быть также определен как решение следующего стохастического дифференциального уравнения (уравнения Ланжевена1) [134]: mdvt vt dt dwt , (5.15) где wt –винеровский процесс (так что dwt dt – обобщенный случайный процесс белого шума), m, – некоторые положительные постоянные, причем m . Уравнение (5.15) приближенно описывает линейное (одномерное) броуновское движение свободной частицы, при этом vt интерпретируется, как было указано выше, как скорость частицы, m – ее масса, vt – сила вязкого трения2. Второе слагаемое в правой части (5.15) соответствует именно случайной компоненте силы, появление которой обусловлено хаотическими толчками молекул среды, находящихся в тепловом движении. Данная компонента, как было указано выше, является основной причиной броуновского движения и описывается белым шумом dwt . p v0
1
В приближении Эйншетйна – Смолуховского m 0 соответствующее уравнение Ланжевена будет иметь вид dX t dwt . Дан1
Более подробно уравнение Ланжевена описано в приложении 6. Например, для сферической частицы радиуса a в силу гидродинамической формулы Стокса коэффициент вязкого трения 6 a. 2
235
ный частный случай уравнения (5.15) приводит к выводу, что координата броуновской частицы t
X t vt 'dt ' 1wt , 0
то есть описывается винеровским процессом. Таким образом, как было указано выше, физической модели броуновского движения Эйнштейна – Смолуховского соответствует математическая модель – винеровский процесс. В уточненной модели броуновского движения учитывается инерция взвешенной частицы, то есть считается m 0. Уточненная модель опирается на полное уравнение (5.15) и математической моделью в данном случае служит процесс Орнштейна – Уленбека. Учет инерции частицы приводит к конечности скорости броуновской частицы, но ее ускорение остается бесконечным вследствие того, что процесс Орнштейна – Уленбека (также как и винеровский процесс) является недифференцируемым. Для того, чтобы и ускорение броуновской частицы оказалось конечным, необходимо дальнейшее уточнение модели, учитывающее отличие случайной силы от идеализированного белого шума [134]. Необходимо отметить, что процесс Орштейна – Уленбека не имеет независимых приращений, то есть измерения скорости броуновской частицы коррелированны на непересекающихся временных интервалах [135]. В соответствии с теоремой Дуба [136] процесс Орштейна – Уленбека является единственным стационарным гауссовским марковским случайным процессом. Стационарность процесса Орштейна – Уленбека и отсутствие независимых приращений отличают его от винеровского процесса. Винеровский процесс, как математическая модель броуновского движения в пространстве координат блуждающей частицы, получается из процесса Орштейна – Уленбека в результате предельного перехода , , так что 2 const (для стандартного винеровского процесса 2 1 ). Таким образом, винеровский процесс соответствует описанию броуновского движения в пределе большой вязкости среды (сильное трение) и интенсивного шума. Процесс Орштейна – Уленбека v при 0 t допускает каноническое представление
236
v k uk , k 0
где коэффициенты k – независимые гауссовские случайные величины такие, что k 0; k l k kl , k – собственные числа, uk – собственные функции интегрального оператора с ядром v t, s 2 e
t s
, определяемые в соответствии с уравнением t
ds t, s u s u . v
k
k k
0
Процесс Орнштейна – Уленбека является однородным по времени марковским процессом диффузионного типа. Верно и обратное утверждение: процесс vt , являющийся одновременно стационарным случайным процессом, гауссовским процессом и марковским процессом, обязательно представляет собой процесс Орнштейна – Уленбека. Как марковский процесс рассматриваемый процесс Орнштейна – Уленбека удобно характеризовать его переходной плотностью p t , x , y , представляющей собой фундаментальное решение прямого уравнения Колмогорова (4.16), которое в данном случае имеет следующий вид: 2 p yp p 2 2 . t y y Таким образом, переходная плотность одномерного процесса Орнштейна – Уленбека задается формулой y x e t 2 1 p t , x, y exp 2 . 2 t 2 2 t 2 2 1 e 2 1 e Необходимо отметить, что многие свойства процесса Орнштейна – Уленбека (включая марковость) можно вывести из соответствующих свойств винеровского процесса, воспользовавшись тем, что процесс t ln t w t v 2
237
является стандартным винеровским процессом [134, 136]. В частности, отсюда следует, что реализации процесса Орнштейна – Уленбека непрерывны и нигде недифференцируемы почти наверное и что почти наверное справедливо [134] v t v 0 v t lim 1, lim 1. t 0 4 2 t ln ln 1 t t 0 2 2 ln t
Многомерный процесс Орштейна – Уленбека vt vt1 ,, vt n
может быть определен как решение соответствующего многомерного уравнения Ланжевена [135]: , dvt Bvt dt Adw t
где wt wt1 ,, wtn , wti – стохастически независимые стационарные винеровские процессы с корреляционной функцией, опре a деляемой как wi w k t, s ik min t , s . Здесь B b ik и A ik t
s
суть n n матрицы, причем матрица a ik связана с диффузионной матрицей a ik , входящей в уравнение Фоккера – Планка со-
T . Уравнение Фоккера – Планка для мноотношением a ik aa ik гомерного процесса Орштейна – Уленбека имеет вид 2 ij n b ik y y k p t , x , y p t , x , y 1 n a y p t, x, y , t 2 i , j 1 y i y j y i i 1
фундаментальное решение которого есть n 2 1 2 p t , x , y 2 det exp yi 1 yk ,
ik
где t B t B t yi yi e Bt xk , ik d e jl e . ik ij lk 0
Пример 5.1. Простейшим примером двумерного n 2 процесса Орштейна – Уленбека может служить гармонический стохастический процесс xt , описываемый стохастическим дифференциальным уравнением dx t 2 dxt 02 xt dt dwt ,
238
где wt – стандартный винеровский процесс, 0 – частота свободных колебаний, – коэффициент затухания, – интенсивность внешнего шума. Уравнение Ланжевена для стохастического гармонического процесса в терминах двухкомпонентных векторов 0 xt Ut и dWt приобретает вид x t dwt 0 dU t BU t dt dWt , B
0
0
. 0 2 Корреляционная функция двумерного процесса Wt имеет вид: 0 0 W i W k t , s ik min t , s , где матрица [135]. t s 0 0 1
§9. Обобщенное (фрактальное) броуновское движение Понятие обобщенного (фрактального) броуновского движения – ФБД – BH t было введено Б. Мандельбротом [56, 137] с помощью замены показателя в формулах для математического ожидания и дисперсии приращений классического броуновского движения на произвольное действительное число H 0,1 . Случай
H 1 2 соответствует независимым приращениям и описывает классическое броуновское движение. Таким образом, ФБД оказалось удобно определять именно с помощью параметра H . Показатель H , в силу исторических причин, называется показателем Херста. Существование фрактального броуновского движения было доказано в [129] с использованием стохастических интегралов. Как будет показано ниже, реализация одномерного ФБД с параметром H имеет размерность d 2 H . Графическим образом двумерного ФБД является поверхность, имеющая размерность d 3 H . Таким образом, параметр H соответствует степени изрезанности графического образа обобщенного (фрактального) броуновского движения. Как и в случае классического броуновского движения,
239
будет дано определение ФБД, основанное на нескольких аксиомах, которые характеризуют случайный процесс этого типа. 9.1. Определение ФБД Определение 5.6. Гауссовский процесс BH t называется обобщенным (фрактальным) броуновским движением с параметром H , H 0,1 на отрезке a , b , если он обладает следующими свойствами: 1) BH 0 0 и функция BH t почти всюду непрерывна на отрезке a , b ; 2) (свойство гауссовости приращений) t2 t1 случайная величина BH BH t2 BH t1 имеет гауссово (нормальное) распределение с нулевым математическим ожиданием и дисперсией равной
2 t2 t1
2H
, где – положительная константа, то есть
u2 exp du. 2 H 2 2H 2 t t 2 2 t2 t1 2 1 Как было указано выше, процесс ФБД является частным случаем автомодельного случайного процесса. P BH x
x
1
9.2. Основные свойства ФБД Закон дисперсии и стационарность. Из свойства 2) определения ФБД следует соответствующий закон дисперсии:
t1 , t2 a , b : D BH t2 BH t1 2 t2 t1
2H
.
В данном случае наблюдается полная аналогия с классическим броуновским движением: в силу того, что дисперсия зависит только от модуля разности значений моментов времени t2 и t1 , но не от самих значений, то приращения в случае ФБД являются стационарными. Свойство зависимости приращений. В отличие от классического броуновского движения B t , приращения которого независи-
240
мы, ФБД BH t с параметром H 1 2 не обладает данным свойством. Теорема 5.12. Пусть BH t – обобщенное (фрактальное) броуновское движение с параметром H , H 0,1 . Приращения BH t независимы тогда и только тогда, когда H 1 2. Доказательство. t 0, t 0 рассмотрим следующие приращения: BH t BH 0 и BH t t BH t . По свойству 1) определения ФБД BH 0 0, поэтому справедливо равенство BH t BH 0 BH t t BH t BH t BH t t BH t .
(5.16)
С другой стороны, справедливо следующее соотношение: 2
2
BH t t BH 0 BH t BH 0 2
(5.17)
BH t t BH t 2 BH t BH t t BH t .
Докажем необходимость. Пусть приращения ФБД BH t независимы, тогда нужно доказать, что H 1 2. В силу свойства 2) определения ФБД приращения BH t имеют гауссовское распределение с математическим ожиданием равным нулю, поэтому независимость приращений приводит к следующим равенствам: BH t BH 0 BH t t BH t BH t BH 0 BH t t BH t 0.
С другой стороны, в силу закона дисперсии и равенств (5.16) и (5.17) должна выполняться цепочка следующих соотношений: 2H BH t BH 0 BH t t BH t 2 2 t t t 2 H 2H t 0, что возможно только при выполнении условия H 1 2. Действительно, при H 1 2 1 2 H 0 и справедливо
2 2 2H 2H t t t 2 H t 2 2
t t t 12 H 1 2 H 1 2 H t t t t t
241
t
t
0.
2 1 1 1 1 t 12 H t 1 2 H 1 2 H 1 2 H t t 2 t t t t При H 1 2 1 2 H 0 и справедливо неравенство
1 2 H
2 H 1 2 H 1 2 H 1 0. Необхо 2 2 t t t t 2 H 1 t t t t димость доказана. Докажем достаточность. Пусть значение параметра H 1 2, тогда нужно доказать, что ФБД BH t имеет независимые приращения. Из соотношений (5.16) и (5.17) следует, что t 0, t 0 : 2 1 BH t BH 0 BH t t BH t BH t t BH 0 2
2
2
BH t BH 0 BH t t BH t . Отсюда, используя за-
кон дисперсии для ФБД и учитывая H 1 2, можно получить ра2H венства BH t BH 0 BH t t BH t 1 2 t t 2H t 2 H t 0. В силу свойства 2) – равенство нулю математи ческих ожиданий приращений ФБД – BH t BH 0 0 и
BH t t BH t 0. Таким образом, при H 1 2 выполнено
равенство, указывающее на независимость приращений: BH t BH 0 BH t t BH t BH t BH 0 BH t t BH t . Достаточность доказана. Теорема доказа-
на. ▲ Немарковское свойство. Из вычислений, выполненных при доказательстве теоремы 5.12, можно получить важные следствия. Если H 1 2, то BH t BH 0 и BH t t BH t имеют, скорее всего, одинаковые знаки и функция BH t обычно возрастает в будущем, если она возрастала в прошлом. Если H 1 2, то приращения BH t BH 0 и BH t t BH t имеют, скорее все-
242
го, различные знаки и функция BH t обычно убывает в будущем, если она возрастала в прошлом. В совокупности данные факты говорят о том, что ФБД не является марковским процессом, за исключением частного случая H 1 2. Обобщенный (фрактальный) броуновский процесс имеет дисперсию приращений, определяемую по следующей формуле: 2H
2H t t D BH t2 BH t1 K P 2 1 t2 t1 . (5.18) Важно отметить, что обобщенное (фрактальное) броуновское движение имеет бесконечно большое время корреляции. Согласно определению ФБД BH 0 0 и пусть 1, K P 1. Тогда из формулы (5.18) получается следующее выражение для коэффициента корреляции: D BH t B H t (5.19) r t 22 H 1 1. DBH2 t
Можно заметить, что при H 1 2 корреляции прошлых и будущих приращений отсутствуют в любой момент времени: t : r t 0 и коэффициент корреляции не зависит от t в соответствии с (5.19). Случай H 1 2 соответствует наличию положительной корреляции, случай H 1 2 – отрицательной корреляции. Таким образом, уникальное свойство обобщенного броуновского процесса заключается в наличии явления персистентности – сохранения имеющейся тенденции (при H 1 2 ) и антиперсистентности – изменения имеющейся тенденции (при H 1 2 ). Ввиду важности поясним суть данного явления более подробно. Если приращения были положительными за некоторый промежуток времени в прошлом и H 1 2, то есть имеет место поддержание имеющейся тенденции, то и в будущем в среднем приращения будут положительными. Более того, данное утверждение справедливо для произвольно больших t. В противоположном случае, для H 1 2, рост в прошлом означает уменьшение в будущем, и наоборот. Следовательно, суть обобщения состоит в том, что обобщенный броуновский процесс (в отличие от классического) обладает памятью.
243
Абсолютная величина приращений. Пусть BH t – ФБД с параметром H , H 0,1 . Тогда математическое ожидание абсолютной величины приращения равно: 2 H M BH t2 BH t1 t2 t1 . Доказательство данного факта полностью аналогично доказательству теоремы 5.1 и предоставляется читателю. Недифференцируемость. Как и в случае классического броуновского движения, ФБД почти наверное недифференцируемо. Полное доказательство данного утверждения приведено в [129]. Сравнение результатов численного моделирования для поведения приращений броуновской функции и собственно самой функции в случае классического и обобщенного (фрактального) броуновского движения представлено ниже (см. §11, рис.5.7). §10. Некоторые важные примеры процессов обобщенного броуновского движения Иная, полезная для различных приложений, формулировка свойства памяти для обобщенного броуновского процесса приведена, например, в [129]. Стимулом проведения исследований в [129] была необходимость понимания разности потоков крови в сердце и легких. Ранее было обнаружено, что местные потоки крови в органах человека обладают свойством фрактальности. Для местных сердечных потоков крови фрактальная размерность DF 0,5 1 при коэффициенте корреляции, равном 0,52. Здесь статистика Херста есть результат длинного потока взаимосвязанных событий. В данном случае присутствует не кратковременная память, которую называют «марковской», а долговременная. Фрактальная природа показателя Херста H определяет меру смещения событий. Тестом для проверки фрактальности потоков крови явля-
1
В данной главе, в отличие от [1], для обозначения фрактальной размерности используется DF для того, чтобы не путать с обозначением дисперсии, например, в (5.19).
244
лись выражения для корреляций между искусственными сериями моделирующих сигналов, разделенных интервалами. Рассмотрение корреляций сумм значений сигналов на двух интервалах, разнесенных на n смежных единичных отрезков, позволяет получить следующее общее выражение для значений коэффициентов корреляции rn : rn
n 1 2
n 1
2 H 1
n 1
1 n i 1 ri i 1
(5.20) 1 2H 2H 2H n 1 2n n 1 . 2 Отсюда, в частности, можно получить формулу (5.19) для простейшего случая n 1, r2 1 2 32 H 1 22 H , и т.д. Для одномерных сигналов показатель Херста связан с фрактальной размерностью простой формулой H 2 DF . В общем случае, между евклидовой или топологической размерностью dim M , показателем Херста и фрактальной размерностью имеет место следующее соотношение [137]: H dim M 1 DF . Значения коэффициента корреляции rn сигналов, разделенных
n 1
целыми интервалами для некоторых фиксированных значений показателя H , представлены на рис. 5.5. Видно, что при увеличении числа интервалов n корреляции сначала быстро ослабевают (соответствующие коэффициенты уменьшаются), затем, при больших n, уменьшение rn происходит значительно медленнее. Для фрактальных сигналов с H 0, 7 значения rn при n 1 настолько малы, что можно рассматривать данные сигналы как фрактальные шумы. Из формулы (5.20) следует, что для абсолютно случайных фрактальных потоков r1 0 значение фрактальной размерности равно DF 1,5 и H 0,5. На основании (5.20) может быть получено следующее асимптотическое соотношение: rn n rn 1 n 1
245
2 H 2
.
Рис.5.5. Коэффициенты корреляции при различных значениях показателя Херста. Точки соединены для наглядности [78]
Используя аналогичный подход можно получить следующее соотношение для непрерывного случая: 1 2H 2H 2H r x x 1 2 x x 1 , (5.21) 2 где x 0 – непрерывная переменная. Важно отметить, что корреляционные кривые (5.21) непрерывны без разрывов производной, кроме выделенного случая H 0,5, когда коэффициент корреляции задается следующей формулой: 1 x , 0 x 1; r x x 1. 0, Вид зависимостей rn (см. рис. 5.5) также интересен тем, что они предсказывают ослабление корреляций, однако более медленное, чем для экспоненциальных или гауссовых кривых. Ослабление корреляций (уменьшение rn ) описывается почти степенной функцией с показателем n, тогда как экспоненциальная и гауссова зависимости спадают более резко. Для определения показателя Херста по формуле (5.20), например, в [129] генерировался фрактальный сигнал из 32768 равномерно расположенных точек. Оценка проводилась выполнением обратного преобразования Фурье в частотной области спектра
246
1 f 2 H при значении H 0,8 и случайной фазе, где f – частота. Было получено следующее значение: H 0,800 0.003. При фрактальном сигнале из 512 точек показатель Херста был оценен равным H 0,74 0,02. Двухточечные автокорреляционные функции для сигнала с разными отсчетами представлены на рис. 5.6,а и 5.6,б соответственно. Из приведенных выше рассуждений следует, что возможна ситуация, при которой за ограниченное время измерения вообще невозможно получить достоверные данные о среднем изучаемого процесса. Следовательно, нахождение показателя Херста является необходимым элементом измерения статистических свойств исследуемых процессов [56].
§11. Моделирование обобщенного броуновского движения Для более глубокого понимания обобщенного броуновского движения и его реализации методами численного моделирования рассмотрим подробно предложенные последовательно варианты определения функции BH t . В [138] была введена случайная функция BH t с нулевым средним:
Рис.5.6. Проверка соответствия модели для фрактальной корреляции синтезированного фрактального сигнала с показателем Херста H 0,8 : а – рассматривается массив из 32768 точек, б – рассматривается массив из 512 точек [78]
247
t
BH t
1 H 1 2 t t ' dB t ' , H 1 2
(5.22)
где x – гамма-функция. Согласно (5.22) значение случайной функции в некоторый момент времени t зависит от всех предшествующих t ' t приращений dB t ' обычного гауссова случайного процесса B t BH 1 2 t с нулевым средним и единичной дисперсией. Обозначение dB t ' представляется физически оправданным и особенно понятным при замене интегрирования в (5.22) суммированием. Будем считать, что переменная t принимает целочисленные значения, и, соответственно, можно записать переменную интегрирования в виде t ' in, где i ,, 2 n , 1 n ,0,1 n ,, t n . Тогда приращение dB t ' исходного гауссова процесса с независимыми значениями можно записать в виде i n , где i является дискретной гауссовой случайной величиной с нулевым средним и единичной дисперсией. Множитель 1 n учитывает перенормировку согласно определению 4.9 инфинитезимального оператора. Тогда для дискретного случая (5.22) перепишется в виде t n 1 H 1 2 BH t t in i n . H 1 2 i Однако данный ряд не сходится, следовательно, при t ' будет расходиться и интеграл в (5.22). Поэтому более корректно и точно случайная функция BH t при заданном значении BH 0 определяется следующим образом [129]: t 1 BH t BH 0 (5.23) K t t ' dB t ' , H 1 2 с модифицированным ядром t t ' H 1 2 , 0 t ' t; K t t ' (5.24) H 1 2 H 1 2 t ' , t ' 0. t t '
248
Соотношение (5.23) является общим уравнением линейного отклика. Независимое гауссово приращение dB t ' , имеющее единичное значение в момент t ', в более поздний момент t вносит вклад в смещение фрактальной броуновской частицы BH t , определяемый функцией отклика K t t ' [139]. Изменим масштаб вре мени, то есть пусть t bt. Тогда bt 1 BH bt BH 0 K bt t ' dB t ' H 1 2 и введена новая переменная интегрирования t ' bt . Используя формулу из свойства масштабной инвариантности, справедливого для классического броуновского движения (то есть для гауссовых приращений), в виде dB t ' bt bdB t и замечая, что справед ливо K bt t ' K bt bt b H 1 2 K t t , можно получить следующее соотношение: BH bt BH 0
bt bt 1 1 K bt bt dB bt b H K t t dB t H 1 2 H 1 2
bt 1 b K t t dB t b H BH t BH 0 , H 1 2 являющееся справедливым в статистическом смысле для всех значений масштабного параметра b. Считая t 1 и приращение t bt, можно получить, что приращение координаты фрактальной броуновской частицы определяется выражением H
H
H
BH t BH 0 t BH 1 BH 0 t ,
(5.25)
H
которое статистически пропорционально t . Поэтому дисперсия приращений будет определяться формулой (5.18) при t t t0 и t0 0.
249
В [140-142] получено следующее выражение для дискретных приращений (фрактальный шум) при обобщенном броуновском движении: n H BH t BH t 1 H 1 2 (5.26) n q 1 nt H 1 2 H 1 2 H 1 2 1 n q 1 t i , i 1n q t i n i i i 1 i 1 где q – номер конечного интервала целочисленных значений времени t; j – набор гауссовых случайных величин с единичной дисперсией и нулевым средним, i 1,2,, q. На основе соотношения (5.25) с использованием последовательности гауссовых случайных чисел можно получить значения приращений функции BH . Выражение (5.26) эквивалентно вычислению скользящего среднего со степенной весовой функцией от гауссова процесса. При t q приращения становятся независимыми. Однако алгоритм, использующий соотношение (5.26), неэкономичен. Вследствие этого был разработан быстрый алгоритм получения фрактального шума, основанный на весовом суммировании ряда марковских гауссовых переменных с возрастающими временами корреляций и на учете высокочастотной компоненты с марковскими свойствами. При расчетах по (5.26) при H 1 2 моделируется белый шум. По мере увеличения значения показателя Херста усиливается низкочастотный шум, приводящий к большим отклонениям амплитуды [56]. Результаты моделирования приращений обобщенной броуновской функции при различных значениях показателя H показаны на рис. 5.7,а-в. Эволюция во времени функции фрактального броуновского движения1 BH t при BH 0 0 описывает изменение положения частицы, начинающей движение из начала координат. При возрастании параметра H увеличивается амплитуда вариаций координаты положения частицы и уменьшается шум (рис. 5.7,д-е). При 1
Иногда в литературе используется термин «фрактальная броуновская функция» или «обобщенная броуновская функция».
250
фрактальном движении с H 1 2 отклонения от начала координат, по сравнению с классическим броуновским движением, оказываются аномально большими [143]. Действительно, используя выражение (5.18) совместно с соотношением Эйнштейна, можно определить коэффициент фрактальной аномальной диффузии следующим образом: K dH K d t
2 H 1
,
где K d – коэффициент диффузии для классического случая. Данная формула играет важную роль в анализе процессов фрактального переноса. Важно подчеркнуть, что в данном случае аномальный характер диффузии связан с фрактальными свойствами блужданий частицы в евклидовом пространстве [56]. Когда блуждания происходят на фрактальном множестве в евклидовом пространстве, коэффициент диффузии остается аномальным, но характеризуется другим показателем в степенной зависимости от времени 1 [144]. Пусть X t , – случайный процесс с дискретным целочисленным временем t, причем 0 t , где – длительность рассматриваемого интервала времени. Как показал Херст, величина нормированного размаха R S хорошо аппроксимируется следующим эмпирическим соотношением: H
R S 2 ,
где R max X t , min X t, – максимальный (для фиксиро1t
1t
ванного ) размах амплитуд случайного процесса, S является среднеквадратичным отклонением процесса. При отсутствии долговременной статистической зависимости величина нормированного размаха R S должна быть асимптотически пропорциональна . Известно, что если временные ряды связаны со случайными процессами с независимыми приращениями и конечной дисперсией, то справедливо следующее соотношение: 12
R S 2 . 1
Подробнее о современных методах описания диффузионных процессов во фрактальных пространствах см. гл. 6.
251
Рис. 5.7. Фрактальный шум или приращения обобщенной (фрактальной) броуновской функции BH t для классического броуновского движения – белый шум – при H 1 2 (а) и для фрактального броуновского движения – фрактальные приращения – при H 0,7 (б) и H 0,9 (в). Обобщенная (фрактальная) броуновская функция BH t , рассчитанная при условии BH 0 0 для классического броуновского движения при H 1 2 (г) и для фрактального броуновского движения при H 0,7 (д) и H 0,9 (е) [143]
Таким образом, как было отмечено выше, в ряде приложений интерес могут представлять именно случаи, соответствующие отличию показателя Херста от значения H 1 2.
252
Соотношение подобия (5.25) показывает, что случайная функH
ция BH t t . Отсюда следует [115, 127], что размах R при величине запаздывания также является случайной функцией, подчиняющейся закону подобия: R H . Поскольку везде выше предполагалось единичное значение дисперсии фрактальной броуновской функции DBH t S 2 1, то для общего случая можно записать: R R H или H . (5.27) S DBH Таким образом, показатель Херста H можно оценивать, аппроксимируя экспериментальные данные соотношением (5.27). Для практических приложений [143] считается, что показатель Херста можно оценить, анализируя временные ряды, состоящие примерно из 2500 измерений. Важно отметить, что для многих естественных процессов (метеоданные, число солнечных пятен, водобмен, слоистые отложения и т.п.) для показателя Херста оказывается справедливо соотношение H 1 2. Например, анализ одной из самых длительных выборок методом нормированного размаха был выполнен в [78, 143] при исследовании древних климатических изменений по толщине слоев в слоистых отложениях озера Тимлепаминт (Канада). Обработанные данные охватывают период в 1809 лет, рассчитанное по ним значение показателя Херста оказалось очень велико H 0,96 . Изучение рядов измерений и применение метода нормированного размаха в физике частиц и атомного ядра было впервые выполнено в [145 – 147]. Были рассмотрены различные реакции с участием адронов и атомных ядер при различных начальных энергиях. В данных исследованиях также было обнаружено отличие значения показателя Херста от H 1 2. Алгоритмы построения не только обычной фрактальной броуновской функции, но и фрактальных броуновских поверхностей и объемов на основе последовательного случайного сложения предложены в работе [148]. Для построения обобщенной броуновской кривой с вертикальной координатой, описываемой законом обоб-
253
щенного броуновского движения, необходимо, чтобы дисперсия приращений координаты удовлетворяла условию V t t
2H
02 ,
где 02 – начальная дисперсия случайных сложений. В алгоритме базисной точкой всего построения служит последовательность значений координаты Y t1 , Y t2 ,, Y t N , заданных для соответствующих моментов времени t1 , t2 ,, tN . Пример 5.2. Рассмотрим простейший случай при N 3 с моментами времени ti1 0,1 2,1; i 1,2,3, причем исходные значения координаты положим равными нулю. К значениям Y t1 , Y t2 ,Y t3 приближаются случайные числа с гауссовым распределением, нулевым средним и единичной дисперсией 02 12 1. На каждом интервале выделяются затем средние значения времени. Значение координаты в данные средние моменты времени оценивается с помощью интерполяции. Следовательно, в результате выполнения данного этапа получены временные точки ti2 0,1 4,1 2,3 4,1; i 1,,5. На следующем этапе ко всем координатам Y ti , i 1,5 прибавляются случайные числа с гауссовым распределением, нулевым 2H
средним и уменьшенной дисперсией 22 1 2 12 . Затем между пятью значениями времени ti2 , i 1,,5 вновь проводится интерполяция к серединам временных интервалов, что приводит к значениям координаты в девяти моментах времени. После n -кратного применения данного алгоритма получаются значения координаты обобщенной броуновской частицы в 1 2n моментов времени. Дисперсия слагаемых n -го поколения: n2 22 H n21 22 Hn 02 . В [148] также показано, что заполненность синтезированных фрактальных поверхностей контролируется выбором коэффициента 1 2, так что в общем случае суммирование в n -ом поколении проводится при нулевом среднем и n2 2 Hn 02 . Достоинство представленного алгоритма заключается в том, что он может применяться до тех пор, пока не будет достигнуто любое, наперед заданное разрешение. Синтезированные поверхности дают
254
возможность достаточно просто алгоритмически описать реальные природные ландшафты при малом числе входных параметров. Данный метод объединяет синтезирование ландшафтов с анализом наблюдений и, таким образом, представляется одним из наиболее многообещающих подходов. §12. Самоаффинность фрактальной броуновской функции В соотношении подобия, полученного выше для приращения фрактальной броуновской функции, время и координата входят с различными коэффициентами: если время умножается на коэффициент b, то координата умножается на b H . Поэтому обобщенный броуновский процесс относится к самоаффинным фракталам. Анализ фрактальных структур показывает, что необходимо различать фракталы самоподобные и самоаффинные. Определение 5.7. Ограниченное фрактальное множество точек A называется самоподобным с отношением (коэффициентом) подобия r, если A является объединением N непересекающихся подмножеств A1 , A2 ,, AN , каждое из которых конгруэнтно множеству r A , полученному из A преобразованием подобия с отношением (коэффициентом) 0 r 1. Свойство конгруэнтности означает, что каждое рассматриваемое подмножество Ai , i 1,, N совпадает с множеством r A после переноса и/или поворота. Тогда гомотетическая размерность определяется следующим образом: ln N Dh . ln 1 r Определение 5.8. Множество A статистически автомодельно, если оно является объединением N отдельных (непересекающихся) подмножеств, каждое из которых получено из A преобразованием подобия с коэффициентом r 0 r 1 , и обладает такими же статистическими свойствами, что и r A . Ранее [1] были рассмотрены конструктивные фракталы, основой алгоритма построения которых служит преобразование подобия, при котором координаты всех точек исходного элемента конструк-
255
тивного фрактала изменяются с одинаковым коэффициентом подобия r 0 r 1 . Однако можно предположить, что данный вид преобразования не является единственно возможным и наиболее общим. Аффинное преобразование переводит точку x x1 ,, xN в новую точку с координатами x ' r1 x1 ,, rN x N , где не все коэффициенты r1 ,, rN одинаковы1. Определение 5.9. Ограниченное множество A самоаффинно по отношению к вектору подобия r r1 , rN , если A является объединением N непересекающихся подмножеств A1 , A2 ,, AN , каждое из которых конгруэнтно множеству r A , полученному из данного множества A с помощью аффинного преобразования, которое оп ределяется вектором r . Определение 5.10. Множество A статистически самоаффинно, если оно является объединением N непересекающихся подмножеств Ai , i 1,, N , каждое из которых получено из множества A аффинным преобразованием с вектором подобия r r1 , rN , и обладает такими же статистическими свойствами, что и r A . Кроме траектории винеровского процесса, математически описывающего классическое броуновское движение, в силу того, что координаты времени и смещения входят в соотношение подобия с разными коэффициентами, примером самоаффинного фрактала может служить функция «чертова лестница». Фрактальная размерность самоаффинных фракталов не определяется однозначно. При анализе самоаффинных фрактальных кривых следует различать локальную и глобальную размерности [138]. В силу важности ниже приводится подробное рассмотрение данного вопроса на примере графика фрактальной функции BH t с длительностью полного рассматриваемого периода времени T . Тогда для покрытия рассматриваемого интервала на оси времени 1
Видно, что частным случаем аффинного преобразования является преобразованием подобия, когда r1 rN r.
256
необходимо T b отрезков длиной b . В пределах каждого отрезка диапазон изменений функции имеет величину порядка BH b b H BH . Для покрытия данного размаха необходимы b H BH ba рядов клеток, высота каждой клетки при этом равна ba. Поэтому для покрытия всего графика фрактальной функции на рассматриваемом интервале оси времени требуется b H BH T N b, a , b H 2 b Dl ba b клеток. В данном случае рассматриваются клетки, размер которых мал как по сравнению с длительностью процесса T 1, так и с диапазоном изменения функции. Приведенные выше рассуждения неприменимы, если для покрытия кривой используются клетки, размер которых сопоставим с размахом кривой на исследуемом интервале оси времени. Если выбрать значение a , соответствующее характерному размеру клетки, a D
2 1, то на каждом
временном отрезке длительностью b для покрытия кривой с размахом BH b потребуется всего один ряд клеток, общее количество которых будет равно T N b, a , b1 b DG . b Таким образом, при анализе самоаффинных фрактальных кривых следует различать локальную фрактальную размерность, равную Dl 2 H , и глобальную фрактальную размерность, равную DG 1 (для рассматриваемого случая фрактальной кривой броуновского движения). Определение 5.11. Мультифракталом называется объединение фракталов, имеющих различные размерности. 1
Как было указано выше, под T подразумевается полная длительность периода, на котором рассматривается график фрактальной функции. С другой стороны, данная величина может быть отождествлена с длительностью процесса фрактального броуновского движения, описываемого функцией BH t .
257
Как можно понять непосредственно из определения, мультифракталы имеют более сложные свойства, чем непосредственно (моно) фракталы [56, 131, 143, 149]. К мультифракталам относится и траектория классического винеровского процесса броуновского движения и график функции «чертова лестница». Для характеристик таких структур вводятся в рассмотрение различные информационные размерности, которые чувствительны к неоднородностям рассматриваемых множеств [150 – 158]. Одними из наиболее содержательных параметров, используемых для описания таких сложных объектов, являются обобщенные размерности Реньи различных порядков [159, 160]. Предположим, что случайное множество точек разбито на ячейки размером и пусть Pi – вероятность попадания в i -ю ячейку. Согласно [159, 160] обобщенные энтропии q -го порядка K q определяются следующим образом: ln Pi q , K q i (5.28) 1 q где q 0,1,2,, n. При q 1, и полагая q 1 , где 0, можно получить
K q Pi ln Pi . Соответственно, разq 1 i
мерность Реньи q -го порядка определяется следующим образом: Dq* lim
K q
. (5.29) ln Важно отметить, что при данном определении размерность Реньи D0* совпадает с размерностью Хаусдорфа рассматриваемого 0
множества. Размерность D1* называется информационной, а D2* – показателем корреляционного интеграла 1 N c r lim 2 r xi x j , (5.30) N N i , j 1 который оценивается непосредственно для последовательности точек. Здесь xi x j – расстояние между точками xi , x j в паре, –
258
функция Хевисайда. Для многих фракталов корреляционный интеграл зависит от r при r 0 по степенному закону: c r r D3 .
Поэтому фрактальную корреляционную размерность D3 1 определяют по наклону прямого участка дважды логарифмического графика ln c r f ln r . Рассмотрим внутреннюю размерность, которая получается в случае, когда для измерения кривой вдоль нее откладывается эталон («линейка») длиной . Для самоподобных фрактальных кривых (например, береговых линий) получается длина L 1 DF , где, как указано выше, DF – размерность рассматриваемого самоподобного фрактала. В качестве самоаффинной кривой будем рассматривать график функции обобщенного броуновского движения. Пусть для данной самоафинной кривой длина линейки выбирается таким образом, что эталон покрывает шаг по оси времени длительностью b . Тогда вклад в общую длину кривой составит [78] 2
B b b H (5.31) . a При выборе достаточно большого увеличения для оси y , по кото2
2H
рой откладывается приращение броуновской кривой BH , то есть при достаточно малых a , в (5.31) будет преобладать второе слагаемое и b H . Число таких отрезков, укладывающихся на рассматриваемом интервале T , составляет T b b 1 1 H . Тогда полная длина самоаффинной кривой может быть оценена следующим образом: L 11 H 1 DF , где DF – размерность фрактала. В локальном пределе, когда растягивается масштаб по оси y , внутренняя размерность оказывается равной Dl 1 H . При растяжении масштаба по оси времени, когда функции X t становятся
1
В литературе для данной размерности также используется термин «корреляционный показатель» и обозначение D3.
259
незаметными1, преобладающим в (5.31) станет первое слагаемое. В данном случае b и полная длина будет оцениваться по следующей формуле: L T b и поэтому DF 1. Иногда Dl 1 H называют скрытой фрактальной размерностью [161], которая связана с фрактальной размерностью следа броуновской частицы. Показатель Херста H носит в данном случае название аффинного показателя. В общем случае для n -мерного аффинного пространства при n 2 имеется n n 1 2 аффинных показателей. Сведения о различных видах фрактальной размерности для случаев самоподобной кривой и самоаффинной кривой на примере обобщенной броуновской функции представлены в табл. 5.1. Таблица 5.1. Размерности фрактальной функции [78] Размерность Хаусдорфова
Самоподобная кривая 1H
Клеточная
1H
2 H
Внутренняя
---
1H
1
1H
---
---
1H
---
---
Случайного блуждания Подобия
Самоаффинная кривая Локальная Глобальная --2 H 1
Среди процессов с независимыми приращениями винеровский процесс занимает, как отмечалось выше, особое положение. График данного процесса непрерывен, что имеет место только при гауссовом распределении. Важно отметить, что отказ от нормального закона распределения для приращений ведет к разрывным траекториям.
1
В данном случае подразумевается, что масштаб по оси y выбран настолько большим, что любые детали поведения рассматриваемой функции становятся незаметными.
260
§13. Функция Вейерштрасса – Мандельброта В качестве важного примера самоаффинной функции рассмотрим подробно фрактальную функцию Вейерштрасса – Мандельброта, определяемую следующим соотношением [78]: n 1 exp ib t exp i n W t . (5.32) 2 D n b n Здесь параметр D принимает значения 1 D 2; n – произвольные фазы. Важно отметить, что функция W t непрерывна, но не является дифференцируемой ни в одной точке. Очень часто модификации (5.32) используются при моделировании рассеяния волн фрактальными поверхностями. Определение 5.12. Косинусной фрактальной функцией Вейерштрасса – Мандельброта называется действительная часть функции W t :
C t ReW t
1 cos bn t
, n : n 0 . (5.33) 2 D n b Данная функция подробно проанализирована в [162]. Обычно считается, что функция (5.33) фрактальна с размерностью DF D . Если иметь в виду клеточную размерность, то данная функция действительно имеет размерность D W , значение которой заключено в
n
пределах D B b D W D [163]. Предполагается, что входящая в данное неравенство постоянная B достаточно велика, чтобы неравенства выполнялись и при больших b. Значения функции Вейерштрасса – Мандельброта W t вычислены в [78] при дискретных параметрах на отрезке 0,1 и при 0 t 1. При значении D 1 функция C t по существу гладкая, при D 2 функция (5.33) сильно флуктуирует и ее график напоминает шум в электрических цепях. Важно отметить, что косинусная функция Вейерштрасса – Мандельброта является однородной и удовлетворяет соотношению C bt b 2D C t . (5.34)
261
Из соотношения (5.34) следует, что если в исходном определении кривой заменить t на b4t и C t на b42 D C t , то получится исходная функция. В этом и проявляются так называемые скейлинговые свойства функции C t . График функции (5.33) является самоаффинной кривой, так как для осей, по которым откладываются значения t и C t , используются разные масштабные множители. Функцию Вейерштрасса – Мандельброта также используют для получения случайных фрактальных кривых, выбирая случайным образом значения фазы из интервала 0,2 . Данные функции подробно рассматриваются в [162]. §14. Фурье-анализ фрактального броуновского движения В данном параграфе рассматривается спектральная плотность обобщенного броуновского движения. Пусть BH t – фрактальное броуновское движение, относящееся к классу функций X t , для которых выполняются условия, необходимые для существования преобразования Фурье1. Рассмотрим функцию фрактального броуновского движения, определенную следующим образом: X t , t 0, T ; BH t , T 0, t ,0 T , . Преобразование Фурье функции BH t , T , имеющей ненулевое значение на конечном носителе, определяется по формуле T BH , T X t e i 2t dt. 0
1
Вследствие важности для дальнейшего изложения преобразование Фурье и его некоторые основные свойства более подробно рассмотрены в приложении 7.
262
Средняя мощность функции X t на отрезке 0,T определяетT
ся как
2 1 BH t , T dt и по теореме Планшереля равна величине T 0
2 1 BH , T d . T Определение 5.13. Спектральной плотностью мощности функ2 1 ции BH t , T называется функция S BH , T BH , T . T Определение 5.14. Спектральной плотностью функции BH t 2 1 называется функция S BH lim BH , T . T T Одна из основных теорем, относящихся к фурье-анализу фрактального броуновского движения, говорит о степенном росте спектральной плотности как функции частоты. Теорема 5.13. Пусть функция BH t описывает фрактальное
броуновское движение с параметром H , H 0,1 и для нее существует преобразование Фурье. Тогда для спектральной плотности справедливо S BH 1 2 H 1 . Доказательство. Полное доказательство данной теоремы использует достаточно глубокие результаты фурье-анализа. Поэтому приводимое ниже упрощенное доказательство выполнено на интуитивно понятном, качественном, уровне. Предположим, что BH 0 0. Свойство статистического самоподобия обобщенного броуновского движения приводит к следующему равенству r 0 : BH t BH rt r H . Зафиксируем r 0 H B rt r , t 0, T ; Y t,T H Выполняя замену 0, t ,0 T , . переменных t s r в преобразовании Фурье для Y t , T , получаем
и определим
T 1 Y , T Y t, T e i 2t dt H r 0
rT
ds B s exp i 2 r s r , H
0
263
что при-
1 водит к соотношению Y , T H 1 X , rT . Отсюда, спекr r тральная плотность мощности функции Y t , T равна SY , T 2
1 2 H 1 BH , rT . Переходя в данном выражении к пределу r rT r при T , можно получить спектральную плотность Y t , T : 1
SY S X r r 2 H 1 . Вследствие определения функции BH t ,
статистического самоподобия функций BH t и Y t , T спектральные плотности S BH и SY должны совпадать и, следовательно, выполнено S BH S BH r r 2 H 1 . Если формально положить r , то S BH SBH 1 2 H 1 . Теорема доказана. ▲ §15. Спектр обобщенного броуновского движения В данном параграфе приведены некоторые сведения о концепциях спектральных представлений обобщенного броуновского движения BH t , опирающиеся на результаты [164]. Для этого определим обобщенный броуновский процесс [128, 129], основываясь на формуле (5.22) в следующем виде: BH t
t 0 (5.35) 1 H 1 2 H 1 2 H 1 2 t s s dB s dB s . ts H 1 2 0
Учитывая свойства самоподобия и стационарности малых приращений (инкрементов) можно получить: d
BH t a BH t a H BH . Задача нахождения спектра обобщенного броуновского движения не может быть решена напрямую с использованием стандартной спектральной плотности мощности. Поэтому необходимо ввести зависящий от времени спектр с помощью частотно-временного анализа. Для этого в [164] рассматривается спектр Винера – Вилля,
264
который для нестационарного процесса t с функцией ковариации r t , s задается следующим выражением:
G t ,
r t
2, t 2 exp i d .
(5.36)
Величина (5.36) не обязательно является положительной и обладает многочисленными важными свойствами. Данная величина обобщает концепцию спектра, предложенную для стационарного случая, и сводится к ней, когда рассматриваемый процесс t стационарен. Учитывая, что 1 2 H cos H 2 H * t s 2 H t s 2H , rBH t , s BH t BH s 2 H и используя (5.36), можно получить 1 GBH t, 1 21 2 H cos 2t 2 H 1 . (5.37) Способом, похожим на тот, который использовался для нахождения белого гауссова шума как производной от классического броуновского движения, можно определить парциальный гауссов шум как производную от обобщенного броуновского процесса. Можно 2 1 G t , показать [161], что G ' t , 2G t , . Тогда 4 t 2 2 H 1 GB' t , 1 . (5.38) H
Важно отметить, что величина (5.36) не зависит от времени, что говорит о стационарности рассматриваемого процесса, который является результатом стационарности приращений обобщенного броуновского движения. Стационарность приращений также может быть подтверждена на основе рассмотрения спектра Винера – Вилля. Если положить H ,T t BH t T BH t , то из (5.36) следует справедливость следующего соотношения: T 1 G H ,T t, 4sin 2 (5.39) 2 H 1 . 2 Выражение (5.39) соответствует спектральной плотности мощности стационарного процесса. Значение производной имеет сле-
265
1 дующий вид: BH' t lim H , t и с учетом (5.38) приводится 0 1 к выражению lim G 1 t, 2 H 1 , которое в точности совпада 0 H , ет с (5.38), соответствующее парциальному гауссову шуму [78]. Усредненный спектр находится из (5.36) в виде T 1 S , T G t, dt. T 0 Тогда из формулы (5.37) можно получить следующее выражение: sin 2t 1 S BH , T 1 212 H . 2t 2 H 1
Благодаря свойствам самоподобия к обобщенному броуновскому движению можно применить вейвлет-преобразование, которое для процесса t имеет вид
где 0, g t
st ds, (5.40) – произвольный локализованный вейвлет. При заT t ,
1
s g
данном базовом вейвлете g t уравнение (5.40) позволяет провести анализ сигнала в большом диапазоне масштабов. Таким образом, в [164] предложено два подхода к исследованию обобщенного броуновского движения. Контрольные вопросы 1. Дайте определение и укажите основные свойства одномерного классического броуновского движения. 2. Дайте определение и укажите основные свойства одномерного обобщенного (фрактального) броуновского движения. 3. В чем заключается принципиальное отличие обобщенного и классического броуновского движения? 4. Приведите определение самоаффинного и статистически самоаффинного множества.
266
5. Дайте определение мультифрактала и приведите формулу для вычисления размерностей Реньи. 6. Приведите выражение для спектра обобщенного броуновского движения. Рекомендуемая литература 5.11. 5.2.
Revuz D., Yor M. Continuous martingales and Brownian motion. Berlin, Heidelberg: Springler-Verlag, 1999. Nelson E. Dynamical theories of Brownian motion. Princeton University Press, 2001.
1
Данная книга будет полезна для более углубленного изучения броуновского движения, а также для специалистов в данной области.
267
Глава 6 ТРАНСПОРТНЫЕ ПРОЦЕССЫ ВО ФРАКТАЛЬНЫХ ПРОСТРАНСТВАХ
§1. Устойчивые распределения В физике, так же как и в теории вероятностей, одной из важных проблем является нахождение распределения вероятности суммы большого количества случайных переменных, поскольку такие распределения часто реализуются в природе. Предположение о «гауссовости» исследуемых процессов базируется на центральной предельной теореме1 (ЦПТ) при конечной дисперсии случайных слагаемых. В этом случае сумма большого количества переменных, имеющих конечные математические ожидания (средние) и дисперсии, следует нормальному распределению, которое, в свою очередь, является частным случаем предельных распределений. В противоположном случае (отсутствие конечных дисперсий рассматриваемых переменных) результирующий процесс может и не быть гауссовым. Общий класс распределений сумм большого числа независимых случайных слагаемых при условии его самоподобия – это устойчивые (по Леви) распределения [165]. Устойчивые распределения s представляют собой точно такие же предельные распределения, но которые могут возникать согласно обобщенным центральным предельным теоремам (оЦПТ). Их исследование было начато в 20-х годах прошлого века математиком П. Леви, который ввел термин «устойчивое распределение» применительно к распределениям, которые в настоящее время называются строго устойчивыми (см. ниже). Относительно недавняя работа [166] содержит подробное описание применений устойчивых распределений в вероятностных моделях, коррелированных системах и фракталах, аномальной диффузии и хаосе, физике, радиофизике, астрофизике, стохастических 1
См. приложение 3.
268
алгоритмах, финансовых приложениях, биологии и геологии. Устойчивые распределения обеспечивают решения определенных типов обыкновенных дифференциальных уравнений и дифференциальных уравнений с операторами дробных порядков, и широта применений данных распределений предполагает, что их можно рассматривать как класс специальных функций [166 – 169]. Вследствие важности данного типа распределений для приложений в физике фундаментальных взаимодействий, в частности, в фемтоскопии [170], ниже рассматривается подробно одномерный случай. 1.1. Определение устойчивого распределения Определение 6.1. Функция распределения F x случайной величины называется устойчивой, если для любых действительных чисел ai 0, bi , i 1,2 найдется пара чисел a 0 и b такие, что имеет место следующее равенство: F a1 x b1 F a1 x b1 F ax b , (6.1) где « » – операция свертки [171]. Если же для данного функционального уравнения можно подобрать пару чисел так, чтобы a 0, b 0, то распределение называется строго устойчивым, при этом выполняется a1 a2 a , где 0 2 – некоторое число, называемое показателем устойчивого распределения. Важная роль устойчивых распределений связана со следующим результатом. n
Теорема 6.1. Пусть k k 1 – последовательность независимых
одинаково распределенных случайных величин и n n 1 последовательность случайных величин, определяемых как 1 n n k An , (6.2) Bn k 1 где Bn 0 и An – некоторые нормирующие и центрирующие константы соответственно. Если Fn x – функция распределения случайной величины n , то предельной функцией распределения для
269
последовательности
F x n
n 1
при n может быть лишь ус-
тойчивая функция распределения, то есть устойчивое распределение s . Верно и обратное, для любой устойчивой функции распределения F x существует последовательность случайных ве
личин вида (6.2) такая, что последовательность Fn x n 1 функций распределения для этих случайных величин сходится к F x при n . Отсюда, в частности, следует, что устойчивые распределения безгранично делимы. Таким образом, устойчивое распределение является представителем класса G возможных предельных распределений для нормированных сумм (6.2), образованных последовательностями незавиn
симых и одинаково распределенных случайных величин k k 1 и некоторых постоянных An и Bn 0. Класс G содержит подкласс N строго устойчивых распределений, выделяемый дополнительным условием n : An 0 для сумм (6.2). Можно сказать, что класс G и подкласс N представляют собой множества распределений, для которых функции распределений являются решениями функционального уравнения (6.1) при соответствующих ограничениях для параметров. 1.2. Характеристические функции За немногими исключениями ни функции распределения F x , ни плотности p s x устойчивых распределений не имеют s
явных выражений в элементарных функциях. Поэтому устойчивые распределения, как правило, задаются в терминах их характеристических функций. В общем случае, если f s t характеристическая функция устойчивого распределения, то ai 0, i 1,2 найдутся b и a 0 такие, что выполнено f s t a1 f s t a2 f s t a exp itb .
270
Теорема 6.2. Для того чтобы функция распределения F x случайной величины была устойчивой, необходимо и достаточно, чтобы логарифм ее характеристической функции имел следующий вид: ln f sA t i At A t
A
1 i Asign t A t , A ,
(6.3)
где tg A 2 , A 1, A t , A 2ln t , A 1. Здесь A , A , A , A – постоянные, причем 0 A 2, A 1, A 0 и A R. Характеристические функции одномерных устойчивых распределений могут быть определены, используя различные схемы. Указанная выше формула (6.3) соответствует параметризации A . В ряде случаев более удобной с аналитической точки зрения оказывается другая система параметризации характеристической функции устойчивого распределения, обозначаемая ниже как параметризация B . При данной параметризации справедливо
ln f sB t i B t B t
B
B t , B , B ,
(6.4)
где B exp i 2 K B sign t , B 1, B t , B , B i ln t sign t , B 1. B 2 Здесь K B B 1 sign B 1 и параметры имеют ту же об-
ласть значений, что и для параметризации A . Таким образом, в общем случае одномерные устойчивые распределения характеризуются четырьмя параметрами: индексом стабильности (Леви) или характеристическим показателем 0 2, параметром асимметрии 1 1, параметром масштаба 0, и параметром положения . Как правило параметр мас-
271
штаба является положительным 0 , случай 0 соответствует вырожденному распределению, сконцентрированному вблизи точки x . Индекс стабильности и параметр асимметрии определяют форму распределения. Значения соответствующих параметров в случае различных параметризаций связаны друг с другом следующим образом: A B ;
1: A B , A B 2, A 2 B ; B B 1: A ctg ,A , B K . tg , A cos cos 2 2 Видно, что в случае 1 при 0 обе параметризации совпадают. Важно отметить, что все устойчивые распределения с характеристическим показателем 0 непрерывны, и их плотности в каждой точке имеют производные всех порядков. Ниже, если специально не оговорено, без уменьшения общности рассмотрения используется параметризация A . Используя обозначения и соглашения, аналогичные принятым в [168], данный выбор соответствует соглашению S , , , ; A S , , , ;1 . Выбор данной параметризации обусловлен также тем, что это приводит, в частности, к естественному обобщению параметризаций данных, используемых ранее при исследовании корреляций Бозе – Эйнштейна в физике высоких энергий. Учитывая обозначения [169], для параметризации B можно получить соответствие S , , , ; B S , , , ;0 . Устойчивое распределение s N тогда и только тогда, когда для любой системы параметризации выполнена совокупность условий 1, 0 или 1, 0 . Устойчивые распределения класса N , то есть строго устойчивые распределения ss , образуют трехпараметрическое семейство. Для данного класса распределений существует своя аналитически оправданная система параметризации характеристической функции. Именно,
272
exp i C sign t , 2 где 0 C 2, C 0, min 1, 2 C C . Данная параметриln f C t C t
C
зация условно может быть названа параметризацией
C .
Пара-
метры , , для данной параметризации связаны с параметрами параметризации B следующими равенствами: C B ;
1:
2 2 2 arctg B , C B B2 ; 4
1: B
K , C B.
1.3. Плотность устойчивого распределения Если выполнены необходимые условия теоремы П3.2, соответствующая плотность вероятности устойчивого распределения в общем случае определяется как 1 itx s ps x e f t dt. 2 Для плотности устойчивого распределения p s x; , , , при 0 справедливы следующие соотношения: 1 s x p ; , ,1,0 , 1, s p x ; , , , 2 1 s x ln ;1, ,1,0 , 1. p Следовательно, не уменьшая общности, для любой параметризации, устойчивое распределение можно стандартизовать, то есть получить 1 и 0. Для плотности стандартного устойчивого распределения используется следующее обозначение: p s x; , p s x; , ,1,0 .
273
Основные аналитические свойства стандартных устойчивых распределений [172]: 1) x, , : p s x; , p s x; , ; 2) если x 0 и 1, то p s x; ,1 p s x; , 1 , во всех остальных случаях p s x; , 0; 3) каждая плотность p s x; , является одновершинной функцией; 4) функции p s x; , при 1 и p s x 1 ; , при 1 аналитически продолжаются с полуоси x 0, представляя собой целые функции. Примеры плотностей стандартных устойчивых распределений для двух основных видов соглашений и при различных значениях параметра устойчивости представлены на рис. 6.1.
Рис. 6.1. Плотности вероятностей стандартных устойчивых распределений для соглашений S , ;0 – (а) и S , ;1 – (б) при 0,8 и указанных значениях параметра [169]
Необходимо отметить, что строго устойчивые распределения связаны соотношением двойственности. С учетом соглашения стандартизации x, , , x 1 , , ,1 данное соотношение имеет следующий вид: если 1 2, то для любых допустимых
274
значений параметра
выполнено равенство: xp ss x , , ,1
xp ss x ,1 , * ,1 , где 1 * 1 . Как было сказано выше, плотности устойчивых распределений, как правило, не выражаются через элементарные функции явным образом. Поэтому для работы с плотностями p s x; , полезными являются асимптотические разложения [171]. Если Fs x – функция устойчивого распределения c характеристическим показателем для случайной величины , то существует константа c 0 такая, что lim x 1 Fs x Fs x c. x
Если 0 1 и x 0, то k 1 k 1 k k 1 p s x ; , x , 1 sin 1 x k 1 k! 2 при 1 ряд в правой части расходится. Если 1 2 и x 0, то k 1 2 k 1 k 1 k p s x; , 1 cos 1 1 x , k 1 k! 2 k при 1 ряд в правой части расходится. Если 1, x 0, то для любого натурального N 2 ps x 1 ;1, 1 N xk x k 0 k !
k t k 2 ln t O x N 2 . Im dte t i 1 0
1.4. Простейшие частные случаи Для плотностей устойчивых распределений существуют явные формулы только в следующих специальных случаях [171]: 1) нормальное распределение устойчиво с 2; 2) распределение Коши устойчиво с 1; 3) вырожденное распределение устойчиво с 0;
275
4) распределение с плотностью exp 1 2 x ,x0 s p x ; , 2 x 3 0, x0 устойчиво с характеристическим показателем 1 2. Для более детального рассмотрения специального случая 1, а также для наглядного знакомства с функциями плотности стабильных распределений в параметризации S , , , ;1 можно рекомендовать [168]. Необходимо отметить, что для 0 физическая интерпретация - и -параметров для рассматриваемого соглашения не является тривиальной. Представляется важным рассмотреть один из самых простых случаев. Математически это соответствует выбору симметричных 0 устойчивых распределений. Соотношение таких распределений с гауссовым случаем являются также наиболее очевидными. Используя обозначения, принятые в [168], данный выбор соответствует S ,0, , ;1 -соглашению. Для симметричных устойчивых распределений характеристическая функция, то есть функция распределения плотности после фурье-преобразования, для S ,0, , ; A -соглашения имеет простую форму:
f t exp it t
,
где областью определения функции плотности f t является числовая ось. Важная особенность устойчивых распределений состоит в том, что их характеристическая функция является неаналитической при t 0 для всех значений индекса стабильности Леви 2. Для симметричных распределений, следующее разложение по степеням t ( t – мало) отражает это неаналитическое поведение:
f t 1 it t .
276
Аналитичность данного разложения восстанавливается только при 2, что соответствует гауссовому пределу. В общем случае, устойчивые распределения с 0 2 являются медленно убывающими1 и часто связываются с самоподобием механизма образования вторичных частиц. Например, как было описано в [1] в КХД, претендующей на роль теории сильных взаимодействий, струи испускаются внутри струй, испускаемых, в свою очередь, внутри струй и так далее. Данный процесс характеризуется самоподобным ветвлением и фрактальной структурой, где фрактальная размерность источника связана с аномальной размерностью КХД [173 – 175]. В модели адронизации Лунда самоподобный процесс фрагментации струн определяет распределение первично образованных2 частиц [1, 176]. Среди данных частиц первого поколения присутствуют различные резонансы с распределением времен распада в широком диапазоне, и распад таких резонансов также может приводить к медленно убывающему (по степенному закону) «хвосту» распределения флуктуаций эффективных размеров источника [177]. Численно подобные результаты были получены в [178] при рассмотрении корреляции Бозе – Эйнштейна для источников с фрактальной, подчиняющейся степенному закону, структурой в пространстве-времени. Ожидается возникновение фазового перехода второго рода в случае, если процесс столкновения релятивистских тяжелых ионов в ходе своей пространственно-временной эволюции проходит через критическую точку кварк-глюонной плазмы, фазовый переход к адронной материи, через конечную точку границы раздела фаз, вдоль которой переход является фазовым переходом первого рода. В окрестности критической точки ожидается, что фазовый переход второго рода будет сопровождаться флуктуациями в координатном пространстве, подчиняющимся степенному закону. Распределения координат с медленно убывающими по степенному закону «хво1
В литературе часто встречается, что при описании распределений данного типа они имеют длинные, медленно убывающие «хвосты». 2 Здесь подразумеваются частицы, образованные непосредственно при фрагментации струны, а не при распаде резонансов, то есть частицы «первого поколения» [1].
277
стами» могут подчиняться оЦПТ, которая, по существу, означает, что эти распределения плотности, в пределе большого количества независимых источников, имеют тенденцию принимать вид устойчивых по Леви распределений с индексом стабильности 2. Устойчивые по Леви распределения многих переменных1 имеют основные свойства, присущие также и распределениям одной переменной; изучение распределений данного типа даже в настоящее время составляет отдельную и передовую область исследований в теории вероятностей и математической статистике [179]. Примеры плотностей двумерных устойчивых распределений и соответствующих линий уровня при различных значениях показателя устойчивости представлены на рис. 6.2.
Рис. 6.2. Плотности двумерных устойчивых распределений и соответствующие картины линий уровня при 0,9 – (а) и при 1,6 – (б) 1
В литературе встречается термин «многомерные распределения, устойчивые по Леви».
278
1.5. Свойство подобия Для взаимно независимых случайных величин X , X 1 и X 2 с одним и тем же распределением при любых положительных коэффициентах s и t доказано следующее важное свойство подобия: d
s1 X 1 t 1 X 2 s t X .
(6.5)
d
Здесь знак означает принадлежность рассматриваемых распределений к общему классу, то есть к классу устойчивых по Леви распределений. Для нормального распределения 2 и формула (6.5) сводится к закону сложения дисперсий. Устойчивые распределения с характеристическим показателем имеют моменты всех порядков, меньших . Диффузионный процесс с независимыми приращениями, распределения которых устойчивы по Леви с показателем 2, называют «полетом Леви» [180 – 182]. Измерения траектории за конечный интервал времени при бесконечной дисперсии смещения случайной величины могут дать определенный результат, но этот результат может быть любым и не характеризует процесс. Аналогом является сумма расходящегося ряда при перестановке его членов [183]. В данных обстоятельствах исключительно важную роль играют измерения фрактальных размерностей. Траекторию «полета Леви» можно представить набором точек поворота с прямолинейными скачками между ними. В двумерном фазовом пространстве для диффузионного процесса, обладающего свойством подобия (6.5), множество точек поворота при 2 является фрактальным, то есть размерность данного множества является фрактальной. При 2 получается (классический) броуновский процесс. Моделирование распределенных по Леви случайных величин может приводить и к процессам аномальной диффузии с конечной дисперсией приращений. Пусть процесс образован скачками, величина которых распределена по Леви. Эти перемещения происходят за время, пропорциональное величине скачка. Тогда дисперсия приращений за известный интервал времени конечна, а фрактальным объектом в данном случае является множество временных точек разрыва про-
279
изводной этого процесса. Таким образом, в рассматриваемом случае получается процесс с фрактальным временем [181, 182], называемый супердиффузионным процессом. Важно отметить, что для данного процесса показатель H может превышать единицу. Примером процесса такого типа в природе является, в частности, поперечное смещение волнового пучка в неоднородной среде [184]. Вопросы, связанные с устойчивыми распределениями в процессах диффузии, рассматриваются ниже. §2. Аномальная диффузия В настоящее время достаточно широко обсуждается возможность обобщения стандартного уравнения диффузии [185 – 193], имеющего следующий вид: r , t K d r , t , (6.6) t r,0 r и задачи диффузии в самых различных системах в применении к аномальным процессам. Моделирование таких систем и процессов часто выполняется с помощью фракталов. В результате наличия скейлинговых свойств в этом случае начинают проявляться эффекты памяти, и обычные операторы дифференцирования заменяются соответствующими операторами дробного порядка. Замена t на
t , 1, ассоциируется в [185 – 188] с влиянием распространения в среде ловушек с бесконечным средним значением времени пребывания частиц в них, а введение лапласиана дробного порядка 2 – с аномально широким распределением свободных пробегов частиц. В режиме аномальной диффузии, называемом субдиффузией, диффузионный пакет t t , то есть ширина плотности распре-
деления r, t расплывается со временем медленнее 1 2 , чем при обычной диффузии v 1 2 , и быстрее, чем при супердиффузии 1 2 . Впервые уравнение с лапласианом дробного порядка 1 3 было рассмотрено при описании диффузии в турбулентной среде в [194, 195].
280
В силу важности ниже подробнее рассматривается решение уравнения супердиффузии с лапласианом дробного порядка 2 в N -мерном пространстве [196]. Определим дробную производную Рисса через лапласиан [81] и, воспользовавшись оператором 2
(2.32), запишем уравнение супердиффузии в следующем
виде: r , t 2 K d r, t . (6.7) t Для N -мерного пространства с векторами x , k , со скалярным проN изведением k , x ki xi и преобразованием Фурье, вводимым
стандартным
i 1
образом
Ff f k eikx f x dx ,
соотношение
(2.32) остается в силе. Дробный лапласиан записывается в виде гиперсингулярного интеграла ny f x dy, 1 2 f d N , n y N n n mn где ny f x 1 f x my – нецентрированные разноm 0 m n
сти, n – любое число, n , d N ,n 1 eix x
N
dx – нор-
мировочный множитель. §3. Супердиффузия и строго устойчивые распределения В [196] супердиффузию описывают в рамках обобщения винеровского процесса. Для этого записывается уравнение Колмогорова – Чепмена для стационарного марковского процесса с независимыми приращениями x , t x ', t ' x x ', t t ' dx ', 0 t t ' (6.8) x ,0 x и рассматривается класс автомодельных решений
281
N 2 1 (6.9) x , t K d t g x K d t , K d 0, 0. После применения преобразования Фурье к (6.8) и (6.9) и учета сферически-симметричных распределений g k из [126] можно
получить следующие выражения: g k exp k , 0 2, (6.10) k exp K d k t . Фурье-образ выражений (6.10) удовлетворяет следующему дифференциальному уравнению: Kd k , t которое, согласно N -мерному аналогу (2.32), в результате обратного преобразования Фурье приводит к следующему уравнению для плотности вероятности: 2 Kd x , t (6.11) t x ,0 x ,
обобщающему (6.7) на N -мерный случай. Для одномерного про 2
странства оператор переходит в производную Маршо (2.39). Данный процесс относится к процессам Леви, и при 2 он представляет собой винеровский процесс. Согласно (6.10), решения обобщенного уравнения супердиффузии (6.11) принадлежат к классу строго устойчивых N -мерных распределений [167, 197] и составляют подмножество сферическисимметричных распределений этого1 класса, в число которых входит и многомерное нормальное распределение, возникающее в частном случае 2. Важной особенностью устойчивых распределений, отличных от гауссова, является то, что их абсолютные мо-
1
Имеется в виду указанный выше класс строго устойчивых многомерных распределений.
282
менты
x g x x dx бесконечны при . Поэтому для
характеристики ширины диффузионного пакета удобно использовать радиус шара R p t , содержащего фиксированную вероятность:
x R p t
x , t dx p.
После подстановки соотношения (6.9) можно получить R p t t 2 при t . §4. Кинетические уравнения При 2 получается нормальная скорость распределения диффузионного пакета; для 2 ширина пакета растет быстрее, чем в нормальном режиме. При 1 ширина диффузионного пакета растет быстрее, чем в баллистическом режиме. Данный результат обусловлен автомодельностью процесса Леви, в котором нет места понятию скорости свободного пробега частицы. Избавиться от этого свойства и, соответственно, получить возможность введения понятия «скорость свободного пробега частицы» можно переходом от винеровской модели к модели случайного блуждания частицы с конечной скоростью свободного движения . Пусть в начальный момент времени t 0 частица находится в начале координат – точке x0 0 – и пребывает там случайное вре мя 0 , затем перемещается на случайный вектор 1 со скоростью и вновь пребывает в новой точке x1 x0 1 в состоянии покоя случайное время 1 , и так далее. Будем считать, что переменные 0 , 1 , 1 , 2 , 2 , взаимно независимы, интервалы времени i имеют одинаковую плотность вероятности вида q t e t , 0, N -мерные векторы i также распределены одинаково. Вместо одной частицы в данном случае рассматривается множество незави симых траекторий, x , t – плотность числа частиц.
283
Представляя плотность частиц x , t как сумму двух составляющих, относящихся к частицам в состоянии покоя (ловушки) 0 x , t и движения x , t , можно получить следующие кинетические уравнения: 0 x , t x' 0 x , t dx ' p x 0 x x ', t , t x' 1 (6.12) x , t dx ' dt ' P x ' t ' 0 x x ', t t ' 1 dx ' P x ' 0 x x ', t t ' . Здесь p x dx – вероятность того, что частица, вылетающая из начала координат, испытает первое столкновение в элементе объема dx dSd x ; P x dS – вероятность того, что частица пересечет элементарную площадку dS сферы радиуса x без взаимодействия на пути длиной x . Система уравнений (6.12) при показательном распределении пробега частиц в трехмерном пространстве описывает нестационарный перенос нейтронов с учетом запаздывания. При 0 рассматриваемая система переходит в нестационарное односкоростное кинетическое уравнение с изотропным рассеянием, используемое в нейтронной физике [198, 199].
4.1. Бесконечная скорость частицы В предельном случае бесконечной скорости частицы можно получить x , t 0 x , t и плотность частиц будет удовлетворять уравнению Колмогорова x , t x , t dx ' p x x x ', t (6.13) t для обобщенного пуассоновского процесса [165]. Из (6.13) следует уравнение для характеристической функции k , t распределения
284
k ,0 1,
с решением
k , t
1 p k k, t t
k , t exp 1 p k t ,
где p k – фурье-компонента плотности вероятности перехода p x . Асимптотика решения уравнения Колмогорова совпадает с точным решением уравнения супердиффузии. Таким образом, уравнение супердиффузии (6.11) описывает асимптотическое поведение плотности распределения частицы, совершающей блуждания с бесконечной скоростью в среде с ловушками, время пребывания в которых распределено по показательному закону, а плотность распределения скачков частиц имеет степенной «хвост» вида r 1.
4.2. Конечная скорость частицы Физически более реалистичным является случай конечной скорости блуждания частицы. Для учета влияния конечной скорости свободного движения блуждающей частицы на асимптотику распределения величины x , t в [196] полагается, что векторной сумме n независимых случайных векторов i , определяемой по n 1 формуле Sn n i , соответствует случайное время, опреi 1
деляемое как i i . n
i 1
Если 1, то среднее случайных векторов i конечно и в пределе при n , в силу закона больших чисел, справедливо 1 t n 1 i , откуда n 1 i t. Полагая
t 1 i
1
, можно получить для данной конечной скоро-
сти свободного движения блуждающей частицы v
285
N 1 s x , t K d t g x K d t , 1. (6.14) Физически это означает, что наличие конечной скорости свободного движения замедляет процесс расширения диффузионного пакета по сравнению с предельным случаем . 1 Переписывая (6.14) с учетом K d 1 K d в виде N 1 s x , t K d t g x K d t , 1, можно для асимптотической плотности частицы, диффундирующей с конечной скоростью свободного движения, записать следующее уравнение в дробных производных: s x , t 2 K d s x , t . t В результате получено, что учет влияния конечной скорости свободного движения при 1 сводится лишь к уменьшению коэффициента диффузии в уравнении с дробным лапласианом, при этом форма распределения остается устойчивой. При 1 ситуация меняется качественно. Как было указано выше, ширина или радиус диффузионного пакета растет со временем пропорционально t1 . При конечной скорости свободного движения плотность распределения вне шара радиуса R t обращается в нуль. Но при 1 распределение, задаваемое (6.11), расплывается быстрее, чем R t и, таким образом, кинематическое ограничение становится преобладающим фактором в формировании асимптотического распределения. Данное распределение, ограниченное сферой радиуса R t, имеет совершенно иной вид, чем устойчивое распределение. Представленные в [196] результаты моделирования методом Монте–Карло одномерного блуждания частицы в сопоставлении с решениями уравнения для супердиффузии подтверждают эти выводы: при 1 решения супердиффузионного и кинетического уравнений имеют совершенно разные асимптотики. Вероятно, это может служить основанием для заключения о неприменимости уравнения супердиффузии (6.11) с лапласианом дробного порядка 2 при 1 к описанию реальных физических процессов.
286
§5. Функция Фокса и процессы во фрактальных средах Применение аппарата функции Фокса [165, 200 – 202] при рассмотрении процессов релаксации и диффузии в средах с фрактальной размерностью, характеризуемых уравнениями типа уравнения диффузии с производными дробных порядков по пространственным координатам и времени, ниже продемонстрировано на основе результатов [203 – 205]. Для потока частиц j в случае фрактальной среды, в отличие от стандартного уравнения диффузии (6.6), когда справедливо j t и j 2 x 2 , вследствие самоподобия нарушается локальность указанных связей. Величина потока начинает зависеть от предыстории процесса, то есть от значений концентраций частиц в более ранние, по отношению к рассматриваемому, моменты времени: t j t x , K t , d . (6.15) t 0 Таким образом, процессы диффузии и релаксации становятся недебаевскими. В (6.15) ядро K t , включает фрактальную размерность DF рассматриваемой среды и в стационарном режиме зависит от разности аргументов. Одновременно, K t , при замене фрактальной среды на обычную должно удовлетворять стандартному уравнению диффузии. Для стационарного режима простейшим вариантом ядра, удовлетворяющего указанным условиям, является степенная D функция K t t F с показателем, зависящим от фрактальной размерности пространства диффузии DF . В данном случае правая часть (6.15) совпадает по структуре с определением дробной производной Римана – Лиувилля (2.26) порядка 0 1, то есть справедливо j x , t x , t t . Одновременно, вследствие сложности и запутанности траекторий движения частиц, производная по пространственной координате (градиент) становится фрак тальной и j x , t 2 x , t x 2 . Уравнения недебаевской диффузии и релаксации примут, соответственно, следующий вид [189 – 192, 203 – 205]:
287
x , t 2 x , t Kd , t x 2 x , t 1 x , t , t где 0 1, 1 2 2. Диффузионно-релаксационные процессы, исследуемые в [204, 205], описываются в одномерном случае следующим уравнением: x, t 2 x, t 1 K x, t (6.16) d t x 2 и для его решения используется именно аппарат функций Фокса, определяемых через обобщенный интеграл Меллина – Барнса [200, 201]. Действуя на обе части уравнения (6.15) дробным интегральным t g t ' 1 оператором (2.23) в виде D0 g t I 0 g t dt ', 0 t t ' 1
можно получить следующее уравнение: 2 1 (6.17) x, t x,0 D0 2 K d x , t x при начальном условии x,0 0 x . Применение левостороннего дробного оператора в (6.17) при условии D0 D0 1 дает 2 1 D0 x , t x,0 2 K d x, t . x Далее необходимо использовать преобразование Фурье по отношению к пространственной координате и для амплитуды Фурье – преобразование Лапласа вида k , p k , t e pt dt по времени. 0
Для амплитуды Фурье k , t справедливо уравнение
k ,t 1 2 D0 k , t 0 k K d ik k , t . T Действие дробной производной по времени на не зависящую от времени функцию 0 x равно D0 0 x 0 x t 1 и не
288
равно нулю. Для образа k , p можно получить следующее урав-
p 1
нение: k , p
p k , t . Далее, представляя k , t через
1 Tp функцию Фокса [204, 205] T k 0 k 1,1 1 1 ,1 k , p H1,1 T k p 1 1 ,1
и выполняя обратное преобразование Лапласа, можно получить следующее выражение для фурье-амплитуды плотности распределения: k 1,1 t 0,1 k,t 0 H1,2 . T 0,1 , 0, Решение уравнения (6.17) имеет следующий вид: x, t (6.18) 0,1 1 2 1,1 0 k H1,2 t ik K d . 0,1 , 0, 1,1 Представляя функцию Фокса H1,2 в виде ряда, можно получить следующее выражение для решения (6.17):
1 2
dk e
ikx
n
2 n t K d ik 1 ikx . (6.19) x, t dk e 0 k 2 1 n n 0 Интеграл в (6.18) в ряде случаев может быть вычислен в явном виде. При 1 0 формула (6.18) приводится к виду
x, t
1 2
1 0,1 2 ikx1 1,1 2 dk e k H ik K t , (6.20) 0 1,2 0,1 , 0, d
1 2
где x1 x K d t
. Для функций Фокса удобнее использовать
синус Fs - и косинус Fc -преобразования Френеля. Ниже рассматривается частный случай при следующих услови ях: 0 k 0 const, 0 x 0 x и пусть 1 , 0 1 2.
289
После ряда преобразований [204, 205] можно получить точное решение уравнения (6.17), выраженное через функции Фокса, при 1 0 и начальных условиях x,0 0 x и 1 2,1 в следующем достаточно громоздком явном виде: 0 x, t 1 2 4 K d t 1 2 2,3 1,1 2 , 1, 2 , 1,1 2 2 H 3,3 1 x1 1,1 , 1,1 2 , 1,1 2 x1
1
2
x1
1
1,1 2 , 1, 2 , 1,1 2 2 2,1 H 3,3 x1 1 1,1 , 1,1 2 , 1,1 2
1 2 1
x1
(6.21)
1,1 2 , 1, 2 , 1 2,1 2 2 2,1 H 3,3 x1 1 1,1 , 1,1 2 , 1 2, 1 2
1 2 1
1,1 2 , 1, 2 , 1 2,1 2 2 2,1 H 3,3 x1 1 . x1 1,1 , 1,1 2 , 1 2,1 2 Для 1 после ряда преобразований решение (6.21) уравнения (6.17) совпадает с хорошо известным решением обычного уравнения диффузии. Асимптотическое разложение для функции x, t при t позволяет записать плотность распределения частицы, совершающей одномерные блуждания, в случае процесса недебаеской диффузии в виде 0 k eikx 1 t n 1 x, t . (6.22) n 1 dk 2 2 n 0 1 n 1 K d ik 1 Для некоторых случаев конкретного вида 0 k можно получить явные выражения на основе (6.22). Пусть, например, выполнено 0 k 0 k , K d 0. Тогда в асимптотике при t
1
x, t t 0 2
n 1 1 t , n0 1 n 1 n 1
290
что совпадает с результатом [192] и t t . Случай 0 k 0 const и 1 0 соответствует чистой диффузии. Решение дается (6.21) и диффузионное смещение частицы со временем x t 2 . При 1 получается хорошо известное соотношение: x t . Необходимо отметить, что приближенное суммирование ряда по n в (6.19) для больших t, которое осуществляется путем сохранения небольшого числа слагаемых в рассматриваемом ряде и заменой функции 1 n на функцию 1 n при 1, позволяет получить асимптотическое выражение по t и при 1. §6. Волновое уравнение во фрактальных средах Ниже представлены результаты исследования нелинейного уравнения типа обобщенного волнового уравнения во фрактальном пространстве, частными случаями которого являются как волновое уравнение для нелинейной среды, так и нелинейное уравнение диффузии, полученные в [206]. Данное нелинейное уравнение учитывает процессы с сохранением временной и пространственной памяти и записывается в следующем виде: D ,t x, t K0 D , x 0 x, t D , x x, t , (6.23) где 0, 0, D ,t и D ,x – дробные производные Римана – Лиувилля по времени и координате, соответственно, K const, x 0. 0
Рассматриваемое обобщенное уравнение отличается от уравнения нелинейной диффузии вида [207] x , t K 0 0 x , t x, t (6.24) t x x с автомодельным решением 1
x, t 0 x , t 1 t x , 0 x t
(6.25)
заменой производных по временной и пространственной переменной на дробные производные, рассматриваемые как обобщенные функции. При этом граничные и начальные условия уравнения
291
(6.24) сохраняются и для обобщенного уравнения (6.23) во фрактальных средах, а x, t рассматривается, соответственно, как обобщенная функция. Уравнение (6.23) описывает, в частности, распространение электромагнитных волн в нелинейных фрактальных или слабофрактальных 2, 1 средах при соответствующем выборе значений параметров , , . При добавлении нелинейных по x, t слагаемых уравнение (6.23) будет описывать как нелинейную диффузию, так и процессы самоорганизации [207]. §7. Стохастические процессы с операторами дробных порядков Как было показано выше, простейшие модели случайных блужданий для процессов нормальной диффузии приводят к гауссовой статистике и среднеквадратичному смещению, увеличивающемуся линейно со временем. Было также доказано, что обратный степенной закон для памяти в случайных флуктуациях, то есть в шагах блуждающей частицы, может приводить к возникновению к аномальному отклику системы в том смысле, что среднеквадратичное смещение будет пропорционально t 2 H , где 0 H 1, t – интервал времени наблюдения при условии t0 0. Такие временные серии являются случайными фракталами с фрактальной размерностью, определяемой как D 2 H . Наиболее сложное явление, включающее в свое описание предел приращений дробных порядков, соответствующий дробным производным, – это стохастический процесс с длительной памятью. Процесс данного типа может быть получен с помощью дифференцирования дробного порядка винеровского процесса. Данные процессы характеризуются гауссовой статистикой, но также они имеют спектр, описываемый обратным степенным законом [208]. При изложении вопросов, связанных с использованием операторов дробных порядков для описания стохастических процессов, в рамках настоящей книги авторы используют [208], в которой дано достаточно строгое и современное изложение данного вопроса.
292
Ниже, хотя будет обсуждаться плотность вероятности для немарковских процессов, основное внимание будет уделено стохастическим динамическим уравнениям с производными дробных порядков. В частности, будет подробно рассмотрено, чем решения этих уравнений отличаются от решений общеизвестного уравнения Ланжевена, когда обычные дифференциалы заменяются на дифференциальные операторы дробных порядков. Стохастические динамические уравнения с дробными производными данного типа отождествляются с уравнением Ланжевена дробного порядка. Функция Миттага – Леффлера заменяет экспоненциальную функцию при анализе этих уравнений и может быть использована как оператор неунитарной эволюции для формального описания эволюции динамических переменных. Данные методы с использованием уравнений дробных порядков для собственных значений широко применяются при изучении транспортных процессов в фрактальных и/или флуктуирующих средах. 7.1. Общий вид уравнения Ланжевена дробного порядка Уравнение Ланжевена (5.15) может быть обобщено с учетом нелокальных воздействий, то есть определенного вида процессов релаксации, которые имеют место, например, в полимерах и вязкоупругих средах (материалах). Необходимо отметить, что уравнение Ланжевена (5.15) носит феноменологический характер, поэтому представляется разумным в случае вязкоупругих средах заменить обычный закон Ньютона для силы на производную скорости дробного порядка. Физически такая замена означает, что сила зависит только от фрактального множества точек. Для гарантии физической приемлемости данной модели во фрактальный закон для силы следовало бы включить зависимость от начальной скорости для того, чтобы обеспечить правильную интерпретацию проблемы начальных условий. Дополнительно, параметр диссипации должен иметь соответствующие масштабные единицы. Таким образом, можно записать динамическое уравнение дробного порядка для скорости в следующем, наиболее общем, виде: t Dt v t v0 v t f t , (6.26) 1
293
где, как правило, f t w t – винеровский процесс, v0 – начальная скорость1. Уравнение (6.26) явно представляет собой уравнение Ланжевена дробного порядка. Необходимо отметить, что уравнение Ланжевена является одним из первых и наиболее широко известных примеров стохастических дифференциальных уравнений. 7.2. Недиссипативный стохастический процесс Прежде, чем решать полное уравнение Ланжевена дробного порядка (6.26) представляется разумным рассмотреть несколько более простую версию данного уравнения в отсутствии диссипации: t Dt v t v0 f t . (6.27) 1 Здесь не приводится физической интерпретации x t в явном виде, поскольку в данном случае основное внимание уделяется формальным математическим свойствам решения уравнения (6.27). Решение (6.27) может быть формально записано в терминах интегрального оператора дробного порядка следующим образом: x t x0 Dt f t . (6.28) Известно также, что статистический закон распределения для решения данного уравнения является гауссовым в случае, если f t w t – винеровский процесс и спектр решения подчиняется обратному степенному закону. Можно записать двухчастичную корреляционную функцию, используя формальные свойства полученного решения, в виде x t1 x0 x t2 x0
1
t1
t2
' ' dt1 dt2
w t1' w t2'
, 2 ' 1 ' 1 0 0 t t t t 1 1 2 2 где предполагается, что флуктуации подчиняются гауссовой статистике и являются -коррелированными во времени:
1
В данном случае, без потери общности, коэффициент в левой части уравнения Ланжевена положен равным единице m 1 в отличие от (5.15).
294
w t1' w t2' D t1' t2' . Здесь D – сила флуктуаций. Можно также получить формальное выражение для корреляционной функции для двух моментов времени. Важно отметить, что интеграл в двухчастичной корреляционной функции является полностью симметричным относительно переменных времени t1 и t2 , но известно, что -функция будет ограничивать область интегрирования более ранним (меньшим) из двух времен, так как здесь обе переменные должны быть равны. Таким образом, для дальнейшего рассмотрения вводится обозначение t для большего (более позднего) и t для меньшего (более раннего) из двух времен. Применяя свойство -коррелированность флуктуаций во времени к интегралу в двухчастичной корреляционной функции, можно получить x t x0 x t x0
t
2D
dt t 2
1
t
1
t t
.
0
Вводя нормированную переменную t t , после некоторых алгебраических преобразований можно получить 2D t 1t
1
1
t 1 d 1 1 . x t x0 x t x0 2 t 0 Используя следующее интегральное представление для гипергеометричекой функции [209, 210]: 1 c c a 1 b F a ; b ; c : z d a 1 1 1 z , 2 1 a c a 0
где Re c Re a 0, и учитывая коэффициенты при соответствующих членах в двухчастчиной корреляционной функции, получаем следующее выражение: 2D t 1t t F 1;1 ;1 : . (6.29) x t x0 x t x0 2 2 1 t Важно отметить, что несмотря на то, что статистика решения (6.28) является гауссовой, она также является нестационарной вследствие
295
того, что корреляционная функция зависит от t и t по отдельности и не зависит от разности t t . На основании представленных выше результатов можно получить выражение для зависящей от времени вариации. Используя выражение (6.29), для второго момента распределения по времени при условии t t t можно записать: x t x0
2
2D t 2 1
F 1;1 ;1 :1 . 2 2 1 Используя соотношение [210] c c a b , 2 F1 a; b; c :1 c a c b
справедливое при условиях Re c Re a b и c не является целым, получается следующее выражение: 2 2D t 2 1 . (6.30) x t x0 2 2 1 Данный результат согласуется с результатами для аномальной диффузии, если выполнить отождествление H 1 2, где пара 1 3 метр , в общем случае, может находиться в пределах ; , 2 2 так что 0 H 1. Если рассматривать область значения 1, то получается 0 H 1 2 и, таким образом, процесс обладает свойством антиперсистентности. Случай немарковской статистики. Известно, что благодаря линейной природе процедуры дифференцирования статистика динамического процесса, описываемого уравнением дробного порядка (6.28), является гауссовой, если предполагается, что случайная сила распределена по закону Гаусса. Но при этом вариация, определяемая согласно (6.30), явно нелинейна. Таким образом, функция плотности распределения (плотности вероятности) в общем случае имеет вид
296
2 x x0 exp 2 , (6.31) 2H 2H 2 t t0 2 2 t t0 где параметр второго момента распределения определяется как D 2 . 2 H H 1 2
p x x0 , t t0
1
Выражение (6.31) соответствует плотности вероятности для ФБД в определении 5.5. Как было подробно рассмотрено выше, распределение Гаусса является решением уравнения Фоккера – Планка, которое, в свою очередь, получается как разложение в ряд уравнения Колмогорова – Чепмена. Поэтому можно ожидать, что изучаемый случайный процесс, описываемый (6.31), является марковским. Однако это не так. Для того чтобы показать, что распределение (6.31) не описывает марковский процесс, можно воспользоваться следующим подходом [211]: предположить, что (6.31) удовлетворяет уравнению Колмогорова – Чепмена и показать, что данная гипотеза приводит к противоречию. В одномерном случае при переходе из точки x , t1 0 в точку
z , t3 t t
через точку y , t выражение (4.19) можно переписать для плотности вероятности в следующем виде1: p z, t t x,0 dzp z , t t y , t p y , t x,0 .
(6.32)
Учитывая выражение (6.31) переходная плотность вероятности может быть записана в виде z y 2 1 p z, t t y , t exp 2 2 H . 2 2 t 2 H 2 t Можно было бы ожидать, что при t t можно получить уравнение Фоккера – Планка из (6.32) путем разложения переходной плотности вероятности в окрестности t 0 следующим образом: 1
В данном случае, в отличие от главы 3, используется несколько иная запись плотностей вероятностей, в которой в явном виде «начальная / конечная» пространственная точка объединена с соответствующим моментом времени, что представляется более оправданным именно с физической точки зрения. При этом p t1 , t2 , x1 , x2 p x2 , t2 x1 , t1 .
297
p z, t t y , t p z, t y , t t p z, t t y , t . t t 0 Можно заметить из формы переходной плотности вероятности, что первый член в правой части разложения является -функцией: p z, t y , t z y .
Далее, выполняя дифференцирование по интервалу времени t выражения для переходной плотности, можно получить 2 p z, t t y , t p z, t t y , t H 2 t 2 H 1 t y 2 так, что второй член в правой части разложения определяется следующим выражением: 2 2 2 H 1 z y p z, t t y , t H t . y 2 t Таким образом, подставляя полученные для слагаемых правой части выражения в разложение переходной плотности вероятности, можно получить 2 z y p z, t t y , t z y H 2 t 2 H (6.33) y 2 так что, подставляя (6.33) в (6.32) и выполняя интегрирование, получается следующее выражение: 2 p z, t x ,0 p z, t t x,0 p z, t x ,0 H 2 t 2 H . z 2 Отсюда p z, t t x ,0 p z, t x,0 2 p z , t x,0 2 H , (6.34) t 2 H z 2 что в пределе t 0 явно не соответствует уравнению Фоккера – Планка для общего случая значения H . Таким образом, противоречие доказано. В частном специфическом случае H 1 2 видно, что в пределе t 0 левая часть (6.34) становится частной производной по вре-
298
мени и получается уравнение Фоккера – Планка для простого диффузионного процесса p z, t x,0 2 2 p z, t x,0 . t 2 z 2 Решением этого уравнения в данном случае является, очевидно, нормальное распределение. Однако, как было отмечено выше, в общем случае H 1 2 не получается уравнение Фоккера – Планка, а получается уравнение диффузии дробного порядка p z, t t x ,0 p z, t x ,0 DtH p z, t x,0 lim t 0 t 2 H (6.35) 2 p z , t x ,0 H 2 . z 2 Полученное уравнение в данном виде заведомо не представляет корректной формы для описания эволюции плотности вероятности далеко от данного начального состояния x,0 . Однако форма уравнения с производной дробного порядка по времени достаточна для демонстрации немарковского характера изучаемого процесса. 7.3. Решение однородного уравнения Однородное уравнение для фрактального броуновского движения получается из уравнения Ланжевена общего вида (6.26) в отсутствии тепловых флуктуаций и имеет следующий вид: t Dt v t v0 v t . (6.36) 1 Данное уравнение является полностью определенным с точки зрения математики. Важно также более подробно рассмотреть (6.36) с физической точки зрения. Из статистической физики известно, что флуктуации в уравнении движения тесно связаны с диссипацией и, фактически, они имеют один и тот же источник происхождения. Это то основание, которое в результате приводит к флуктуационнодиссипационному соотношению, связывающему силу флуктуаций с отношением температуры к параметру диссипации. Однако в (6.36) диссипация присутствует без соответствующего множества флуктуаций. Вследствие того, что все операторы, входящие в
299
(6.36), являются линейными, возможно интерпретировать данное уравнение в терминах средней скорости. Таким образом, ниже, если другое не оговорено особо, формула (6.36) трактуется как математическое выражение, соответствующее учету ненулевого значения начальной скорости v0 и учету временной зависимости, поскольку присутствует хорошо определенная проблема начального значения, и для которого отмасштабированный нужным образом параметр диссипации имеет единицы, соответствующие порядку дробной производной. Определение 6.2. Функцией Миттаг – Лефлера называется функция, задаваемая следующим рядом: zk E z , 0. (6.37) k 0 k 1 Определение 6.3. Обобщенной функцией Миттаг – Лефлера называется функция, задаваемая следующим рядом: zk E , z , 0, 0. (6.38) k 0 k Видно, что обобщенная функция Миттаг – Лефлера сводится к обычному случаю при 1: E ,1 z E z . Решение уравнения (6.36) находится из соответствующего интегрального уравнения дробного порядка v t v0 Dt v t ; (6.39) выполняя преобразование Лапласа после некоторых алгебраических преобразований можно получить v0 s v s . 1 s Обратное преобразование Лапласа с использованием функции Фокса позволяет получить следующее выражение: k
1 k v t v0 t , k 0 1 k
так, что решение уравнения Ланжевена для однородного случая определяется функцией Миттаг – Лефлера
v t v0 E t .
300
(6.40)
Таким образом, фундаментальный процесс не характеризуется экспоненциальной релаксацией как в случае процесса Орнштейна – Уленбека, а характеризуется скорее растянутой экспоненциальной релаксацией в течение короткого времени и долговременным распадом, подчиняющимся обратному степенному закону, процесса Миттаг – Лефлера. Время перехода между двумя областями релаксации определяется параметром диссипации . §8. Решение уравнения Ланжевена общего вида В данном параграфе подробно рассмотрено решение уравнения Ланжевена дробного порядка для неоднородного случая. 8.1. Решение в общем случае На основании изложенного выше можно рассмотреть решение полного уравнения Ланжевена. Заменяя (6.26) эквивалентным интегральным уравнением1 v t v0 Dt v t Dt f t (6.41) 2 и используя преобразование Лапласа данного уравнения, можно получить f s v v s 0 v s . s s s Отсюда образ Лапласа решения уравнения Ланжевена общего вида для дробного порядка записывается следующим образом: f s v s 1 v s 0 . (6.42) s s 1
Как было указано выше, при построении уравнения Ланжевена (6.26) считается, что случайный процесс в правой части является винеровским процессом. Однако в рамках представленного ниже рассмотрения никаких дополнительных требований на случайный процесс не накладывается, и поэтому используется обозначение случайного процесса общего вида f t . 2 Обобщенные (для дробных порядков) интегральные преобразования рассмотрены подробнее в приложении 7.
301
Образ решения записан именно в виде двух членов для наглядности вследствие разной s -зависимости коэффициентов. Обратное преобразование Лапласа первого слагаемого в правой части (6.42) представляет собой функцию Миттаг – Лефлера, как это было найдено выше для однородного случая. Обратное преобразование второго члена представляет собой свертку случайных флуктуаций и стационарного ядра. Ядро определяется посредством функции Фокса следующим образом: 1 0, 1 1 1 1 11 . LT ;t t H 12 t 1 s 0, , 1 ,1 Разложение в ряд для данной функции Фокса может быть записано в виде k 0,1 1 1 11 k H 12 t t E , t . 0,1 , 1 ,1 k 0 k Таким образом, как однородный, так и неоднородный члены в решении (6.41) могут быть выражены в терминах функции Миттаг – Лефлера. Общее решение уравнения Ланжевена дробного порядка, используя обратное преобразование Лапласа, можно также записать в следующем виде:
v t v0 E t
t
1
t t'
E , t t '
0
f t dt . '
'
(6.43)
В частном случае 1 функция Миттаг – Лефлера превращается в экспоненциальную функцию и решение уравнения Ланжевена становится идентичным решению, получаемому для процесса Орнштейна – Уленбека при f t w t и v0 0 : t
v t v0 e t e
t t '
w t ' dt ' ,
0
как и должно быть. Данные результаты были получены также в [212] на основе использования стандартной техники для решения интегральных уравнений Вольтера.
302
8.2. Автокорреляционная функция скорости Традиционными количественными характеристиками, вычисляемыми на основе временных рядов скорости, являются автокорреляционная функция скорости, среднеквадратичная скорость и среднеквадратичное смещение броуновской частицы. Ниже данные характеристики вычисляются на основе решения (6.43) уравнения Ланжевена дробного порядка. Автокорреляционная функция скорости, учитывая (6.43), записывается следующим образом: v t1 v t2 v t1 , t2 2 0
v E t1 E t2
t1
1
0
' 1 1
dt t t ' 1
f t1' f t2' E , t1 t1'
dt t ' 2
1
2
t2'
(6.44)
0
t2
E t t , ,
' 2
2
где усреднение в данном уравнении связано со статистикой случайной силы, управляющей поведением системы. Традиционным является предположение, что случайные флуктуации описываются гауссовой статистикой и характеризуются отсутствием памяти, то есть они (флуктуации) являются -коррелированными во времени f t1' f t2' D t1' t2' . Здесь D характеризует силу флуктуаций. Как уже встречалось выше, в данном случае видно, что корреляционный интеграл является полностью симметричным относительно моментов времени t1 и t2 . Вводя более ранний t и более поздний t моменты времени, подставляя -функцию, интегральный член в (6.44) может быть записан в следующем виде: t
1
I 2 dt t t 0
1
t t
E , t t
E t t .
,
Используя разложение в ряд обобщенной функции Миттаг – Лефлера (6.38) и изменяя начальное значение при суммировании, можно получить:
303
k l
I 2 k 1 l 1
t
k l
I kl , I kl dt t t
k 1
t t
l 1
.
0
Введение масштабной переменной t t позволяет получить следующее выражение: k 1
1 t l 1 I kl tk 1tl d 1 1 . t 0 Используя, как и ранее, интегральное представление гипергеометрической функции, можно выразить данный интеграл следующим образом: l t I kl tk 1tl 2 F1 1;1 k ;1 l : . l 1 t Таким образом, интегральный член в автокорреляционной функции скорости имеет вид
k l k 1 l
t
t
t F1 1;1 k ;1 l : , t k 1 l 1 k l 1 соответственно, полная автокорреляционная функция запишется как I 2
2
v t v t v02 E t E t
(6.45) t 2D 2 F1 1;1 k ;1 l : . t k 1 l 1 k l 1 Очевидно, данный результат является нестационарным вследствие того, что он зависит от обоих моментов времени по отдельности, но не от их разности. Аналитические методы не дают возможности дальнейшего исследования (6.45) в силу его общности. Поэтому для использования аналитического подхода необходимо некоторое упрощение (6.45). Второй момент распределения для скорости получается из (6.45) при условии t t t , что в результате дает следующее выражение для среднего квадрата скорости:
k l k 1 l
t
t
304
2
v 2 t v02 E t
k l
t
k l 1
2 F1 1;1 k ;1 l :1 . k l 1 Используя выражение для гипергеометрической функции 2 F1 a ; b; c :1 из [210] и выполняя необходимые сокращения, мож-
2D k 1 l 1
но переписать данную формулу для v 2 t в следующем виде: v t 2
k l
t l v E t 2D . k 1 l 1 k l 1 l k 1 2 0
2
k l 1
Если второе слагаемое в правой части данного уравнения обозначить I , то справедливы следующие соотношения [212]: k l
2
t ' k ' dt . I k t ' 2 0 k 1 С другой стороны, для производной функции Миттаг – Лефлера справедливо: t dI , dt k l k 1 l 1
k l 2
dE t
t
k
t
dt
k
k 1
1 , t
где член при k 0 равен нулю в силу наличия полюса -функции. Таким образом, второй момент распределения скорости может быть переписан в виде [212]
2
dE t ' dt ' . (6.46) v 2 t v02 E t 2D ' dt 0 Можно также определить асимптотические свойства второго момента, так как известно, что функция Миттаг – Лефлера в асимптотике подчиняется обратному степенному закону:
t
2
lim E t t , t
так что интегральный член в (6.46) гарантировано сходится при t для всех 0, причем данный член спадает быстрее на
305
множитель 1 t , чем зависимость t 2 для первого члена. Таким образом, главный член при асимптотическом поведении второго момента распределения имеет следующий вид: 1 lim v 2 t 2 , t t что является отличительной чертой процессов с долговременной памятью. Необходимо отметить, что производную функции Миттаг – Лефлера можно также записать в терминах обобщенной функции Миттаг – Лефлера:
dE t
t
1
E , t .
dt Таким образом, среднеквадратичная скорость может быть переписана как t
2
2
v 2 t v02 E t 2D 2 t ' 1 E , t ' dt ' . (6.47) 0 Данное выражение, естественно, обладает теми же асимптотическими свойствами, что и (6.46). Важно отметить, что в пределе 1 и при f t w t можно получить из (6.46) и (6.47) результат Орнштейна – Уленбека, при указанных выше условиях, как и следовало ожидать, справедливо v 2 t v02 e 2 t D 1 e 2 t .
В асимптотическом пределе данное выражение дает флуктуационно-диссипационное соотношение между параметром диссипации и коэффициентом диффузии следующего вида D K d kT . При получении данного соотношения использовалась теорема о равном распределении энергии между степенями свободы в рамках статистической физики для замены кинетической энергии в случае единичной размерности массы частицы v 2 t 2 на kT 2 (см. Kd
приложение 5).
306
8.3. Среднеквадратичное смещение Смещение частицы в случае обобщенного (фрактального) броуновского движения может быть выражено через интеграл по времени от скорости так, что среднеквадратичное смещение броуновской частицы может быть записано в следующем виде: t
t
x 2 t dt1 dt2 v t1 v t2 . 0
(6.48)
0
Необходимо отметить, что выбранная формула является одним из возможных соотношений между скоростью и смещением, которое позволяет вводить производные дробных порядков. В [212] были рассмотрены два различных соотношения между скоростью и смещением броуновской частицы. Первое из них, приведенное выше, позволяет получить смещение в зависимости от времени, что является обычным условием. Второй возможный вариант рассматривает смещение как интеграл дробного порядка от скорости так, что смещение частицы определяется только ее скоростью на множестве точек внутри временного интервала размерности . Данный подход аргументирован тем, что на микроскопическом уровне траектория диффундирующей частицы является недифференцируемой кривой, как указывали и Больцман, и Перрен, но в [212] сделано более сильное предположение о том, что дробная производная такой кривой все-таки может быть получена. Это предположение основывается на [213], где было показано, что наблюдаемое движение частицы может быть представлено ее средним движением. Также выдвигается аргумент, что некоторые мгновенные значения скоростей и смещений не дают вклад в результирующее макроскопическое движение даже в случае классического броуновского движения. Это, как утверждается, является источником аномальной диффузии. Строго говоря, это может рассматриваться только как один из возможных источников аномальной диффузии. Рассмотрение ниже ограничивается интегралом (6.48). Подставляя решение уравнения диффузии дробного порядка в (6.48), можно записать среднеквадратичное смещение в следующем виде:
307
x2 t t
t
v02 dt1 dt2 E t1 E t2 0 t
0
0
t2
dt2 dt t2 t ' 2
0
t1
t
' 1 2
' 1
E , t1 t
0
1
dt1 dt1' t1 t1'
0
(6.49)
E t t
,
2
' 2
f t1' f t2' .
Интегрирование в первом члене в правой части данного равенства может быть выполнено в явном виде с использованием представления функции Миттаг – Лефлера в виде ряда. Интеграл по одной из переменных может быть выражен через обобщенную функцию Миттаг – Лефлера: t
dt1E t1
k k 1
t
k
t k
tE2, t . k 0 k 1 k 1 k 0 k 2 0 Способ вычисления членов, подобных второму слагаемому в (6.49), был неоднократно рассмотрен выше. Таким образом, можно записать среднеквадратичное смещение в следующем виде:
t
2
x 2 t v02 tE2, t DI , где второе слагаемое имеет вид
k l
t
t
(6.50)
t F1 1;1 k ;1 l : . t k 1 l 1 0 0 Для выполнения интегрирования по штрихованным переменным и получения последнего выражения была выполнена подстановка интегрального члена I , приведенного выше при рассмотрении автокорреляционной функции скорости, в (6.49). Таким образом, удается понизить порядок интегрирования с четырех до двух, дополнительный множитель, равный двум, возникает вследствие симметрии. Для вычисления интеграла в последнем выражении вводится масштабная переменная для более позднего из двух моментов времени, как было выполнено выше. Тогда, используя приведенное выше выражение для I kl , можно получить I 4
k 1
l 2
dt t dt t k l 1
308
t
1
I kl dtt
k l
0
d
l 2
F1 1;1 k ;1 l :
0
t d l 2 F1 1;1 k ;1 l : . k l 1 0 Используя интегральное представление для гипергеометричекой функции из [209, 210], приведенное выше, после необходимых преобразований можно получить k l 1
1
1
d
d 2
F1 a; b; c :
0
1 1 c c a 1 b a 1 d d 1 0 d 1 a c a 0
1 c c a 1 dzz a 1 1 z 2 F1 d 1; b; d 2 : z . d 1 a c a 0 Сравнивая данный интеграл с соответствующим интегралом в [214], окончательно можно записать 1 c d 2 a d 0 d 2 F1 a; b; c : d 1 a c a
d 1 a d 2 a b 1 1 , c d 2 b d 2 a d 1 b k l где использованы следующие обозначения: a 1, b 1 k , c 1 l и d l . Таким образом, можно записать
k l
t I 4 . k 1 l 1 k l 1 k l 1 k l
k l 1
Справедливо следующее выражение [212]: k k l k l 1 t d2I d t 4 2 dt 2 dt l 1 k 1 k 1 l 1 k l 1 2 d 2 E t 1 . dt
309
Интегрируя полученное выражение дважды и учитывая, что I и соответствующая первая производная равны нулю при t 0, можно на основании (6.50) получить следующее выражение для среднеквадратичного смещения:
2
x 2 t v02 tE2, t 2 (6.51) ' ' D t 1 2 E2, t dt E t . 0 Как и прежде, используя асимптотическую форму функции Миттаг – Лефлера и обратный степенной закон, можно показать, что интеграл в (6.51) сходится при 1 2 и главный член в (6.51) в асимптотической области имеет следующий вид: x 2 t t.
Это в точности соответствует случаю обычной диффузии, описываемой классическим уравнением Ланжевена. Необходимо отметить, что даже в случае 1 2 расхождение интеграла будет очень медленным, поэтому асимптотическое поведение будет все еще определяться линейным членом. Таким образом, среднеквадратичное смещение частицы оказывается полностью нечувствительным к динамическим особенностям (классическое / фрактальное движение) данного процесса. Итак, выше было показано как конструируется и решается стохастическое уравнение дробного порядка, которое может быть использовано для моделирования физических явлений с долговременной памятью и/или дальнодействующими взаимодействиями. Дальнодействующие корреляции, подчиняющиеся степенному закону и характеризующие фрактальное броуновское движение, приводят в результате к немарковскому описанию таких процессов как, например, распространение трещин. Было обнаружено, что непрерывное управляющее уравнение приводит к уравнению эволюции распределения Леви, когда ядро отклика (памяти) может быть представлено обратным степенным законом в координатном пространстве, основываясь на аналогичном законе для параметра «время ожидания» функции распределения во времени [208].
310
Контрольные вопросы 1. Дайте определение устойчивого распределения. Приведите примеры простейших устойчивых распределений. 2. Приведите кинетические уравнения и их решения в случае бесконечной (конечной) скорости частицы. 3. Поясните кратко использование аппарата функции Фокса при описании транспортных процессов во фрактальных средах. 4. Дайте определение обобщенной функции Миттаг – Лефлера. 5. Приведите уравнение Ланжевена в общем случае и для частного случая недиссипативного стохастического процесса. 6. Приведите решение уравнения Ланжевена в общем случае. 7. Приведите выражения для автокорреляционной функции скорости, среднеквадратичной скорости и среднеквадратичного смещения броуновской частицы для уравнения Ланжевена дробного порядка. Рекомендуемая литература 6.1.
Miller K.S., Ross B. An introduction to the fractional calculus and fractional differential equations. N.Y.: John Wiley, 1993.
311
Глава 7 ОПЕРАТОРЫ ДРОБНЫХ ПОРЯДКОВ В ФИЗИКЕ ФУНДАМЕНТАЛЬНЫХ ВЗАИМОДЕЙСТВИЙ
§1. Вводные замечания Определение 7.1. Множественностью частиц i -го типа ni называется число частиц данного типа, образованное в одном акте взаимодействия. Пусть i является случайной величиной «множественность частиц типа i в событии», принимающей целочисленные неотрицательные значения ni . Распределение вторичных частиц данного типа по множественности ni с плотностью распределения (вероятностей) P ni P n pn 1 является наиболее общей характеристикой процессов множественного рождения [215]. Определение 7.2. Распределение неупругих событий по числу вновь образованных в них частиц данного типа называется распределением по множественности, и плотность данного распределения определяется следующим образом:
pn n
n
,
(7.1)
n0
где n – сечение рождения n частиц данного типа (топологическое сечение). Распределение по множественности (распределение
1
Индекс, указывающий на тип частицы, может быть опущен для краткости. Важно отметить: часто в литературе (особенно в физической), говоря о распределении при целочисленных неотрицательных значениях (соответствует распределению по множественности в ФВЭ) используют обозначение P n pn , являющееся исторически широко распространенным, тем не менее не совсем строгим с математической точки зрения.
312
вероятностей) нормировано так, что
P n 1,
то есть pn дейст-
n 0
вительно имеет смысл плотности вероятности. Данное распределение показывает вероятность рождения заданного количества частиц в процессе взаимодействия данного типа при некоторой фиксированной начальной энергии. Как для КХД, так и для любой феноменологической модели важно изначально правильно описывать распределения по множественности, поскольку все другие инклюзивные характеристики, как правило, получаются путем усреднения с учетом данного распределения. Модель, не способная правильно воспроизвести распределение по множественности, не может претендовать на описание других инклюзивных распределений. 1.1. Гипотеза КНО-скейлинга В случае ранга момента распределения по множественности выше единицы удобно использовать нормированные моменты Cq
S n S q
n
S
q
,
(7.2)
где стандартные моменты (в дискретном случае) определяются следующим образом1:
n q
S n S n s p S . q
q
n
n 0
Вплоть до энергий S 50 ГэВ нормированные моменты (7.2) распределений по множественности частиц различных типов практически не зависели от энергии столкновения для широко спектра реакций. Независимость нормированных моментов (7.2) от энергии явилось одним из аргументов в пользу гипотезы скейлингового описания распределений по множественности для частиц различных типов. Как известно, было получено успешное феноменологи1
В данном разделе для характеристик распределения используются, как правило, обозначения, принятые в физических приложениях и отличающиеся от использованных выше в разделах, посвященных теории вероятностей.
313
ческое описание распределений неупругих событий по множественности n в полном фазовом пространстве с помощью масштабно-инвариантного КНО-распределения (распределения Кобы – Нильсена – Олесена) 1 n pn S n n
в процессах различных типов вплоть до энергий
S 50 ГэВ.
Здесь , n n считается универсальной функцией, не зависящей явно от энергии, а вся энергетическая зависимость определяется поведением средней множественности. Данное предположение, названное гипотезой КНО-скейлинга, было обосновано изучением фейнмановского плато в быстротных распределениях частиц [216]. Указанная гипотеза была одним из наиболее успешных предположений о форме распределений по множественности. Для универсальной КНО-функции справедливо условие нормировки
x dx 1, 0
и стандартные моменты КНО-распределения не зависят от энергии взаимодействия, а только от своего ранга q :
x q x q x q x dx const
S .
0
Однако при более высоких энергиях и для z 2 наблюдается нарушение гипотезы КНО-скейлинга: масштабная инвариантность, определяемая зависимостью функции только от отношения множественности n к ее среднему значению n , нарушается и распределения по множественности становятся шире при увеличении энергии столкновения. 1.2. Отрицательное биномиальное распределение Феноменологические подходы к описанию распределения по множественности пока ограничиваются простейшими приближениями отдельных, как правило, независимых источников с приме-
314
нением некоторых распределений, хорошо известных в теории вероятности. Среди них наибольшей популярностью пользуется отрицательное биномиальное распределение (ОБР), обычно достаточно разумно описывающее основные особенности экспериментальных данных для распределений по множественности в различных реакциях в широком интервале начальных энергий при выборе соответствующих значений параметров. В связи с нарушением КНО-скейлинга в [217] было предложено использовать именно ОБР для описания распределений по множественности в широком интервале начальных энергий S 10 103 ГэВ. Определение 7.3. Отрицательным биномиальным распределением (распределением Паскаля) с параметрами r, называется дискретное распределение случайной величины , принимающей целочисленные значения k 0,1, 2, с вероятностями k
pk P k Crk k 1 r 1 ,
где 0 1 и r 0, причем для нецелых r величина Crkk 1 опре r k 1 r k 2 r . деляется следующим образом: Crk k 1 k! ОБР встречается во многих приложениях как теории вероятностей, так и физики. При целом r 0 ОБР интерпретируется как распределение времени ожидания r го «успеха» в схеме испытаний Бернулли с вероятностью «успеха» . Именно в данном случае ОБР, как правило, называется распределением Паскаля и является дискретным аналогом гамма-распределения. Характеристическая функция ОБР имеет следующий вид: r
f t . 1 1 exp it Некоторые стандартные и центральные моменты низших рангов ОБР равны: r 1 r 1 r 1 2 3 , D , , 2 3 4
r 1 3r 1 6 1 2 . 4
315
Коэффициент асимметрии: 1 2
r 1 , коэффициент
эксцесса: 2 6 r 2 r 1 . Одной из наиболее привлекательных черт ОБР является именно наличие асимптотического КНО-скейлинга при высоких энергиях, то есть при стремящейся к бесконечности средней множественности. В настоящее время возможен учет членов более высоких порядков в рамках ТВ КХД, что приводит к приближенному КНОскейлингу с формой распределения, зависящей теперь уже от константы связи (или аномальной размерности КХД). Необходимо отметить, что наблюдается некоторое расхождение теоретического описания и экспериментальных данных при наивысших доступных энергиях (в ТэВной области). §2. Математический формализм Изложение в данном разделе следует [38, 218, 219], где соответствующие математические аспекты рассмотрены подробно. 2.1. Плотности распределений для различных процессов Для введения основных определений и соотношений между физическими величинами, которые будут полезны в дальнейшем, рассматривается процесс a b 1 2 n , (7.3) соответствующий взаимодействию начальных частиц a и b с образованием в точности n частиц в некоторой области n полного фазового пространства . В противоположность (1.1) процесс (7.3) является (полностью) эксклюзивным. При фиксированном числе вторичных частиц образованную систему можно характеризовать плотностью вероятности pne xn , n 1,2, где xn x1 ,, xn и xi – (многомерная) координата i -й частицы в фазовом пространстве, то есть совокупность всех физических параметров, характеризую-
316
щих данную частицу1. Такое описание называется эксклюзивным. В случае тождественности всех вторичных частиц эксклюзивные распределения (плотности вероятностей) pne x1 ,, xn полностью симметричны относительно перестановки аргументов и описывают распределения частиц, когда их число в точности равно n. В действительности, особенно при высоких энергиях, чаще бывает удобно использовать так называемый инклюзивный подход, когда число частиц не фиксировано, а рассматриваются всевозможные n частичные характеристики процесса взаимодействия. Именно таким образом проводится большинство экспериментов, в которых изучается множественное рождение частиц. Соответствующие инклюзивные плотности распределения для данного фиксированного n 1, 2, учитывают интегральный вклад процессов с более высокой множественностью и характеризуются плотностью вида 1 ' m e ' pni x pne xn p x (7.4) n m n , xm dxn i , m ! m 1 i 1 n то есть инклюзивные плотности порядка n определяются суммой эксклюзивной плотности того же порядка и интегралов от эксклюзивных плотностей более высокого порядка по всем неучитываемым переменным. Соответственно, обратное соотношение имеет следующий вид: 1 pne x pni xn m 1 m !
m
'
m
p x , x dx i n m
n
n
' n i
m
.
(7.5)
i 1
Таким образом, инклюзивная плотность pni xn задает плотность вероятности обнаружить n частиц в точках фазового пространства x1 , xn независимо от наличия и расположения других частиц.
Плотность вероятности p0e не найти ни одной частицы в заданном объеме равна
1
Например, если процесс рассматривается в одномерном пространстве быстрот вторичных частиц, то i : xi yi – быстрота частицы, в трехмер ном пространстве импульсов – i : xi pi – импульс частицы и так далее.
317
n 1 e p x dxi . n n n 1 n ! n i 1
p0e 1
В соответствии с (7.4) последнее соотношение означает, что p0i 1. Пусть in это – полное сечение неупругого взаимодействия. Инклюзивные плотности вероятности pni xn связаны с измеряемыми на опыте инклюзивными дифференциальными сечениями следующим образом: 1 d n pni xn , in dx1 dxn то есть, например, in-1d p1i x dx задает число частиц в интервале dx в данном процессе; in-1d 2 p2i x1 , x2 dx1dx2 равно среднему числу пар частиц в области dx1dx2 и так далее. Важно отметить, что в данном случае достаточно продуктивным оказывается метод производящего функционала, позволяющий получать все необходимые формулы и записывать их в компактном виде. Пусть z x – производящий функционал, где z x – некоторая функция в n . Согласно [218] справедливы взаимосвязь для эксклюзивного и инклюзивного процессов z e x z i x 1 и следующие выражения для производящих функционалов: n n 1 a z a x p0a pna xn z a xk dx j , a e, i; n 1 n ! n k 1 j 1 (7.6) i z x e z x 1 , z i x z x .
Варьируя данные соотношения, можно получить:
n a z a x pna xn n za x
, a e, i. za 0
i 1
Если заменить функцию z x на некоторую константу по отношению к x (то есть на простой аргумент), то на основе (7.6) для производящих функций получаются следующие соотношения:
318
n zn i p x dx j , n n n 1 n ! n j 1
i z 1
(7.7)
i z e z 1 . Поскольку в литературе для приложений в физике многочастичных процессов используются разные определения производящих функций, полезно отметить следующее: из соотношений между производящими функциями видно, что, например, производная i в некоторой точке z0 будет соответствовать производной от e в точке z0 1. Полученные функции (7.7) являются производящими функциями для распределений по множественности.
2.2. Кумулянтные корреляционные функции Результаты, представленные ниже, имеют достаточно общий характер и применяются при различных видах корреляционного анализа процессов множественного рождения. Поэтому приведенные ниже формулы полезны для дальнейшего рассмотрения, в частности, для исследований в области фемтоскопии. Инклюзивные n -частичные плотности pni xn содержат «тривиальные» вклады плотностей низших порядков и отличны от нуля, даже если все частицы статистически независимы. Поэтому при определенных условиях оказывается предпочтительно рассматри вать набор таких функций Cn xn Cn x1 ,, xn , которые обращаются в нуль в случае, когда один из их аргументов становится статистически независимым от остальных. Величинами с такими свойствами являются, как известно, корреляционные функции, называемые также (факториальными) кумулянтными корреляционными функциями. Данные функции вводятся аналогично тому, как это сделано в кластерном разложении в статистической механике. В общем случае справедливо следующее соотношение, связываю щее кумулянтные корреляционные функции Cq xq C q x1 ,, xq порядков 1 q n с инклюзивной плотностью pni xn [218]:
319
pni xn
C1 x1 C1 xl Cn xn1 Cn xnln , 1 li n перестановки
l1сомножителей
(7.8)
lnсомножителей
где l1 0,1,2, и полный набор этих чисел удовлетворяет условию n
kl
k
n, аргументы корреляционных функций C j x j , j 1,, n
k 1
задаются j -мерными векторами, построенными из n возможных величин xi , i 1,, n, которые выбираются в любом порядке. Сумма по перестановкам в (7.8) соответствует различным путям заполнения этих аргументов. Таким образом, получается всего n! ln
lk
n
k ! l j ! k 1
j 1
членов. Согласно [218] полный набор соотношений для корреляционных функций определяется выражением
n g z i x Cn x n n zi x j j 1
, z i 0
где n 1 n i C x z x k dx j n n n 2 n ! n k 1 j 1
g z i x p1i x z i x dx
и справедливо следующее функциональное тождество: i z i x
exp g z i x . На основе достаточно громоздкой общей формулы (7.8) можно получить для низших значений n : p1i x1 C1 x1 ; p2i x2 p2i x1 , x2 C1 x1 C1 x2 C2 x1 , x2 ; p3i x3 C1 x1 C1 x2 C1 x3 C1 x1 C2 x2 , x3 C1 x2 C2 x1 , x3 C1 x3 C2 x1 , x2 C3 x1 , x2 , x3 , которые можно обратить так, что для кумулянтных корреляционных функций низших порядков справедливо [218]:
320
C2 x1 , x2 p2i x1 , x2 p1i x1 p1i x2 ; C3 x3 p3i x3 p1i x1 p2i x2 , x3 ; 3
C4 x4 p4i x4 p1i x1 p3i x2 , x3 , x4 p2i x1 , x2 p2i x3 , x4 4
i 1
i 1
3
i 2
i 1
i 1
2 p x1 p x2 p x3 , x4 6 p x1 p x2 p1i x3 p1i x4 . 6
Знаки суммирования указывают суммы по всем возможным перестановкам (их число приведено под соответствующим знаком). Часто оказывается удобным разделить функции pni xn , Cn xn на произведение одночастичных плотностей. Таким способом получаются нормированные инклюзивные плотности и корреляционные функции: pni xn Cn xn i rn xn n , K n xn n . (7.9) i i p x p x 1 k 1 k k 1
k 1
Важно отметить, что выше предполагалось, что все n частиц идентичны. Математический аппарат для корреляций частиц различных типов описан в [218]. 2.3. Факториальные и кумулянтные моменты Используя общие определения теории вероятностей для моментов и семиинвариантов, представленные выше (гл. 3), можно ввести соответствующие характеристики в физике множественного рождения. Все необходимые моменты могут быть получены с помощью производящих функций (7.7). Данный подход позволяет изучать аналитическую функцию вместо дискретной последова
тельности чисел pn n 0 . Используя стандартное определение (П3.5), можно записать
z e pn z e n 0
или
321
n
n
z pn 1 z ,
(7.10)
n0
где pn определяется (7.1). Факториальный (или биномиальный) момент связан с эксклюзивной и инклюзивной плотностями следующим образом: n Fn pni xn dx j pk k k 1 k n 1. n
j 1
k 0
Формально, обратное соотношение имеет вид 1 j F pn 1 n j . n ! j 0 j! При анализе процессов множественного рождения удобно использовать нормированные факториальные моменты и кумулянты, определяемые, соответственно, следующим образом: l j 1 d z 1 d ln z fl , k (7.11) , j l j l dz j n dz z 0 n z 0 где порядок моментов l 0 f0 f1 1 и j 1 k 1 1 . Ниже, если другое не оговорено специально, говоря о факториальных моментых и кумулянтах, подразумеваются именно нормированные моменты (7.11). Необходимо отметить, что в действительности все физические распределения по множественности ограничены сверху, то есть существует такое n nmax , что n nmax : pn 0. Вследствие ограниченности распределения по множественности сверху все факториальные моменты ранга j nmax равны нулю. При меньших j они всегда положительны. Кумулянты же могут быть как положительными, так и отрицательными. Выражение для производящей функции может быть записано в виде zj zj j j z n f j ; ln z n k j. j ! j ! j 0 j 1 Само распределение по множественности вторичных частиц, то есть плотность pn , выражается через производящую функцию
322
(7.10) стандартным образом1, а его обычные нормированные моменты (7.2) могут быть записаны в виде k z 1 d e 1 Ck . k dz k n z 0
Важно отметить, что все моменты связаны друг с другом определенными соотношениями, получаемыми путем использования их определений через производящую функцию. Так нормированные факториальные моменты и кумулянты однозначно выражаются друг через друга с помощью следующей формулы: l 1
fl Clm1k l m fm ,
(7.12)
m 0
где Clm1
l l 1! 1 . m ! l m 1! m 1 l m mB l , m
Здесь m
и B m – гамма- и бета-функции соответственно. Таким образом, в соотношении (7.12) содержатся только числовые коэффициенты, и последовательная итеративная процедура их решения, особенно удобная при компьютерных расчетах, позволяет воспроизвести все кумулянты, если известны факториальные моменты и наоборот. В этом смысле факториальные моменты и кумулянты равноправны. Физический смысл данных характеристик можно понять на основе их определений, выраженных через интегралы от корреляционных функций [38]. Факториальные моменты являются интегральными характеристиками всевозможных корреляций частиц, а кумулянты j -го ранга соответствуют «истинным» j -частичным корреляциям, не сводимым к произведениям корреляций более низкого порядка2. Более строго, в кумулянте j -го ранга все j частиц связаны друг с другом и не могут быть разбиты на группы, между которыми отсутствовали бы корреляции. По аналогии с (майеровским) кластер1
Здесь необходимо учитывать конкретное определение производящей функции и брать производные в соответствующей точке, как обсуждалось выше. В данном случае – в точке z 1. 2 Данная интерпретация справедлива фактически лишь для характеристик, порядок (ранг) которых меньше средней множественности при данной энергии [218].
323
ным разложением в статистической механике можно сказать, что данные частицы образуют j -частичный кластер, не делимый на более мелкие кластеры [38]. Как правило, нормированные факториальные моменты и кумулянты распределений, изучаемых в физике высоких энергий, достаточно быстро растут с увеличением своего ранга. Поэтому удобно оказалось рассматривать также их отношение H j k j fj , (7.13) которое обладает более плавным поведением при больших рангах j, сохраняя вместе с тем характерные качественные особенности зависимости кумулянтов от их ранга. На основе представленных выше соотношений можно получить реккурентные соотношения для H j -моментов: j 1
H1 1, H j 1 Cmj 11
f j m fm
Hm. (7.14) fj Таким образом, весь объем физической информации, содержащийся в распределении по множественности, может быть представлен в виде производящей функции z или, что эквивалентm 1
но, заданием моментов C j , f j , k j (либо отношения последних двух) при определенной средней множественности n . Важно отметить, что моменты высших рангов подчеркивают особенности распределения при все более высоких множественностях, то есть структуру «хвоста» распределения. Как следует из определения (7.11), только множественности n j дают вклад в факториальный момент (целочисленного) ранга j. 2.4. Моменты дробных порядков Выше a priori предполагалось, что порядок (ранга) моментов является целым положительным числом. Однако определения (7.11) и (7.13) могут быть обобщены и на нецелочисленные значения рангов [220]. Данное обобщение можно сделать двумя способами.
324
В первом случае можно переписать определение (7.11), например, для нормированного факториального момента в виде n 1 1 fq p , q n n n 0 n q 1 применимом при любом вещественном q и позволяющем вычислять дробные факториальные моменты1 по экспериментальным данным о плотности распределения pn . Во втором способе рассматриваемые характеристики можно находить по формулам изложенного выше дробного (обобщенного) дифференцирования, если известна производящая функция. Согласно правилам дробного дифференцирования производная произвольного (вещественного) порядка от производящей функции (7.10) записывает следующим образом [221, 222]: mq
d m z 1 z . dz m m 0 m q 1 z 1
Dzq z
Таким образом, определение моментов (7.11) перепишется для нецелых рангов q в следующем виде [218, 223]: Dzq z d m z 1 1 z0 fq , q q m n n m 0 m q 1 dz z 1 Dzq ln z d m ln z 1 1 z 0 kq . q q dz m n n m 0 m q 1 z 1
(7.15)
Как видно для факториальных моментов, формулы, полученные двумя различными способами, могут быть трансформированы друг в друга с учетом стандартного выражения pn через производящую функцию. Таким образом, устанавливается однозначное соответствие экспериментального определения fq , полученного в рамках первого способа, его теоретическому определению (7.15), получен-
1
В литературе, так же как и в случае интегродифференциального исчисления дробных порядков выше, для обозначения моментов дробных порядков часто для краткости используется термин «дробные моменты».
325
ному вторым способом с использованием оператора дробного порядка. Необходимо отметить, что, к сожалению, в общем случае дробных рангов значительно усложняется взаимосвязь дробных факториальных моментов и дробных кумулянтов, выражаемая в случае целых рангов формулой (7.12) и служащей, как было отмечено выше, основой вычисления кумулянтов по экспериментально определенным факториальным моментам. Учитывая очень высокую чувствительность кумулянтов к виду распределения при низких рангах и важность данных характеристик в исследованиях процессов множественного образования частиц, в качестве аналога (7.12) можно использовать следующее выражение [38]: q 1 fmk qam fq , m 0 mB q, m a где k q m можно назвать «аналитическим продолжением» кумулянтов на нецелые ранги. Данную формулу удобно использовать как экспериментаторам, так и в теоретических исследованиях. Однако необходимо отметить, что для рассматриваемой формулы имеется неоднозначность с определением кумулянтов около точки q 1 и теряется теоретическая основа в виде формул (7.15) [38]. Использование дробных моментов позволяет в ряде случаев более детально проводить различия между разнообразными распределениями. §3. Некоторые важные распределения В данном параграфе подробно рассмотрен ряд распределений важных для исследований именно многочастичных процессов. Для рассматриваемых распределений можно получить аналитические выражения для производящих функций и всех моментов [38]. Важнейшей и определяемой непосредственно из экспериментальных данных характеристикой распределения по множественности является средняя множественность. Поэтому для физических приложений параметры рассматриваемого распределения выражают, по возможности, именно через n .
326
3.1. Распределение Пуассона Важность приложения данного распределения в физике частиц объясняется, в частности, тем, что присутствие каких-либо корреляций в процессе взаимодействия, как правило, принято характеризовать мерой отличия типичного для данного процесса распределения от пуассоновского распределения. Если распределение по множественности описывается пуассоновским распределением, то, учитывая свойства распределения Пуассона, плотность распределения и производящая функция в данном случае определяются следующим образом: n pnP exp n , P z exp n z , n 0. n! Соответственно, j 0 : j 0 : f jP 1, k Pj H Pj j1 .
Таким образом, мерой корреляций для процессов множественного образования частиц может служить отличие факториальных моментов от единицы, кумулянтов и H j -моментов (кроме тривиального первого) от нуля, то есть от значений моментов пуассоновского распределения. Данное распределение обладает свойством КНО-скейлинга в асимптотической области n и характеризуется постоянством факториальных моментов как функций n . Данное свойство называется f -скейлингом [38]. Необходимо отметить, что в асимптотике КНО- и f -скейлинг эквивалентны. Дробные (отрицательные, комплексные) моменты пуассоновского распределения определяются как [220, 223] 1 exp n 1 q fqP F 1,1 q; n , k qP , q q 1 1 q 2 q n n H Pj
n exp n q , 1 q F 1,1 q; n
где F 1,1 q; n
– вырожденная гипергеометрическая функция. 327
Как и ожидалось, при целых рангах обобщенные (дробные) моменты равны единице, а при вещественных q – осциллируют с амплитудой, зависящей от ранга и от n . Амплитуда осцилляций кумулянтов и, как следствие, H Pj -моментов быстро падают с ростом средней множественности. Возникновение осцилляций объясняется поведением -функций в знаменателях факториальных моментов и кумулянтов. При больших n факториальные моменты стремятся к единице во всей комплексной плоскости q. Однако кумулянты стремятся к нулю лишь при Re q 1 и растут по величине в обратном случае с ростом n в области высоких энергий. Важно отметить, что указанные качественные особенности присутствуют в поведении моментов и других распределений, рассмотренных ниже. 3.2. Отрицательное биномиальное распределение Важность ОБР для физики частиц была кратко рассмотрена выше. Здесь необходимо отметить, что ОБР получается также при рассмотрении ветвящегося процесса, а также процесса рождения и уничтожения с иммиграцией. Для физических приложений плотность и производящая функция ОБР могут быть записаны в виде n n r pnNB Cnn r 1 , NB z 1 z , , n r r 1 где, в данном случае, r – свободный параметр. В частных случаях ОБР переходит в другие хорошо известные распределения: в пределе r получается распределение Пуассона, при r 1 – распределение Бозе – Эйнштейна. Видно, что производящая функция обладает сингулярностью в точке z 1 и z 0 при n и r const. Таким образом, по мере роста энергии вычисления производной производящей функции происходит все ближе к данной точке сингулярности. Моменты целочисленных рангов определяются по следующим формулам:
328
j r 1 1 r j NB j , k j j 1 , H NB rB j , r . j j r r r r j Из полученных соотношений видно, что при фиксированном значении параметра r факториальные моменты ОБР увеличиваются с ростом r быстрее экспоненциальной функции. Кумулянты всегда положительны, значения их сначала быстро падают, достигая минимума при j r, и растут при дальнейшем увеличении ранга. Необходимо отметить, что кумулянты остаются положительными даже для произведения производящих функций ОБР с разными параметрами. Отношения факториальных моментов и кумулянтов, H j f jNB
моменты, монотонно уменьшаются при увеличении ранга ( j r при больших j ) и тоже всегда положительны. Указанные характерные особенности поведения моментов ОБР в зависимости от их ранга графически продемонстрированы на рис. 7.1. На данном рисунке представлены зависимости ln M j j , где M f , k , H , для значений параметра r 5,10 и при j 20. Поскольку увеличение параметра распределения r приводит к более узкому распределению, рост f j при r 10, как и ожидалось, оказывается медленнее, чем при r 5. Зависимость от r еще более явно видна в поведении кумулянтов и частично компенсируется в поведении H j -моментов. Важно отметить, что указанные особенности являются специфическими для ОБР и не столь явно проявляют себя в КХД. ОБР, так же как и распределение Пуассона, помимо КНО - скейлинга в асимптотической области n характеризуется постоянством моментов как функций n
при фиксированном значении
параметра r, то есть f -скейлингом. При n и фиксированном значении r КНО-функция для ОБР определяется по формуле rr x x r 1 exp rx . r 1 ! Общие выражения для моментов, справедливые во всей комплексной плоскости ранга q, имеют следующий вид [38]:
329
fqNB
F r, q;1 q; q
n 1 q
, k NB q
r F 1,1;2 q; ln 1 q , q n 1 q
r F 1,1;2 q; 1 q ln H NB r . , j 1 1 q F 1, r;1 q;
Рис. 7.1. Зависимость (целочисленных) факториальных моментов (а), кумулянтов (б) и H -моментов (в) от ранга для ОБР при двух различных значениях параметра распределения. Кривые плавно соединяют точки при целых рангах и проведены для наглядности [38]
330
Осцилляции моментов между целочисленными положительными q вымирают с увеличением n , то есть они малы при высоких энергиях, и уменьшением параметра r. При отрицательных значениях q моменты растут с увеличением средней множественности. 3.3. Распределение для фиксированной множественности Пример данного распределения явно демонстрирует, что поведение моментов (даже целочисленных рангов) может радикально отличаться от того, что наблюдалось для рассмотренных выше распределений. Дополнительно данный пример подчеркивает важность процедуры отбора событий в эксперименте и, соответственно, степень ее влияния на получаемые результаты. Как известно, достаточно часто для анализа выбираются события вида a b 1 2 n0 X , n0 const, то есть с заданной множественностью вторичных частиц (полуинклюзивные события). В данном случае плотность и производящая функция (7.10) определяются как n
pn nn0 , z 1 z 0 . Поскольку n n0 , то для моментов целочисленных рангов справедливы следующие соотношения: n10 j n0 n0 ! , 1 j n0 , f jF n0j n0 j ! n0 j 1 0, j n0 , 1 j
1 j
k Fj n0 j , H Fj 1 n0 B j , n0 j 1 . Необходимо отметить, что вследствие поведения факториальных моментов в зависимости от ранга, H j -моменты можно вычислять
только при j n0 . Факториальные моменты уменьшаются монотонно с ростом ранга до n0 (рис. 7.2,а), данное поведение является не типичным для КХД. Характерной чертой рассматриваемого бесконечно узкого распределения являются осцилляции кумулянтов при целых зна-
331
чениях рангов, которые положительны при нечетных значениях j и отрицательны при четных (рис. 7.2,б). Амплитуда осцилляций кумулянтов уменьшается при увеличении значения ранга от j 1 до j n0 , а затем монотонно растет. Необходимо отметить, что подобное поведение наблюдается при анализе распределений, возникающих в результате уравнений КХД, хотя «периоды» осцилляций будут существенно отличаться от данного случая [38]. Необходимо подчеркнуть, что появление осцилляций для кумулянтов и, соответственно, для H j -моментов (рис. 7.2,в) в данном случае может быть связано только с процедурой отбора событий в эксперименте, а не с динамикой взаимодействия. Таким образом, в полуинклюзивном случае детальное знание условий отбора событий для анализа является исключительно существенным при проведении сравнения экспериментальных данных и результатов расчетов по феноменологическим моделям. При произвольных значениях ранга моменты распределения с фиксированной множественностью определяются следующим образом: n1 q B n0 ,1 q F 1 1 q 1 1 q fqF 0 , k q n01 q , H qF , 1 q 1 q B n0 ,1 q где x d ln x dx – -функция. При асимптотически высокой множественности n0 для фиксированного значения ранга fq 1, k H q 0. Важно подчеркнуть, что для всех рассмотренных примеров значения дробных моментов вычислялись именно на основе производных дробного порядка согласно (7.15), а не с помощью прямого «аналитического продолжения» формул для целочисленных рангов на общий случай. Общим свойством осцилляций моментов в рассмотренных распределениях является смена максимума на минимум при изменении ранга момента на единицу. Однако если для распределения Пуассона и ОБР при целочисленных рангах находятся узлы, то для распределения с фиксированной множественностью – именно точки экстремумов.
332
Рис. 7.2. Моменты распределения с фиксированной множественностью в зависимости от ранга. Зависимости ln k j j и ln H j j представлены на врезках для (б) и (в) соответственно, Кривые соединяют точки при целых рангах и проведены для наглядности [38, 224]
Важно отметить, что амплитуды наблюдаемых осцилляций малы при больших множественностях (высоких энергиях) и могут быть полезными в действительности лишь для распределений с малой и средней множественностью. Данное условие при высоких
333
энергиях может реализовываться при рассмотрении малых областей фазового пространства. В то же время рост отрицательных моментов с увеличением n оказывается полезным при анализе структуры и особенностей распределений в полном фазовом пространстве [219]. §4. Уравнение Фоккера – Планка дробного порядка Распределение вероятности (распределение по множественности) и уравнение расщепления с помощью преобразования Пуассона трансформируются, соответственно, в плотность вероятности (в скейлинговую KNO-функцию) и уравнение Фоккера – Планка. Как было указано выше, интегродифференциальное исчисление дробных порядков имеет достаточно длинную историю. Однако уравнение Фоккера – Планка дробного порядка было введено для описания явления аномальной диффузии относительно недавно [225 – 228], при этом соответствующие производные дробных порядков заменили обычные производные по пространственным переменным и времени. Если производная дробного порядка для временной переменной введена в правую часть уравнения Фоккера – Планка, то это означает, что вводится своего рода задержка по времени или эффект памяти в уравнение Фоккера – Планка или в уравнение расщепления. Ниже рассмотрен более подробно данный тип уравнения Фоккера – Планка дробного порядка. Необходимо отметить, что решение указанного уравнения сводится к гамма-распределению в случае замены производной дробного порядка обычной производной. В данном параграфе рассматривается следующее уравнение Фоккера – Планка дробного порядка: z , t t (7.16) 2 2 z z, t 1 1 D0,t z z, t D0,t L z, t , z 2 z 2 с начальным условием z , t 0 z z0 .
334
1 Здесь 0 1, 0, 0 и – реальная постоянная, D0,t – дробная производная Римана – Лиувилля (2.26) по времени при t 0. Дифференциальный оператор обычного уравнения Фоккера – Планка в данном случае формально может быть записан в следую 2 2 щем виде: L z z . Важно отметить, что D0,0 t 1, 2 2 z z 0 то есть при 1 выполнено D0,t f t f t и уравнение (7.16)
переходит в обычное уравнение Фоккера – Планка с параметрами a z 2 z 2 и b z z. Необходимо отметить, что если в момент t0 распределение характеризовалось средней множественностью
n0 , то плотность
распределения по множественности pn t для момента времени t может быть связана с соответствующей скейлинговой КНО - функцией z, t с помощью преобразования Пуассона: n
n0 n pn t u exp n0 u u, t du. (7.17) n ! 0 Используя в данном параграфе стандартное определение (П3.5), с учетом последнего соотношения производящая функция может быть определена следующим образом:
1 z n0
u, t exp zu du. 0
В соответствии с методом, предложенным в [228], можно предположить, что
z , t Rs t Gs z ds, 0
и что функция Gs z удовлетворяет следующему уравнению: Gs z , LGs z s G0 z z z0 .
335
При выполнении указанных условий функция Gs z определяется по следующей формуле [229]: 1 2 2 zz0 1 p z z0 1 p 1 z Gs z exp I 1 kp kp kp z0 1 p и становится скейлинговой КНО-функцией. Здесь I x – модифицированная функция Бесселя, k 2 2 , 2 2 , p 1 e s . Применяя преобразование Лапласа к (7.16) можно получить 1 Rs u 1 Gs z ds 1 u R0 u z z0 , 0 uRs u u s
u R t exp ut dt – лапласов образ для R t . Далее где R s s s 0
можно предположить, что обе части полученного уравнения равны нулю, то есть справедливо u 1, u1 R 0 1 Rs u u . uR u s u Решением данной системы является R u u 1 exp su , тогда s
c i
Rs t
t 0 s 1 exp d , c0 0. 2 i c0 i t
Для дальнейшего рассмотрения предполагается, что 0. Тогда полученная выше формула для Gs z может быть переписана в виде следующего ряда по полиномам Лаггера Lm 1 x : 1
1 z m! z 1 z 1 z Lm Lm 0 exp m s . exp k k k m m 0 k k Необходимо отметить, что для функции Миттаг – Лефлера справедливо следующее интегральное представление: 1 exp xt sin , t 0. E t dx 0 x 2 2 x cos 1 Gs z
336
Таким образом, при z0 0 решение уравнения Фоккера – Планка дробного порядка (7.16) будет иметь вид z 1 m! z 1 z z , t exp Lm E m t . (7.18) k k m 0 m k При 1 данное выражение сокращается до гамма-распределения, представляющего собой скейлинговую KНО-функцию для ОБР. Производящая функция, соответствующая (7.18) и определению (П3.5), может быть записана как m
m k n 0 z 1 z E m t . m m ! 1 k n0 z 1 m 0
Можно показать, что при 1 данное выражение сокращается до
производящей функции ОБР NB z 1 n NB z 1 , где NB средняя множественность равна n k n0 1 exp t . На основе формулы для производящей функции можно получить следующее выражение для нормированных факториальных моментов целочисленного ранга: j
m
1 Cmj E m t j m 0 (7.19) fj j . j 1 E t Видно, что различие между нормированными факториальными моментами, полученными для уравнения Фоккера – Планка дробного порядка 0 1 , и соответствующими моментами для ОБР
1
определяется функцией Миттаг – Лефлера [229].
§5. Сравнение с экспериментом Ниже рассматриваются некоторые экспериментальные результаты и обсуждается эффект влияния производной дробного порядка на поведение моментов, являющихся экспериментально определяемыми характеристиками распределений по множественности.
337
Анализ экспериментальных данных и вычисление моментов H j в e e -столкновениях и pp pp -взаимодействиях был выполнен в широком интервале начальных энергий. Список экспериментальных данных с достаточно большой статистикой и детальным разделением упругих и неупругих событий при малых множественностях представлен в табл. 7.1. Таблица 7.1. Экспериментальные данные, использованные при вычислении отношений кумулянтных и факториальных моментов [38] Тип взаимодействия e e -аннигиляция
pp pp -столкновения
Эксперимент или спектрометр TASSO HRS TASSO TASSO ALEPH DELPHI L3 OPAL FNAL SMF-детектор (CERN) E743 (FNAL) SMF-детектор (CERN) SMF-детектор (CERN) UA5 -- // --- // --
S , ГэВ
22 29 34,8 43,6 91 -- // --- // --- // -23,8 30,4 38,8
Статистика событий, шт. 1913 29649 52832 8620 90000 47400 169700 82941 8477 37069 10217 26842 58196 4156 7775 6839
На рис. 7.3, 7.4 представлены зависимости моментов H j от их ранга j, вычисленные на основе приведенных в табл. 7.3 экспериментальных данных, для процессов e e -аннигиляции и pp pp взаимодействий соответственно. Хотя детальное поведение моментов H j зависит от типа взаимодействия, энергии и методических особенностей анализа данных в том или ином эксперименте, качественные черты этого поведения близки в обоих типах взаимодействия, особенно при энергиях S 60 ГэВ. Основные характерные черты поведения зависимости H j j сохраняются как в процессах
338
аннигиляции, так и в адронных столкновениях: быстрое падение при малых j с последующим главным минимумом, расположенном при j 4 6, и дальнейшими осцилляциями. Однако амплитуда осцилляций в адронных взаимодействиях примерно на порядок больше, чем в e e -аннигиляции.
Рис. 7.3. Поведение моментов H j в зависимости от ранга момента j для e e аннигиляции при различных энергиях (экспериментальные группы идут в том порядке, как они представлены в табл. 7.1, то есть увеличение энергии идет по мере перехода сверху вниз). Слева – низшие моменты в логарифмической шкале, справа – высшие моменты в линейном масштабе [38]
339
Рис. 7.4. Поведение моментов H j в зависимости от ранга момента j для pp pp столкновений при различных энергиях (экспериментальные группы идут в том порядке, как они представлены в табл. 7.1, то есть увеличение энергии идет по мере перехода сверху вниз). Слева – низшие моменты в логарифмической шкале, справа – высшие моменты в линейном масштабе [38]
В то же время, имеется количественная разница даже в результатах экспериментов на электрон-позитронном коллайдере LEP при одинаковой энергии S 91 ГэВ. Вероятно, это обусловлено несколько различным отбором используемых в анализе событий в
340
разных экспериментах и систематическими погрешностями. На это указывает также сравнение результатов использования различных генераторов событий, использующих метод Монте–Карло, с данными экспериментов: различия в поведении зависимости H j j для e e -аннигиляции на LEP обусловлено деталями того или иного эксперимента, а не динамикой процесса взаимодействия. Таким образом, для детального сравнения теоретических предсказаний и результатов эксперимента необходимы как более прецизионные данные, так и более совершенный контроль методики обработки и погрешностей. Как было указано выше, ОБР часто используется для анализа наблюдаемых на эксперименте распределений по множественности в процессах адрон-адронных hh и e e - столкновений при высоких энергий. Примеры сравнения значений H j -моментов, вычисленных на основе экспериментальных данных, и теоретических предсказаний с использованием ОБР для различных взаимодействий представлены на рис. 7.5 [38].
Рис. 7.5. Зависимость H j j по данным эксперимента DELPHI для e e - аннигиляции (а) [230] и эксперимента UA5 для pp -взаимодействий (б) [231]. Штриховой линией показаны теоретические зависимости, полученные с использованием ОБР
341
Здесь, как и выше, ввиду большого различия в числовой величине, данные при малых j выделены в виде врезки, где заметен быстрый спад отношения кумулянтных и факториальных моментов соответствующих рангов. В основной части рис. 7.5 как для электрон-позитронной аннигиляции, так и для pp -столкновений видны два отрицательных минимума (при j 5 и 12 ) и два положительных максимума (при j 8 и 15 ). Важно отметить, что предсказания ОБР демонстрируют уменьшение величин моментов H j с ростом их рангов, но не имеют максимумом и минимумов, то есть моменты H j , полученные из производящей функции ОБР, не демонстрируют осциллирующего поведения при увеличении ранга. Таким образом, можно утверждать, что ОБР способно воспроизвести лишь основные детали экспериментальных распределений по множественности (соответственно, поведение моментов H j низших рангов), но не их более тонкие особенности (осцилляции при больших значениях j ). В настоящее время существуют несколько модельно зависимых физических интерпретаций наблюдаемых осцилляций. В частности, данные осцилляции могут быть связаны с рождением различного числа подструй [1, 38]. Важно то, что осцилляции моментов H j вызваны динамическими особенностями процесса взаимодействия и однозначно указывают на то, что феноменологические модели адронизации, в которых образуются кластеры, распределенные по пуассоновскому закону, не пригодны для точного описания экспериментальных данных [38]. Для вычисления моментов H j на основе уравнения Фоккера – Планка дробного порядка в [230] были использованы наблюдаемые значения nch
и C 2 nch2
nch
2
для заряженных частиц. Тогда,
при фиксированных и t , параметр в (7.19) определяется следующим выражением: 2
1 E t 1 2 1 C 1. nch 1 2 E t E 2 t
342
Представленные ниже результаты расчетов соответствуют случаю 0,5. На рис. 7.6,а вычисленные H j -моменты сравнены со значениями данных моментов, вычисленных на основе экспериментальных данных для e e -столкновений при энергии S 91 ГэВ [232]. Параметр подбирался с шагом 0,01 так, чтобы первый относительный минимум вычисленного H j -момента был наблюден при
j 5. Из рис. 7.6,а видно, что сила осцилляций вычисленных для уравнения Фоккера – Планка дробного порядка H j -моментов сопоставима с осцилляциями моментов, вычисленных на основе экспериментальных данных. Тем не менее период осцилляций и положение первого относительного минимума различаются для данных, полученных на основе (7.16) и в эксперименте. Сравнение результатов расчетов при значении 1,0 66,82 и при величине
2,0 10,24 с моментами H j , вычисленных на основе экспериментальных данных по pp -столкновениям при начальной энергии S 546 ГэВ [231], представлено на рис.7.6,б. Видно, что вычисленные значения H j -моментов для первого набора параметров демонстрируют осцилляции такой же силы, что и экспериментальные данные. Необходимо отметить, что если параметр подбирается с шагом 0,01 таким образом, чтобы выполнялось следующее условие: первый относительный минимум вычисленного H j -момента должен быть наблюден при j 5, то вычисленное значение первого относительного минимума оказывается равным H 7 3,323105. Полученное абсолютное значение H 7 оказалось намного меньше значения, полученного из экспериментальных данных. Важно отметить, что подобные исследования (7.16) были выполнены также в [233] и привели к несколько отличным конечным формулам. Для вычисления моментов H j в адрон-адронных взаимодействиях также использовалось усеченное ОБР, при этом результаты
343
данных вычислений могли достаточно хорошо описывать экспериментально наблюдаемое поведение данных моментов на качественном уровне [234, 235]. Однако важно отметить, что даже если для вычисления H j -моментов используется усеченное ОБР, осцилляции полученных значений H j -моментов оказываются намного слабее, чем наблюдаются для H j -моментов, полученных на основе экспериментальных данных, в частности, в процессах электронпозитронной аннигиляции [236].
Рис.7.6. Вычисленные для уравнения Фоккера – Планка дробного порядка моменты H j как функции ранга j в сравнении с H j -моментами, вычисленными на основе экспериментальных данных для e e - (а) и pp - столкновений (б) [229]
Таким образом, использование уравнения Фоккера – Планка дробного порядка, то есть введение дробной производной по времени, позволяет улучшить описание экспериментальных данных как для электрон-позитронной аннигиляции, так и для адронных взаимодействий при высоких энергиях. За последние годы достигнут заметный прогресс в сближении на качественном уровне предсказаний КХД и данных эксперимента о распределении по множественности вторичных частиц, достигнуто понимание того, насколько важны те или иные приближения в теоретических подходах и детали экспериментального анализа для выполнения сравнения на количественном уровне. Тем самым создана реальная основа
344
для прецизионного подхода к проблеме описания распределения по множественности в целом [38]. Однако необходимы дальнейшие исследования как для получения согласованных результатов, так и для более точного описания экспериментальных данных. Контрольные вопросы 1. Дайте определение распределения по множественности. 2. Приведите формулы для плотности распределения эксклюзивного и инклюзивного процессов. 3. Получите прямые и обратные формулы, связывающие инклюзивные плотности распределений и кумулянтные корреляционные функции низших порядков. 4. Приведите формулы для моментов дробных порядков, справедливые в общем случае. Рекомендуемая литература 7.1.1
Kendall M.G., Stuart A. The Advanced Theory of Statistics. V.1. London: C. Griffin and Co., 1969.
1
Данная книга полезна для более углубленного изучения корреляционного анализа, в частности, здесь приведены формулы для кумулянтных корреляционных функций более высоких порядков.
345
Глава 8 ФЕМТОСКОПИЯ И УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ
§1. Метод интерферометрии При высоких энергиях частицы и ядра, столкнувшись, образуют некую область, в которой происходит образование вторичных частиц и из которой данные частицы испускаются1. Одна из наиболее важных задач заключается в определении пространственновременных параметров данной области, установлении фундаментальной связи между геометрией источника эмиссии вторичных частиц и динамикой его образования. Решающим здесь оказалось установление физической аналогии между парными корреляциями тождественных частиц, образующихся в столкновениях квантовых объектов, и корреляциями фотонов, испускаемых оптическими источниками, в частности звездами. Как известно, Ханбери-Браун и Твисс показали, что регистрация двухфотонных корреляций позволяет измерить угловые размеры звезды. С другой стороны, пионы распространяются в пространстве по таким же волновым законам, как и фотоны. Поэтому в принципиальном плане источник пионов аналогичен звезде, излучающей фотоны, а тогда должен существовать некоторый аналог астрономического метода Ханбери-Брауна и Твисса, позволяющий измерять размеры области генерации пионов. Такой метод, как выяснилось, существует и назван НВТинтерферометрия (НВТ – английское сокращение от фамилий Ханбери-Браун и Твисс соответственно). Это очень мощный метод для определения пространственно-временных параметров области излучения.
1
Для столкновения ядер данная область имеет исторически устоявшееся название – «файербол» – и характеризуется значительными, по масштабам сильного взаимодействия, пространственно-временными размерами.
346
В данной главе рассмотрены корреляции только тождественных частиц. За рамки изложения выведена очень значительная и прогрессирующая часть фемтоскопии, а именно, корреляции в парах нетождественных частиц и взаимодействие в конечном состоянии. За последнее время накоплен очень существенный массив экспериментальных результатов по фемтоскопии, особенно для столкновений релятивистских тяжелых ядер. Обзор новых и важных результатов может составить предмет отдельной книги и сознательно не рассматривается здесь. Данная глава сфокусирована на основных положениях формализма корреляционного анализа и использованию именно распределений общего типа для исследований в области фемтоскопии. 1.1. Краткая историческая справка Сама идея определять размеры объектов по интерференции двух бозе-частиц – а именно, двух фотонов видимого света – пришла в физику микромира из области астрономии, то есть из физики мегамира, в которой выполняются измерения размеров объектов, находящихся на противоположном, по отношению к квантовой физике, конце линейных масштабов. Р. Ханбери-Браун и Р. Твисс впервые применили метод интерферометрии интенсивностей для двух фотонов в астрономии при определении угловых диаметров звезд. Для сохранения когерентности сигналов данный интерферометр должен был обладать (очень) большой базой. Первый звездный амплитудный интерферометр появился в 1955 г. Это оборудование использовалось для проведения первого измерения углового диаметра самой яркой звезды северного полушария – Сириуса. Схема данного эксперимента представлена на рис. 8.1. Данный эксперимент выполнял роль контрольного, одна из основных задач которого состояла в демонстрации применимости метода корреляций интенсивности. После успешного измерения углового диаметра двух звездных радиоисточников данный метод был использован для измерения углов ого размера видимых звезд. Успех первого эксперимента обусловил строительство звездного амплитудного интерферометра в астрономическом центре в Найроби (Австралия), закончен-
347
ного в 1963 г. Гигантские рефлекторы обсерватории Найроби, имеющие параболические поверхности диаметром 7,3 м с фокусной длиной 12 м (рис. 8.2), были установлены на тележках, перемещавшихся по окружной железной дороге, диаметр которой был 206 м. Каждое зеркало сосредотачивало свет от звезды на фотоумножитель, расположенный в фокусе. Существенным компонентом экспериментальной установки был так называемый коррелятор, то есть радиосхема, которая получала сигналы от обоих зеркал и выполняла их сложение. Ханбери-Браун Р. описал это так: «они ... собирают свет в ковш как дождь ...».
а) б) Рис. 8.1. Фотография с воздуха (а) и схема аппаратуры (б) для измерения углового диаметра Сириуса [237].
Рис. 8.2. Рефлекторы в астрономической обсерватории Найроби, используемые в эксперименте Ханбори-Брауна и Твисса [237]
348
Таким образом, первоначально метод корреляций был использован для определения угловых диаметров звезд главной последовательности [238, 239]. Авторы назвали данный метод «интерферометрия интенсивности». В течение последних 50 лет изучение корреляций интенсивности превратилось в обширную область исследований с заметными достижениями не только в квантовой оптике, физике твердого тела и астрономии, но и в физике высоких энергий и релятивистской ядерной физике [240 – 243]. Начало применению метода интерферометрии в физике фундаментальных взаимодействий было положено в 1959 г., когда Дж. Голдхабер, С. Голдхабер, В.-Е. Ли и А. Пайс выполнили эксперимент в лаборатории Беркли (США), цель которого состояла в открытии 0 -резонанса [244]. В эксперименте изучались pp столкновения при импульсе пучка 1,05 ГэВ/c. Авторы пытались обнаружить резонанс при изучении предполагаемого канала распада 0 , измеряя массовое распределение для пар пионов с различным зарядом и сравнивая его с распределением для пар одинаково заряженных пионов . Впоследствии при анализе экспериментальных данных выяснилось, что набранной статистики было недостаточно для обнаружения 0 -мезона. Однако была обнаружена неожиданная угловая корреляция для пар тождественных пионов. Позже, в 1960 г., авторы успешно воспроизвели эмпирическое угловое распределение, используя симметризованные волновые функции для пар тождественных частиц. Сделав это, Дж. Голдхабер, С. Голдхабер, В.-Е. Ли и А. Пайс заключили, что обнаруженный эффект был проявлением статистики Бозе – Эйнштейна, которой подчиняются пары тождественных заряженных пионов. Они не знали об эксперименте Ханбери-Брауна и Твисса в астрономии. Таким образом, в столкновениях частиц при высокой энергии был обнаружен, достаточно случайно, аналог эффекта, наблюдаемого в астрономии и используемого для определения некоторых геометрических характеристик (размера) источника излучения. В физике высоких энергий данный метод получил название
349
HBT-интерферометрии 1. Физической основой нового метода корреляционного анализа является тот факт, что тождественные частицы, располагающиеся близко в фазовом пространстве, испытывают квантовые статистические эффекты, возникающие благодаря (анти)симметризации многочастичной волновой функции. Поэтому для бозонов / фермионов скорость двухчастичных совпадений демонстрирует рост / уменьшение для близких в фазовом пространстве пар частиц, то есть для пар частиц с малыми относительными импульсами. Важно отметить, что диапазон относительных импульсов, в котором наблюдается данное превышение / уменьшение, может быть связан в силу соотношения неопределенности с линейными размерами источника частиц в обычном координатном пространстве. В 1972 г. Г.И. Копылов и М.И. Подгорецкий предложили использовать особенности поведения корреляционной функции при малых разностях импульсов частиц пары для изучения размеров и формы области взаимодействия2. Они рассматривали влияние на поведение корреляционной функции как эффекта Бозе для пар тождественных заряженных пионов, так и принципа Паули для пар протонов. В 1977 г. С.Е. Кунин учел влияние сильного и электромагнитного взаимодействия в конечном состоянии и рассчитал соответствующие разным расстояниям корреляционные функции для пар протонов, вылетающих из ядер. В 1982 г. эти нетривиальные, зависящие от деталей взаимодействий, расчеты были повторены Р. Ледницки и В.Л. Любошицем. В учете взаимодействий в конечном состоянии у С.Е. Кунина были предшественники. А.Б. Мигдал и К.М. Ватсон еще в 50-х годах, рассматривая механизм образования дейтонов, вылетающих из ядер, предложили модель слияния в дейтон протона и нейтрона на границе ядра. Эта гипотеза не только описывает ряд экспериментально найденных закономерностей об1
Обнаруженный Дж. Голдхабером, С. Голдхабером, В.-Е. Ли и А. Пайсом эффект также часто упоминается в литературе как HBT-, или GGLPэффект, или интерферометрия интенсивности, или просто как бозеэйнштейновкие (BE) корреляции. 2 Поэтому в литературе для метода исследования геометрии источника частиц на основе поведения двухчастичной корреляционной функции можно встретить термин «метод Копылова – Подгорецкого».
350
разования дейтонов, но и позволяет по величине коэффициента слияния найти также размеры области, из которой вылетели протон и нейтрон. Это соотношение было найдено в 1981 г. японскими физиками Х. Сато и К. Язаки. Оно дает в соответствующих условиях размеры области реакции в согласии с данными о поведении корреляционной функции [245]. Экспериментальные исследования в этой области начались с работ, посвященных наблюдению эффекта интерференции пионов и измерению размеров протона. Затем в число исследуемых объектов попали ядра, размеры области взаимодействия в которых были исследованы по парам нейтронов, и даже по парам дейтонов и pd парам. В настоящее время растет число исследований корреляционной функции как в p -, pp -, pA -, eA -реакциях, так и в процессах аннигиляции и AA -взаимодействиях. В последние годы интерес к изучению корреляционных функций в ядерных реакциях значительно усилен благодаря поискам нового экзотического состояния сильновзаимодействующей материи – КГП, которое может образовываться в экстремальных условиях высокой температуры и плотности ядерного вещества. Необходимо отметить, что как в астрономии, так и в физике элементарных частиц при открытии метода HBT-интерферометрии рассматривались тождественные частицы. Поэтому данное название справедливо только при рассмотрении пар тождественных частиц, корреляции которых обусловлены проявлением статистик Бозе – Эйнштейна или Ферми – Дирака. Однако в последние годы интенсивно развиваются исследования корреляций пар нетождественных частиц, позволяющие получить дополнительную важную информацию о структуре и геометрии источника испускания. Определяемые размерные параметры источника в физике фундаментальных взаимодействий имеют значения порядка одного ферми. Под фемтоскопией, в общем случае, понимают область науки об измерении объектов с размерами порядка 1 фм. Термин «фемтоскопия» есть точная копия более широко известного термина «микроскопия», под которым подразумевается наука о способах измерения и изучения объектов микронных размеров. Однако в
351
физике фундаментальных взаимодействий под «фемтоскопией», как правило, подразумевается следующее. Определение 8.1. Направление корреляционного анализа в физике фундаментальных взаимодействий, изучающее корреляции пар частиц (как тождественных, так и нетождественных) с малыми относительными импульсами и / или скоростями, называется фемтоскопией. Важно отметить, что данное, более конкретное и развернутое, определение полностью совпадает с общим случаем, поскольку в настоящее время, по крайне мере, только двухчастичные корреляции являются единственным экспериментальным методом для определения пространственно-временной протяженности источника эмиссии в физике частиц и атомного ядра. Ниже основное внимание будет уделено корреляциям тождественных частиц, то есть именно методу HBT-интерферометрии. 1.2. Принципы метода HBT Как было указано выше, при изучении некоторого источника излучения, характеризуемого конечной пространственно-временной протяженностью, в настоящее время в физике вообще и в физике фундаментальных взаимодействий, в частности, широко используется приближение точечных источников. На рис. 8.3 представлена общая схема эксперимента по интерферометрии (рис. 8.3,а), а также схемы, характерные для астрономических наблюдений (рис. 8.3,б) и для исследований в физике элементарных частиц и атомного ядра (рис. 8.3,в). Рассмотрим два точечных источника a и b, располо женные на расстоянии R друг от друга, испускающие некоторые тождественные частицы (фотоны, пионы, протоны и так далее) с одинаковой энергией E p m 2 p 2 , которые, после прохождения расстояния L, регистрируются детектирующими элементами 1 и 2, расположенными друг от друга на расстояние d (рис. 8.3,а). При этом расстояние L должно быть много больше, чем R и d . Данное условие может считаться выполненным как в астрономии, так и в физике микромира. Важно отметить, что вследствие неразличимости рассматривае-
352
мых частиц существуют два возможных пути их попадания на данный детектирующий элемент, изображенные двумя сплошными линиями. Таким образом, результирующий сигнал в детекторе представляет собой суперпозицию сигналов от тождественных частиц, испущенных каждым из точечных источников и прошедших различные расстояния до данного детектирующего элемента.
Рис. 8.3. Схематическое изображение эксперимента по интерференции в общем случае (а). Экспериментальные схемы, применяемые в астрономии (б) и в физике фундаментальных взаимодействий (в) [242]
Амплитуда результирующего сигнала в детекторе j j 1,2 определяется следующим образом: 1 Aj exp i prja a exp i prjb b , L где , a и , b – амплитуды и фазы волн, описывающих испущенные частицы, в пространственных точках a и b соответственно, rja и rjb – расстояния от данных точечных источников до
детектора j. Интенсивность результирующего сигнала равна: 1 2 2 2 Re exp i p rjb rja b a . 2 L Второе слагаемое в данной формуле, содержащее информацию о расстоянии R между точками эмиссии частиц a и b, то есть о про2
I j Aj
353
странственном распределении протяженного источника. Данное слагаемое пропадает после усреднения сигнала по времени:
2
j 1,2 : I j
2
L2 .
Отсюда видно, что произведение средних по времени интенсивностей результирующих сигналов в двух детекторах I1 I 2 не зависит от пространственных параметров эксперимента R и d . Однако для усредненного по времени произведения интенсивностей результат получается другой: 2 2 2 I1 I 2 I1 I 2 4 cos p r1a r2 a r1b r2 b . L Определение 8.2. Двухчастичной корреляционной функцией в рамках метода интерферометрии интенсивностей (HBT-метода) называется отношение среднего по времени произведения интенсивностей к произведению средних по времени интенсивностей: 2 2 I1 I 2 2 C2 R , d 1 cos p r1a r2 a r1b r2 b . (8.1) 2 2 2 I1 I 2
Для асимптотического случая L R, d пространственный множитель аргумента второго, осциллирующего слагаемого, имеет следующий вид: dR r1a r2a r1b r2b LR,d cos d , R cos d , L cos R, L . L Данное выражение симметрично относительно R и d . Однако данная симметрия исчезает в двух важных с практической точки зрения предельных случаях. 1. В астрономии, вследствие того, что точечные источники a и b являются частью поверхности звезды или объектов, характеризуемых даже более значительными линейными масштабами, величина R сопоставима с диаметром звезды. Детекторы расположены на поверхности Земли, то есть величина d имеет порядок метров или километров. Поэтому в астрономии реализуется следующее условие: R d . В данном случае (см. рис. 8.3,б) косинус в (8.1) пре вращается в cos d pa pb , где pa ,b pea ,b и единичные векторы ea ,b направлены от детекторов к точкам излучения a и b. Для оп-
354
ределения углового размера объекта экспериментально варьируется параметр d и искомая величина pa pb . 2. В физике ядра и элементарных частиц реализуется другой предельный случай (см. рис. 8.3,в): линейные размеры всего протяженного источника намного меньше расстояния, разделяющего детекторы: R d . Тогда косинус в (8.1) может быть записан в следую щем виде: cos R p1 p2 . В данном случае главная эксперимен тальная переменная – разность импульсов p1 p2 . Как было указано выше, в действительности источник эмиссии вторичных частиц, особенно в столкновениях атомных ядер, характеризуется некоторым пространственным (и временным) распреде лением точек эмиссии с плотностью R . Для случая R d по-
сле усреднения (8.1) по распределению относительных расстояний между точками испускания, измеряемая экспериментально корреляционная функция будет иметь следующий вид: C2 p1 p2 1 d 3 R R cos R p1 p2 .
Таким образом, измеряя корреляционную функцию и выполняя обратное преобразование Фурье, можно получить информацию о геометрической структуре (линейные размеры, пространственное распределение) источника вторичных частиц. Важно отметить, что данное выражение справедливо только в случае статичных источников, что соответствует простейшему приближению. В случае столкновения тяжелых ядер, особенно при релятивистских энергиях, источник эмиссии испытывает существенное изменение геометрии за малый промежуток времени, то есть является быстро эволюционирующим. Как результат, двухчастичные корреляции, измеряемые в столкновениях тяжелых ионов, с одной стороны, несут более разнообразную информацию о структуре источника, с другой – интерпретация результатов фемтоскопии становится более сложной и менее однозначной. §2. Метод HBT в физике микромира Ниже рассматриваются корреляции тождественных частиц. Наряду с общими подходами, основное внимание уделяется двухчас-
355
тичной корреляционной функции для столкновений тяжелых ионов при высоких энергиях. При рассмотрении корреляций, для исключения путаницы с обозначениями теории вероятностей, будут использоваться следующие обозначения для 4-вектора координаты и импульса, соответственно: x t , x и импульса k E , k . Ис-
пользование именно 4-векторов позволит обобщить большинство результатов для релятивистской области. Важно отметить, что при изучении физики микромира используются не интенсивности, а сечения и различные распределения (спектры) вторичных частиц. 2.1. Определение корреляционной функции Важно отметить, что в различных источниках даются разные определения корреляционной функции в области фемтоскопии. Следуя изложенному выше общему формализму построения корреляционных функций в многочастичных процессах, можно дать следующее определение. Определение 8.3. В физике фундаментальных взаимодействий двухчастичная корреляционная функция в области фемтоскопии определяется как отношение двухчастичной инклюзивной плотности распределения (сечения) к произведению одночастичных инклюзивных плотностей (сечений): pi k , k C2 k1 , k2 i 2 1 i 2 p1 k1 p1 k2 (8.2) d 2 k1 , k2 1 , in d dk1 d dk 2 где k1 и k 2 – 4-векторы импульсов частиц пары, in – полное сечение неупругого взаимодействия налетающей частицы. В (8.2) была учтена приведенная выше взаимосвязь инклюзивных плотностей pni xn и дифференциальных сечений. Важно отметить, что в рамках данного определения во втором равенстве естественным образом возникает нормировочный множитель, обеспечивающий безразмерность корреляционной функции. Учитывая (7.9), справедлива следующая взаимосвязь корреляционной функции в области
356
фемтоскопии и нормированной кумулянтной корреляционной функцией: K 2 k1 , k2 C2 k1 , k 2 1. В трехмерном случае корреляционная функция часто определяется как отношение соответствующих импульсных распределений, поскольку d n const d n N , где d n N – число отсчетов в канале гистограммы, const – постоянная соответствующей размерности. Учитывая безразмерность величин d n N , корреляционная функция может быть определена следующим образом. Определение 8.4. В физике фундаментальных взаимодействий двухчастичная корреляционная функция в области фемтоскопии определяется как отношение инвариантного двухчастичного импульсного распределения к произведению одночастичных импульсных распределений: d 6 N k1 , k2 dk1dk2 C2 k1 , k2 (8.3) . dN 3 k1 dk1 dN 3 k 2 dk2 Поскольку C2 k1 , k 2 представляет собой отношение инвариант-
ных распределений по импульсу, то данная корреляционная функция также является инвариантной наблюдаемой. Данное свойство может быть подчеркнуто использованием соответствующего обозначения C2 k1 , k 2 и в определении (8.3). В данном определении одно- и двухчастичные сечения нормированы на среднее число частиц n и на среднее число пар частиц рассматриваемого типа n n 1 в событии соответственно. Видно, что определения (8.2)
и (8.3) совпадают с точностью до постоянного множителя. Различные нормировки, используемые для двухчастичной корреляционной функции, подробно описаны в [246, 247]. Без уменьшения общности и для простоты рассмотрения ниже предполагается, что при больших относительных импульсах корреляционная функция стремится к единице. Таким образом, влиянием дальнодействующих корреляций и различием нормировочных коэффициентов в (8.2) и (8.3) можно пренебречь. Однако нормировка играет более существенную роль при изучении эффектов симметрии в многочастичных корреляциях и в таких случаях требуется более акку-
357
ратный учет нормировки соответствующих корреляционных функций [248 – 252]. Как правило, корреляционная функция изучается в зависимости от следующих переменных, смысл которых явно следует из их определения: k k K 1 2 ; q k1 k 2 . 2 При рассмотрении релятивистского случая для определения корреляционной функции в обрасти фемтоскопии удобным оказывается формализма функции Вигнера. 2.2. Формализм функции Вигнера В рамках данного подхода эмиссия частиц характеризуется функцией источника или, другими словами, функцией эмиссии S x, k . В нерелятивистском пределе эта функция соответствует производной по времени от функции Вигнера, которая, в свою очередь, непосредственно является квантово-механической аналогией для классического распределения в фазовом пространстве, и эта же функция S x , k может также рассматриваться как релятивистская, ковариантная форма функции Вигнера. Часто в литературе S x , k называется также эффективной одночастичной вигнеровской плотностью (источника)1. Наиболее прямая связь между измеренными двухчастичными корреляциями в импульсном пространстве и распределением источника в координатном пространстве может быть установлена, в случае если частицы испускаются независимо (приближение полностью хаотического источника) и свободно распространяются от источника к детектору [250, 251, 253 – 259]. Тогда инвариантное распределение по импульсу и двухчастичная корреляционная функция могут быть выражены в формализме функции Вигнера следующим образом:
1
Определенная таким образом плотность является действительной, но не всегда положительно определенной величиной.
358
E
d dN E 3 d 4 xS x, k , 3 d k d k
d
C 2 q, K 1
4
x S x, K exp iqx
2
, q 4 q d x1 S x1, K 2 d x2 S x2 , K 2 где в формуле для корреляционной функции верхний знак соответствует бозонам, нижний – фермионам. Функция источника S x , K , при условии положительной определенности, может рассматриваться как вероятность того, что частица с импульсом K испущена из пространственно-временной точки x в области столкновения. Важно отметить, что различные источники приведенного выше соотношения для C2 q, K дают различные микроскопические интерпретации функции Вигнера [260]. Отличия в интерпретациях могут становиться концептуально важными для источников с большой плотностью в фазовом пространстве [252]. До ввода в строй LHC и начала тяжелоионной программы исследований даже в столкновениях тяжелых ядер при высоких энергиях достигнутые фазово-пространственные плотности при «застывании» являются достаточно низкими, что позволяет пренебрегать отличиями в интерпретациях S x, K [261, 262]. Вводя S q, K d 4 x exp iqx S x, K , формулу для корреляци4
онной функции можно записать в виде 2 C2 k1 , k2 1 S q, K S 0, k1 S 0, k 2 . Две измеряемые частицы, для которых вычисляется корреляционная функция, находятся на массовой поверхности, то есть для них выполнено i 1,2 : ki0 Ei m 2 ki2 , где m – масса рассматриваемых тождественных частиц. В то же время, эволюция корреляционной функции рассматривается вне массовой поверхности, то есть q и K находятся вне массовой поверхности. Для массовой поверхности выполнено условие ортогональности qK 0. Приведенные выше выражения для корреляционной функции трудно решаемы и не применимы непосредственно для анализа
359
экспериментальных данных, поскольку требуют a priori знания функции источника. Поэтому данные выражения требуют дальнейшего упрощения в рамках некоторых дополнительных предположений. Для этого используется приближение гладкой аппроксимации [263 – 265], то есть предполагается, что функция источника имеет гладкую зависимость от импульса и справедливо q q S x1 , K S x2 , K S x1 , K S x2 , K . 2 2 Тогда приведенные выше выражения для корреляционной функции можно переписать следующим образом: C 2 q, K 2 2 (8.4) d 4 x S x , K exp iqx S q, K 2 1 1 1 K , 2 4 S 0, K d x S x, K где exp iqx является функцией K благодаря функции источника. Важно отметить, что справедливость приближения гладкой аппроксимации была проверена для расширяющихся источников, находящихся в термодинамическом равновесии. Было обнаружено, что данное приближение очень хорошо выполняется и является вполне разумным для источников с большими пространственновременными размерами, подобными тем, которые были экспериментально наблюдены в столкновениях релятивистских тяжелых ионов при энергиях RHIC. Однако применимость приближения гладкой аппроксимации для адрон-адронных pp, pp и электронпозитронных столкновений является гораздо менее очевидной и представляет собой предмет для серьезных дополнительных исследований и обсуждений [266]. Выражение (8.4) допускает дальнейшее упрощение в частном случае факторизуемой функции источника: S x, k f x g k . (8.5) Нормировка выбрана таким образом, что справедливо
d
4
xf x 1,
d
4
kg k n .
Одночастичный спектр записывается в следующем виде:
360
N1 k d 4 xS x , k g k . Предполагая хаотическую эмиссию частиц и справедливость приближения плоской волны, двухчастичная симметризованная для статистики Бозе – Эйнштейна волновая функция запишется как 1 k1 ,k2 x1 , x2 exp ik1 x1 ik 2 x2 exp ik1 x2 ik 2 x1 . 2 В формализме Яно – Кунина [267] двухчастичное импульсное распределение определяется следующим образом: 2
2
N 2 k1 , k 2 d 4 x1d 4 x2 S xi , ki k1 ,k2 x1 , x2 . i 1
Соответственно, результирующая двухчастичная корреляционная функция определяется как 2 C2 k1 , k2 1 f q , f q d 4 x exp iqx f x . (8.6) где нижний знак получается для фермионов при использовании, соответственно, антисимметричной ВФ для статистики Ферми – Дирака. Образ Фурье f q плотности источника в координатном пространстве f x , при условии положительной определенности функции источника, может рассматриваться в качестве характеристической функции для распределения источника (в координатном пространстве). Соотношение (8.6) позволяет на основе экспериментальных данных получать информацию об абсолютном значении квадрата образа Фурье для функции распределения источника вторичных частиц в координатном пространстве. Необходимо отметить, что при высоких энергиях, в силу того, что образуется много вторичных частиц, экспериментально регистрируются не все частицы и поэтому измеряется, как правило, инклюзивное сечение. В данном случае формализм ВФ неприменим и свойства симметрии тождественных частиц выражаются коммутационными соотношениями операторов рождения и уничтожения в методе вторичного квантования. Вторичное квантование посредством понятия «матрица плотности» обеспечивает глубокую связь между корреляциями и распределением по множественности. Это
361
видно из определения 8.3, носящего общий характер и применимого для инклюзивных реакций при высоких энергиях. 2.3. Проблема обратимости Одной из основных задач корреляционного анализа является извлечение информации о пространственно-временной структуре источника, то есть о функции S x, k , на основе экспериментально измеренной функции C2 q, K . Для этого формально необходимо выполнить обратные преобразования. Существенно отметить, что поскольку двухчастичная корреляционная функция определяется модулем образа Фурье распределения источника, то данная функция нечувствительна к фазе фурьепреобразования. Таким образом, указанный квадрат модуля фурьеобраза дает возможность измерить только распределение относительных координат источника, но они не чувствительны к параметрам смещения, например, к координатам центра распределения источника в пространстве-времени. Условие ортогональности, справедливое для массовой поверхности, позволяет исключить одну из четырех компонент относительного 4-импульса пары q : qK 0 q 0 q , где K K 0 – скорость пары. Таким образом, имеются только три независимых компоненты 4-вектора q. Формулу (8.4) можно переписать следующим образом: C 2 q, K 1 2 2 4 d 4 x S x, K exp iq x t d x S t , x t , K exp iqx . 4 4 d x S x , K d x S x , K
Видно, что обратное преобразование Фурье данного выражения не может быть выполнено только с тремя независимыми компонента ми q. Таким образом, пространственно-временная структура источника не может быть полностью восстановлена обратным преобразованием Фурье экспериментально измеренной корреляционной
362
функции. Разделение пространственной и временной структуры источника требует дополнительных модельно зависимых гипотез о функции S x, k . Для решения данной проблемы был предложен, в частности, метод изображений, подробно описанный в [268], суть которого заключается в следующем. Вводится нормированная функция распределения по относительному расстоянию, представляющая собой свертку одночастичных функций испусканий: S x, K x x d x, k d 4 ys y , K s y , K , s x, K . (8.7) 4 2 2 d xS x, K Тогда, согласно [260] справедливо:
C2 q, K 1 d 4 x cos qx d x, K d 3 x cos qx SK x , где S K x – относительная функция источника, определяемая следующим образом:
S K x dtd t , x t ; K . В системе покоя пары, то есть при 0, функция S K x пред-
ставляет собой интеграл по времени функции распределения по относительному расстоянию d t, x ; K и, таким образом, временная структура источника оказывается полностью интегрируемой. С другой стороны, функция S K x для каждого значения импульса пары K полностью реконструируется на основе экспериментально измеренной корреляционной функции с помощью обратного 3мерного преобразования Фурье. Детальный анализ формы двухчастичной корреляционной функции достаточно сложен, но важен потому, что данная форма несет информацию о пространственно-временной структуре процесса эмиссии частиц. Относительно недавно был предложен модельно-независимый метод для анализа формы данной функции [269]. Метод основан на экспериментально оптимизированных функциях и полном наборе ортогональных полиномов, где ортогональность определяется относительно оптимизированной весовой функции. В частном случае приблизительно гауссовых корреляционных функций, метод приводит к разложению Эджуорта, и пол-
363
ным набором ортогональных полиномов являются полиномы Эрмита. В случае приблизительно экспоненциальной формы, разложение дается в терминах полиномов Лаггера. Для приблизительно сферических распределений разложение может быть выполнено по сферическим гармоникам [269]. Разложение Эджуорта и Лаггера являются очень общими методами для изучения и характеристики двухчастичной корреляционной функции. Данные методы зависят только от следующих экспериментальных условий: 1) функция корреляции имеет тенденцию к выходу на константу при больших значениях относительного импульса пары q; 2) корреляционная функция отклоняется от своей асимптотики, наблюдаемой при больших q, в некоторой определенной области своего аргумента. Для простоты предполагается, что область, где корреляционная функция отклоняется от своего асимптотического значения, другими словами, местоположение ее нетривиальной структуры, является область вблизи q 0, что полностью соответствует всей полученной до настоящего времени совокупности экспериментальных результатов. Данное условие подразумевает, что разложения Эджуорта и Лаггера могут быть применены ко всем видам данных, которые удовлетворяют свойствам 1) и 2), поскольку бозонные / фермионные свойства наблюдаемых частиц не используются. Такие разложения полезны, если изучают и пытаются характеризовать на количественном уровне короткодействующие корреляции в рамках единого общего подхода, и если не делается попытка связать структуру формы корреляционной функции с особенностями изучаемой пространственно-временной картины взаимодействия1. На основе рассмотренной выше общей методики была выработана процедура для получения модельно-независимой характеристики корреляционной функции с учетом следующего дополнительного предположения: 3) двухчастичная функция корреляции связана преобразованием Фурье с пространственно-временным распределением источника,
1
Условия сходимости таких расширений подробно описаны в [269].
364
другими словами, с геометрией источника в 4-мерном пространстве-времени. Последнее предположение подразумевает, что справедливость приближения плоской волны может быть гарантирована, и вклады дополнительных возможных короткодействующих корреляций вследствие, например, кулоновского или сильных взаимодействий в конечном состоянии, так же как сохранения энергии-импульса, или струйной структуры источника могут быть удалены из данных, или их величина может находиться под теоретическим и/или экспериментальным контролем. Разложение Эджуорта было использовано для анализа экспериментальных данных с высокой статистикой, полученных в столкновениях тяжелых ионов при релятивистских энергиях в эксперименте STAR на коллайдере RHIC [270]. §3. Системы координат Связь между параметрами, извлекаемыми в эксперименте на основе метода НВТ-интерферометрии1, и пространственно-временной структурой функции источника можно установить, используя гауссову параметризацию функции источника: 1 S x , K S x K , K exp x K B K x K . (8.8) 2 Пространственно-временные координаты x , 0,,3 в (8.8) определены относительно эффективного центра источника x K для бозонов (фермионов), испущенных с импульсом K : x K x x K , x K x K ,
1
В литературе данные параметры для краткости часто называют HBTпараметрами размеров источника, или размерными параметрами HBT. Часто встречается название «HBT-радиусы». Однако последний термин должен использоваться с известной осторожностью, так как несмотря на то, что извлекаемые значения параметров HBT характеризуют пространственно-временную протяженность источника, они не являются непосредственно его радиусами.
365
где ... означает усреднение с весом, равным функции источника S x, K :
f
d K
Используя соотношение B 1
4
x f x S x, K
d
4
K
x S x, K
x x
.
K
означающее, что гауссова параметризация (8.8) имеет пространственно-временные ширины распределения такие же, как и истинная функция источника и делая подставку (8.8) в (8.4), можно получить следующую гауссову форму двухчастичной корреляционной функции в общем случае: C2 q, K 1 exp q q x x K . (8.9) Величины
x x
формально представляют собой ширины га-
уссовой формы (8.9), то есть пространственно-временные дисперсии, характеризующие геометрию источника частиц при данном значении K . Учитывая определения параметров, можно сказать, что уравнение (8.9) выражает ширину пика корреляционной функции в терминах ширин (дисперсий) одночастичной функции Вигнера S x , K . Важно отметить, что дисперсии, определяемые с помощью функции источника и с помощью функции относительно расстояния (8.7), связаны соотношением x x 2 x x , d
S
где нижние индексы указывают вес для усреднения. Таким образом, можно записать также общую гауссову форму корреляционной функции в следующем виде: 1 C2 q, K 1 exp q q x x K . (8.10) d 2 Видно, что параметры дисперсии гауссовой формы (8.9) непосредственно связаны с ширинами одночастичной функции испускания, в то время как форма (8.10) связывает дисперсии с ширинами функции распределения по относительному расстоянию, или отно-
366
сительной функции источника S K x . Ниже, если специально не
оговорено, используется форма (8.9). Так как корреляционная функция зависит от относительных расстояний x по отношению к центру источника, то нельзя получить никакой информации о положении x K центров эмиссии, что полностью совпадает с выводом, полученном при рассмотрении проблемы обратимости. Пусть C2 k1 , k 2 определена на эксперименте и удовлетворяет условиям 1) - 3). Относительный импульс может быть разложен на некоторые компоненты наиболее оптимальным с точки зрения эксперимента способом в одном, двух или трех измерениях. Например, экспериментальные данные представляются в одном измерении в зависимости от разности инвариантных импульсов частиц 2
пары QI q k1 k 2 , или как функция различных компонентов относительного импульса, например, для 3-мерного разло 2 жения q0 , qz , qt E1 E2 , k1 z k2 z , k1i k2 i , где ось z со ix, y ответствует оси столкновения. Для экспериментальных данных по двухчастичным корреляциям обычно используется декартова параметризация общей гауссовой формы (8.9) в терминах НВТ размерных параметров Rij K и параметра , описывающего степень хаотичности источника [271]: 3 (8.11) C2 q , K 1 K exp Rij2 K qi q j . i , j 1 В данном случае индексы i и j пробегают по трем из четырех компонент q. Четвертая компонента q зафиксирована требованием того, чтобы частицы в конечном состоянии находились на массовой поверхности, то есть условием ортогональности. Поэтому в данном случае корреляционная функция и параметры в правой части (8.11) зависят от трехмерных векторов. Разный выбор трех неза висимых компонент q q 0 , q соответствует различным формам
гауссовой параметризации.
367
Для исследований в области фемтоскопии было предложено несколько вариантов специфических разложений относительного импульса по отношению к среднему импульсу пары. Это разложение Бертча – Пратта [254, 272], Яно – Кунина – Подгорецкого [267, 271] и инвариантное разложение Буда – Лунда [242, 246, 273 – 275]. 3.1. Параметризация Бертча – Пратта Данная параметризация оказалась особенно удобной при изучении столкновений релятивистских тяжелых ионов, в которых образуются источники со значительной (пространственной) протяженностью и сложной структурой [254, 272]. Система координат выбирается следующим образом: ось пучка определяет ось, соответствующую направлению продольного расширения источника и называемую продольной; вторая ось выбирается параллельно поперечной компоненте среднего импульса пары K и соответствует поперечному («внешнему», «во вне») расширению источника, третья ось выбирается перпендикулярно к первым двум по правилу правой тройки и соответствует боковому направлению расширения. В соответствии с английскими названиями осей данная система координат и параметризация называется также « osl »-системой1 (рис. 8.42). В данном случае o -ось определяется для каждой пары частиц. Параметры ширины гауссиана (8.11), то есть размерные HBTпараметры, декартовой параметризации связаны с пространственно-временными характеристиками функции испускания следующим соотношением [276 – 278]: Rij2 K xi it x j j t , i, j o, s, l.
Необходимо отметить, что имеются десять независимых пространственно-временных дисперсий x x , из которых только шесть могут быть измерены экспериментально. Таким образом, в данном случае имеется шесть функций трех кинематических пере1
Название отражает тот факт, что основной интерес представляют характеристики источника в поперечной плоскости. 2 На данном рисунке приведены именно англоязычные названия осей.
368
менных, Y – быстроты пары, K и азимутального угла между вектором K и вектором прицельного параметра b .
Рис. 8.4. Координатная система, соответствующая « osl »-параметризации, в трехмерном пространстве
Азимутальная симметрия источника частиц в центральных столкновениях переводится в координатной системе « osl » в отражательную симметрию относительно s -направления: S xo , xs , xl , t; K , K l S xo , x s , xl , t; K , K l . Таким образом, для более простого случая азимутально-симметричных столкновений функция испускания обладает симметрией относительно преобразования xs x s , что приводит к исключению трех из десяти пространственно-временных дисперсий, линейных относительно xs , и корреляционная функция становится симметричной относительно преобразования qs qs [279]. Тогда Ros2 Rsl2 0 и для случая азимутальной симметрии существует только семь неисчезающих пространственно-временных характеристик, которые объединяются в четыре размерных HBT-параметра
369
Rij2 K . Корреляционная функция полностью определяется че тырьмя функциями только двух переменных K K и Y сле-
дующим образом: C2 q , K 1 K exp q 2j R 2j K 2qo ql Rol2 K . (8.12) j o , s ,l 2 Для того чтобы выразить размерные параметры HBT R j K на до подставить условие ортогональности q0 q , ,0, l в общую форму (8.9) и сравнить полученный результат с декартовой параметризацией (8.11). Таким образом, можно найти, что размерные параметры HBT связаны с различными комбинациями пространственных и временных характеристик источника вторичных частиц следующими соотношениями: 2 Rs2 K ,Y xs2 , Ro2 K , Y xo t , (8.13) 2 Rl2 K , Y xl l t , Rol2 K , Y xo t xl l t .
Видно, что данные размерные параметры HBT «смешивают» информацию о пространственных и временных характеристиках источника нетривиальным образом. Поэтому интерпретация данных параметров зависит от системы отсчета, в которой определен относительный импульс q [259, 265, 276, 279 – 287]. Важно отметить, что перекрестный параметр Rol2 исчезает в любой системе отсчета, в которой источник симметричен относительно xl xl [271]. Для симметричных столкновений это выполняется для так называемых LCMS-систем1 отсчета, в которых Y 0 [284, 288]. Общий случай корреляций с учетом азимутальной переменной подробно рассмотрен в [242, 274, 289]. Экспериментальные результаты, полученные при изучении азимутально-чувствительных ха1
Название системы отсчета представляет собой аббревиатуру от английского Longitudinal Co-Moving System. LCMS – это система отсчета, которая двигается относительно лабораторной системы в продольном направлении со скоростью, равной скорости пары в данном направлении, и в которой продольная компонента импульса (скорости) пары равна нулю.
370
рактеристик методом HBT в столкновениях тяжелых ионов, представлены в [290, 291]. Важным предельным случаем является K 0. В данном пределе никакой поперечный вектор не позволяет различать « o » и « s » компоненты, а пространственно-временные характеристики, таким образом, становятся инвариантными относительно замены xo x s . Данный факт означает, что xo2 x s2 , кроме K 0
K 0
того, для недиагональных элементов справедливы следующие раo венства: xo xl K 0 tx 0. Как следствие, размерные параK 0
метры HBT демонстрируют следующее поведение в данном предельном случае: lim Ro2 K lim Rs2 K , lim Rol2 K 0. K 0
K 0
K 0
При K 0 указанные соотношения для пространственно- временных дисперсий могут быть нарушены, приводя к генерации поперечного коллективного потока в столкновениях тяжелых ионов. Если данный тип коллективного потока достаточно слаб, лидирующий член K -зависимости разности квадратов поперечных размерных параметров имеет вид 2 Rdiff R02 Rs2 2 t 2 2 txo xo2 xs2 (8.14) и определяется явной -зависимостью первого члена. Это дает возможность определить продолжительность процесса эмиссии вторичных частиц как t
t2 t
2
для частиц с малыми K [288, 292, 293]1. Важно отметить, что возможность извлечения продолжительности эмиссии из корреляционного анализа экспериментальных данных, отмеченная в [288, 292, 293], обеспечила одну из главных фи1
Данный параметр иногда называют «время жизни» эффективного источника. Нельзя путать введенную характеристику с полным временем между моментом столкновения тяжелых ионов и стадией застывания, которое не измеряется непосредственно в эксперименте.
371
зических мотиваций для разработки, в частности, второго поколения экспериментов в релятивистской ядерной физике для измерения корреляционных функций с высокой статистикой и высоким качеством экспериментальных данных. Тем не менее существенно отметить, что последующие модельные исследования для столкновений релятивистских тяжелых ионов [294 – 297], где продолжительность эмиссии ожидается относительно небольшой (порядка поперечной протяженности источника), показали, что выделение t является до некоторой степени модельно зависимой процедурой, поскольку относительная малость двух последних членов в (8.14) не всегда может быть гарантирована [242]. 3.2. Параметризация Яно – Кунина – Подгорецкого Параметризация Яно – Кунина – Подгорецкого (ЯКП) представляет собой альтернативную декартовой « osl » параметризацию корреляционной функции, используемую для азимутально- симметричных столкновений. Данная параметризация использует ограничение массовой поверхности для того, чтобы выразить общую гауссову форму (8.9) в терминах следующих компонент относительного импульса пары: q q0 , ql , q , где q qx2 q 2y – поперечная компонента, которая может быть определена стандартным образом через декартовы компоненты, в частности, в « osl » системе отсчета справедливо q qo2 qs2 [271, 279, 283, 298]. Тогда двухчастичная корреляционная функция может быть записана как 2 2 C q, K 1 exp R2 q2 R2 ql2 q0 R02 Rl2 qU , (8.15) где, как и выше, параметр хаотичности и все размерные параметры являются функциями K ; U K – 4-мерная скорость пары для рас-
сматриваемой параметризации, трехмерный вектор которой имеет только продольную компоненту: 1 U K K 1,0,0, K , . 1 2 K
372
Таким образом, в данном случае, как и для параметризации Бертча – Пратта корреляционная функция определяется параметром хаотичности и четырьмя параметрами, R0 , R , R и U , каждый из которых является функцией K и Y . Быстрота пары в рассматриваемом случае ЯКП-параметризации определяется стандартным обра зом: YYKP K 0,5ln 1 1 и меняется аддитивно при про-
дольных преобразованиях Лоренца. Важное преимущество ЯКП-аппроксимации экспериментальных данных (8.15) заключается в том, что размерные HBT-параметры R j K , j 0, , инвариантны относительно продольных преобра-
зований Лоренца и не зависят от продольной скорости системы, в которой выполняются измерения. Система отсчета, в которой пара частиц находится в состоянии покоя, то есть K 0, называется
системой Яно – Кунина – Подгорецкого. Размерные параметры наиболее просто интерпретируются именно в ЯКП-системе, для которой справедливо: 2 R02 K , Y t xo xs2 2 t 2 , R2 K , Y
x l
l
xo
2
2
l xs2 xl2 , (8.16)
R2 K , Y xs2 .
Для получения данных соотношений применяется подход, полностью аналогичный рассмотренному выше методу установления соотношений между размерными HBT-параметрами и пространственно-временными характеристиками источника для декартовой параметризации Бертча – Пратта. Параметризации (8.12) и (8.15) используют различные независимые компоненты q, но являются эквивалентными математически. Параметры ЯКП-параметризации могут быть вычислены из параметров декартовой « osl »-параметризации и наоборот [270]. Справедливы следующие соотношения для прямого и обратного преобразований соответственно [242]: Rs2 R2 , R2 Rs2 ,
373
Rl2 1 l2 R2
l 1 2
2
R
2 o
R2 ,
2 Ro2 2 R2 , 1 2 Rl2 l R2 l 2 Ro2 R2 , 1 2 Rdiff Ro2 Rs2
R2 B C ,
R02 A C ,
A B 2C 1 1 . 2C A B
Здесь 2 Rdiff l 2 l2 2 Rol2 l 2 2 , B R 2 R R , C Rdiff . l ol diff 2 2 2 Видно, что ЯКП-параметризация становится неопределенной, если аргумент подкоренного выражения становится отрицательным. Такой случай является физически реализуемым, если, в частности, источник обладает непрозрачностью [296, 299]. Данное обстоятельство обусловило появление модифицированной ЯКПпараметризации [296, 297], в рамках которой указанная проблема решается за счет менее интуитивно понятной интерпретации модифицированных размерных параметров. Данное замечание демонстрирует, что указанные выше соотношения обеспечивают существенную проверку внутренней последовательности гауссовской формы, применяемой для аппроксимации измеренной корреляционной функции, и физической интерпретации получаемых размерных HBT-параметров.
A
3.3. Инвариантная параметризация Буда – Лунда Для столкновений с очень высокой энергией процесс эмиссии частицы становится явлением с высокой степенью релятивизма. В данном случае инвариантность функции эмиссии может быть отражена, если используется инвариантная относительно продольного расширения переменная собственного времени t 2 rz2 , и также вводится в качестве гиперболической, аддитивной относительно преобразований Лоренца в продольном направлении, пространственно-временная псевдобыстрота 0,5ln t rz t rz .
374
Для дальнейшего рассмотрения вводятся обозначения для инвариантных временной q и продольной q разностей импульсов,
являющихся сопряженными переменными для пары пространственно-временных переменных , . Тогда общая гауссова форма (8.7) двухчастичной корреляционной функции для параметризации Буда – Лунда (БД) может быть записана в следующем виде: C2 k1 , k2 1 exp R2 q2 R2 q2 R2 q2 , (8.17) ch 2 ch 2 2 y m y , q q q . T x y sh 1 1 sh В данных уравнениях mTi m 2 ki 2 – поперечная масса частицы q 1 q mT
в паре, y 0,5ln Ei kiz
E k i
z i
– быстрота частицы i, и
обозначает пространственно-временную псевдобыстроту точки максимальной светимости1 для частиц с данным фиксированным значением 4-импульса ki [300]. §4. Физическая интерпретация параметров источника Из общих формул (8.9) и (8.10) видно, что в любом случае изучение двухчастичной корреляционной функции позволяет определять пространственно-временные характеристики источника частиц с некоторым определенным значением K . Однако источник испускает частицы и, соответственно пары, с различными 4импульсами, то есть источнику соответствует целый спектр по k или по 4-импульсу пары. Таким образом, указанные характеристики, то есть дисперсии гауссианов, относятся только к некоторой части с центром в точке x K и не характеризуют полной пространственно-временной протяженности всего источника. Определение 8.5. Части полного источника, геометрические характеристики которых в пространстве-времени зависят от 41
Здесь имеется в виду точка с максимальным значением эмиссии частиц рассматриваемого типа.
375
импульса пары и характеризуются дисперсиями гауссиана (8.9) или (8.10), называются областями однородности источника. Термин «область однородности» был введен в [301]. Физический смысл термина заключается в том, что именно из данной области источника пары частиц с некоторым K , точнее, для которых 4-импульс заключен в интервале K , K K , испускаются с наибольшей вероятностью. Данная ситуация графически проиллюстрирована на рис. 8.5. В гауссовом приближении область однородности описывается четырехмерным пространственно-временным эллипсоидом, центрированным в точках x K , и характеризуется функцией источника S x , K . Протяженности области однородности определяются пространственно-временными характеристиками x x K из (8.9). В зависимости от направления и модуля K измеряются различные области объема источника эмиссии вторичных частиц рассматриваемого типа. Центр области однородности зависит от K и расположен между центром полной области испускания и наблюдателем. Таким образом, как было указано выше, размерные параметры HBT позволяют получить доступ на эксперименте только к относительным пространственно-временным характеристикам x x K и не зависят от «эффективного центра источника» x . Необходимо отметить, что пространственно-временные дисперсии x x в (8.9) соответствуют полным протяженностям источника только в специальном случае, когда функция эмиссии может быть факторизована S x , k f x g k . Понятие области однородности является ключевым для физической интерпретации размерных HBT-параметров в параметризации Яно – Кунина – Подгорецкого. Три ЯКП-радиуса интерпретируются непосредственно как временная (темпоральная), продольная и поперечная линейные масштабы (длины) однородности в соответствующей системе. Для источников со значительной протяженностью в продольном направлении подобных тем, которые образуются в столкновениях тяжелых ионов при высоких энергиях, на основании многочисленных модельных исследований [283, 295 – 297]
376
было показано, что скорость K с хорошей точностью соответ-
ствует скорости центра x K области однородности для пар частиц с данным четырехмерным импульсом.
Рис. 8.5. Схематичное изображение источника эмиссии частиц и областей однородности, соответствующих излучению пар частиц в некоторых диапазонах 4импульса
Таким образом, ЯКП-система отсчета может быть интерпретирована как система покоя эффективного источника пар частиц с данным K . Размерные HBT-параметры в данной системе характеризуют темпоральную, продольную и поперечную протяженность эффективного источника в его собственной системе покоя. Более детально пространственно-временная интерпретация параметров ЯКП обсуждена и изучена в [283, 296, 302].
377
§5. Метод фемтоскопии в эксперименте В последние годы экспериментальные методы в области фемтоскопии получили заметное развитие для соответствия существенному прогрессу, достигнутому как в теоретических подходах, так и количестве и качестве экспериментальных данных. Изложенный выше формализм справедлив для корреляций пар тождественных частиц. В данном параграфе рассматривается метод построения корреляционной функции в эксперименте, справедливый в общем случае фемтоскопии. Вследствие общего характера рассмотрения в данном параграфе конкретный вид разложения относительного момента, определяемый, как правило, спецификой эксперимента, не важен. В условиях реального эксперимента формальные определения двухчастичной корреляционной функции (8.2) и (8.3) используются достаточно редко. Определение 8.6. Двухчастичная корреляционная функция на эксперименте определяется как отношение распределения пар частиц рассматриваемых типов по относительному импульсу q при некотором заданном импульсе пары K к некоторому реперному распределению: A q C2K q K q K . (8.18) BK q Здесь AK q – распределение пар данного типа, образованных частицами из одного события. Распределение BK q называется реперным или фоновым распределением. В идеальном случае распределение BK q во всем аналогично распределению AK q , за исключением присутствия фемтоскопических корреляций. Дополнительный множитель K q вводится для учета как корреляций, имеющих не фемтоскопическую природу и не полностью компенсированных фоновым распределением, так и всевозможных поправок, связанных с особенностями того или иного эксперимента. Фоновое распределение строится, как правило, методом перемешивания, в рамках которого пары данного типа формируются из частиц разных событий. Число «смешанных» пар, приходящихся на одну
378
«реальную» пару, то есть на пару, сформированную частицами из одного события, как правило, выбирается в интервале 10 – 50 в зависимости от особенностей эксперимента и решаемой физической задачи. Подробное описание методик, используемых для построения фонового распределения, учета особенностей эксперимента, а также для фитирования экспериментальных корреляционных функций, можно найти, например, в [243, 303]. §6. Корреляционный пик и устойчивые распределения Структура корреляционного пика двухчастичной корреляционной функций представляет собой исключительно интересную и важную физически измеримую количественную характеристику. Данная структура содержит информацию о доле долгоживущих резонансов [304] и, следовательно, может использоваться для изучения фундаментальных свойств КХД. В частности, такие исследования в области фемтоскопии могут сигнализировать о восстановлении U A 1 -симметрии в реакциях с участием тяжелых ионов при высоких энергиях, ожидаемую в случае образования сильновзаимодействующей материи в деконфайнментном состоянии [305]. Структура корреляционного пика может использоваться для определения обобщенной постоянной Хаббла для поперечного потока в релятивистской ядерной физике [306], она также чувствительна к возможной частичной когерентности в источнике [307]. Дополнительно обсуждение данных вопросов и другие примеры представлены в [246, 273]. Существенная информация по общей структуре пика двухчастичной корреляционной функции в области фемтоскопии и касающаяся невозможности разложения в ряд Тэйлора корреляционных функций в окрестности точки q 0 представлена в [308] и в приложении [309], где было указано, что класс устойчивых распределений играет важную роль в исследованиях негауссовых корреляционных функции для частиц, подчиняющихся статистике Бозе – Эйнштейна. Нарушение гауссова приближения в окрестности точки q 0 было продемонстрировано с помощью теоретического анализа и численного моделирования в [310]. Результаты модели-
379
рования, включающего медленно спадающие (с длинными «хвостами») и/или асимметричные распределения плотности источника, подтвердили данный результат [311]. В данном разделе, строго говоря, корреляционная функция зависит от двух переменных, но принимая по умолчанию, что рассматриваются пары, импульс которых находится в некотором интервале, и для краткости зависимость от K явно не указывается. Представленные выше результаты являются, по существу, следствием того факта, что двухчастичный фазовый объем растет как q3 при малых значениях относительного импульса q. Следовательно, число, например, пионных пар стремится к нулю при q 0, подразумевая, что числитель и знаменатель корреляционной функции стремятся к нулю одинаковым образом lim C2 q 0 0. q0
Это является причиной того, что экспериментально невозможно определить C2 q 0 точно: экспериментальные ошибки для корреляционной функции расходятся1 при q 0. Соответственно, экспериментальные ошибки dC2 q dq и d 2C2 q dq 2 увеличиваются даже больше, чем для C2 q . Таким образом, функция корреляций двух частиц может быть измерена только при ненулевых относительных импульсах пары, то есть для инвариантного положительно определенного относительного импульса пары min Qinv Qinv , где Qinv q 2 . Причем масштаб нижней границы определяется совокупностью таких факторов, как объем доступной статистики, экспериментальное разрешение двух треков, точность определения и учета вклада взаимодействий в конечном состоянии. Для современных корреляционных измерений в релятивистской ядерной физике типичные значения для Qmin составляют 5-10 МэВ. При Qinv 0 значение бозе-эйштейновской функции корреляций может быть оценено различными методами экстраполяции, напри-
1
Здесь имеется в виду, что по мере приближения к точке Qinv 0 экспериментальные ошибки резко увеличиваются из-за уменьшения статистики. Данное уменьшение, как было указано выше, происходит вследствие стремления к нулю двухчастичного фазового объема.
380
мер, с помощью модельно-зависимого предположения для функциональной формы1 C2 Qinv , или с помощью модельнонезависимых разложений Эджуорта или Лаггера [269]. §7. Корреляционная функция в случае одномерных устойчивых распределений Для наглядности в данном параграфе рассматривается случай одномерного статического источника тождественных частиц и наиболее существенные идеи модельно-независимого подхода демонстрируются на простейшем примере. Ниже полученные результаты будут обобщены на случай более реалистичного, расширяющегося источника, для которого присутствуют корреляции между координатным и импульсным пространством, и также для более сложных случаев. Таким образом, в данном разделе предполагается, что источник может быть охарактеризован факторизованной формой функции эмиссии (8.5), где x и k – одномерная координата и импульс частицы соответственно. 7.1. Аналитичность характеристической функции Основной физический интерес для фемтоскопии представляет, как было указано выше, именно область малых значений q, то есть область корреляционного пика. При выполнении исследований в области фемтоскопии часто предполагается (явно или неявно), что функция f q в (8.6) является аналитической в окрестности q 0 и что разложение Тэйлора вплоть до второго порядка характеризует поведение самой функции хорошо даже при больших значениях q. Однако как было показано выше при рассмотрении класса устойчивых распределений, данное предположение справедливо только при 2, что соответствует гауссовым корреляционным 1
Как правило, используется предположение о гауссовой форме корреляционной функции. Однако данное предположение является простейшим случаем и требует выполнения достаточно жестких дополнительных условий.
381
функциям. В то же время устойчивые распределения формируют несчетное бесконечное множество. Таким образом, требование аналитичности характеристической функции накладывает серьезные ограничения на выбор возможного вида характеристической функции и, следовательно, функции источника. Поскольку данное утверждение является существенным, необходимо еще раз под черкнуть, что аналитичность функции f q в окрестности q 0 является именно предположением, и именно данное предположение очень сильно сокращает возможные формы распределений плотности источника [166, 168]. В частном случае, если функция f q является аналитической в окрестности точки q 0 и если возможно разложение по полиномам Лаггера / Эрмита / сферическим гармоникам в сходящийся ряд, то можно получить f q 1 iq x q 2 x 2 2 , где x n dxx n f x . Это, в свою очередь, подразумевает, что справедливы следующие соотношения: 2 2 C2 q 1 f q 1 1 q 2 x 2 x 1 exp q2 R 2 , (8.19) где параметр линейного размера гауссова источника R определен как ширина функции испускания источника
R
2
x2 x .
Такой тип чрезмерно упрощенных соотношений, повторенных в многомерных формах, часто используется, чтобы «доказать», что двухчастичная корреляционная функция в области фемтоскопии «должна иметь гауссову форму», не исследуя при этом область применимости приближений, которые приводят к данному результату. Фактически, гауссов подход для фемтоскопических двухчастичных корреляций часто дает хорошую первую аппроксимацию для реальных экспериментальных данным, в частности, если статистическая точность данных не соответствует выполнению детального
382
анализа формы. Одной из причин для такого поведения могло бы быть то, что эмиссия элементарных частиц является сложным, вероятностным процессом, в особенности в столкновениях с очень высокими энергиями. Если предполагается, что имеется много независимых процессов, которые изменяют (сдвигают) на x координату x , и что координата конечной точки является суммой многих, подобно распределенных, случайные изменений (сдвигов) x xi , и изменения характеризуются конечными дисперсиями, i
то для таких случайных переменных распределение вероятности для x стремится к гауссовому, если все условия центральной предельной теоремы (ЦПТ) удовлетворены. Описанные выше условия могут быть реализованы в различных каскадных процессах (пере) рассеяния. Поскольку фурье-образ гауссиана является также гауссианом, то в таких случаях ожидаемая форма двухчастичной корреляционной функции является также гауссианом. Однако, как обсуждалось выше, существует много вероятностных процессов для аддитивных случайных переменных, когда предельное распределение существует, но гауссова версия ЦПТ не применима. Такие процессы характеризуются большими флуктуациями, медленно спадающими по степенным законам «хвостами» распределений и неаналитическим поведением характеристической функции распределения вероятности при малых значениях своих аргументов. Как было показано выше, распределения для таких процессов удовлетворяют условиям обобщенной центральной предельной теоремы (оЦПТ) и являются устойчивыми распределениями или распределениями Леви. Ниже рассматривается форма двухчастичной корреляционной функции без ссылки на определенную модель, то есть с более общей точки зрения математической статистики. 7.2. Общий случай характеристической функции В качестве обобщенной параметризации данных в области фемтоскопии могут рассматриваться устойчивые распределения. Тогда, как было указано выше, для одномерных характеристических функций в области фемтоскопии удобно использовать соглашение
383
S , , , ; A S , , , ;1 . Учитывая, что метод двухчастичной корреляционной функции позволяет исследовать распределение источника только по относительным координатам, можно ожидать, что физически применимым является подкласс устойчивых распределений, не чувствительных к параметру асимметрии , то есть симметричные устойчивые распределения S ,0, , ; A . В случае симметричных распределений наиболее явно определяется физический смысл параметров и . Для исследований в области фемтоскопии параметр положения распределения соответствует положению центра источника пар с данным K , то есть центра области однородности, x . Параметр масштаба распределения соответствует параметру R, определяющему характерный линейный масштаб данного распределения некоторой физической величины или объекта1. Для соглашения S ,0, , ; A удобно использовать соотношение R 2, для S ,0, , ;1 – равенство R
2
соответственно. Таким образом, в физических обозначениях в общем случае для параметризаций данных в области фемтоскопии можно использовать S ,0, R 2, x ; A -соглашение, то есть обобщенную характеристическую функцию 1 ln f q iqx qR , 0. (8.20) 2 2 Соответственно, f q exp qR , то есть положение цен-
тра распределения, так же как и асимметрия, не входит в наблюдаемые на эксперименте корреляции, что полностью соответствует физическому смыслу рассматриваемого корреляционного анализа. Таким образом, форма характеристической функции (8.20), с одной стороны, удовлетворяет оЦПТ и соответствует устойчивому распределению, с другой стороны, подразумевает, что двухчастичные фемтоскопические корреляции, посредством которых измеряется 1
В случае фемтоскопии – это характерный размер источника вторичных частиц, то есть характерный линейный масштаб распределения точек испускания частиц.
384
на эксперименте квадрат модуля преобразованного1 распределения источника, являются нечувствительными как к параметру асимметрии устойчивых по Леви распределений, так и к положению центра x источника. Подставляя (8.20) в (8.6) можно получить, что устойчивые распределения приводят к следующей, относительно простой, форме двухчастичной корреляционной функции для одной переменной:
C2 q, 1 exp qR
.
(8.21)
Видно, что данная форма имеет дополнительный свободный параметр – индекс стабильности Леви – по сравнению с обычным гауссовым (или показательный) распределением, в которых значение фиксировано и равно двум (или единице). Представляется исключительно важным отметить, что (8.20) не является аппроксимацией для формы характеристической функции вблизи точки q 0, требующей аналитичности f q . Данная формула представляет собой точный и глубокий математический результат, являющийся следствием оЦПТ, которая, в свою очередь, определяет возможные формы образа Фурье для функций плотности устойчивых распределений. Следовательно, (8.20) справедливо при всех значениях q, и соответствующее соотношение (8.21) хорошо подходит для детального анализа формы двухчастичной корреляционной функции в физически допустимой обширной области по q, в том числе, и при очень малых переданных импульсах. Таким образом, если источник вторичных частиц характеризуется устойчивым распределением, то двухчастичную корреляционную функцию всегда можно записать в форме (8.21) во всем диапазоне изменения q. Некоторые типы распределений одной переменной, наиболее важные для экспериментального изучения двухчастичных корреляций и фундаментальных свойств материи в экстремальных состояниях в релятивистской ядерной физике и физике высоких энергий, более подробно рассматриваются ниже. 1
Здесь имеется ввиду фурье-преобразование функции распределения источника.
385
Пример 8.1. Как было указано выше, гауссово распределение соответствует частному устойчивых по Леви распределений при 2. Масштабный параметр R
x2 x
2
соответствует стандартному
отклонению. Распределение плотности в координатном пространстве и двухчастичная корреляционная функция для соответствующего источника: x x0 2 1 f x exp , x , 2 R 2 2 R 2 C2 q 1 exp q 2 R 2 .
Пример 8.2. Лоренцевское (Коши) распределение соответствует частному случаю 1. Параметр масштаба R является стандартным масштабным параметром распределения Лоренца. Распределение плотности в координатном пространстве и соответствующая двухчастичная корреляционная функция определяются как 1 R f x , x , 2 R x x0 2 C2 q 1 exp qR .
Данная форма (с верхним знаком) корреляционной функции достаточно часто применялась для описания Qinv -зависимости двухчастичных бозе-эйнштейновских корреляций при столкновениях адронов и тяжелых ионов в области промежуточных и высоких энергий [246, 275]. Пример 8.3. Асимметричное распределение Леви представляет собой несколько более сложный, но все еще относительно простой случай, соответствующий 1 2, 1. Функция плотности источника в координатном пространстве и корреляционная функция характеризуются следующими односторонними распределениями: R 1 R f x exp , x0 x , 32 8 x x0 8 x x0
386
C2 q 1 exp qR .
Данное распределение плотности также было использовано, хотя в рамках несколько другого формализма, для характеристики двухчастичных корреляций в [308]. Таким образом, простота (8.21) является причиной использования соглашения S ,0, R 2, x ; A : в случаях 1 и 2 получаются формулы, которые уже имели множество применений в исследованиях по интерферометрии частицы в физике высоких энергий. §8. Устойчивые распределения многих переменных и геометрия источника В физике высоких энергий и особенно в релятивистской ядерной физике, вследствие протяженной и сложной геометрии источника, часто изучаются именно многомерные двухчастичные корреляционные функции. Простейший случай соответствует не расширяющемуся (статическому) источнику, испускающему все частицы мгновенно. Такой источник описывается факторизованной формой функции испускания: S x , k f x g k t t0 . Если функция распределения плотности f x является многомерным устойчивым по Леви распределением, которое характеризуется эллипсоидальными контурными линиями, то реконструкция распределения плотности источника становится одномерной решаемой задачей [169]. Соответствующая трехмерная, симметричная, субгауссова устойчивая по Леви характеристическая функция имеет вид 2 1 3 2 f q exp i q x Rij qi q j , 1,2,3, 2 i , j 1 2 где Rij – квадрат элемента симметричной матрицы Rij R ji , имеющего размерность линейного размера («радиуса») источника.
387
Аналогично изложенному выше для одномерного случая, обозначения и дополнительные уравнения адаптированы таким образом, чтобы выполнялись соотношения, используемые ранее при исследовании двухчастичных корреляций в физике высоких энергий, то есть так, чтобы частный гауссов случай 2 соответствовал обычной гауссовой форме корреляционной функции (8.11). Следовательно, для симметричного, субгауссова многомерного устойчивого по Леви распределения плотности источника двухчастичная корреляционная функция имеет следующий вид: 2 3 2 C2 q , K 1 K exp Rij K qi q j . (8.22) i , j 1 Компоненты матрицы квадратов размерных параметров и соответствующего относительного импульса могут быть определены в системе отсчета, наиболее удобной для экспериментатора. Это обу-
3
словлено тем, что
2 ij
qR q i
j
является (нерелятивистской) билиней-
i , j 1
ной формой, которая инвариантна (в нерелятивистском случае) от носительно выбора системы координат, следовательно, qR 2 q может быть разложено по базису в любой системе отсчета. Эллипсоиды характеризуются инверсией матрицы R 2 , которая обозначается символически R 2 и часто называется ковариационной матрицей: 3 2 ij
R R
2 jk
ik .
j 1
Распределения плотности, имеющие эллиптические линии уровней1, могут быть вычислены интегрированием одномерного распределения [169]. Эллипсоидальные линии уровней могут быть преобразованы к сферическим линиям, учитывая, что двухчастичная корреляционная функция характеризуется матрицей R 2 , которая является симметричной матрицей и всегда может быть записана как R 2 RRT . Матрицу R можно рассматривать как своего рода 1
Здесь имеется в виду, что для распределений данного типа линии постоянной плотности имеют эллипсоидальную форму.
388
«квадратный корень» из матрицы квадратов радиусов. Физически матрица R дает ориентацию главных осей эллипсоидов профиля плотности в координатном пространстве и характеризует также растяжение вдоль главной оси, которое необходимо выполнить, чтобы преобразовать единичную сферу в эллипсоид, соответствующий линиям уровней. Следовательно, билинейная форма в показателе корреляционной функции также может быть записана как 2 qR 2 q Rq . Как видно из (8.22) двухчастичные корреляционные функции имеют обобщенную экспоненциальную форму, но, по сравнению с обычным гауссовым случаем, здесь присутствует дополнительное преобразование масштаба qi qi 2 , которое иногда в литературе также упоминается как растяжение. Следовательно, получающиеся корреляционные функции можно рассматривать как многомерные «растянутые» экспоненциальные параметризации. Очевидно, для 2 остаются справедливы используемые ранее гауссовы формы, в то время как для 2 максимум функции корреляции становится более резким и ярко выраженным, чем для гауссова распределения, и это приводит также к более длинным медленно спадающим «хвостам». Поскольку такое, с более резким максимумом, но, с другой стороны, почти гауссово, поведение достаточно часто наблюдается в экспериментальных данных для бозе-эйнштейновских корреляций в реакциях с участием частиц и тяжелых ионов высоких энергий, можно ожидать, что полученная выше растянутая экспоненциальная или субгауссова параметризация является полезной для характеристики таких наборов экспериментальных данных даже в случае многомерного анализа [170]. Как следует из представленного выше обсуждения, возможно, представление данных для двухчастичных корреляций в обычном, линейно-линейном виде C2 q не всегда является оптимальным. Для того чтобы продемонстрировать возможную степенную структуру показателя корреляционной функции, вероятно наиболее приемлемым будет дважды логарифмическая зависимость двухчастичной нормированной кумулянтной корреляционной функции следующего вида: ln ln K 2 q ln от ln q. Для зависимостей дан-
389
ного типа функция двухчастичных корреляций имела бы вид прямой линии, параметр наклона которой определялся бы индексом стабильности Леви [170]. Поведение функции распределения плотности на больших расстояниях может быть аналитически определено следующим образом: 1 2
3 f x Rij2 xi x j , i , j 1 таким образом, плотность источника уменьшается по степенному закону1 для достаточно больших значений аргументов при 0 2. Случай 2 соответствует гауссовому распределению плотности источника. Распределение плотности в общем случае выражается в d 1 измерениях для 2 в следующем виде [312]: 1 d 2
dtt ts J ts exp t , s 2 det R d 1
d 2 1
f
0
2 d 2
s s x R 1 x ,
где J i z – функция Бесселя первого рода, R 1 – матрица, обрат ная к матрице радиусов R, функция s x соответствует масштабной переменной, которая является постоянной для каждой эллипсоидальной поверхности, характеризующей постоянные значения плотности источника. Можно увидеть, что физический смысл имеет вариант данного уравнения в d 3 измерения, в системе эллипсоидальных расширений2, где матрица размерных параметров («радиусов») соответствует R diag X , Y , Z , обратная матрица имеет вид R 1 diag 1 X ,1 Y ,1 Z и масштабная переменная распределения для источника, обладающего эллипсоидальной симметрией определяется как
1
Важно отметить, что подобное распределение плотности считается характерным именно для объектов, обладающих фрактальной структурой. 2 Здесь подразумевается, что расширение вдоль каждой из трех главных осей эллипсоида имеет свое значение.
390
s x R 1 x
2
ry rx2 rz2 . X 2 Y 2 Z2 Необходимо отметить, что такие масштабные переменные возникают естественным образом в решениях, обладающих эллипсоидальной симметрией, в рамках гидродинамики файрбола, которые могут соответствовать нецентральным столкновениям тяжелых ионов в нерелятивистской области энергии [313 – 315]. Дополнительно к рассмотренному выше аналитическому результату для f s случай многомерных устойчивых распределений подробно обсуждается в [312, 316].
§9. Устойчивые распределения для расширяющихся источников Зависимость пространственно-временных дисперсий в соотношениях (8.9), (8.10) от импульса пары возникает вследствие коррелированности импульсов частиц с 4-мерными пространственными точками их испускания, то есть с так называемыми « x k » корреляциями. Важно отметить, что к подобным корреляциям могут приводить различные механизмы, среди которых наиболее важным для столкновений релятивистских тяжелых ионов является коллективное расширение источника вторичных частиц. В последние годы, особенно с началом экспериментальной программы на RHIC, значительные усилия были направлены именно на выделение вклада коллективного потока на стадии застывания из K -зависимости размерных HBT-параметров. Подробное обсуждение модельных подходов и экспериментальные результаты представлены, например, в [303, 317]. Однако источник, находящийся в термодинамическом равновесии, может проявлять температурные градиенты вдоль поверхности застывания, которые приводят к дополнительным « x k » корреляциям. Более того, спектры частиц, особенно пионов, получают заметные вклады от распада нестабильных резонансов через некоторое время после застывания. Эти распадные пионы имеют тенденцию испускаться из некоторой области, имеющей бóльшие пространственно-временные размеры, чем область испускания прямых пионов. Причем, вследствие кинематики,
391
распадные пионы дают вклад преимущественно в область малых импульсов k и, как следствие, малых относительных импульсов. Учет влияния резонансов на фемтоскопические корреляции сделан, в частности, в модельно-зависимом подходе «ядро-гало» для структуры источника [304]. Важно отметить, что оба указанных эффекта (температурные градиенты и распады резонансов) могут приводить к возникновению « x k » корреляций испущенных частиц даже если сам источник эмиссии не обладал ими [318]. В данном параграфе применяется широко используемая именно в релятивистской ядерной физике, но не инвариантная относительно продольного расширения, параметризация Бертча – Пратта. Выбор такой системы отсчета обусловлен тем, что при данной параметризации в LCMS-системе временная компонента пространственно-временной геометрии источника входит совместно с пространственными только для « o »-направления и в определение соответствующего параметра размера источника (8.13). Если корреляции между пространственными координатами и временем являются незначительными, то возможно модельно-зависимое предположение, что функция эмиссии при каждом значении импульсов частиц может быть написана как факторизованное произведение распределения в координатном пространстве и во времени: S x, k S x , k h t . Можно предположить, что при каждом значении k распределение в координатном пространстве соответствует трехмерному субгауссовому распределению Леви с индексом стабильности x , в то время как временное распределение соответствовало бы одномерному распределению Леви с индексом стабильности t . В общем случае пространственный и временной индексы стабильности могут быть различны. Такой вид предположений для факторизации может быть сделан в качестве приближения не только для нерелятивистского, или медленно расширяющегося источника, но в некоторых случаях также для релятивистских расширяющихся источников, а именно, когда функция эмиссии изучается в LCMS [319], и движение является нерелятивистским относительно данной системы отсчета.
392
Результирующая двухчастичная корреляционная функция для цилиндрически симметричных источников может быть записана в следующем виде: C 2 q, K
x 2 t 2 (8.23) 2 1 K exp Rij K qi q j t 2 o2 qo2 . i , j l ,o ,s Важной особенностью (8.23) является то, что пространственный и временной масштабы могут входить в зависимость по относительному импульсу для « o »-направления qo с различными показате-
лями x и t . Следовательно, детальный анализ формы корреляционной функции в терминах разложения Бертча – Пратта может быть использован для извлечения этих различных индексов равно как и информации относительно пространственного и временного масштабов протяженности источника. Однако, как хорошо известно, случай t x становится вырожденным, и только комбинация Ro2 o2 t 2 может быть определена из анализа. Более реалистичный случай должен включать возможные корреляции между временем образования частицы и пространственным положением, которые выходят за рамки рассматриваемого подхода, основанного на факторизации. §10. Устойчивые распределения и трехчастичные бозе-эйнштейновские корреляции На основе изложенного выше можно сделать вывод, что двухчастичные корреляции не чувствительны к относительной фазе двухчастичной обменной амплитуды. Записав последнюю в виде Aij d 4 xS x, K exp iqx ij exp ij , видим, что фаза ij не входит в корреляционную функцию (8.4). Важно отметить, что данный вывод несправедлив для многочастичных корреляций более высоких кратностей, то есть с участием более, чем двух частиц. Определение 8.7. В физике фундаментальных взаимодействий двухчастичная корреляционная функция в области фемтоскопии
393
определяется как отношение трехчастичной инклюзивной плотности распределения к произведению одночастичных инклюзивных плотностей: pi k , k , k C3 k1 , k 2 , k3 33 1 2 3 p ij k j j 1
3 1 d k1 , k2 , k3 , in 3 d dk j
(8.24)
j 1
где k1 , k2 и k3 – 4-векторы импульсов частиц рассматриваемой тройки. Важно отметить, что в определяемую в соответствии с (8.24) корреляционную функцию дают вклады корреляции более низких порядков (двухчастичные). Для исключения последних необходимо рассматривать нормированные кумулянтные корреляционные функции, представляющие собой истинные трехчастичные корреляционные функции. Учитывая (7.9), справедлива следующая взаимосвязь корреляционных функций в области фемтоскопии и нормированных кумулянтных корреляционных функций: K3 k1 , k2 , k3 C3 k1 , k2 , k 3 C2 ki , k j , 3
или, учитывая определение 8.3, K3 k1 , k2 , k3 C3 k1 , k2 , k3 K 2 ki , k j 1. 3
Здесь i, j 1,2,3; суммирования выполняются по всем возможным перестановкам (их число приведено под соответствующим знаком). Соответственно, нормированная и симметризованная кумулянтная корреляционная функция определяется следующим образом: K 3 k1 , k 2 , k3 w k1 , k2 , k3 . (8.25) 2 K 2 k1 , k2 K 2 k 2 , k3 K 2 k3 , k1 Данная функция определяет сумму фаз трех двухчастичных обменных амплитуд [320, 321] w k1 , k2 , k3 cos 12 13 23 cos . (8.26)
394
Учитывая явные выражения двухчастичных обменных амплитуд Aij для области малых относительных импульсов, можно получить следующее выражение [320]: x 2 x x 3 1 1 3 3 q12 q23 q q q q q q 12 12 23 23 23 12 2 K 24 K K K 2 x
2 x
1 4 q12 q23 q12 q23 x x x 3 o q , K K K K 2 где qij ki k j , q12 q13 q23 0, K k1 k2 k3 3 – средний им
3
3
пульс триплета частиц, средние 3 вычисляются с весом, равным функции испускания S x, k . Данное уравнение показывает, что угол зависит от пространственно-временных дисперсий нечетного порядка x3 функции испускания и от производных по K точки наибольшей относительной эмиссионной способности
x 3 .
Важно отметить, что полученное выражение отражает асимметрию источника относительно его центра и в частном случае гауссовой параметризации исчезает. Таким образом, важным является вопрос о принципиальной возможности получения информации о параметре асимметрии устойчивых законов с помощью методов интерферометрии частиц. Для изучения данной проблемы ниже рассматривается частный случай статистики Бозе – Эйнштейна и соответствующая функция корреляций с тремя частицами. В общем случае данная функция может иметь сложную форму [246, 307]. Однако если эмиссия частицы является полностью хаотической и если может быть гарантирована справедливость приближения плоской волны, то корреляционная функция с тремя частицами, подчиняющимися статистике Бозе – Эйнштейна, может быть записана в следующем виде: 2 (8.27) C3 1,2,3 1 f i, j 2 Re f i, j , 3 3
395
где i, j 1,2,3 и для упрощения записи введено следующее услов ное обозначение: f i, j f qij . Знаки суммирования и произведения указывают арифметические действия по всем возможным перестановкам (их число приведено под соответствующим знаком). Последнее слагаемое в формуле (8.27) соответствует трехчастичной кумулянтной корреляционной функции K3 1,2,3 2 Re f i, j , 3 где двухчастичная кумулянтная корреляционная функция в соответствии с определением 8.3 и формулой (8.6) может быть записана в следующем виде: 2 K 2 1,2 f 1,2 . Здесь верхний знак соответствует рассматриваемому случаю статистики Бозе – Эйнштейна, нижний – статистике Ферми – Дирака. Следовательно, нормированная и симметризованная кумулянтная корреляционная функция оказывается достаточно простой функцией параметра асимметрии устойчивых распределений Леви: w 1,2,3 cos R tg qij sign qij , 1. (8.28) 2 3 2 Специальный случай 1 рассмотрен подробно в [168]. Необходимо отметить, что, как и ожидалось, параметр смещения x не входит в данный результат, поскольку данный параметр, связанный с центром источника испускания частиц, не измеряется на эксперименте, и поэтому не является существенной количественной характеристикой в физике интерферометрии частиц. Для простоты и без потери общности подхода, можно предположить, что начало координат выбранной системы отсчета совпадает с центром источника эмиссии пар с данным K и фиксировано условием x 0. Важно подчеркнуть, что результат (8.28) справедлив только в пределах приближения плоской волны и при пренебрежении возможной частичной когерентностью в источнике [246, 307]. Если эти условия выполняются, то параметр асимметрии 1,1 может быть определен на основании зависимости от разности им-
396
пульсов двух частиц нормированной трехчастичной кумулянтной корреляционной функция w. Угол в (8.26) непосредственно пропорционален , параметру асимметрии устойчивых распределений, и коэффициенты пропорциональности могут быть определены на основе экспериментальных данных для двухчастичных корреляций. Таким образом, доказано, что для одномерного устойчивого распределения параметр асимметрии источника может, в принципе, быть определен с помощью комбинированного использования двух- и трехчастичных бозе-эйнштейновских корреляционных функций. Следовательно, все существенные параметры характеристической функции, а значит и функции плотности источника, могут быть восстановлены в рамках рассматриваемого класса распределений плотности. Необходимо отметить, что случаи 1 представляют особый интерес, поскольку в данных случаях область определения f q является односторонней: , и , соответственно. Такие виды устойчивых по Леви распределений могут иметь применение, например, для описания развития процессов во времени при столкновениях частиц высоких энергий: образование вторичных частиц не может начаться раньше начального столкновения, следовательно, соответствующий временной интервал должен быть ограничен снизу. После того, как параметры , и определены, может быть непосредственно построено устойчивое по Леви распределение плотности. В большинстве случаев эти функции также известны в аналитической форме. Трудность состоит в том, что они могут быть выражены в терминах рассмотренных выше функций очень общего вида, а именно, в терминах H -функций Фокса. Более детальное обсуждение представлено в [322, 323]. В данном параграфе пренебрегается возможной поправкой, связанной с наличием у источника ядра и гало. Данное приближение связано с тем, что в рамках модельного подхода «ядро-гало» можно непосредственно продемонстрировать аннулирование конечного результата (8.28) [300]. В более общем случае расширяющихся источников корреляции Бозе – Эйнштейна характеризуют только некоторые части полного
397
источника – области однородности, соответствующие локальному распределению плотности для частиц, имеющих данный импульс k , и чувствительны только к линейным масштабам данных областей, так называемым длинам однородности. Для того чтобы восстановить полную картину распределения плотности для всех частиц, необходимо выполнить комбинированный анализ одночастичных спектров и двухчастичных корреляционных функций [246, 309, 324]. Для такого типа расширяющихся источников параметры радиусов, как известно, уменьшаются с увеличением (поперечной) массы частиц [246, 273]. Это подразумевает, что чувствительность корреляций с тремя частицами к параметрам формы распределения источника увеличивается при использовании более тяжелых каонов вместо пионов. Данное утверждение следует из оценки (8.28) при использовании уменьшенного параметра радиуса. Явные выражения для кумулянтной корреляционной функции и обобщения гауссовой параметризации на случай частично когерентных источников приведены в [320]. В рамках многомерного анализа двух- и трехчастичных корреляций они позволяют разделить определение размеров областей однородности, соответствующих хаотической и когерентной компоненте источника, а также оценить расстояние между их центрами. Таким образом, представленное выше рассмотрение демонстрирует, что трехчастичные корреляции содержат важную дополнительную информацию, которая не доступна при изучении двухчастичных корреляций. Однако на практике извлечение данной информации оказывается достаточно трудоемким процессом. Результаты экспериментального исследования трехчастичных корреляций в столкновениях релятивистских тяжелых ионов на RHIC представлены в [325]. §11. Устойчивые распределения: сравнение с экспериментальными данными В качестве примера использования одномерных устойчивых распределений для описания корреляционной функции в области фемтоскопии рассматривается анализ, выполненный в [300]. В данном случае проводится сравнение корреляционной функции, полученной в рамках гипотезы устойчивого распределения источника, и
398
экспериментальных данных высокой точности, полученных для двухчастичных функций для короткодействующих корреляций в экспериментах CERN NA22 [326] и UA1 [327]. Необходимо подчеркнуть, что в данном параграфе не делается попытка восстановить детальную пространственно-временную структуру процесса эмиссии частиц, или интерпретировать результат в терминах физического процесса, который может привести к возникновению устойчивого распределения Леви. Сравнение данного класса распределений с реальными корреляционными функциями рассматривается здесь как тест состоятельности и применимости описанного выше общего метода в качестве инструмента для количественного анализа двухчастичной корреляционной функции в физике высоких энергий. Параметры для лучшей аппроксимации экспериментальных данных одномерным устойчивым по Леви распределением представлены в табл. 8.1. Графически результаты фитирования представлены на рис. 8.6. Таблица 8.1. Результаты аппроксимации данных UA1 и NA22 устойчивым по Леви распределением [170] Параметр фита
UA1 1,34 0,03
NA22 0,95 фиксирован
R, фм
1,85 0,07 6,36 0,33 0,49 0,01 56,5 42 1,35
1,15 0,17 1,33 0,30 0,67 0,07 27,67 35 0,769
6,6%
80,6%
2 ст.св. CL1
Из рис. 8.6 видно, что аппроксимации, соответствующие распределениям Леви, существенно лучше описывают экспериментальные данные, чем даже лучшие экспоненциальные фиты той же самой экспериментальной зависимости (здесь даже не приводится гауссова аппроксимация, которая абсолютно не описывает быстро растущий пик в области точки Qinv 0 ). Таким образом, бозе1
Уровень статистической достоверности результата.
399
эйнштейновские двухчастичные корреляционные функции в случае устойчивых по Леви распределений лучше всего описываются растянутыми экспоненциальными аппроксимациями.
Рис. 8.6. Функции D2s , пропорциональные двухчастичным корреляционным функциям для короткодействующих корреляций, измеренных в экспериментах UA1 (а) и NA22 (б) в CERN. Сплошными линиями показаны аппроксимации вытянутыми экспонентами (соответствуют распределениям Леви), которые способны описать экспериментальные данные при приемлемых значениях 2 ст.св. Штриховые линии – экспоненциальные фиты [170]
Качество аппроксимаций с помощью распределения Леви аналогично качеству описания, полученному с помощью разложений по полиномам Лаггера. Однако преимущество устойчивых законов Леви и соответствующих фитов заключается в том, что они связывают показатель со степенным поведением «хвоста» флуктуаций плотности в распределениях элементарных частиц в большом координатном пространстве. Необходимо отметить, что возможна интерпретации данных результатов в терминах КХД-каскада. Следующие утверждения могут быть сделаны без какой-либо ссылки на динамическую модель.
400
Оба рассматриваемых набора данных могут быть описаны фитами, соответствующими устойчивым по Леви распределениями с статистически приемлемым качеством. В случае данных эксперимента NA22, уровень достоверности аппроксимации составляет приблизительно 80%, даже когда один из параметров фита является фиксированным и имеет значение, полученное методом разложения по полиномам Лаггера [269]. Оставляя данный параметр свободным, в анализе, выполненном в [300], был найден вырожденный минимум параметра 2 ст.св. и уровень достоверности оказывался еще выше. В случае данных эксперимента UA1 уровень достоверности является достаточно низким и составляет только 6%. В случае массива данных NA22 значение параметра , определенное фитированием, в пределах ошибок близко к максимально допустимому значению 1, которое является теоретическим верхним пределом в рамках подхода «ядро-гало». Такой верхний предел нарушается при аппроксимации данных UA1. Это может служить указанием, что в данных UA1 присутствует вклад некоторых типов короткодействующих корреляций, не относящихся к изучаемому бозе-эйнштейновскому типу. Однако фит данных UA1 с помощью устойчивого по Леви распределения оказывается все еще возможным при фиксированном 1, но только с малым уровнем достоверности, равным приблизительно 1%. Фиксируя значение нормировочного множителя, равным полученному с помощью разложения по полиномам Лаггера для той же самой функции, [269], видим, что аппроксимация с помощью устойчивого по Леви распределения оказывается возможна только с очень малым (0,1%) уровнем достоверности. Во всех вышеупомянутых случаях значение остается существенно ниже единицы. При фиксировании 1 (экспоненциальный фит) уровень достоверности для данных NA22 уменьшается с 80% до 24%, в случае данных UA1 – с 6% до 108. Фиксируя 2 (фит гауссианом), удается получить уровень достоверности лучшей аппроксимации для данных NA22 на уровне 108 , в то время как данный уровень становится по существу нулевым в случае набора данных UA1. Таким образом, видно, что аппроксимации, соответствующие устойчивым по Леви распределениям (или «растянутой» экспонен-
401
те), разумно описывают данные экспериментов NA22 и UA1 для короткодействующих корреляций вторичных частиц в физике высоких энергий. Причем обнаружено, что индекс стабильности устойчивого распределения значительно меньшим двух. Это означает, что отклонение от гауссового поведения в данном случае может быть определено количественно и охарактеризовано представленным выше методом. §12. Некоторые выводы В настоящее время фемтоскопия превратилась в отдельную бурно развивающуюся область физики фундаментальных взаимодействий. Экспериментальное определение пространственно-временных параметров источника существенно для понимания динамики взаимодействий, ответственных, в частности, за существование и свойства атомных ядер. Более того, образование и экспериментальное исследование нового экстремального состояния сильновзаимодействующей материи достижимо на существующих ускорительных комплексах. Свойства действительно нового состояния материи тесно связаны с его пространственно-временными характеристиками. Некоторые следствия СМ, которые не могут быть проверены непосредственно, должны проявляться в фемтоскопических корреляциях. Один из наиболее актуальных тестов СМ, связанный с многочисленными поисками хиггс-бозонов, подвержен влиянию корреляций данного типа. Как было указано выше, двухчастичные корреляции могут быть полезны для решения некоторых фундаментальных проблем КХД. Поскольку устойчивые по Леви распределения удовлетворяют обобщенной центральной предельной теореме, они могут возникать естественным образом в случае физики высоких энергий и элементарных частиц, где, как известно, присутствуют самоподобные ветвящиеся процессы при больших масштабах передачи импульса, самоподобный процесс фрагментации струн описывает, как ожидается, распределения адронов первого поколения, и где распределение широкого спектра различных резонансов может также демонстрировать примерно степенное поведение как функция времени жизни резонанса. Ожидается, что подобные процессы будут существовать также и в столкновениях тяжелых ионов при высоких
402
энергиях, где дополнительные флуктуации адронной или кваркглюонной материи могут также изменить спектр этих флуктуаций. Аддитивные стохастические процессы могут определять распределение пространственно-временной плотности образования вторичных частиц в реакциях с участием частиц или тяжелых ионов при высоких энергиях. В этом случае, если обобщенная центральная предельная теорема применима, то распределение вероятности эмиссии частиц соответствует (одномерным или многомерным) устойчивым распределениям. Хотя характеристика устойчивых распределений Леви не является простой, к настоящему времени эти распределения доступны как в численной, так и аналитической форме. Самая важная особенность распределений данного класса состоит в том, что фурьеобраз функции эмиссии имеет в общем случае неаналитическую структуру в области исчезающее малых импульсов. Вследствие данной причины, двухчастичная корреляционная функция характеризуются функцией с дополнительным параметром – индексом стабильности 0 2. Аналитическое поведение и гауссово предельное распределение соответствуют только специальному случаю 2, то есть единственной точке из несчетного множества возможностей в пространстве параметров распределений Леви. Таким образом, в общем случае нет никаких фундаментальных оснований полагать, что фемтоскопическая корреляционная функция для двух частиц должна вести себя как (многомерная) гауссова форма. Контрольные вопросы 1. Приведите схемы и поясните основные различия интерференционных экспериментов в астрономии и в физике фундаментальных взаимодействий. 2. Дайте определение двухчастичной корреляционной функции в области фемтоскопии. 3. Получите выражение (8.4) и укажите необходимые для этого дополнительные условия. 4. Дайте определение трехчастичной корреляционной функции в области фемтоскопии.
403
Рекомендуемая литература 8.1. 8.21. 8.3.
Weiner R.M. Introduction to Bose-Einstein correlations and subatomic interferometry. Chichester and New York: John Wiley & Sons Ltd., 2000. Lisa M. Femtoscopy in heavy ion collisions: wherefore, whence, and whither? Eur. Phys. J. C49, 65 (2007). Подгорецкий М.И. Интерференционные корреляции тождественных пионов. Теория. ЭЧАЯ. 1989. Т.20. С.628.
1
Данный обзор полез для более углубленного изучения методов фемтоскопии и знакомства с современными экспериментальными результатами в релятивистской ядерной физике.
404
Приложение 1 Определение параметров КХД в экспериментах по ГНР В настоящее время акцент исследований КХД в экспериментах по ГНР смещен с качественных проверок КХД на точное количественное определение параметров теории и распределения партонов в нуклоне. Ниже в качестве примера рассмотрено определение константы s и параметра теории КХД . Первые измерения структурной функции F2 x , Q 2 с высокой статистикой, позволившие надежно определить КХД , были выполнены на пучке мюонов высоких энергий на суперпротонном синхротроне (SPS) в CERN при больших x и Q 2 на углеродной, водородной и дейтериевой мишени [328 – 330]. Полученные результаты впоследствии были уточнены в ходе тщательного анализа, объединившего экспериментальные данные, полученные на SLAC и на SPS [331]. Для КХД было получено следующее значение: 4 MS 263 42 МэВ, где ошибка объединяет статистические и систематические неопределенности. Это соответствует константе сильного взаимодействия при типичном для рассматриваемых экспериментальных данных значении Q 2 :
s 50 ГэВ2 0,180 0,008. В рамках этого же самого анализа [332] была получена оценка теоретической неопределенности1, которая исчезает при переопределении шкалы факторизации и ренормализации, что часто называется «масштабной неопределенностью». Конечный результат 1
Данная неопределенность связана с пренебрежением членов более высокого порядка в КХД-разложении коэффициентной функции и функции расщепления.
405
s Q 2 M Z2 0,113 0,003 эксп. 0,004 теор. является одним из самых точных, дающих определяющий вклад в мировое среднее значение s . Измерения структурных функций с доминирующим вкладом члена, соответствующего синглету по типам кварков, таких как функция F2 x , Q 2 дают в результате коррелированные измерения параметра s и глюонной структурной функции. Таким образом, использованная в анализе КХД - аппроксимация дала возможность оценить глюонное распределение в нуклоне на основе соответствующей формулы из (1.32). Поскольку глюонное распределение имеет острый пик при малых x , полученная оценка в настоящее время требует уточнения путем аппроксимации по более поздним данным1 с большим охватом кинематического диапазона [26]. Полная аппроксимация в рамках следующего за лидирующим порядке ТВ КХД для данных, полученных на SLAC [333] и HERA [334], в экспериментах BCDMS [329, 335], E665 [336], была выполнена в [337]. Было получено значение s Q 2 M Z2 0,116. Вычисления в следующем за NLO (NNLO) порядке дали значение s Q 2 M Z2 0,1172 0,0017 эксп. 0,0017 сист. . В данном случае экспериментальная погрешность включает комбинацию статистических и систематических ошибок, вторая погрешность – ошибки, обусловленные неопределенностями вследствие масс кварков, вклада «высших твистов», глюонного распределения и поправок на массу мишени. Полученное значение совпадает как с более ранним измерением s , приведенном выше, так и с расчетом в NLO ТВ КХД, что, в свою очередь, указывает на стабильность теоретических результатов. Важно отметить, что структурные функции с доминирующим вкладом несинглетного члена предоставляют принципиальную возможность наиболее точного способа определения s и проверки КХД, поскольку для них Q 2 -эволюция не зависит от глюонного 1
Значительный вклад в базу экспериментальных данных в данной области внесли эксперименты на RHIC.
406
распределения, не измеряемого экспериментально. В [338, 339] была выполнена аппроксимация экспериментальных данных зависимостью следующего вида: 1 p 2 p 2 2 3 0 dx F3 x, Q F3 x, Q 3 1 3,58 19 HT , s , где вклад «высших твистов» оценен HT 0,090 0,045 Q 2 [338, 340], в [341] величина данного вклада была еще меньше. Комбинируя данные различных экспериментов, было получено значение константы сильного взаимодействия при очень малых (для КХД) значениях переданного импульса [330]: 0,035
s Q 2 3 0,280 0,035 эксп. 0,050 сист. 0,030 теор. . Определяющий вклад в теоретическую погрешность вносит ошибка, обусловленная «высшими твистами»1. Если использовать результаты для «высших твистов» из [341], то значение s увеличится до 0,31, что совпадает с результатами аппроксимации в [342]. Экстраполяция полученного значения позволяет получить разумную оценку s Q 2 M Z2 0,118 0,011. Приложение 2 Интегрирование дробных порядков В приведенных ниже таблицах представлены некоторые основные результаты вычисления интегралов (то есть действия оператора Римана – Лиувилля) произвольных, в том числе и дробных, порядков для некоторых часто встречающихся функций. В табл. П2.1 используются стандартные обозначения специальных функций. В табл. П2.2 представлены интегралы произвольных порядков для функций, определенные, в отличие от предыдущей таблицы, на пространстве R1 , т.е. на прямой. В табл. П2.3 представлены результаты действия правостороннего оператора I на некоторые часто встречающиеся функции.
1
Для указанного результата предполагалось значение HT 0, 05 0,05.
407
Таблица П2.1. Результат действия левостороннего оператора Римана – Лиувилля для некоторых функций № п.п. 1
I x , x a , C
x , x a
a
x a
1
1 x a , Re 0
2
x c
1
a c x a F 1,1 ; 1; a x , 2 1 1 ac
3
1
1
a c 0, C
x a b x
1
1
x a b a 1
2
xa F1 ,1 ; ; , b a
Re 0, C , a x b 4
x a
1
5
b x 1 1 x a x c
1
x a , Re 0, a x b b a b x 1
x a a c 1
2
a x F1 ,1 ; ; , ac
Re 0, C , a c 0 1
6
x a
7
x c x a 1 2 x c
8
e x
9
x a
1
x a , Re 0, a c 0 a c x c 2
1 xa , 1 2 x c a c x c Re 1, a c 0 e x , x a e a x a E1, 1 x a
1
e x
e a 1 x a 1 F1 ; ; x a , Re 0
10 11
x a
1
e
2i x
sin x a cos x a
1 2
2
x a
1 2
e
i x a
J 1 2 x a ,
Re 0 i 11 2 x a 1 F1 1; 1; i x a 2 1 1 F1 1; 1; i x a
408
Таблица П2.1. (продолжение) № п.п. 12
13
x , x a
sin x a sh x a
x a
1
a
1 2
2 i
14
x a
16
sin x a J 1 2 x a , cos x a Re 1 1 2 xa 2
18
x a
1
1 2
2
x a
2 1 4
J 1 2 x a I 1 2 x a
ln x a
x a
1 x a
1 2
17
1 2
Re 1 1 2
cos x a ch x a
1 xa
1 2
2 1 4
1 F1 ; ; i x a 1 F1 ; ; i x a ,
sin 2 x a cos 2 x a
15
11 2
2
sin x a cos x a 1
I x , x a , C J x a x a I x a
x a ln x a 1 1 , 1 1 x a ln x a ,
ln x a
Re 0
19 20
1
2
x a
J x a
x a
2 3 4
x a
2 3 4
K 1 2 2 x a
x a
1
m
k d
2
x a
2
J x a , Re 1
1 2
Y 1 2 2 x a 21
m d k m k ln x a , k k 0 Re 0, m 1,2,
ln m x a
xa J 1 2 x a Y 1 2 x a , Re 0 1 2 xa I 1 2 x a K 1 2 x a , Re 0
409
Таблица П2.1. (окончание) № п.п. 22
I x , x a , C
x , x a
x a
1
a
1 x a 2 F1 , ; ; x a ,
2 F1 , ; ; x a 23
x a
1
E ,
Re 0
x a
x a
1
E ,
x a , Re 0, Re 0
Таблица П2.2. Результат действия левостороннего оператора Римана – Лиувилля на прямой для некоторых функций № п.п. 1
2
I x , x R , C
x , x R1
b ax
1
1 1 b ax , 1 a
1
a 0, ax b, Re 1 i 2 1 e , 1 ix
1
1 ix
Re 0, 0, 1, 2,
3
1
1 x a , Re 0
x a
e x , Re 0
4
e x
5
sin x cos x
6
sin x e x cos x
sin x 2 , 0, Re 1 cos x 2 sin x e x , arctg , Re 0, 0 2 2 2 cos x
Таблица П2.3. Интегралы произвольных порядков для некоторых функций № п.п. 1 2
x , x R1 x 1
ax b
I x , x R , C
1
1 1 x , Re 1 1 1
1 1 ax b , Re 1, arg a b 1 a
410
Таблица П1.3. (окончание) № п.п. 3
x , x R1 1 1 2
x a x b 4
e x
5
e
6
7
8
1
x a x b 1 2 x a x b
x
1 2
2
, Re 1
e x , Re 0 2 1 2 1 2 2 1 4 a x K 1 2 x , Re 0 sin x 2 , Re 1, 0 cos x 2
sin x cos x sin x cos x sin x e x cos x
I x , x R , C
1 2
2
e x
2
2 2
Y 1 2 x x 2 1 4 , Re 1 2 , 0 J 1 2 x
sin x , cos x
Re 0, 0, arctg 9 10
x
2
J x
Y x x 2 K x
2 2 J x , 0, Re 2 3 2 x Y x 2 2 , x K x 0, Re 0, Re 2 3 2
Важно отметить, что в ряде работ было выполнено дальнейшее развитие подхода Л. Шварца, связанное с разностями дробного порядка. Оператор дробного дифференцирования вводится в этих работах как k lim 1 f x kh h . h 0 k 0 k Выяснено, что при надлежащем толковании данного предела сужение представленного оператора на подпространство шварцевых обобщенных функций, сосредоточенных на полуоси R1 , совпадает
411
с определением дробного интегрирования (порядка ) по Л. Шварцу. С помощью операторов дробного интегродифференцирования Эрдейи – Кобера были введены дробные степени обыкновенных дифференциальных операторов L x 1 Dx2 Dx3 xn Dx n 1 I , D d dx, и рассмотрены их свойства в пространствах обобщенных функций Fp . Приложение 3 Аналитический аппарат теории вероятностей П3.1. Характеристическая функция Определение П3.1. Характеристической функцией случайной величины с функцией распределения F x P x называется комплекснозначная функция
f t exp it
e
itx
dF x .
(П3.1)
В частности, если для рассматриваемой случайной величины существует плотность распределения вероятностей p x dF dx , то характеристическая функция представляет собой фурьепреобразование плотности распределения:
f t
e p x dx. itx
Для дискретной случайной величины, принимающей значения xk с вероятностями pk , характеристическая функция представима следующим рядом: f t eitxk pk . (П3.2) k
Характеристическая функция определена при вещественных t для любой случайной величины. Ниже представлены основные свойства характеристических функций: 1) f 0 1, f t 1, t ;
412
2) функция f t равномерно непрерывна на числовой оси; 3) при каждом целом n 0 для любых комплексных чисел n
zi i 1
n
и любых вещественных чисел t j справедливо неравенстj 1
n
во
f t
k
tl zk zl 0;
k ,l 1
4) эрмитовость: f t f t ; 5) характеристическая функция суммы независимых случайных величин равна произведению характеристических функций слагаемых: f t f t f t ; 6) если и – случайные величины, причем a b, где a, b – постоянные, то f t f at e ibt .
Свойства 1 – 4 являются определяющими. Теорема П3.1 (Бохнера – Хинчина). Для того чтобы непрерывная функция f t , заданная на вещественной оси и удовлетворяющая условию f 0 1, была характеристической функцией, необходимо и достаточно, чтобы она была положительно определенной. Теорема П3.2 (обращения). Функция распределения F x однозначно определяется своей характеристической функцией f t . Если x, y – точки непрерывности F x , то имеет место формула обращения c 1 e itx e ity F x F y lim f t dt. (П3.3) 2 c c it В частности, если f t t интегрируема на бесконечности, то 1 F x F y 2
e itx e ity it f t dt.
Если характеристическая функция f t суммируема на вещественной оси, то функция распределения F x имеет ограниченную
413
непрерывную плотность p x dF dx , которая определяется по следующей формуле: 1 p x e itx f t dt. 2 *
Пусть 1 ,, n
– конечномерный случайный вектор и *
пусть F x P 1 x1 ,, n xn , x x1 ,, xn R n – n -мерная функция распределения случайного вектора . Определение П3.2. Характеристическая функция случайного вектора определяется по следующей формуле: f t Me
i t ,
e
i t ,x
dF x ,
(П3.4)
Rn *
n
где t t1 ,, tn , t , x tk xk – скалярное произведение. k 1
Свойства характеристических функций многомерных распределений во многом аналогичны свойствам характеристических функций случайных величин [343]. П3.2. Производящая функция Определение П3.3. Пусть – целочисленная неотрицательная случайная величина с плотностью вероятности (распределением вероятностей) pk P k , k 0,1,2, Производящей функцией данного распределения вероятностей (производящей функцией случайной величины ) называется функция
z, z z k pk ,
(П3.5)
k 0
где z – комплексное число z 1. Достаточно часто случайная величина в аргументе производящей функции не указывается. Производящая функция аналитична внутри единичного круга z 1. Распределение вероятностей случайной величины , удов-
414
летворяющей указанным выше требованиям, однозначно определяется своей производящей функцией [343]: k 0 dk pk , k 0 k z , k 0. (П3.6) k! dz z 0 В ряде случаев, особенно в асимптотическом анализе, оказывается полезным представление распределения вероятностей интегралом Коши: z 1 pk dz, 0 1. 2 i z z k 1 Если определить «хвост» распределения вероятностей рассматриваемой неотрицательной целочисленной случайной величины
как P k qk pk r , k 0, то производящая функция Q z r 1
z k qk
последовательности
qk k 0
связана с производящей
k 0
функцией z распределения вероятностей pk , k 0 следующим соотношением: 1 z Q z . 1 z В частности, Q 1 [343]. Производящая функция связана с характеристической функцией f t соотношением f t exp it , , t R1 .
(П3.7)
Заменяя в определении П3.3 комплексное число z на произвольную комплекснозначную функцию z u , можно получить определение производящего функционала. Определение П3.4. Для n -мерного целочисленного неотрицательного случайного вектора , то есть для группы из n целочисленных неотрицательных случайных величин 1 ,, n , совместная производящая функция определяется следующим образом:
415
z1 ,, zn z11 znn
k1 ,,k n 0
z1k1 znkn pk1kn ,
где pk1kn P 1 k1 , n kn [343]. Приложение 4 Нормальное распределение Нормальное распределение является одним из важнейших распределений вероятностей. Термин «нормальное распределение» был введен К. Пирсоном (более старые названия «закон Гаусса», «гауссовское распределение», «распределение Гаусса – Лапласа») и применяется как по отношению к распределениям вероятностей случайных величин, так и по отношению к совместным распределениям вероятностей нескольких случайных величин (конечномерных случайных векторов), а также случайных процессов. Определение П4.1. Функция x 1 x exp y 2 2 dy , x R1 (П4.1) 2 называется интегралом вероятностей или функцией Лапласа. Определение П4.2. Случайная величина R1 называется гауссовской или нормальной1 с параметрами ; 2 , где 0, если функция распределения данной случайной величины имеет вид x F x P x (П4.2) . В силу того, что функция Лапласа непрерывно дифференцируема на R1 , функция распределения F x гауссовской случайной величины имеет плотность распределения следующего вида: x 2 1 p x exp , 0. 2 2 2
1
Подразумевается, что рассматриваемая случайная величина имеет гауссово или нормальное распределение.
416
Из определения П4.2 следует, что математическое ожидание и дисперсия гауссовской случайной величины равны, соответственно, , D 2 . Для обозначения гауссовской случайной величины, как правило, используют обозначение N ; 2 . Характеристическая функция нормально распределенной случайной величины N ; 2 имеет следующий вид: t 2 2 f t exp i t . 2 Вероятность попадания в произвольный интервал a, b R1 можно определить по следующей известной формуле: b a P a b . Случайная величина с распределением N 0;1 называется стандартной гауссовской случайной величиной. Из (П4.2) следует, что ее функция распределения совпадает с функцией Лапласа. С уменьшением кривая нормального распределения становится все более островершинной. Изменение a при постоянном не меняет форму кривой, а приводит лишь к ее смещению по оси абсцисс. Площадь, заключенная под кривой нормального распределения, всегда равна единице. Замечание П4.1. Свойство гауссовости распределения сохраняется при линейном преобразовании случайной величины . Пусть
N M ; D и определена случайная величина a b, где a , b R1 . Тогда N M ; D , где M aM b; D a 2 D .
Для описания гауссовского случайного вектора, под которым понимается одномерная упорядоченная система гауссовских случайных величин, оказалось удобно использовать введенный выше * аппарат характеристических функций. Пусть 1 ,, n – вещественный конечномерный случайный вектор с математическим
ожиданием 1 ,, n
*
и ковариационной матрицей R
417
cov i , j
*
i , j 1,,n
, пусть x x1 ,, xn R n , F x – n -мерная
функция распределения случайного вектора . Определение П4.3. Случайный вектор n R n имеет n -мерное гауссовское распределение с параметрами , R , если его характеристическая функция имеет следующий вид: 1 f exp i * * R , R n . 2 Замечание П4.2. Любая компонента k гауссовского вектора
имеет распределение N k ; Dk , где k – k -й элемент вектора ; Dk – k -й диагональный элемент матрицы R .
Замечание П4.3. Если матрица R 0, то есть положительно определена, то F x имеет плотность распределения p x , где x R n , определяемую по следующей формуле: * 1 exp x R1 x 2 , p x n 2 2 R
где R 0 – определитель ковариационной матрицы. Ниже представлены важнейшие свойства гауссовских векторов. *
1. Если cov , * * 0, а вектор * , * является гауссовским, то гауссовские векторы и независимы.
2. Пусть N ; R и A B, где A R mn , B R n , тогда
N ; R , где A B, R AR A* . 3. Пусть n – последовательность гауссовских случайных векс.к.
торов. Если имеется среднеквадратичная сходимость n при n , то N ; R , где lim n , R lim cov n , n , n
причем указанные пределы существуют и конечны.
418
n
4. Если n – последовательность гауссовских случайных векп.н.
торов и почти наверное имеется сходимость n при n , то с.к.
присутствует среднеквадратичная сходимость n при n . Важно отметить, что в общем случае данное утверждение не верно. 5. Теорема П4.1 (о нормальной корреляции). Пусть вектор *
* , * является гауссовским, причем R 0, тогда: а) условное математическое ожидание имеет вид R R1 ; б) , то есть и являются независимыми;
* в) если , то 0, cov , R R R1 R ;
г) условное математическое ожидание имеет гауссовское рас* пределение N ; R , R R R1 R , где введены обозначе-
ния R cov , , R cov , . Замечание. Данная теорема дает явный вид среднеквадратичной оптимальной оценки для по наблюдениям в гауссовском случае. Важно отметить, что линейно зависит от . 6. Если , , составляют гауссовский вектор, причем и некоррелированы, то , . *
7. Если компоненты вектора 1 ,, n – гауссовские и независимые в совокупности, то является гауссовским случайным вектором. Пример П4.1. Двумерный случайный вектор 1 , 2 имеет нормальное распределение, если его характеристическая функция f t1 , t2 имеет следующий вид [343]: 1 f t1 , t2 exp i m1t1 m2t2 c11t12 2c12t1t2 c22 t 2 , 2
419
2
причем квадратичная форма Q t1 , t2
c tt ,c ij i j
12
c21 неотрица-
i , j 1
тельна, то есть Q t1 , t2 0 при любых действительных t1 , t2 . Если ранг квадратичной формы Q t1 , t2 равен двум, то есть детерминант матрицы C cij , i, j 1, 2 отличен от нуля, то двумерное нормальное распределение называется невырожденным или собственным. Если ранг квадратичной формы Q t1 , t2 равен нулю или единице, то двумерное нормальное распределение называется вырожденным или несобственным. Если случайный вектор 1 , 2 имеет невырожденное нормальное распределение, то его плотность вероятности равна 1 p x1 , x2 2 1 2 1 2 2 x1 m1 2 x1 m1 x2 m2 x2 m2 , 1 exp 2 2 2 1 2 22 2 1 1 где det C c11c22 c122 12 22 1 2 . Смысл параметров плотности
вероятности следующий: i 1,2 : mi i , i2 Di2 ; коэффициент корреляции компонент 1 и 2 случайного вектора определяет 1 m1 2 m2 , справедливо 12 1 2 m1m2 . ся как 1 2 Данную плотность вероятности удобно записывать в виде 1 exp Q 1 x1 m1 , x2 m2 1 2 p x1 , x2 2 2 det C 2 1 2 1 2 2 1 1 exp c111 x1 m1 2c121 x1 m1 x2 m2 c22 x2 m2 , 2
2
где Q 1 t1 , t2
1 ij i j
c
t t , cij1 – элементы матрицы C 1.
i , j 1
420
Необходимо отметить, что плотность вероятности невырожденного нормального распределения сохраняет постоянное значение на эллипсах 2 x1 m1 2 x1 m1 x2 m2 x2 m2 1 2 2 , 2 1 2 22 2 1 2 1 называемых эллипсами равных вероятностей, причем вероятность попадания случайного вектора 1 , 2 внутрь такого эллипса равна P элл. 1 exp . Если двумерное нормальное распределение вырождено, то в случае, когда ранг квадратичной формы Q t1 , t2 равен нулю, оно сосредоточено в точке m m1 , m2 , то есть P m 1. Если ранг данной квадратичной формы равен единице, то двумерное нормальное распределение сосредоточено на прямой, определяемой собственным вектором матрицы C , который соответствует ее ненулевому собственному значению [343]. Одно из основных направлений исследований в теории вероятностей составляют так называемые предельные теоремы. «Предельные теоремы» – это общее название обширной группы теорем. Важно отметить, что именно предельные теоремы несут в себе большую часть практической значимости теории вероятностей. Пусть k k 1 – последовательность независимых одинаково распределенных случайных величин с k : k a, Dk 2 0. Пусть n
Sn n , очевидно, что Sn na и DSn n 2 0. Тогда случайi 1
n Sn na n
ная
величина
0 и нормированной D n 1 суммой случайных величин
n
является
центрированной
k n
k k 1 . Теорема П4.2 (центральная предельная теорема). Последовательность случайных величин n n 1 , определенных выше, сходится по распределению к стандартной гауссовской случайной ве-
421
личине , то есть P n x x при n равномерно по x R1. Замечание. Любая последовательность случайных величин, слабо сходящаяся к некоторой гауссовской случайной величине, называется асимптотически нормальной. Центральная предельная теорема устанавливает свойство асимптотической нормальности для последовательности центрированных и нормированных сумм произвольных независимых одинаково распределенных случайных величин, имеющих конечные дисперсии [344]. В частности, одну из категорий предельных теорем для марковских процессов составляют те предельные теоремы, которые являются прямыми обобщениями соответствующих предельных теорем для независимых случайных величин. Нормальное распределение встречается в очень большом числе приложений. Теоретическое обоснование исключительное роли нормального распределения дают предельные теоремы теории вероятностей. На качественном уровне соответствующий результат может быть объяснен следующим образом: нормальное распределение служит хорошим приближением каждый раз, когда рассматриваемая случайная величина представляет собой сумму большого числа независимых случайный величин, максимальная из которых мала по сравнению с данной суммой.
Приложение 5 Теоремы Хинчина и Леви Пусть X t является случайной величиной, X 0 0, задано положительное число t и приведенная случайная величина t X t t , распределенная по приведенному нормальному закону, имеет очень малую вероятность принять очень большое или очень малое значение. Однако при изменении t происходит своего рода повторение эксперимента, и случайная функция t , как известно, будет почти наверное иметь бесконечную последовательность нулей. Сход-
422
ным образом могут реализоваться и очень большие значения величины , поэтому нет основания ожидать, что функция t будет ограничена сверху. В связи с этим возникает важная проблема определения верхней функции для траектории процесса, то есть такой функции от параметра t, которая при t была бы почти достоверной верхней гранью траектории t . Данная проблема была решена в 1924 г. Хинчином [345], и результат, получивший название «закон повторного логарифма», сформулирован в виде следующей теоремы. Теорема П5.1 (Хинчин). При c 1 почти наверное существует такое число T , что t T :
t c 2t log log t . (П5.1) При c 1 почти наверное существует такое число T , что t T : t c 2t log log t . Другими словами, справедливо следующее равенство: t P lim sup 1 1. t 2t log log t Доказательство. Положим tn qn , q 1, n 0,1,2, и M n max X t .
(П5.2)
(П5.3)
t t0
Для x 0 согласно формуле x
2 exp 2 2t d 0 можно получить следующее соотношение: 2 P M n x tn exp 2 2 d x P M x x
(П5.4)
2 2 d 2 exp x 2 2 exp 2 . x x x Следовательно, справедливо следующее неравенство:
423
(П5.5)
n P M n c 2tn 1 log log tn 1 где xn c
2 2 exp xn 2 , xn
2 log n 1 log q , то есть выполняется следующее неq
2 n 1 log q равенство: n xn
c2 q
2 k n c q , при n , log n где k const. Поскольку c 1, величину q можно выбрать такой,
чтобы выполнялось неравенство 1 q c 2 . Тогда ряд
n
схо-
n0
дится. Согласно лемме Бореля – Кантелли в данном случае почти наверное существует такое случайное число N , что n N вы-
M n c 2tn 1 log log tn 1 ,
следовательно,
t T tn
X t M n c 2tn 1 log log tn 1 c 2t log log t ,
(П5.6)
полняется
справедливы следующие соотношения: ибо каждое t T заключено в некотором интервале tn 1 , tn , где n N , что и требовалось доказать. Формула (П5.6) применима также и для X t , следовательно, и для X t . Положим X n X tn X tn 1 . Величины X n не зависят друг от друга, что позволяет использовать лемму Бореля для изучения q 1 1 вероятностей n P X n xn tn exp x 2 2 dx , n q 2 xn 1 exp xn2 2 при xn . Для следующих значений: xn 2
xn c ' 2 log log tn c ' 2 log n log q ,
где
xn c ' 2log n
при
n , имеют место цепочка следующих соотношений: 1 k c '2 c '2 n n log q n log q , где k const, n . xn 2 log n
Таким образом, если c ' 1, вероятность n является общим чле-
424
ном расходящегося ряда и, согласно лемме Бореля, для бесконечq 1 ного числа номеров n справедливо: xn c ' 2 tn log log tn . С q другой стороны, полагая в (П5.6) c 2 1, можно получить, что для всех достаточно больших значений параметра n справедливы t неравенства X tn 1 2 2tn 1 log log tn 1 2 2 n log log tn . Откуq да для достаточно больших «избранных» номеров n следует справедливость следующих соотношений: X tn X n X tn 1 q 1 2 c' 2tn log log tn . Пусть c 1. Выберем значение q q величины c ' так, чтобы c c ' 1, а затем возьмем столь большое
q, чтобы было c '
q 1 2 c. Таким образом, для бесконечно q q
большого числа значений n и для t T tn справедливо неравенство
X t c 2t log log t ,
(П5.7)
что и требовалось доказать. Формула (П5.7) применима также и для X t , следовательно, и для X t . Теорема доказана. ▲ Теорема П5.2 (Леви). Если c ' 3 2, то почти наверное существует число T такое, что t T : X t 2t log log t c 'log log log t . Если c ' 1 2, то T почти наверное t T :
(П5.8)
X t 2t log log t c ' log log log t . Данная теорема доказывается аналогично предыдущей. Разница состоит в том, что в первой части теоремы последовательность чисел tn q n следует заменить последовательностью, растущей
медленнее, например, выбрать log tn n log n. Для доказательства
425
второй части, напротив, необходима последовательность, растущая быстрее, чем в доказательстве теоремы Хинчина, например, tn n ! или log tn n log log n . Приложение 6 Уравнение Ланжевена Уравнение Ланжевена получено П. Ланжевеном в 1908 г. в теории броуновского движения, его используют для описания случайного воздействия на различные динамические системы, в кинетике фазовых переходов и др. С физической точки зрения справедливо следующее определение [346]. Определение П6.1. Уравнение Ланжевена – это уравнение движения макроскопического тела, взаимодействующего с частицами термостата, влияние которых учитывается при помощи согласованного включения в уравнение силы трения и случайной внешней силы. Если без учета взаимодействия с термостатом уравнение движения имеет вид: d 2r m 2 U r , t 0, dt где m – масса частицы, U – потенциальная энергия, то соответствующее уравнение Ланжевена принимает форму d 2r dr m 2 U r , t F t . (П6.1) dt dt Здесь dr dt – пропорциональная скорости v dr dt сила трения, а F t – случайная сила. Последняя обусловлена одновременным воздействием на тело большого числа частиц термостата, поэтому с большой точностью ее можно считать нормально распределенной. Среднее значение силы равно нулю, а корреляционная функция Fi t1 Fj t2 ij t1 t2 зависит лишь от t1 t2 . Если время корреляции k внешней силы, совпадающее по порядку величины со временем одного соударения, k m h , то во всех соотношени-
426
ях, содержащих лишь интеграл от корреляционной функции, ее можно считать пропорциональной -функции: ij 2 ij . Величина связана с коэффициентом трения , так как и трение и внешняя сила обусловлены взаимодействием тела с термостатом. Эту связь легче всего установить для свободного движения, U 0, тогда при t m имеют место соотношения1:
v 2 t 3 m ,
r 2 t 6t 2 .
Из теоремы о равнораспределении энергии по степеням свободы следует, что v 2 t 3kT m , здесь T – абсолютная температура, откуда kT . Это соотношение между интенсивностью случайной силы и коэффициентом трения является частным случаем флуктуационнодиссипативной теоремы. Формула для r 2 t соответствует закону диффузии
r 2 t 6 K d t , откуда получаются связь Kd 2
между , и коэффициентом диффузии Kd , а также соотношение Эйнштейна Kd kT между коэффициентом трения и коэффициентом диффузии. Приложение 7 Интегральные преобразования Определение П7.1. Интегральным преобразованием в общем случае называется линейное взаимнооднозначное отображение U множества распределений (или соответствующих им функций распределений F или плотностей
p,
заданных на некотором
пространстве R ) в множество функций , U : , причем элемент множества является функцией n комплексных пе ременных z z1 , zn C n и имеет следующий вид: n
1
Необходимо отметить, что в данном случае, в отличие от гл. 5, рассматривается уравнение Ланжевена в прострастве трех измерений.
427
z U z z , u du , R
(П7.1)
n
где z , u – некоторая фиксированная функция на R n C n , являющаяся ядром интегрального преобразования [347]. Ядро может иметь в области интегрирования сингулярные точки, и тогда интеграл (П7.1) понимается в каком-либо специальном смысле (например, в смысле главного значения). Явные выра жения обратного преобразования U 1 z , позволяющие вос-
станавливать по функции распределение (функцию распределения F или плотность p ), называются формулами обращения. Примерами интегральных преобразований являются многомерные преобразования, для которых z , u z , u , где z , u – скалярное произведение n мерных векторов переменных: 1) преобразование Фурье – Стилтьеса (характеристический функционал) z , u exp i z , u ; 2) преобразование Лапласа – Стилтьеса на R n (производящий функционал) z , u exp z , u ; и следующие одномерные n 1 преобразования: 3) преобразование Меллина – Стилтьеса 0, u 0, z, u s u , u 0; 4) преобразование Ганкеля u 0, 0, z, u J s, u su , u 0, где J – функция Бесселя; 5) косинус / синус преобразование u 0, 0, z, u cos / sin su , u 0. Ниже более подробно рассмотрены интегральные преобразования играющие важную роль для физических приложений, рассмотренных в данной книге.
428
П7.1. Преобразование Фурье В 1807 г. Ж. Фурье сформулировал круг идей, вошедших в современную математику под названием «ряды Фурье». Возникновение фурье-анализа стимулировало исследования в области основ математического анализа. В данном разделе основное внимание сфокусировано на основных идеях и теоремах данного раздела математики, которые имеют непосредственное отношение к созданию алгоритма моделирования фрактального броуновского движения. Пусть функция X t , t , абсолютно интегрируема на
, ,
то есть X t dt. Строго говоря, предполагается, что
X t измерима по Лебегу и указанный интеграл существует в смысле Лебега. Важно отметить, что класс рассматриваемых функций включает кусочно-непрерывные функции, удовлетворяющие следующему условию роста:
X t O 1 t t
p
, p 1.
(П7.2)
К данному классу, в частности, относится и фрактальное броуновское движение, имеющее компактный носитель, то есть заданное на конечном отрезке и равное нулю вне него. Определение П7.1. Преобразованием Фурье введенной выше функции X t называется функция X , определяемая следующим образом: X X t exp it dt. (П7.3)
При определенных условиях имеет место формула обращения – формула обратного преобразования Фурье X t X exp it dt , (П7.4)
которая в физических приложениях описывает синтез некоторого сигнала X t из отдельных частотных составляющих (гармоник).
429
В литературе для прямого и обратного преобразования Фурье, могут использоваться следующие соответствующие обозначения: FT X t ; X и FT 1 X ; t X t . Из определения (П7.3) и формулы обращения (П7.4) можно получить: d n X t n n FT ; i FT X t ; i X , n dt (П7.5) n d X t n i FT 1 n X ; t . dt n
Пусть функция X t – периодическая с периодом, равным единице. Тогда частоты будут кратны целым величинам n и операция «преобразование Фурье» в данном случае имеет следующий вид: 1 X n X t exp i 2 nt dt. 0
Величины X n называются коэффициентами Фурье, а формула обращения в данном случае есть не что иное как ряд Фурье: X t X n exp i 2 nt . n
Если период функции X t отличен от T 1, то всегда можно изменить масштаб независимой переменной t таким образом, чтобы рассматриваемая функция имела период равный единице.
Полная энергия сигнала X t равна
X t
2
dt и при дальней-
шем рассмотрении предполагается конечной. По теореме Планшереля справедливо следующее равенство: 2 2 X t dt X d ,
то есть полная энергия может быть вычислена как по временной, так и по частотной области.
430
Необходимо отметить, что если X t – вещественно значная функция, то справедлива следующая цепочка равенств: X
X t exp it dt
X t exp it dt X . Верно и обрат-
ное утверждение, если справедливо X X , то функция X t имеет вещественные значения.
П7.2. Преобразование Лапласа Из общих определений интегральных преобразований, рассмотренных выше следует, что преобразования Фурье и Лапласа могут быть введены единым образом: заменяя в преобразовании Фурье частоту не некоторый комплексный параметр так, что i , можно автоматически получить преобразование Лапласа. Определение П7.2. Преобразованием Лапласа введенной выше функции X t называется функция X , определяемая следующим образом: X
X t exp t dt,
Re 0.
(П7.6)
0
При определенных условиях (непрерывность X t ) имеет место формула обращения – формула обратного преобразования Лапласа c i 1 X t X exp t d , (П7.7) 2 i c i где Re t 0. Здесь c 0 и интеграл берется вдоль любой прямой Re c 0 и понимается в смысле главного значения, то есть как предел интеграла вдоль отрезка c iA, c iA при A. . В литературе для прямого и обратного преобразования Лапласа, могут использоваться следующие соответствующие обозначения: LT X t ; X и LT 1 X ; t X t . Из определения (П7.6) и формулы обращения (П7.7) можно получить:
431
k n 1 d n X t n n 1 k d X t LT ; LT X t ; , n k k 0 dt dt t 0 (П7.8) d n X t LT 1 n X ; t . n dt Необходимо отметить важное отличие от фурье-преобразования: зависимость от начальных условий в первой формуле (П7.8) возникает вследствие того, что преобразование Лапласа, в отличие от преобразования Фурье, начинается при начальном значении переменной (времени) t 0. Поэтому преобразование Лапласа является полезным при решении проблемы начальных условий. Ниже в данном разделе более подробно рассматривается преобразование Лапласа в рамках теории вероятности. Пусть – неотрицательная случайная величина с функцией
распределения вероятностей F x P x. Определение 7.3. Преобразованием Лапласа функции распределения вероятностей F x P x (или случайной величины ) называется функция [16]
exp exp x dF x ,
(П7.9)
0
определенная при Re 0 и аналитическая для Re 0. Предполагается, что точка нуль включена в область интегрирования. Теорема 7.1 (обращения). Функция распределения случайной величины F x P x однозначно определяется своим преобразованием Лапласа : в каждой точке непрерывности функции распределения справедливо F x lim
где
k
k x
k!
k
k ,
(П7.10)
– производная k -го порядка, определяемая следую
щим образом: k 1
k
exp x x dF x . k
0
432
Преобразование Лапласа можно представить в виде ряда
k 0
k!
k
k
mk , k 1: mk x k dF x 0
в любом интервале 0 0 , в котором указанный ряд сходится. Если такой интервал сходимости ряда существует, то последова
тельность моментов mk k 0 однозначно определяет функцию распределения F x P x. Важно отметить, что преобразование Лапласа при вещественных 0 имеет вероятностный смысл: F P , 0, (П7.11) где – случайная величина, не зависящая от и характеризуемая функцией распределения: F t P t exp t с преобразованием Лапласа exp s s . Соотношение (П7.11) в приложениях интерпретируется следующим образом: exp при 0 представляет собой вероятность того, что момент успеха (восстановления, вызова, отказа и тому подобное) наступит до момента прекращения наблюдений , имеющего, в свою очередь, показательное распределение. Если для случайной величины определена плотность распределения вероятностей p x P x dF x dx , то преобразование Лапласа (П7.9) может быть записано в виде
exp exp x p x dx. 0
Формула обращения (П7.10) в данном случае имеет вид n 1
1 n n n1 n p x lim n n 1! x x и для почти всех x 0 справедливо c i exp x 1 d p x d , 2 i dx c i
433
где c 0 и интеграл берется вдоль любой прямой Re c 0 и понимается в смысле главного значения, то есть как предел интеграла вдоль отрезка c iA, c iA при A. Если плотность распределения p x непрерывна, то c i
p x
1 exp x d . 2 i ci
Функция распределения F x суммы двух независимых неотрицательных случайных величин и , характеризуемых функциями распределения F x и F x , соответственно, определяется сверткой x
x
F x F x y dF y F x y dF y 0
0
и обозначается F F F [343]. П7.3. Обобщенные интегральные преобразования Рассмотренные выше преобразования Фурье и Лапласа могут быть обобщены на случай дробных порядков [208]. Пусть функция X t удовлетворяет указанным выше условиям. Учитывая обобщенную формулу Лейбница (2.33) и соотношение 1 Dt t 1 t , можно получить: 0 D X t D X 1 t D X t t t t t k Dtk t 0 X k t k 0 t k k X t . k k 1 k 0 Применяя преобразование Фурье для производной целого порядка, данное соотношение может быть переписано в виде
434
k
k 0
D X t k k t 1 d exp it i X t
k
it exp it i X . k 1 k 0
k
d k
Функция k
z exp z (П7.12) E z k 0 k k 1 называется обобщенной экспоненциальной функцией. Тогда Dt X t dE it i X i FT 1 X ; t .
Полученное соотношение имеет важное значение. С одной стороны, оно позволяет вычислять производную дробного порядка с помощью некоторого интегрального преобразования без использования рядов. С другой стороны, данное соотношение, являясь аналогом (П7.5), позволяет определить, соответственно, прямое и обратное обобщенное преобразование Фурье следующим образом:
FT X t ;
dtE it X t ,
FT 1 X ; t dE it X .
(П7.13)
Действуя аналогично, а также используя формулу (П7.8) и формальное соответствие i , можно получить c i
D X t 21 i t
c i
d E t X LT
1
X ; t
и формально определить соответственно прямое и обратное обобщенное преобразование Лапласа следующим образом:
LT X t ;
dtE t X t , 0
c i
LT
1
1 X ; t d E t X . 2 i c i
435
(П7.14)
Однако в данном случае имеется фундаментальное отличие от обобщенного преобразования Фурье. В последнем случае сходимость определяется только формой функции, участвующей в преобразовании. С другой стороны, сходимость (стандартного / обобщенного) преобразования Лапласа дополнительно к форме преобразовываемой функции определяется сходимостью при t (стандартной / обобщенной) экспоненциальной функции. В отличие от стандартного случая, обобщенная экспонента E t спадает не по экспоненциальному, а по обратному степенному закону в асимптотике t . Поэтому сходимость обобщенного преобразования Лапласа является не очевидным фактом и данный вопрос требует аккуратности и дополнительных исследований для конкретных функций X t [208].
436
УПРАЖНЕНИЯ Упражнение 1. Проверить, что требование справедливости равенства (4.1) равносильно требованию выполнения любого из следующих двух равенств: а) t T , B Ft почти наверное справедливо следующее соотношение P B Ft P B Ft ; б) t T , B Ft почти наверное справедливо следующее соотношение P B Ft P B Ft . Упражнение 2. Показать, что если A1 и A2 являются булевыми полуалгебрами подмножеств множества , то класс B A1 A2 ; A1 A1 , A2 A2 тоже является булевой полуалгеброй подмножеств множества . Показать, что булева алгебра ( -алгебра), порожденная определенным выше классом B, совпадает с булевой алгеброй ( алгеброй), порожденной A1 A2 . Упражнение 3. Вычислить инфинитезимальный оператор винеровского процесса. Упражнение 4. Для процесса, плотность вероятности которого удовлетворяет следующему уравнению p 1 2 p p a 2 b bp , t 2 y y найти инвариантную меру при условии b a. Упражнение 5. Пусть 0,1,2,3,4,5,6. Описать все борелевские поля (булевы -алгебры, см. определение 3.12), содержащие следующие множества: A1 2,3,4 и A2 4,6. Упражнение 6. Доказать, что каждое конечное борелевское поле A подмножеств порождается некоторым конечным разбиением . Дру-
437
гими словами, доказать, что в борелевском поле A найдутся непересекающиеся множества B1 ,, BN («атомы» A ) такие, что N
B , k
k 1
и любой элемент AA представим в виде
A
B
ki .
i
Упражнение 7. Пусть an n1 – счетное множество, а A – набор всех его
подмножеств. Если pn n 1 – последовательность неотрицательных чисел, сумма которых равна единице, то для любого S можно определить P S
p . n
Показать, что указанным выше спосо-
an S
бом определяется вероятностная мера на измеримом пространстве , A , и обратно, все такие меры получаются описанным выше способом. Упражнение 8. Пусть E1 , A1 и E 2 , A2 – измеримые пространства, 1, 2 – измеримые отображения, определяемые следующим образом: 1 :
E1, A1 E2 , A2 ; 2 : E2 , A2 E1 , A1 . Доказать,
что отображе-
ние 2 1 является измеримым отображением пространства
E1, A1
в пространство E 2 , A2 . Упражнение 9. Пусть I – интервал числовой оси R1 и пусть A I является алгеброй, порождаемой всеми интервалами, содержащимися в I . Пусть A – -алгебра в пространстве E , A . Числовая функция f x , xE называется A -измеримой, если она задает измеримое
отображение измеримого пространства E , A в измеримое пространство I , A I . Проверить, что если последовательность
438
f n n 1
является последовательностью A -измеримых функций, то следующие функции: sup f n , inf f n , lim f n , lim f n также A -измеримы. n
n
Упражнение 10. Пусть i , i 1,2, – измеримые отображения измеримого пространства E , A в пространства E i , Ai , i 1,2, Показать, что тогда отображение измеримого пространства E , A в измеримое пространство E1 E 2 E n , A1 ,, An , , определенное формулой x 1 x , 2 x ,, n x ,, является измеримым. Упражнение 11. Пусть f x1 , x2 – A1 A2 -измеримая функция, определенная в пространстве E1 E 2 . Показать, что тогда при любом фиксированном x2 E 2 функция f x1 , x2 является A1 -измеримой функцией от x1. Упражнение 12. Пусть – мера на -алгебре A. Доказать следующее утверждение: если E \ E 0 и функции f и f совпадают на E, то из A -измеримости f следует A -измеримость функции f . Упражнение 13. Доказать, что A является -алгеброй. Упражнение 14. Доказать, что пересечение всех -алгебр, получающихся пополнением A по мерам M , также является -алгеброй. Упражнение 15. Пусть , A, P – вероятностное пространство, , является случайной величиной с математическим ожиданием, определяемым по формуле P d . Доказать следующие
часто встречающиеся в теории вероятностей неравенства: а) неравенство Коши – Буняковского:
439
для любых случайных величин , из рассматриваемого вероятно2
стного пространства справедливо 2 2 ; 2
б) 2 ; в) для любых случайных величин , из рассматриваемого вероятностного пространства справедливо следующее соотношение: 2
2 2 2 ; 2
n n k k2 ; k 1 k 1 д) неравенство Чебышева: 0 и t 0 : P t t 1 ; е) соотношение, являющееся важным частным случаем неравенства Коши – Буняковского: a1 ,, an , b1,, bn ; ai , bi R1, i 1,2,n :
г)
2
n n 2 n 2 ak bk ak bk . k 1 k 1 k 1 Указание: для доказательства данного неравенства надо применить соотношение Коши – Бунякоского из а) к таким случайным величинам , из рассматриваемого вероятностного пространства,
0, j k ; для которых P a j , bk 1, j k . Упражнение 16. Пусть A является пополнением -алгебры A по системе всех конечных мер . Проверить, что A совпадает с пополнением A по системе всех вероятностных мер . Упражнение 17. Проверить, что если p t , x , y – переходная плотность, то формула p t , x , y dy , при t 0; t, x, x , при t 0
440
определяет переходную функцию t, x, для множества . 1, x ; Здесь x E , A , x – индикатор множества (или 0, x характеристическая функция). Вывести нормальность рассматриваемой переходной функции из условия lim p t , x, y dy 1 t 0
xE
E
и ее консервативность из условия p t, x, y dy 1
E
441
t 0, x E .
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1.
2.
3.
4. 5.
6.
7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
Окороков В.А., Сандракова Е.В. Фракталы в фундаментальной физике. Адронные струи при высоких энергиях: фрактальность и самоподобие. Учебное пособие. М.: МИФИ, 2005. Холево А.С. Вероятность. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.97. Славнов А.А. Функционального интеграла метод. Физическая энциклопедия. М.: Большая российская энциклопедия, 1998. Т.5. С.383. Фейнман Р., Хиббс А. Квантовая механика и интегралы по траекториям. Пер. с англ. М.: Мир, 1968. Mandelbrot B.B. On fractal geometry, and a few of the mathematical questions it has raised. In «Proc. Intern. Cong. Math. Warszawa. 1983». Warszawa. 1984. V.2. P.1661. Аносов Д.В. Фрактал. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.777. Nelson E. // Phys. Rev. 1966. V.150. P.1079. Roepstorff G. Path integral approach to quantum physics. Berlin: Springler, 1994. Abbot L.F., Wise M.B. // Am. J. Phys. 1981. V.49. P.37. Kröger H. // Phys. Rep. 2000. V.323. P.81. Bohm D. // Phys. Rev. 1952. V.85. P.166, 180. Holland P.R. The quantum theory of motion. Cambridge: Cambridge University Press, 1993. Sanz A.S. // arXiv: quant-ph/0412050. 2004. Abelev B.I. et al. (STAR collaboration). // arXiv: 0805.0364 [nucl-ex]. 2008. Moore G.D., Teaney D. // Phys. Rev. 2005. V.C71. P.064904. Akamatsu Y., Hatsuda T., Hirano T. // arXiv: 0809.1499 [hep-ph]. 2008.
442
17.
18. 19.
20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
32. 33. 34. 35. 36. 37.
Ефремов А.В. Глубоко неупругие процессы. Физическая энциклопедия. М.: Большая российская энциклопедия, 1998. Т.1. С.497. Barone V., Predazzi E. High-energy particle diffraction. Springler-Verlag, 2002. Ефремов А.В. Структурная функция. Физическая энциклопедия. М.: Большая российская энциклопедия, 1998. Т.5. С.6. Deshpande A., Milner R., Venugopalan R., Vogelsang W. // Annu. Rev. Nucl. Part. Sci. 2005. V.55. P.165. Klein M., Riemann T. // Z. Phys. 1984. V.C24. P.151. Ченг Т.-П., Ли Л.-Ф. Калибровочные теории в физике элементарных частиц. Пер. с англ. М.: Мир, 1987. Фейнман Р. Взаимодействие фотонов с адронами. Пер. с англ. М.: Мир, 1975. Abramowicz G., Caldwell A.C. // Rev. Mod. Phys. 1999. V. 71. P. 1275. Callan C.G., Gross D.J. // Phys. Rev. Lett. 1969. V.22. P.156. Фосс Р. // УФН. 1996. Т. 166. С.927. Ellis R.K., Stirling W.J., Webber B.R. QCD and collider physics. Cambridge University Press, 1996. Yao W.-M., et al. // J. Phys. 2007. V.G33. P.1. Altarelli G. et al. // Nucl. Phys. 1978. V.B143. P.521 (erratum: Nucl. Phys. 1978. V.B146. P.544). Bardeen W.A. et al. // Phys. Rev. 1978. V.D18. P.3998. Грибов В.Н., Липатов Л.Н. // ЯФ. 1972. Т.15. С.781. Докшитцер Ю.Л. // ЖЭТФ. 1977. Т.73. С.1216. Altarelli G., Parisi G. // Nucl. Phys. 1977. V.B26. P.298. Marage P. // arXiv: hep-ph/9911426 1999. Ellis R.K., Furmanski W., Petronzio R. // Nucl. Phys. 1983. V.B212. P.29. Martin A.D. et al. // Phys. Lett. 2007. V.B652. P.292. Close F.E. An Introduction to quark and partons. Academic Press, London, 1979. Frampton P.H. Gauge field theories. Benjamin/Cummings, Menlo Park, 1987. Dremin I.M., Levtchenko B.B. // Phys. Lett. 1992. V.B292.
443
38. 39.
40. 41. 42.
43. 44. 45. 46. 47. 48. 49. 50. 51.
52.
53. 54.
P.155. Дремин И.М. // УФН. 1994. Т.164. С.785. Шредер М. Фракталы, хаос, степенные законы. Миниатюры из бесконечного рая; пер. с англ. Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. Лейбниц Г.В. Сочинение в 4-х томах. М.: Мысль, 1982. Т.1, С. 413. Медведев Ф.А. Очерки истории теории функций действительного переменного. М.: Наука, 1975. Hata M. Fractals in mathematics. Pattern and waves: qualitative analysis of nonlinear differential equations. Studies in mathematics and its applications. V.18. Eds. by Nischida T., Minura M., Fujii H. Tokyo: Kinokuniya Comp.lid. 1986. P. 259. Pascal E. Esercizi e note critiche di calcolo infinitesimale. Milano, 1895. Brimschvieg L. Les etapes de la philosophie. Mathematique. Paris, 1912. Hawkins Th. Lebesque’s theory of integration. Its origins and development. London, 1970. Гелбаум Б., Олмстед Дж. Контрпримеры в анализе; пер. с англ. М.: Мир, 1967. Бржечка В.Ф. // УМН. 1979. Т. IV. С.15. Hardy G.H. // Trans. Amer. Math. Soc. 1916. V.17. P.301. Gerver J. // Proc. Nat. Acad. Sci. USA, 1969. V.62. P.668. Gerver J. // Amer. J. Math. 1971. V.93. P.33. Hankel H. Untersuchungen uber die unendlich oft oszillierenden und unstetigen funktionen (1870) // Ostwalds Klassiker der exacten Wiessenschaften. Leipzig, 1905. №153. P.44. Houel J., Hankel H. Untersuchungen uber die unendlich oft oszillierenden und unstetigen funktionen. Fin Beitrag zur Festellung des Begriffs der function uberhaupt. Universitats programm zum 6 Marz 1870. Tubingen – Bull. Sci. Math et Astron. 1870. V.1. P.117. Schwarz H.A. // Berlin: Ges. Math. Abhandlungen, 1890. B. 2. S.269. Dugac P. // Archive for Hist. Exact. Sci. 1973. V.10. P.41.
444
55.
56. 57. 58. 59. 60.
61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73.
74. 75. 76.
Du Bais-Reymond P. Verch einer classification der Willkurlichen functionen reeler argumente nach ihren Aenderungen in kieinsten Jutervallen. // Crelle: J. fur die reine und angewandte mathematiques. 1875. V.79. P.21. Mandelbrot B.B. The fractal geometry of nature. N.Y.: Freeman, 1982. Сакс С. Теория интеграла. Пер. с англ. М.: Иностранная литература, 1949. М.: Факториал-Пресс, 2004. Denjoy A., Felix L. // L’Enseig Math. 1957. Ser.2, V.3. P.1. Darboux G. // Ann. Sci. Ecole Norm. Super. 1875. Ser.2, V.4. P.57. Dini U. Sopra una classe di funzioni finite e cjntinue che non hanno mai una derivata (1877). // Roma : Opere Matem. 1954. V.11. P.5. Dini U. Fondamenti per la teorica delle funzioni de variabili reali. Pisa, 1878. Darboux G. // Ann. Sci. Ecole Norm. Super. 1879. Ser.2, V.8. P.195. Knopp K. // Math. Zeitschrift. 1918. V.2. P.1 Зигмунд А. Тригонометрические ряды; пер. с англ. М.: Мир, 1965. Гапошкин В.Ф. // УМН. 1966. Т.XXI. С.3. Hadamard J. // Journ. Math. 1892. V.8. P.101. Куратовский К. Топологи;. пер. с англ. М.: Мир. Т.1, 1966; Т. 2, 1969. Бэр Р. Теория разрывных функций; пер. с франц. М.-Л.: ГТТИ, 1932. Окстоби Дж. Мера и категория; пер. с англ. М.: Мир, 1974. Banach S. // Stud. Math. 1931. V.3. P.174. Mazurkiewicz S. // Stud. Math. 1931. V.3. P.92. Mouldin R.D. // Pacif. J. Math. 1979. V.83, №1. P.199. Безикович А.С. Исследование непрерывных функций в связи с вопросом об их дифференцируемости. // Матем. сб. 1924. Т.31, №3-4. С.529. Saks S. // Fund. Math. 1932. V.19. P.211. Orlicz W. // Fund. Math. 1947. V.34. P.45. Яглом А.М. Корреляционная теория стационарных слу-
445
77. 78. 79. 80. 81.
82. 83. 84. 85. 86. 87.
88.
89.
90. 91. 92. 93.
чайных функций. Л.: Гидрометеоиздат, 1981. Винер Н. Я – математик. Пер. с англ. М.: Мир, 1964. Потапов А.А. Фракталы в радиофизике и радиолокации. Топология выборки. М.: Университетская книга, 2005. Oldham K.B., Spanier J. The fractional calculus. N.Y.: Academic Press, 1974. Потапов А.А. // Нелинейный мир. 2003. Т.1. С.69. Самко С.Г., Килбас А.А., Маричев О.Н. Интегралы и производные дробного порядка и их применения. Минск: Наука и техника, 1987. Брычков Ю.А., Прудников А.П. Интегральные преобразования обобщенных функций. М.: Наука, 1977. Lawrence J.K., Schrijver C.J. // Astrophys. J. 1993. V.411, №1. P.402. Нигматуллин Р.Р. // Теор. и мат. физика. 1992. Т.90. С.354. Nakajama T., Yakubo K., Orbach R.L. // Rev. Mod. Phys. 1994. V.66. P.381. Saied E.A. // Chaos, Solitons & Fractals. 2000. V.11. P.1369. Захарченко В.Д., Брыжин А.А. Использование дробного дифференцирования в задачах цифровой обработки доплеровских сигналов при оценке центра тяжести спектра. Доклады III-й Международной конференции и выставки «Цифровая обработка сигналов и ее применение». М.: изд. РНТО РЭС им. А.С. Попова. 2000. Т. 1. С.311. Fractional calculus and its applications. Lecture notes in mathematics. Eds. by Dold A., Eckmann B. Berlin: SpringerVerlag, 1975. V.457. Fractional Calculus. Research notes in mathematics. Eds. by McBride A.C., Roach G.F. London: Pitman advanced publishing program, 1985. V.128. Rutman R.S. // Теор. и мат. физика. 1994. Т.100. С.476. Rutman R.S. // Теор. и мат. физика. 1995. Т.105. С.393. Applications of fractional calculus in physics. Ed. by Hilfer R. Singapore: World Scientific Publishing Co.Pte.Ltd., 2000. Нахушев А.М. Дробное исчисление и его применение. М.: Физ.-мат. лит., 2003.
446
94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113.
114.
115. 116.
Рехвиашвили С.Ш. // Письма в ЖЭТФ. 2004. Т.30. С.33. Климантович Ю.Л. Введение в физику открытых систем. М.: Янус-К, 2002. Забурдаев В.Ю., Чукбар К.В. // ЖЭТФ. 2002. Т.121. С.299. Кобелев Я.Л., Кобелев Л.Я., Климантович Ю.Л. // ДАН. 2003. Т.390. С.605. Кобелев Я.Л., Кобелев Л.Я., Климантович Ю.Л. // ДАН. 2003. Т.391. С.35. Кобелев Я.Л., Кобелев Л.Я., Климантович Ю.Л. // ДАН. 2003. Т.391. С.614. Uchaikin V.V. // Physica A. 1998. V.255. P.65. Учайкин В.В. // УФН. 2003. Т. 173. С.847. Учайкин В.В. // ЖЭТФ. 2003. Т.124. С.903. Санчев А.Н., Уткин С.Г. // ЖТФ. 2003. Т.73. С.1. Бакунин О.Г. // УФН. 2003. Т.173. С.757. Станиславский А.А. // Теор. и мат. физика. 2004. Т.138. С.491. Станиславский А.А. // ЖЭТФ. 2004. Т.125. С.805. Учайкин В.В., Сибатов Р.Т. // Письма в ЖТФ. 2004. Т.30. С.27. Учайкин В.В., Коробко Д.А. // ЖТФ. 2004. Т.74. С.12. Санчев А.Н., Уткин С.Г. // ЖЭТФ. 2004. Т.126. С.502. Учайкин В.В. // ЖТФ. 2004. Т.74. С.123. Драников И.Л., Кондратенко П.С., Матвеев Л.В. // ЖЭТФ. 2004. Т.125. С.1082. Engheta N. // IEEE Antennas and propagation magazine, 1997. V.39. P.35. Прохоров Ю.В., Севастьянов Б.А. Вероятностей теория. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.77. Боровков К.А. Вероятностей теория. Физическая энциклопедия. М.: Большая российская энциклопедия, 1998. Т.1. С.259. Дынкин Е.Б. Основания теории марковских процессов. М.: Физматгиз, 1959. Дынкин Е.Б. Марковские процессы. М.: Физматгиз, 1963.
447
117. 118.
119.
120. 121. 122.
123. 124. 125. 126. 127. 128.
129. 130. 131. 132. 133. 134.
Кай-Лай Ч. Однородные цепи Маркова. М.: Мир, 1964. Боровков К.А. Винеровский процесс. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.111. Кузнецов С.Е. Марковский процесс. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.306. Ито К. Вероятностные процессы. Вып. 1. М.: ИЛ, 1960; Вып. 2. М.: ИЛ, 1963. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1968. Вентцель А.Д., Кузнецов С.Е. Инфинитезимальный оператор. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.201. Неве Ж. Математические основы теории вероятностей. Пер. с англ. М.: Мир, 1969. Вейтцель А.Д. Курс теории случайных процессов. М.: Наука, 1996. Колмогоров А.Н. // Доклады АН СССР. 1940. Т.26. С.115. Леви П. Стохастические процессы и броуновское движение. М.: Наука, 1972. Kurlin S., Taylor H.M. A first course in stochastic processes. Sec.Ed. N.Y.: Academic Press, 1975. Виннишин Я.Ф. Броуновского движения процесс. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.70. Morris H., De Croot A. Probability and statistics. Addison – Wesley Reding, Mass, 1975. Levi P. // Amer. Jour. Math. 1940. V.62. P.487. Uhlenbeck G.E., Ornstein L.S. // Phys. Rev. 1930. V.36. P.823. Бернштейн С.Н. // ДАН. 1934. Т.1. С.1. Там же С.361. Колмогоров А.Н. Теория вероятностей и математическая статистика. М.: Наука, 1986. С.168. Яглом А.М. Орнштейна-Уленбека процесс. Вероятность и математическая статистика. Энциклопедия. М.: Боль-
448
135.
136. 137.
138. 139. 140.
141. 142. 143. 144. 145. 146. 147. 148. 149. 150.
151. 152.
шая российская энциклопедия, 1999. С.429. Ласкин Н.В. Орштейна-Уленбека процесс. Математическая физика. Энциклопедия. М.: Большая российская энциклопедия, 1998. С.411. Doob J.L. // Ann. Math. 1942. V.43. P.351. Mandelbrot B.B., Van Nees J.W. // SIAM Rev. 1968. V.10. P.422. Мандельброт Б. Фракталы, случай и финансы; пер. с франц. М.: Ижевск НИЦ «Регулярная и хаотическая динамика», 2004. 256 с. Mandelbrot B.B. // Water Resour. Res. 1971. V.7. P.543. Bassingthwaighle J.B., Beyer R.P. // Physica D. 1991. V.53. P.71. Voss R.F. Fractals in nature: from characterization to simulation. The science of fractal images. Eds. By Peitgen H.O., Saupe D. N.Y. Springler, 1988. P.21. Wiener N. // J. Math. Phys. Mass Technol. 1923. V.2. P.131. Mandelbrot B.B., Wallis J.R. // Water Resour. Res. 1969. V.5. P.228. Федер Е. Фракталы; пер. с англ. М.: Мир, 1991. Mandelbrot B.B., Wallis J.R. // Water Resour. Res. 1969. V.5. P.242. Михайличенко В.И., Окороков В.А., Поносов А.К. и др. // Препринт ИТЭФ. 1994. №79-94. 9 стр. Михайличенко В.И., Окороков В.А., Поносов А.К. и др. // Препринт МИФИ. 1995. №002-95. 28 стр. Окороков В.А., Поносов А.К., Сергеев Ф.М. // Инженерная физика. 2000. №2. С.2. Mandelbrot B.B., Wallis J.R. // Water Resour. Res. 1969. V.5. P.260. Gefen Y., Aharony A., Alexander S. // Phys. Rev. Lett. 1983. V.50. P.77. Voss R.F. Random fractal forgeries. In «Fundamental algorithms in computer graphics». Ed. by Earnshow R.A. Berlin Springler Verlag, 1985. P.805. Grassberger P., Procaccia I. // Phys. Rev. Lett. 1983. V.50. P.346. Termonia Y., Alexandrowicz Z. // Phys. Rev. Lett. 1983.
449
153. 154. 155. 156. 157. 158.
159. 160. 161. 162. 163.
164. 165. 166. 167. 168.
V.51. P.1265. Монин А.С., Якобсон М.В. // ДАН. 1986. Т. 287. С.795. Hausdorff F. // Math. Annal. 1919. B.79. S.157. Besicovitch A.S. // Math. Annal. 1934. B.110. S.321. Guckenheimer J., Buzyna G. // Phys. Rev. Lett. 1983. V.51. P.1438. Badii R., Politi A. // Phys. Rev. Lett. 1984. V.52. P. 1661. Бадин Р., Полити А. Численные исследования неоднородных фракталов. Сб. Фракталы в физике; пер. с англ. М.: Мир, 1988. С. 632. Renyi A. Probability theory. Amsterdam: Norht-Holland, 1970. Crassberger P., Procaccia J. // Physica D. 1984. V.13. P.34. Mandelbrot B.B. // J. Stat. Phys. 1984. V. 34. P.895. Berry M.V., Lewis Z.V. // London: Proc. R. Soc. 1980. V.A370. P.459. Manldin R.D. On the Hausdorff dimension of graphs and random recursive objects. In «Dimensions and entropies in chaotic systems». Ed. by Mayer G. Kress-Berlin: SpringerVerlage, 1986. P.28. Flandrin P. // IEEE Traus. 1989. V.IT-35. P.197. Феллер В. Введение в теорию вероятностей и ее приложения; пер. с англ. М.: Мир, 1967. Uchaikin V.V., Zolotarev V.M. Chance and stability, stable distributions and their applications. VSP: Science, 1999. Золотарев В.М. Одномерные устойчивые распределения. М.: Мир, 1983. Nolan J.P. Stable distributions: models for heavy tailed data. http://academic2.american.edu/˜jpnolan/stable/ CHAP1.PDF
169.
Nolan J.P. Fitting data and assessing goodness-of-fit with stable distributions. http://academic2.american.edu/˜jpnolan/stable/ DataAnalysis.ps
170. 171.
Csörgő T., Hegyi S., Zajc W.A. // Eur. Phys. J. 2004. V.C36. P.67. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятности и математиче-
450
172.
173. 174. 175. 176. 177. 178. 179.
ской статистике. М.: Наука, 1985. Золотарев В.М. Устойчивые распределения. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.750. Gustafson G., Nilsson A. // Nucl. Phys. 1991. V.B355. P.106. Dokshitzer Y.L., Dremin I.M. // Nucl. Phys. 1993. V.B402. P.139. De Wolf E.A., Dremin I.M., Kittel W. // Phys. Rept. 1996. V.270 P.1; arXiv: hep-ph/9508325 (1995). Andersson B., Gustafson G., Ingelman G., Sjöstrand T. // Phys. Rept. 1983. V.97 P.31. Bialas A. // Acta Phys. Polon. 1992. V.B23. P.561. Utyuzh O.V., Wilk G., Wlodarczyk Z. // Phys. Rev. 2000. V.D61. P.034007. Nolan J.P. Multivariate stable distributions: approximation, estimation, simulation and identification. http://academic2.american.edu/˜jpnolan/stable/ overview.ps
180. 181. 182. 183. 184. 185. 186. 187. 188. 189. 190. 191.
Shlessinger M.F., West B.J., Klafter J. // Phys. Rev. Lett. 1987. V.58. P.1100. Zaslavsky G.M., Tippet M.K. // Phys. Rev. Lett. 1991. V.67. P.3251. Shlessinger M.F., Zaslavsky G.M., Klafter J. // Monthly Nature. 1993. V.1. P.45. Зосимов В.В., Лямшев Л.М. // УФН. 1995. Т. 165. С.361. Feng S., Golubovie L., Zhang Y.-C. // Phys. Rev. Lett. 1990. V.65. P.1028. Bouchland J.P., Georges A. // Phys. Rep. 1990. V.195. P.127. Isichenko M.B. // Rev. Mod. Phys. 1992. V.64. P.961. Fogedby H.C. // Phys. Rev. Lett. 1994. V.73. P.2517. Чукбар К.В. // ЖЭТФ. 1995. Т.108. С.1875. Schnelder W.R., Wyss W. // J. Math. Phys. 1989. V.30. P.134. Friedrich C. // Rheologica Acta 1991. V.30. P.151. Glockle W.G., Nonnenmacher T.F. // Macromolecules. 1991. V.24. P.6426.
451
192. 193. 194. 195. 196. 197.
198. 199. 200. 201.
202. 203. 204. 205. 206. 207. 208. 209.
210.
Glockle W.G., Nonnenmacher T.F. // Stat. Phys. 1993. V.71. P.741. Metzler R., Glockle W.G., Nonnenmacher T.F. // Physica A. 1994. V.211. P.13. Монин А.С. // ДАН СССР. 1955. Т.105. С.256. Монин А.С., Яглом А.М. Статистическая гидромеханика. Ч.2. М.: Наука, 1967. Золотарев В.М., Учайкин В.В., Саенко В.В. // ЖЭТФ. 1999. Т.115. С.1411. Гнеденко Б.В., Колмогоров А.Н. Предельные распределения для сумм независимых случайных величин. М.: ГИТТЛ, 1949. Кейз К., Цвайфель П. Линейная теория переноса; пер. с англ. М.: Мир, 1972. Крянев А.В., Шихов С.Б. Вопросы математической теории реакторов. М.: Энергоатомиздат, 1973. Fox C. // Trans. Amer. Math. Soc. 1961. V.98. P.395. Mathai A.M., Saxena R.K. The H-function with applications in statistics and other disciplines. New Delhi: Wiley Eastern Limited, 1978. Прудников А.П., Брычков Ю.А., Маричев О.И. Интегралы и ряды: дополнительные главы. М.: Наука, 1986. Кобелев В.Л., Кобелева О.Л., Кобелев Я.Л., Кобелев Л.Я. // ДАН. 1997. Т.355. С.326. Кобелев В.Л., Романов Е.П., Кобелев Я.Л., Кобелев Л.Я. // ДАН. 1998. Т.361. С.755. Кобелев В.Л., Романов Е.П., Кобелев Л.Я., Кобелев Я.Л. // Известия РАН. Серия физ. 1998. Т.62. С.2401. Кобелев Я.Л., Кобелев Л.Я., Романов Е.П. // ДАН. 1999. Т.369. С.332. Васильев В.А., Романовский Ю.М. Яхно В.Г. Автоволновые процессы. М.: Наука, 1987. West B.J., Bologna M., Grigolini P. Physics of fractal operators. Springler-Verlag New York, Inc., 2003. Miller K.S., Ross B. An introduction to the fractional calculus and fractional differential equations. John Wiley, New York, 1993. Abramowitz M., Stegun I.A. Handbook of mathematical
452
211. 212. 213. 214. 215. 216. 217. 218. 219. 220. 221. 222.
223. 224. 225. 226. 227. 228. 229. 230. 231. 232. 233.
functions. US Dept. of Commerce, NBS. Appl. Math. Ser. 1972. V.55. Jumarie G. // Int. J. Systems Sci. 1993. V.24. P.1113. Kobelev V., Romanov E. // Prog. Theor. Phys. Suppl. 2000. V.139. P.470. Kolwankar K.M., Gangal A.D. // Chaos. 1996. V.6. P.505. Грандштейн И.С., Рыжик И.М. Таблицы интегралов, сумм, рядов и произведений. Изд. 5-е. М.: Наука, 1971. Дремин И.М., Кайдалов А.Б. // УФН. 2006. Т.176. С.275. Koba Z., Nielsen H.B., Olesen P. // Nucl. Phys. 1972. V.B40. P.317. Alner G.J. et al. (UA5 collaboration). // Phys. Lett. 1986. V.B167. P.476. Де Вольф Э.А., Дремин И.М., Китель В. // УФН. 1993. Т. 163. С.3. Дремин И.М., Леонидов А.В. // УФН. 1995. Т. 165. С.759. Friedlander E.M., Stern I. Preprint LBL-31354. 1991. Oldham K. The fractional calculus. Orlando: Academic Press 1974. P.60. Ross B. Fractional calculus and its applications. In Lecture Notes in Mathematics. Berlin, Springer-Verlag. 1975. V.457. P.1. Дремин И.М. // Письма в ЖЭТФ. 1994. Т.59. С.561 Dremin I. M., Hwa R. // Phys. Rev. 1994. V.D49. P.5805. Wyss W. // J. Math. Phys. 1986. V.27. P.2782. Schneider W.R., Wyss W. // J. Math. Phys. 1989. V.30. P.134. Carpinteri A., Mainardi F. Fractional calculus in continuum mechanics. Vienna, Springer-Verlag. 1997. Barkai E., Silbey R.J. // arXiv : cond-mat/0002020. 2000. Suzuki N., Biyajima M. // arXiv : hep-ph/0101069. 2001. Abreu P. et al. (DELPHI collaboration) // Z. Phys. 1991. V.C50. P.185. Alner G.J. et al. (UA5 collaboration) // Phys. Rep. 1987. V.154. P.247. P. D. Acton P.D. et al. (OPAL collaboration) // Z. Phys. 1992. V.C53. P.539. Hegyi S. // Phys. Lett. 1996. V.B387. P.642 . Ibid 1998.
453
234. 235. 236. 237.
238. 239. 240. 241. 242. 243. 244. 245.
246. 247. 248. 249. 250.
V.B417. P.186. Nakajima N., Biyajima M., Suzuki N. // Phys. Rev. 1996. V.D54. P.4333. Ugoccioni R., Giovannini A., Lupia S. // Phys. Lett. 1995. V.B342. P.387. Suzuki N., Biyajima M., Nakajima N. // Phys. Rev. 1996. V.D53. P.3582; V.D54. P.3653. Goldhaber G. Proceedings of the International workshop on correlations and multiparticle production (CAMP-LESIP IV). Eds. by Plümer, Raha S., Weiner R.M. World Scientific, 1991. P.409. Hanbury Brown R., Twiss R.Q. // Phil. Mag. 1954. V.45. P.663. Hanbury Brown R., Twiss R.Q. // Nature 1956. V.178. P.1046. Boal D.H., Gelbke C.-K. // Rev. Mod. Phys. 1990. V.62. P.553. Bauer W., Gelbke C.-K., Pratt S. // Annu. Rev. Nucl. Part. Sci. 1992. V.42. P.77. Heinz U., Jacak B.V. // Annu. Rev. Nucl. Part. Sci. 1999. V.49. P.529; arXiv: nucl-th/9902020. 1999. Lisa M.A., Pratt S., Soltz R., Wiedemann U. // Annu. Rev. Nucl. Part. Sci. 2005. V.55. P.357. Goldhaber G., Goldhaber S., Lee W.-Y., Pais A. // Phys. Rev. 1960. V.120. P.300. Лексин Г.А. Фемтоскопия. «Современное естествознание». Энциклопедия в 10 т. Т.7. «Физика волновых процессов». М.: Издательский дом «Магистр-Пресс», 2001. С.156. Csörgő T. // Heavy Ion Phys. 2002. V.15. P.1; arXiv: hepph/0001233. 2000. Miskowiec D., Voloshin V. // Heavy Ion Phys. 1999. V.9. P.283; arXiv: nucl-ex/9704006. 1997. Pratt S. // Phys. Lett. 1993. V.B301. P.159; Pratt S., Zelevinsky V. // Phys. Rev. Lett. 1994. V.72. P.816. Chao W.Q., Gao C.S., Zhang Q.H. // J. Phys. 1995. V.G21. P.847; Phys. Rev. 1995. V.C52. P.2064 Csörgő T., Zimányi J. // Phys. Rev. Lett. 1998. V.80. P.916;
454
251. 252. 253. 254. 255. 256. 257. 258. 259.
260. 261.
262. 263. 264. 265. 266. 267. 268. 269. 270. 271.
arXiv: hep-ph/9705432. 1997. Wiedemann U.A. // Phys. Rev. 1998. V.C57. P.3324. Zhang Q.H., Scotto P., Heinz U. // Phys. Rev. 1998. V.C58. P.3757. Shuryak E. // Phys. Lett. 1973. V.B44. P.387. Шуряк Э.В. // ЯФ. 1973. Т.18. С.1302. Pratt S. // Phys. Rev. Lett. 1984. V.53. P.1219 ; Phys. Rev. 1986. V.D33. P.1314. Kolehmainen K., Gyulassy M. // Phys. Lett. 1986. V.B180. P.203. Padula S., Gyulassy M., Gavin S. // Nucl. Phys. 1990. V.B329. P.357. Andreev I.V., Plümer M., Weiner R. // Int. J. Mod. Phys. 1993. V.A8. P.4577. Chapman S., Heinz U. // Phys. Lett. 1994. V.B340. P.250. Heinz U. In «Correlations and clustering phenomena in subatomic physics». Eds. Harakeh M.N., Scholten O., Koch J.H. New York: Plenum. NATO ASI Series. 1997. V.B359. P.137. Wiedemann U.A., Heinz U. // arXiv: nucl-th/9901094. 1999. Miśkowiec D., et al. // Nucl. Phys. 1996. V.A610. P.227c; Barrette J., et al. (E877 collaboration) Phys. Rev. Lett. 1997. V.78. P.2916. Ferenc D., Heinz U., Tomášik B., et al. // arXiv: hep-ph/ 9802342. 1998. Pratt S. In «Quark-gluon plasma 2». Ed. Hwa R.C. Singapore: World Science. 1997. P.700. Pratt S. // Phys. Rev. 1997. V.C56. P.1097. Chapman S., Scotto P., Heinz U. // Heavy Ion Phys. 1995. V.1. P.1. Pratt S. // Phys. Rev. 1997. V.C56. P.1095. Yano F.B., Koonin S.E. // Phys. Lett. 1978. V.B78. P.556. Brown D.A., Danielewicz P. // Phys. Lett. 1997. V.B398. P.252; Phys. Rev. 1998. V.C57. P.2474. Csörgő T., Hegyi S. // Phys. Lett. 2000. V.B489. P.15. Adams J.,et al. (STAR collaboration) // Phys. Rev. 2005. V.C71. P.044906; arXiv: nucl-ex/0411036. 2004. Подгорецкий М.И. // ЯФ. 1983. Т.37. С.455.
455
272.
273. 274. 275. 276. 277. 278. 279. 280. 281. 282. 283. 284. 285. 286. 287. 288.
289. 290.
Bertsch G.F., Gong M., Tohyama M. // Phys. Rev. 1988. V.C37. P.1896; Bertsch G.F., Brown G.E. // Phys. Rev. 1989. V.C40. P.1830. Kittel W. // Acta Phys. Polon. 2001. V.B32. P.3927; arXiv: hep-ph/0110088. 2001. Wiedemann U.A., Heinz U.W. // Phys. Rept. 1999. V.319. P.145; arXiv: nucl-th/9901094. 1999. Weiner R.M. // Phys. Rept. 2000. V.327 P.249; arXiv: hepph/9904389. 1999. Chapman S., Scotto P., Heinz U. // Phys. Rev. Lett. 1995. V.74. P.4400. Bertsch G.F., Danielewicz P., Herrmann M. // Phys. Rev. 1994. V.C49. P.442. Herrmann M., Bertsch G.F. // Phys. Rev. 1995. V.C51. P.328. Chapman S., Nix J.R., Heinz U. // Phys. Rev. 1995. V.C52. P.2694. Akkelin S.U., Sinyukov Yu. // Phys. Lett. 1995. V.B356. P.525. Csörgő T., Lörstad B. // Nucl. Phys. 1995. V.A590. P.465c; Phys. Rev. 1996. V.C53. P.918. Wiedemann U.A., Scotto P., Heinz U. // Phys. Rev. 1996. V.C53. P.918. Heinz U., Tomášik B., Wiedemann U.A., Wu Y.F. // Phys. Lett. 1996. V.B382. P.181. Chapmann S., Scotto P., Heinz U. // Nucl. Phys. 1995. V.A590. P.449. Heinz U. // Nucl. Phys. 1996. V.A610. P.264c. Tomášik B., Heinz U. // Eur. Phys. J. 1998. V.C4. P.327. Schlei B.R., Strottmann D., Xu N. // Phys. Lett. 1998. V.B420. P.1. Csörgő T., Pratt S. Proceedings of the workshop «Relativistic heavy ion collisions at present and future accelerators». Eds. Csörgő T., et al. Budapest: MIA KFKI Press, 1991. P.75. Heinz U., Hummel A., Lisa M.A., Wiedemann U.A. // arXiv: nucl-th/0207003. 2002. Lisa M.A., et al. (E895 collaboration) // Phys. Lett. 2000.
456
291. 292. 293. 294. 295. 296. 297. 298. 299. 300. 301.
302. 303. 304. 305. 306.
307. 308. 309. 310. 311.
V.B496. P.1. Adams J.,et al. (STAR collaboration) // Phys. Rev. Lett. 2004. V.93. P.012301; arXiv: nucl-ex/0312009. 2003. Bertsch G.F. // Nucl. Phys. 1989. V.A498. P.173. Pratt S., Csörgő T., Zimányi J. // Phys. Rev. 1990. V.C42. P.2646. Fields D.E., et al. // Phys. Rev. 1995. V.C52. P.986 Tomášik B., Heinz U. // arXiv: nucl-th/9805016. 1998. Wu Y.F., Heinz U., Tomášik B., Wiedemann U.A. // Eur. Phys. J. 1998. V.C1. P.599. Tomášik B., Heinz U. // arXiv: nucl-th/9901006. 1999. Yano F., Koonin S. // Phys. Lett. 1978. V.B78. P.556. Heiselberg H., Vischer A. // Eur. Phys. J. 1998. V.C1. P.599 ; Phys. Lett. 1998. V.B421. P.18. Csörgő T., Hegyi S., Zajc W.A. // Eur. Phys. J. 2004. V.C36. P.67. Sinyukov Yu. In «Hot hadronic matter: theory and experiment». Ed. Rafelski J. New York: Plenum. NATO ASI Series. 1995. V.B346. P.309. Tomášik B., Heinz U. // Acta Phys. Slov. 1999. V.49. P.251. Adams J.,et al. (STAR collaboration) // Phys. Rev. 2005. V.C71. P.044906; arXiv: nucl-ex/0411036. 2004. Csörgő T., Lörstad B., Zimányi J. // Z. Phys. 1996. V.C71. P.491; arXiv: hep-ph/9411307. 1994. Vance S.E., Csörgő T., Kharzeev D. // Phys. Rev. Lett. 1998. V.81. P.2205; arXiv: nucl-th/9802074. 1998. Ster A., Csörgő T. // arXiv: hep-ph/0112065. 2001; Csanád M., Csörgő T., Lörstad B., Ster A. // arXiv: nuch-th/0403074 2004. Csörgő T., Lörstad B., Schmid-Sorensen J., Ster A. // Eur. Phys. J. 1999. V.C9. P.275; arXiv: hep-ph/9812422. 1998. Csörgő T., Zimányi J. // Nucl. Phys. 1990. V.A517. P.588. Csörgő T., Lörstad B. // Phys. Rev. 1996. V.C54. P.1390; arXiv: hep-ph/9509213. 1995. Nickerson S., Csörgő T., Kiang D. // Phys. Rev. 1998. V.C57. P.3251; arXiv: nucl-th/9712059. 1997. Hardtke D., Voloshin S.A. // Phys. Rev. 2000. V.C61. P.024905; arXiv: nucl-th/9906033. 1999.
457
312. 313.
314. 315. 316.
317. 318. 319. 320. 321. 322.
323.
324. 325. 326. 327. 328.
Zolotarev V.M. In «Contributions to probability». New York: Academic Press, 1981. P.283. Akkelin S.V., Csörgő T., Lukács B., Sinyukov Y.M., Weiner M. // Phys. Lett. 2001. V.B505. P.64; arXiv: hep-ph/ 0012127. 2000. Csörgő T., Akkelin S.V., Hama Y., Lukács B., Sinyukov Y.M. // arXiv: hep-ph/0108067. 2001. Csörgő T. // arXiv: hep-ph/0111139. 2001. Abdul-Hamid H., Nolan J.P. // J. Multivariate analysis 1998. V.67. P.80; Nolan J.P., Rajput B. // Commun. StatisticsSimula. 1995. V.24. P.551. Retiere F., Lisa M.A. // Phys. Rev. 2004. V.C70. P.044907. Gyulassy M., Padula S. // Phys. Lett. 1988. V.B217. P.181. Csörgő T., Pratt S. // Preprint KFKI. 1991. №1991-28/A. P.75. Heinz U.W., Zhang Q.H. // Phys. Rev. 1997. V.C56. P.426; arXiv: nucl-th/9701023. 1997. Heiselberg H., Vischer A.P. // arXiv: nucl-th/9707036. 1997. Schneider W.R. Stable distributions: Fox function representation and generalization. In «Stochastic processes in classical and quantum systems». Lecture Notes in Physics. Berlin: Springer-Verlag, 1986. Eds. by Albeverio S., Casati G., Merlini D. V.262. P.497. Schneider W.R. Generalized one-sided stable distributions. Proceedings of the second BiBoS Symposium. In «Stochastic Processes – Mathematics and Physics II». Lecture Notes in Mathematics. Berlin: Springer-Verlag, 1986. Eds. by Albeverio S., Blanchard Ph., Streit L. V.1250. P.269. Csörgő T., Lörstad B. // Nucl. Phys. 1995. V.A590, P.465c; arXiv: hep-ph/9503494. 1995. Adams J., et al. (STAR collaboration) // Phys. Rev. Lett. 2003. V.91. P.262301; arXiv : nucl-ex/0306028. 2003. Agababian N.M., et al. (EHS/NA22 collaboration) // Z. Phys. 1993. V.C59. P.405. Neumeister N., et al. (UA1-Minimum Bias collaboration) // Z. Phys. 1993. V.C60. P.633. Benvenuti A.C., et al. (NA4/BCDMS Collaboration) // Phys. Lett. 1987. V.B195. P.97.
458
329. 330. 331. 332. 333. 334. 335. 336. 337. 338. 339. 340. 341. 342. 343.
344. 345. 346.
347.
Benvenuti A.C., et al. (NA4/BCDMS Collaboration) // Phys. Lett. 1989. V.B223. P.490. Benvenuti A.C., et al. (NA4/BCDMS Collaboration) // Phys. Lett. 1990. V.B237. P.592. Virchaux M., Milsztajn A. // Phys. Lett. 1992. V.B274. P.221. Ellis R.K., Furmanski W., Petronzio R. // Nucl. Phys. 1983. V. B212. P.29. Whitlow L.W., et al. // Phys. Lett. 1992. V.B282. P.475. Derrick M., et al. // Phys. Lett. 1995. V.B345. P.576; Z. Phys. 1999. V.C62. P.399. Benvenuti A.C., et al. (NA4/BCDMS Collaboration) // Phys. Lett. 1989. V.B223. P.485; Phys. Lett. 1990. V.B237. P.599. Adams M.R., et al. // Phys. Rev. 1996. V.D54. P.3006. Santiago J., Yndurain F.J. arXiv: hep-ph/9904344 (1999). Chyla J., Kataev A. L. // Phys. Lett. 1992. V.B297. P.385. Larin S.A., Vermaseren J.A.M. // Phys. Lett. 1991. V.B259. P. 345. Braun V.M., Kolesnichenko A.V. // Nucl. Phys. 1987. V.B283. P.723. Dasgupta M., Webber B. // Phys. Lett. 1993. V.B382. P.273. Kataev A.L. arXiv: hep-ph/9907310 (1999). Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятности и математической статистике. М.: Наука, 1985. Миллер Б.М., Панков А.Р. Теория случайных процессов. М.: Физматлит, 2007. Хинчин А.Я. Fundam. Math. 1924. V.6. P.9 (в кн.: Избранные труды по теории вероятности. М., 1995. С.12). Татарский В.И. Ланжевена уравнение. Физическая энциклопедия. М.: Большая российская энциклопедия, 1990. Т.2. С.575. Золотарев В.М. Интегральное преобразование. Вероятность и математическая статистика. Энциклопедия. М.: Большая российская энциклопедия, 1999. С.199.
459
Окороков Виталий Алексеевич Сандракова Елизавета Васильевна
ФРАКТАЛЫ В ФУНДАМЕНТАЛЬНОЙ ФИЗИКЕ
ФРАКТАЛЬНЫЕ СВОЙСТВА МНОЖЕСТВЕННОГО ОБРАЗОВАНИЯ ЧАСТИЦ И ТОПОЛОГИЯ ВЫБОРКИ
Учебное пособие
Редактор Шумакова Н.В. Оригинал-макет изготовлен Окороковым В.А.
Подписано в печать Печ. л. 28,75 Изд. № 055-1
15.04 2009 г. Уч.-изд. л. 28,75
Формат 60 х 84 1/16 Тираж 150 экз. Заказ №
Московский инженерно-физический институт (государственный университет) Типография МИФИ 115409 г. Москва, Каширское шоссе, 31
«…С самого момента своего зарождения идеи самоподобия и фрактального анализа постоянно привлекали внимание многих авторов… Однако пока что только в учебных пособиях В.А. Окорокова и Е.В. Сандраковой впервые в мире была предпринята попытка в рамках учебного издания продемонстрировать пользу от возможного применения этого математического аппарата в физике высоких энергий…» Из рецензии