Любушин А.А. Анализ данных систем геофизического и экологического мониторинга. М.: Наука, 2007. 228 с.
РОССИЙСКАЯ АКАД...
54 downloads
253 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Любушин А.А. Анализ данных систем геофизического и экологического мониторинга. М.: Наука, 2007. 228 с.
РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ФИЗИКИ ЗЕМЛИ им. О.Ю. ШМИДТА
А.А. Любушин
Анализ данных систем геофизического и экологического мониторинга
Ответственный редактор Член-корреспондент РАН Г.А. Соболев
Москва Наука 2007
УДК 550.3 ББК 26.2 Л93
Рецензенты: доктор технических наук М.В. БОЛГОВ доктор физико-математических наук А.В. ПОНОМАРЕВ
Любушин А.А. Анализ данных систем геофизического и экологического мониторинга / А.А.Любушин; отв. ред. Г.А. Соболев; Ин-т физики Земли им. О.Ю. Шмидта РАН. – М.: Наука, 2007. – 228 с. – ISBN 5-02-034063-4 (в пер.). В монографии на основании многолетнего опыта работы автора приведены результаты совместного анализа временных рядов деформаций и наклонов земной коры, электротеллурических наблюдений, вариаций уровней подземных вод, атмосферного давления и скорости ветра, последовательностей сейсмических событий, уровня морей, расходов воды в реках, древесных колец роста, реконструкций температур по данным анализа ледовых кернов. Автором разработаны оригинальные методы совместного анализа данных, полученных в результате исследования различных природных процессов. Разработанные методы применяются для решения широкого круга задач: от поиска новых предвестников сильных землетрясений до идентификации скрытых периодичностей вариаций климата. Для специалистов в области геофизики и экологического мониторинга, а также для студентов, обучающихся по соответствующим специальностям Темплан 2006-1-131 ISBN 5-02-034063-4
© Институт физики Земли им. О.Ю. Шмидта РАН, 2007 © Любушин А.А., 2007 © Редакционно-издательское оформление Издательство «Наука», 2007
ВВЕДЕНИЕ.
Временные ряды – это одна из наиболее распространенных форм представления исходных данных систем мониторинга в задачах геофизики, метеорологии, экологии. Последовательные значения исследуемых характеристик отражают как внутреннюю динамику объектов, так и их взаимные связи и изменчивость этих связей во времени. Сами временные ряды могут отличаться как физической природой измеряемых величин, так и пространственным положением пунктов измерения. Обычно целью мониторинга является либо непосредственный прогноз исследуемых характеристик на некоторый интервал времени вперед, либо выделение интервалов времени «аномального поведения», которое
может
служить,
например,
предвестником
резких
или
даже
катастрофических изменений в будущем, или выделение скрытых сигналов, присутствие которых неочевидно в силу высокого уровня шума. В книге рассматриваются только задачи второго и третьего типа. Интуитивно понятие «аномальное поведение», очевидно, требует формального определения и, что важнее всего, алгоритмической реализации в виде надежно работающих программ. Принятие решений по данным мониторинга может быть достаточно простым, если априорно известны пороговые значения измеряемых величин, такие, что при их превышении или уменьшении относительно порогов можно говорить об аномальном состоянии исследуемого объекта и утверждать, что он требует повышенного внимания. Например, для многих экологических, социологических и медицинских объектов подобные пороги часто известны и непосредственно следуют из смысла измеряемых величин. Что же касается геофизического мониторинга, то его специфика заключается в том, что измеряемые величины очень сложно и запутанно связаны между собой и с состоянием объекта (земной коры), поэтому определение критических порогов в геофизике является чрезвычайно трудным делом. В настоящее время общепризнанно, что все критические явления имеют сходные черты. Исследование этих особенностей можно объединить под общим
3
названием “наука о критических явлениях”. Изначально под критическими явлениями понимали, в основном, фазовые переходы и, следовательно, это был раздел статистической физики и термодинамики. Однако позже, когда было осознано, что математический аппарат, описывающий разрушение строительной конструкции, фазовый переход в жидкости и образование каустик в оптике, имеет поразительно много общего, зародилась математическая теория катастроф (Арнольд, 1981; Gilmore, 1981). Накопление опыта анализа критических явлений с общих позиций привело к качественной формулировке относительно небольшого числа так называемых флагов катастроф, то есть наиболее общих качественных признаков поведения любых систем, приближающихся к точке резкой смены своего состояния (Gilmore, 1981). Дальнейшее развитие теории критических явлений пополнило ее арсенал такими концепциями, как самоорганизующаяся критичность
(Bak
Tang,
1989),
критическое
поведение
со
все
более
увеличивающейся частотой осцилляций по мере приближения к катастрофе (Sornette et al., 1996) и др. Достаточно полный обзор современного состояния теории критических явлений и ее связей с синергетикой приведен в (Haken, 1982; Nicolis, Prigogine, 1989; Капица и др., 1997). Вернемся
к
такой
популярной
геофизической
задаче,
как
прогноз
землетрясений, и попытаемся понять, как реально можно применить абстрактные концепции общей теории катастроф к прогнозу, учитывая, что придется иметь дело
с
«грязными»,
сырыми
данными
геофизических
измерений,
сопровождающихся сбоями аппаратуры, перерывами в наблюдениях, влиянием метеорологических и техногенных шумов. Ведь в данном случае невозможно выписать какой-нибудь потенциал и исследовать его особенности в точках равновесия, как это принято, например, в математической теории катастроф. Следовательно,
необходимо
взять
на
вооружение
максимально
общую
закономерность, своего рода метазакон, и трансформировать его таким образом, чтобы он мог работать с реальными данными, что подразумевает применение статистических
методов
анализа
данных,
адекватных
этому
метазакону.
Необходимо научить компьютер выделять из данных геофизических наблюдений самую главную их суть и отбрасывать малосущественные детали. При этом опасение «выплеснуть с водой и ребенка» является для геофизика весьма актуальным при анализе и интерпретации данных.
4
Ниже в качестве такого метазакона предлагается брать феномен увеличения коллективного поведения или синхронизации геофизических полей в области подготовки
землетрясения.
Почему
именно
синхронизация,
увеличение
коллективного поведения измеряемых характеристик должно представлять интерес для задач мониторинга и иметь отношение к подготовке землетрясения или
иной
вытекающие
геокатастрофы? из
наиболее
Для
этого
общих
есть
методические
закономерностей
рекомендации,
поведения
систем,
приближающихся к бифуркации, катастрофе. Увеличение радиуса корреляции флуктуаций в окрестности точки бифуркации указывает на тенденцию к установлению согласованности во всем объеме системы, которая тем самым готовится к коллективному переходу в новое состояние (Nicolis, Prigogine, 1989). В статистической физике жидкостей такое поведение известно как "критическая опалесценция" или аномальная дисперсия, которая рассматривается как один из универсальных "флагов" приближающейся катастрофы (Gilmore, 1981). Иными словами, целью анализа многомерных временных рядов систем мониторинга предлагается считать поиск сигналов синхронизации, согласованности вариаций наблюдаемых параметров, относящихся к состоянию изучаемого объекта, измеряемых в пространственно разнесенных пунктах системы мониторинга или измеряемых в одном пункте физически различных величин. Если бы дело ограничилось только пожеланиями, какого рода сигналы следует искать, без формального описания, как это надо делать, и реализации алгоритмов в виде программ, то в этой идее не было бы ничего нового и оригинального, так как в той или иной форме она всегда витала в воздухе и считалась даже очевидной среди исследователей, занимавшихся прогнозом землетрясений. Ведь если имеется серия графиков измерений различных характеристик на геофизическом полигоне, то исследователь прежде всего старается найти элементы общего поведения. Однако человеческий глаз весьма несовершенен в ситуации, когда необходимо проанализировать 10 графиков, например одновременно. Кроме того, глаз может заметить только особенности низкочастотного и плавного поведения, причем лишь в том случае, если они не теряются на фоне помех. Далее, формализовать визуальные особенности графиков очень сложно, их восприятие весьма субъективно, и то, что для одного кажется аномалией, другим воспринимается как фон. А как быть в случае, если имеется очень слабый общий
5
сигнал,
присутствующий
во
всех
измерениях
в
сумме
с
сильными
индивидуальными помехами, характерными только для одного типа измерений или для того или иного места их проведения? Метод пристального взгляда здесь будет совершенно бессилен. Иногда помогает частотная фильтрация – способ цифровой обработки сигналов, когда колебания, имеющие периоды в заданном диапазоне значений, сохраняются, а все прочие подавляются. Но и он становится бессилен, если периоды и общего сигнала и индивидуальных помех имеют одинаковый диапазон значений, тогда, подавляя помехи, мы заодно уничтожаем и сигнал. Для того чтобы эта идея могла фактически работать, необходима ее реализация в виде комплекса вычислительных алгоритмов и программ, позволяющих проводить анализ многомерных временных рядов, скалярными компонентами которых являются результаты измерения физически разнородных геофизических
величин
в
пространственно
разнесенных
пунктах
сети
мониторинга. Опыт проведения наблюдений за фоновыми процессами в сейсмоактивных регионах показывает, что все процессы в земной коре более или менее равноправны в том смысле, что в любом из них доля предвестниковой информации сравнительно невелика, а значительная мощность вариаций приходится на шумы различного происхождения. Такая ситуация является общим положением, хотя иногда (очень редко) по отдельным процессам могут наблюдаться ненадежность
сильные и
предвестниковые
мозаичность
изменения.
исторически
Этим
наблюденных
объясняется предвестников
землетрясений по тому или иному процессу, несмотря на то, что некоторые из них систематически появляются в лабораторных опытах по разрушению образцов (Kasahara, 1981; Соболев, 1993; Соболев, Пономарев, 2003). Одна из причин этому может быть достаточно проста – при наблюдениях в лабораторных условиях нет шумов, и, как следствие, отношение сигнал/шум значительно выше, чем при полевых наблюдениях (в которых предвестники фиксируются при случайном понижении уровня шумов перед событием). Поэтому проблема увеличения отношения сигнал/шум для реальных наблюдений – одна из основных для прогноза землетрясений. Однако проблема фильтрации помех, повышения отношения сигнал/шум – это не единственная причина, для которой
необходим
многомерный
анализ.
Более
важным
стимулом
представляется возможность анализа взаимодействия, связи между различными
6
геофизическими полями. Самые общие соображения и аналогии подсказывают, что наиболее тонкие, скрытые, особенности поведения геофизических полей должны проявиться именно при анализе их взаимодействий. Прежде чем стремиться увеличивать отношение сигнал/шум, очевидно, надо задаться вопросом: что есть "сигнал"? В данном подходе, как уже говорилось выше,
сигналом
предлагается
называть
синхронизацию,
согласованность
вариаций наблюдаемых параметров, относящихся к состоянию земной коры, измеряемых в пространственно разнесенных пунктах системы геофизического мониторинга, покрывающей исследуемый участок земной коры. В книге основным аппаратом для анализа информации от сетей мониторинга является многомерный анализ временных рядов, использующий как классические методы многомерных параметрических моделей и преобразования Фурье, так и сравнительно недавно созданные методы (за последние 15 лет) вейвлетпреобразований. При анализе многомерных временных рядов значительное внимание уделяется рассмотрению поведения в скользящем временном окне оценки максимального собственного числа спектральных матриц (оцениваемых после определенного рода нормировки компонент многомерного ряда) и канонических когерентностей.
Анализ
эволюции
максимального
собственного
числа
спектральных матриц является обобщением на многомерный случай привычного геофизикам спектрально-временного анализа (СВАН-а) скалярных временных рядов. Канонические когерентности служат обобщением обычного квадрата модуля спектра когерентности между двумя скалярными временными рядами на случай, когда оба ряда или один из них являются многомерными. Анализ эволюции канонических когерентностей позволяет исследовать связи на различных частотах и в разные интервалы времени между двумя геофизическими полями
(число
пунктов
измерения
которых
и
образуют
размерности
анализируемых рядов). Исследование эволюции максимального собственного числа спектральных матриц и канонических когерентностей (которые представляются в виде частотно-временных диаграмм) и определение сигнала синхронизации как временных интервалов и частотных полос увеличения значений этих статистик, является
инструментом
анализа
взаимодействия
между
геофизическими
процессами. Если согласиться с тем, что искомый сигнал есть увеличение
7
синхронного, коллективного поведения, то отсюда естественно вытекает использование аппарата главных спектральных компонент и канонических когерентностей для выделения этого сигнала. Попутно решается и задача повышения отношения сигнал/шум, поскольку используемые методы как раз и нацелены на то, чтобы из множества регистрируемых процессов выделить максимально общую для всех тенденцию и пренебречь индивидуальными особенностями каждого процесса и места проведения измерений. Рассматривается
конструкция
агрегированного
сигнала
–
такого
скалярного сигнала, который в максимальной степени аккумулирует в себе наиболее общие вариации, присутствующие сразу во всех анализируемых процессах и в то же время подавляющая те составляющие, которые характерны только для одного (того или иного) процесса и имеют, как правило, характер локальных помех, обусловленных спецификой места проведения измерений, техногенными причинами или ошибками измерений. Агрегированный сигнал, в отличие от частотно-временных диаграмм, часто дает более наглядное и более привычное
(в
виде
графика
одного
сигнала)
для
многих
геофизиков
представление о поведении наиболее общих компонент, присутствующих во всех измеряемых величинах, что позволяет эффективнее использовать накопленный опыт и интуицию. Все вышеперечисленные методы основаны на спектральном подходе, то есть так
или
иначе
использовали
разложение
сигнала
по
гармоническим
составляющим. Это имеет свои плюсы и минусы: эти методы наилучшим образом подходят для выделения общих гармонических составляющих и в то же время неспособны справиться с выделением общих сигналов, имеющих резко нестационарный характер, − “всплесков”. Учет нестационарности спектральными методами возможен только путем оценок в скользящем временном окне. Однако при этом всплески усредняются, а моменты общих всплесков могут быть определены только с точностью, равной длине временного окна. В то же время слишком сильное уменьшение длины временного окна делает спектральные оценки неустойчивыми и повышает влияние чисто шумовых компонент. Как известно, почти все модели подготовки землетрясений указывают на увеличение коллективной составляющей поведения геофизических полей в зоне подготовки по мере приближения к моменту землетрясения (Kasahara, 1981; Mogi, 1985; Соболев, 1993; Соболев, Пономарев, 2003). Если долго и среднесрочные
8
предвестники
имеют характер плавных общих изменений в поведении
геофизических полей и, следовательно, есть надежда, что они могут быть выявлены спектральными методами, то краткосрочные предвестники, как правило, имеют импульсный, “всплесковый” характер (например, обусловленные разрушением перемычек между трещинами в очаге), и поэтому выделить их на фоне сильных помех спектральными методами невозможно. Выходом из этой ситуации является теория вейвлетов – ортогональных разложений сигналов по системе функций с финитным носителем (Daubechies, 1992; Chui, 1992; Mallat, 1998). В книге рассматривается процедура построения агрегированного сигнала многомерных временных рядов систем мониторинга, использующая в качестве базисных функций не комплексные осциллирующие экспоненты, а вейвлеты. Последнее обстоятельство позволяет выделять такие общие сигналы, которые было невозможно выделить спектральными методами и, в частности, краткосрочные предвестники землетрясений. Кроме того, на основе использования вейвлет-разложений, строится мера когерентного поведения, обобщающая подход на основе канонических когерентностей. Следует
подчеркнуть,
что
при
анализе
данных
мониторинга
из
сейсмоктивных регионов возможны три причины возникновения сигнала синхронизации в низкочастотных геофизических измерениях П 1. Наличие внешнего источника помех с большим пространственным радиусом корреляции, воздействующего на все пункты измерения (например, вариации атмосферного давления). П 2. Консолидация вещества земной коры в области, охватываемой сетью мониторинга (объединение малых блоков земной коры в более крупные). П 3. Постсейсмическая синхронизация вариаций геофизических полей после сильных землетрясений. Сигнал П1 может быть устранен путем компенсации внешних активных помех, поддающихся измерению. При этом следует иметь в виду, что при наличии нескольких одновременно действующих, связанных друг с другом, помех эффективна лишь их совместная, многомерная компенсация. Сигнал П3 наиболее легко выделяется при наблюдениях в сейсмоактивных регионах, и зачастую убедиться в его существовании можно просто визуально, без какой либо обработки. Что же касается сигнала П2, то он является наиболее интересным с геофизической точки зрения и наиболее трудным для выделения. Очевидно, что
9
он представляет интерес для поиска предвестников землетрясений, поскольку процесс подготовки сильного землетрясения на стадии появления долго- и среднесрочных предвестников неизбежно включает в себя консолидацию вещества земной коры. Одна из проблем анализа систем мониторинга – их предварительная обработка с целью получения некоторых «новых» временных рядов, которые содержали бы наиболее общие характеристики данных и были бы максимально свободны от индивидуальных особенностей. Простейшим способом избавиться от влияния масштаба данных является, например, их нормализация, то есть вычитание выборочных средних и деление на оценку стандартного отклонения. Однако возможны иные, более изощренные методы предварительной обработки, которые основаны на выделении глубоких статистических свойств поведения сигнала на последовательных интервалах времени. Один из способов - это анализ вариаций оценок постоянных Херста, а также параметров мультифрактальных спектров сингулярности, полученных в скользящем временном окне. Эти способы предварительного преобразования информации составляют содержание так называемого фрактального анализа временных рядов. Временные ряды систем геофизического мониторинга, если из них вычленить детерминированные циклические тренды сезонного характера и воздействие приливов, проявляют основные черты самоподобного поведения на различных временных масштабах: прямолинейный график спектра мощности в двойном логарифмическом масштабе, эффекты длительной памяти о прошлых состояниях. Положительное качество фрактального анализа – его способность исследовать сигналы, которые с точки зрения ковариационной и спектральной теории не содержат никакой информации и являются «шумом», либо «белым», либо «цветным». В
книге
изложены
результаты
выделения
эффектов
синхронизации
временных рядов мониторинга, полученные вследствие анализа не исходных данных, а вариаций во времени параметров их спектров сингулярности, оцененных в скользящем временном окне методом анализа флуктуаций после исключения
масштабно−зависимых
трендов.
Эти
результаты
можно
интерпретировать как использование мультифрактальных мер синхронизации. Основным объектом дальнейшего рассмотрения будут результаты измерения так называемых низкочастотных фоновых процессов (НФП) в земной коре,
10
атмосфере. Под НФП понимаются постоянно имеющие место и случайный характер временные вариации геофизических полей (наклонов, деформаций земной коры, уровней подземных вод в скважинах, концентраций химических элементов
в
подземных
водах,
интенсивности
выделения
газов,
электросопротивления горных пород, микросейсмического фона, атмосферного давления и т.д.) с характерным периодом от нескольких минут до нескольких месяцев и даже лет (верхний предел изучаемых периодов зависит от длительности наблюдений). НФП имеют место как в сейсмоактивных, так и в асейсмических регионах
и,
очевидно,
являются
носителем
информации
о
процессах,
происходящих в верхних слоях земной коры, в том числе и подготавливающих геокатастрофы (землетрясения, горные удары). Кроме того, рассмотрено применение разработанных методов к анализу климатических временных рядов (расхода воды в реках, ежегодных колец роста деревьев, реконструкций температур по ледовым кернам вариаций уровня Каспийского моря, вариации скорости ветра). Исследована нестационарная периодическая структура последовательности
сейсмических событий в ряде
регионов. Рассмотрена задача классификации большого массива 3-мерных сейсмических записей событий в глубоких шахтах. Книга состоит из трех глав. Две главы методического характера и посвящены изложению методов анализа данных систем мониторинга, в том числе и разработанных автором. Изложение методов сопровождаются примерами анализа реальных данных мониторинга. В третьей главе последовательно излагаются примеры применения предложенных методов к анализу различных данных мониторинга
для
решения
задач
поиска
предвестников
землетрясений,
обнаружения скрытых периодичностей и характерных точек смены «моды» поведения исследуемых объектов. Исследования программой Г.А.Соболева,
были
Президиума
поддержаны РАН
Г.Н.Копылову,
грантами
«Электронная Ю.Ф.Мороза,
РФФИ, Земля».
INTAS, Автор
М.В.Болгова,
а
также
благодарит
В.Ф.Писаренко,
А.Ф.Кушнира, Л.Б.Кляшторина, Д.М.Печерского, А.Б.Манукина, О.С.Казанцеву, В.И.Осику, весь коллектив экспериментаторов Лаборатории физики колебаний пробных масс ИФЗ РАН, а также Зденека Калаба (Чехия) и Питера ван Гельдера (Нидерланды) за многолетнее сотрудничество, полезные и плодотворные обсуждения и предоставленные данные наблюдений.
11
ГЛАВА 1. МЕТОДЫ АНАЛИЗА СКАЛЯРНЫХ ВРЕМЕННЫХ РЯДОВ.
В этой главе излагаются методы анализа скалярных сигналов. В процессе изложения методы иллюстрируются примерами обработки реальных данных систем
мониторинга.
Эти
примеры,
помимо
чисто
методической,
иллюстративной, цели часто имеют и самостоятельный интерес. В примерах анализированы
различные
статистические
свойства
следующих
сигналов:
глобальная температурная аномалия; реконструкция зимних температур в Гренландии (553-1973 гг.); палеомагнитное наклонение за интервал времени 265 тыс. лет; зависимость численности поголовья сельди от нерестовых запасов; среднегодовые температуры в Центральной Англии (1723-1970 гг.); записи микросейсм на сейсмостанции Петропавловск-Камчатский перед Кроноцким землетрясением (05.12.1997); дендрохронология срезов остистой сосны в Калифорнии, (6000 г. до н.э. – 1979 г.); вариации электротеллурических потенциалов на Камчатке; сейсмический режим в окрестности эпицентра землетрясения на Суматре (26.12.2004); ежесуточные стоки Рейна, (1816-1997 гг.). 1.1. Циклические тренды. Задача выделения тренда временного ряда является первым естественным шагом при анализе данных. Разделение сигнала на «тренд» и «остаток» достаточно условно и основано неявно на предположении, что плавные, низкочастотные изменения обусловлены влиянием каких-то детерминированных причин, тогда как сравнительно высокочастотные осцилляции отражают случайную составляющую сигнала. Очевидно, что такая интерпретация зависит от временного масштаба, на котором рассматривается временной ряд, так как при его увеличении низкочастотные вариации постепенно переходят в разряд высокочастотных и, тем самым, становятся «более случайными». Существует, однако, класс трендов, отражающих устойчивую низкочастотную периодическую составляющую сигнала, которые далее будем называть циклическими. Важность
12
этого класса обусловлено тем, что, при наличии такого тренда, он сильно упрощает прогноз временного ряда и делает его более «дальнобойным». Всюду ниже, если не будет оговорено особо, временная переменная t является целочисленным индексом, нумерующим отсчеты (последовательные значения)
временного
ряда.
Если
временной
ряд
представляет
собой
последовательность измерений с равномерным шагом δ t по времени, то для простоты изложения будем переходить к единицам времени, равным шагу дискретизации δ t . Тренд может быть формализован как сумма заданных функций времени g k (t ) с неизвестными коэффициентами γ k : m
G (t ) = ∑ g k (t ) + G0
(1.1.1)
k =1
Выбор циклических
функций трендов.
g k (t ) = ak cos(2π t / Tk ) + bk sin(2π t / Tk ) Если
периоды
Tk
трендов
задает
известны,
семейство то
задача
идентификации неизвестных амплитуд ak , bk и статического смещения G0 может быть сравнительно легко решена из минимума суммы некоторых мер отклонения тренда от наблюдений X (t ), t = 1,..., N : N
∑ Φ(ε (t )) → min, t =1
ak ,bk
ε (t ) = X (t ) − G (t )
(1.1.2)
Если функция Φ(ε ) = ε 2 , то задача (1.1.2) становится стандартной задачей метода наименьших квадратов (МНК) и при условии нормальности и независимости распределения величин ε (t ) (то есть, если ε (t ) – стационарный гауссовский белый шум), оценка параметров циклического тренда является оценкой максимума правдоподобия. Статистические свойства таких оценок подробно исследованы в (Anderson, 1971). Наличие в наблюдениях X (t ) выбросов, обусловленных либо сбоями системы регистрации, либо природой измеряемых величин, то есть «тяжелыми хвостами» плотности распределения невязок ε (t ) , приводит к известной неустойчивости МНК-оценок (Huber, 1981). Обеспечение большей устойчивости или робастности оценок требует замены квадратичной функции отклонения на какую-нибудь другую, растущую не так быстро как ε 2 . Одним из выходов является использование Φ (ε ) =| ε | , то есть переход от МНК к методу наименьших
13
модулей. Однако использование такой функции невязки сильно усложняет вычисления (требуется, фактически, решать задачу линейного программирования) и, кроме того, может быть неадекватно реальной плотности распределения невязок. Другим путем увеличения робастности оценок является использование метода максимума правдоподобия, в предположении, что остаточный сигнал ε (t ) распределен не по нормальному закону, а согласно комбинированной плотности распределения, которая при малых ε совпадает с нормальным законом, а при больших – с распределением Лапласа. Это распределение имеет плотность (Huber, 1981): p(ε ) =
p(ε ) =
β s
exp(−
ε2 2s 2
) при ε ≤ sa
β
a as exp(− (| ε | − )) при ε > sa s s 2
(1.1.3a)
(1.1.3b)
где a – т.н. параметр робастности, обычно принимающий значения 1-3 (ниже используется всюду a = 2 ), s – параметр масштаба (аналогичен стандартному отклонению в гуссовском законе), β = β (a) - нормировочная постоянная. Введем в рассмотрение (2m + 1) -мерный вектор параметров тренда
c = (a1 , b1 ,..., am , bm , G0 )T
(1.1.4)
где верхний индекс “T” означает транспонирование вектора-столбца. Кроме того, введем (2m + 1) -мерную вектор-функцию: Y (t ) = (cos(θ1 (t )),sin(θ1 (t )),..., cos(θ m (t )),sin(θ m (t )),1)T , θ k (t ) = 2π t / Tk
(1.1.5)
Тогда модель временного ряда с циклическими трендами может быть записана в компактной форме: X (t ) = cT Y (t ) + ε (t )
(1.1.6)
Метод максимального правдоподобия при условии независимости величин ε (t ) для случая (1.1.3) приводит к следующей задаче максимизации (с точностью до аддитивной константы, зависящей лишь от параметра a ): N
J (c, s) = ∑ ln( p(ε (t )) = − t =1
1 a ε 2 (t ) − ∑ | ε (t ) | − N ln( s) → max 2 ∑ c,s 2 s |ε (t )|≤ sa s |ε (t )|> sa
(1.1.7)
Решение задачи (13) может быть получено численно, путем комбинации обобщенного метода Ньютона для поиска вектора c и метода простой итерации для поиска параметра s (Любушин и др., 1992):
14
c ( j +1) = c ( j ) + A−1 (c ( j ) , s ( j ) ) R(c ( j ) , s ( j ) ), s ( j +1) = 1/ χ (c ( j ) , s ( j ) )
(1.1.8)
где j = 0,1,... является индексом итераций. Матрица A(c, s) и вектор R (c, s ) вычисляются согласно следующим формулам: A(c, s ) =
t0 + N −1
∑
F '' (ε (t ), s ) ⋅ Y (t ) ⋅ Y T (t ), R(c, s ) =
t = t0 + p
t0 + N −1
∑
F ' (ε (t ), s ) ⋅ Y (t ) , ,
(1.1.9)
t = t0 + p
⎧ε , | ε | ≤ a F ′(ε , s ) = ⎨ ⎩ sa ⋅ sign(ε ), | ε | > as
⎧ 1, | ε | ≤ a F ′′(ε , s ) = ⎨ ⎩0, | ε | > as
(1.1.10)
Функция χ (c, s ) определена согласно формулам:
χ (c, s ) = ( γ 2 + 4α − γ ) /(2α ) , α=
∑ε ε
2
(t ) / N , γ = a ⋅
| | ≤ as
∑ | ε (t ) | / N , ε
(1.1.11)
ε = X ( t ) − cT Y ( t )
(1.1.12)
| | > as
Вывод соотношений (1.1.8) основан на следующих соображениях. Если мы рассмотрим зависимость величины J (c, s) от параметра s , то нетрудно заметить, что основная часть этой зависимости обусловлена наличием множителей 1/(2s 2 ) и a / s . Если δ s - малая вариация s , то соответствующие ей вариации сумм:
∑ ε
ε 2 (t ),
∑
| ε (t ) |
(1.1.13)
|ε ( t )| > sa
| ( t )|≤ sa
умноженные на 1/(2s 2 ) и a / s , много меньше (и могут быть вовсе равными нулю для малых δ s ), чем вариации самих множителей 1/(2s 2 ) и a / s , умноженные на соответствующие суммы из (1.1.13). Поэтому, если мы хотим оценить вариацию
J (c, s) , вызванную δ s , мы можем положить величины (1.1.13) приблизительно постоянными и, таким образом, получить формулу:
δ J ( c, s ) ≈ − Из
условия
δ J ( c, s ) = 0
N ⎛ α γ⎞ ⋅ ⎜1 − − ⎟ ⋅ δ s s ⎝ s2 s ⎠
следует
квадратное
(1.1.14) уравнение
относительно
неизвестной величины r = 1/ s : α r 2 + γ r − 1 = 0 , которое имеет единственный положительный
корень
r = χ = ( γ 2 + 4α − γ ) ( 2α ) .
Вспомним,
что
в
действительности величины α и γ зависят от s и рассмотрим последнее уравнение как итерационную процедуру для уточнения значения параметра s (2ое уравнение в (1.1.8)). Кстати, если положить параметр робастности a достаточно большим, то γ = 0 и согласно формуле (1.1.14) s = α что совпадает
15
с МНК-оценкой стандартного отклонения. Итерационная процедура стартует с начального приближения согласно МНК:
c = A−01 R 0 ,
N
N
t =1
t =1
A0 = ∑ Y (t )Y T (t ), R0 = ∑ X (t )Y (t )
(1.1.15)
и сходится очень быстро − за 5-10 итераций. Оценка циклического тренда может служить основой для формулировки гипотез о будущем поведении процесса. Классический подход к прогнозированию временного ряда состоит в использовании корреляций соседних значений сигнала и построении прогноза на один или более шагов вперед по времени в виде суммы определенного числа прошлых значений, взятых с весовыми коэффициентами – это и есть линейная модель авторегрессии (Box, Jenkins, 1970; Kashyap, Rao, 1976).
Значения
весовых
коэффициентов
(коэффициентов
авторегрессии)
определяются путем минимизации суммы квадратов ошибок пробных прогнозов в прошлом. Методической основой
для прогноза вперед является гипотеза о
стационарности сигнала, то есть о том, что те значения корреляций между соседними значениями ряда, которые были в прошлом, останутся неизменными и в будущем. При выполнении этой гипотезы статистический прогноз на один шаг вперед, использующий корреляцию с прошлыми значениями фактически является оптимальным. Однако при прогнозировании не на один, а на несколько шагов вперед дисперсия прогноза в силу классических линейных моделей начинает быстро расти и через несколько шагов вперед выходит на асимптотический предел – значение полной дисперсии прогнозируемого процесса. Последнее означает, что авторегрессионный прогноз вырождается в тривиальный, когда в качестве прогноза выдается просто средний показатель сигнала, вычисленный по прошлым значениям. Кроме того, фактором, осложняющим применение классического прогноза, часто является доминирование низких частот в вариациях сигнала, что эквивалентно нарушению гипотезы о стационарности. Одним из стандартных приемов, увеличивающих стационарность, является переход от исходных рядов к рядам в приращениях. Но такой переход подменяет задачу прогноза значений исходного ряда задачей прогноза ее приращений и увеличивает шум. Если временной
ряд
содержит
сильную
монохроматическую
низкочастотную
16
компоненту, то вполне естественно оценить ее по имеющимся данным и интерполировать в будущее на несколько шагов вперед в качестве возможного сценария поведения среднего значения. В качестве примера рассмотрим временной ряд глобальной температурной аномалии на период инструментальных наблюдений 1861-2000 гг. (Lawrimor et al., 2001) На Рис.1.1 его график изображен тонкой линией. Циклический тренд с одной гармоникой, представленный
толстой
сплошной
линией, получен
следующим образом. Оценим параметры линейного тренда и вычтем его из анализируемого ряда значений. Для остатка после вычитания линейного тренда подберем наилучшую гармонику с некоторым периодом и вычислим ее значения для интервала времени 2001-2030 гг. Наконец, вернем устраненный общий линейный тренд. Оценка параметра s задаст интервалы ошибок прогноза.
Рис.1.1. Циклический тренд глобальной температурной аномалии (толстая линия), межгодовые вариации dT (тонкая линия) и поведение тренда на 2000-2030 гг. (толстая штриховая линия с вертикальными засечками стандартных отклонений).
Для нахождения периода тренда был использован следующий прием. Зададим некоторый интервал пробных значений периодов. Для каждого периода циклического тренда из этого интервала можно найти гармонику, наилучшим образом аппроксимирующую ряд температурных аномалий после исключения общего линейного тренда. При этом остаток после исключения циклического тренда с заданным периодом будет характеризоваться некоторым параметром масштаба плотности распределения остатка s (T ) , зависящим от значения периода. Найдем период из решения задачи s (T ) → min , например, методом
17
золотого сечения. Для ряда глобальной температурной аномалии
после
исключения общего линейного тренда и поиска периода тренда в интервале значений от 20 до 200 лет было найдено оптимальное значение T =64.13 года. Интерпретация результата подгонки циклического тренда и его интерполяции на будущее достаточно очевидна: исходя из поведения аномалии на последние 140 лет одним из сценариев эволюции климата на ближайшие 30 лет является не глобальное потепление, а некоторое похолодание (Klyashtorin, Lyubushin, 2003). 1.2. Гауссовские и локально-полиномиальные тренды.
Оценка тренда может быть рассмотрена как процедура сглаживания данных. Одним из популярных методов сглаживания является использование ядерных функций
(Hardle,
1989).
Пусть
y(s)
-
произвольный
ограниченный
интегрируемый сигнал с непрерывным временем. Назовем ядерным усреднением с параметром масштаба H > 0 среднее значение y ( s | H ) в момент времени s , вычисляемое по формуле: y (s | H ) =
где
ψ (ξ )
-
+∞
+∞
−∞
−∞
∫ y(s + H ξ ) ⋅ψ (ξ ) dξ ∫ ψ (ξ ) dξ
произвольная
неотрицательная
ограниченная
(1.2.1)
симметричная
интегрируемая функция, называемая ядром усреднения. Если ψ (ξ ) = exp(−ξ 2 ) , то назовем величину
y ( s | H ) гауссовским трендом с параметром (радиусом)
усреднения H . Для сигналов с дискретным временем вычисление ядерных трендов
может
быть
эффективно
реализовано
с
помощью
быстрого
преобразования Фурье. Гауссовский тренд относится к классу непараметрических трендов, которые целесообразно применять тогда, когда нет априорной информации о виде низкочастотных вариаций ряда. Рис.1.2 иллюстрирует применение гауссовского тренда. На нем представлены исходные данные реконструкций ежегодных зимних температур в Гренландии в течение 553-1973 гг. по содержанию изотопа
18
O в ледовых кернах из Датской
лаборатории изотопного анализа Копенгагенского университета (Dansgaard et al., 1975) и его гауссовский тренд с параметром усреднения 10 лет. Данные любезно предоставлены В.И. Николаевым (Институт Географии РАН).
18
Рис.1.2. Гауссовский тренд с параметром усреднения 10 лет (толстая линия) данных ежегодных реконструкций зимних температур в Гренландии (553-1973 гг.) по содержанию изотопа 18O в ледовых кернах (тонкая линия).
Часто временная последовательность задана в точках, не образующих равномерную сетку по времени. В этом случае возникает задача преобразования исходных данных к обычному временному ряду с постоянным шагом по времени – поскольку большинство методов анализа сигналов рассчитаны на постоянный интервал взятия отсчетов. Такого рода предварительная обработка также может быть выполнена с помощью ядерного сглаживания. Пусть исходные данные представляют собой последовательность пар чисел { t j , z j }, j = 1,..., N , в которых
первое – суть временные метки, второе – некоторая измеряемая величина. Для перехода к равномерному шагу по времени прежде всего необходимо задать временной интервал дискретизации δ t . Его можно выбрать из условия максимума гистограммы приращений временных меток t j . Далее необходимо осуществить переход к сигналу с равномерным шагом по времени – для этого надо совершить операцию усреднения исходных (неравномерных) данных в окрестности каждой временной точки, взятых с шагом δ t . Пусть τ - такая точка. Для получения значения равномерно оцифрованного сигнала x(τ ) воспользуемся ядерным гауссовским методом усреднения (Hardle, 1989): x(τ ) = W1 (τ | H ) / W0 (τ | H )
(1.2.2)
N
N
j =1
j =1
W1 (τ | H ) = ∑ z jψ ((t j − τ ) / H ), W0 (τ | H ) = ∑ψ ((t j − τ ) / H ), ψ (ξ ) = exp(−ξ 2 )
(1.2.3)
19
По смыслу формул (1.2.2) и (1.2.3), в среднее значение x(τ ) основной вклад вносят те исходные измерения
(t j , z j ) , для которых временные метки
удовлетворяют условию | t j − τ |≤ H . Отсюда следует естественный выбор параметра H - он должен быть равен половине выбранного шага по времени, то есть
δt / 2 .
При
реализации
такого
способа
перехода
к
равномерно
оцифрованному сигналу может возникнуть ситуация, когда непосредственное применение формулы (1.2.2) приведет к неопределенности типа деления на ноль – в том случае, когда точка τ лежит внутри достаточно длительного интервала времени отсутствия измерений. В этом случае необходимо увеличить параметр усреднения H так, чтобы ядро усреднения из точки τ могло «достать» до ближайших к этой точке временных меток t j или чтобы величина W0 (τ | H ) была не меньше некоторого порогового малого значения. Рис.1.3 иллюстрирует применение вышеизложенной техники перехода к равномерному шагу для палеомагнитных данных (Печерский и др., 2005; Pechersky et al., 2004). Одним из важных вопросов геодинамики является определение по экспериментальным данным частотно-временной структуры изменения направления вектора магнитного поля в прошлом на больших интервалах времени. Исходными данными являются реконструкции направления вектора по исследованиям образцов горных пород. На рис.1.3(а) крестиками обозначены исходные данные палеомагнитных наклонений. Временные метки образуют очень неравномерную сетку значений, характеризуемую наличием как интервалов сгущения (очень частого измерения), так и достаточно длительными интервалами отсутствия данных. Сами значения
характеризуются высоким
шумом измерений, о чем можно судить по большой амплитуде их изменений в интервалах сгущения временных меток. Перечисленные выше недостатки данных, тем не менее, не снимают вопроса об их использовании в попытках ответить на вопрос, в какие интервалы времени в прошлом и на каких периодах была максимальная амплитуда вариаций направления вектора магнитного поля. Для этого необходимо перейти к ряду с равномерным шагом по времени.
20
Рис.1.3. Палеомагнитное наклонение: (а): точками (×) обозначены исходные данные; тонкой линией – график усредненных значений с равномерным шагом 0.5 тыс. лет; толстой линий – общий тренд.
Гистограмма приращений временных меток показывает максимум для значений от 0.3 до 0.7 (тыс.лет). Поэтому в качестве шага по времени было выбрано значение 0.5 как наиболее типичное для приращений. На рис1(а) тонкой сплошной линией изображен график ряда усредненных значений (согласно формулам (1.2.2) и (1.2.3)) с равномерном шагом. Для него нетрудно заметить наличие низкочастотного тренда, который может быть связан с побочными эффектами технологии реконструкции палеомагнитного наклонения. Этот тренд был удален полиномом 3-го порядка (толстая сплошная линия на рис.1.3(а)). Дальнейшему изучению подлежат отклонения ряда усредненных значений с шагом 0.5 от общего полиномиального тренда – их график изображен на рис.1.3(б). В дальнейшем мы к нему еще вернемся. Наряду с ядерным сглаживанием может быть использовано локальнополиномиальное. Здесь мы временно откажемся от обязательного использования времени в качестве аргумента и рассмотрим последовательность пар наблюдений случайных величин { X j , Y j ; j = 1,..., N } , между которыми существует нелинейная зависимость, осложненная шумом, зависящим от значения аргумента X : Y = f (X ) + ε (X )
(1.2.4)
21
В формуле (1.2.4) f ( X ) − искомая детерминированная функция; ε ( X ) является случайной величиной с нулевым средним, не зависящей от f ( X ) , параметры плотности распределения которой зависят от значения аргумента X . Например, ε ( X ) может быть гауссовской величиной с нулевым средним и с дисперсией, зависящей от X . Значения ε ( X ) для различных значений X будем считать независимыми. Проблема регрессионного анализа состоит в том, чтобы определить функцию f ( X ) , знание которой вскрывает физические или иной природы механизмы влияния X → Y . Заметим, что в такой постановке критерием правильной подгонки зависимости f ( X ) к набору данных не может служить малость дисперсии остатка ε − во-первых, потому что эта дисперсия неоднородна (зависит от X ), а во-вторых, если амплитуда шума велика, то стремление добиться малой дисперсии остатка приведет к адаптации регрессионной функции f ( X ) к шуму, а не к скрытым механизмам связи X → Y . Дополнительную сложность вносит отсутствие априорной информации о виде функции f ( X ) . Одним из возможных путей решения проблемы может быть использование локально-полиномиальной регрессии (Hardle, 1989). Пусть
X k - значение
аргумента, для которого мы хотим оценить значение f ( X k ) . Введем параметр алгоритма сглаживания – радиус m окна усреднения для числа ближайших соседей рассматриваемой точки. Будем считать, что пары { X j , Y j } упорядочены по возрастанию X j . Рассмотрим наблюдения { X j , Y j }, k0 ≤ j ≤ k1 ; k0 = max(1, k − m); k1 = min( N , k + m)
(1.2.5)
Подгоним методом наименьших квадратов к наблюдениям (1.2.5) полином заданного порядка p и значение этого полинома в точке X k возьмем в качестве оценки величины f ( X k ) . Очевидно, что множество (1.2.5) представляется собой своего рода окрестность точки X k . Теперь возникает проблема выбора оптимального порядка полинома. Решим ее с помощью процедуры скользящего контроля, который в англоязычной литературе называется “jack-knife” (Efron, Tibshirani, 1986; Hardle, 1989). Для этого зададим максимально возможный порядок полинома pmax и для каждой точки X k найдем оптимальный порядок для 0 ≤ p ≤ pmax . Из окрестности (1.2.5) 22
будем последовательно удалять по одной точке (с последующим возвращением), по оставшимся точкам окрестности (1.2.5) подгонять полином текущего пробного порядка p и вычислять квадрат разности между значением этого полинома в выколотой точке и значением наблюдения Y . Просуммировав квадраты таких разностей по всем точкам из множества (1.2.5), получим некоторую зависимость
δ 2 ( p) от пробного порядка полинома. Далее выберем оптимальный полином для 0 ≤ p ≤ pmax ,
соответствующий
порядку,
для
которого
значение
минимально. Параметрами процедуры сглаживания являются
δ 2 ( p)
радиус
m
окрестности сглаживания и максимально возможный порядок pmax . Повторив описанную выше процедуру вычисления оценки f ( X k ) для всех k = 1,..., N , получим сглаженную кривую.
Рис.1.4. Зависимость численности поголовья сельди от нерестовых запасов (точки) и локальнополиномиальная кривая регрессии (сплошная линия), полученная в скользящем окне по окрестности радиуса 30 ближайших соседей с выбором порядка полинома в диапазоне от 0 до 4.
В качестве примера рассмотрим зависимость численности популяции сельди от
нерестовых
запасов
(данные
предоставлены
Л.Б.Кляшториным
из
Всероссийского института рыболовства и океанографии). На рис.1.4 изображены точками исходные данные для зависимости числа 3-летних потомков (млн. штук) от нерестовых запасов (тыс. тонн), N = 86 . Сплошными линиями представлены сглаженные кривые для параметров m = 30 , pmax = 4 . Отметим, что сглаженные кривые содержат выбросы, амплитуда которых много меньше вариаций шума – это следствие большого шума. Возможно дополнительное сглаживание уже этой,
23
сглаженной кривой, которое можно проделать, например, ядерным методом или вручную, исключая выбросы. Главное достоинство сглаженной кривой на рис.1.4 – выявление скрытых крупномасштабных особенностей поведения и критических точек зависимости X → Y , которые совершенно не видны на исходных данных.
Главная
особенность – это разбиение интервала значений аргумента X на 3 части точками X = 6000 и X = 10000 , между которыми зависимость X → Y почти линейна с
максимумом при X = 6000 . Поиск оптимального порядка локального полинома, очевидно, является весьма трудоемкой операцией и может быть опущен, если порядок полинома выбирается постоянным из каких-либо априорных соображений. Кроме того, локально-полиномиальное сглаживание, конечно, может быть применено в случае равномерной сетки значений X k , например, для обычных временных рядов. 1.3. Спектры и спектрально-временные диаграммы.
Оценка спектра мощности временного ряда в настоящее время является настолько рутинной операцией, что выделение этого вопроса в виде отдельного параграфа может показаться излишним. Тем не менее, поскольку в дальнейшем неоднократно будут использоваться как статические оценки спектров мощности (то есть полученные по всей выборке в виде зависимости лишь от частоты или периода), так и частотно-временные диаграммы эволюции спектров мощности, в этом параграфе кратко будут описаны используемые методы. Для оценки спектра мощности скалярного временного ряда в дальнейшем будет использоваться параметрическая авторегрессионная оценка (Kanasewich, 1981; Marple, 1987). Пусть x(t ) – стационарный в широком смысле временной ряд. Модель авторегрессии порядка p ≥ 0 (AR(p)-модель) представляет собой уравнение: p
x(t ) + ∑ ak x(t − k ) = ε (t ) + d
(1.3.1)
k =1
где ak – коэффициенты авторегрессии (параметры модели), d – параметр статического смещения, ε (t ) – белый шум с нулевым средним и дисперсией σ 2 . Аналогично формулам (1.1.4, 1.1.5) введем ( p + 1) -мерные векторы:
24
Y (t ) = (− x(t − 1),..., − x(t − p),1)T , c = ( a1 ,..., a p , d )T
(1.3.2)
и запишем (1.3.1) в компактной форме, аналогично (1.1.6): x(t ) = cT Y (t ) + ε (t )
(1.3.3)
Пусть имеется конечная выборка { x(t ), t = 1,..., N } . Тогда оценка вектора параметров c из условия минимума суммы квадратов остатков
N
∑ε
2
(t ) → min
t = p +1
сводится
к
решению
системы
нормальных
уравнений
с
симметричной
положительно определенной матрицей A : Ac = R,
A=
N
∑ Y (t )Y
t = p +1
Решение
уравнений
(1.3.4)
N
T
(t ), R = ∑ x(t )Y (t )
(1.3.4)
t = p +1
автоматически
удовлетворяет
условию
p
устойчивости AR(p)-модели: все корни полинома λ p + ∑ ak λ p − k по модулю k =1
строго меньше 1 (Box, Jenkins, 1970; Marple, 1987). Однако при больших порядках p решение системы (1.3.4) становится достаточно трудоемким, особенно если его надо решать многократно. Поэтому обычно предполагают стационарность выборки, от параметра d освобождаются тем, что вычитают из значений выборочную оценку среднего, а элементы aij матрицы A размером теперь уже p × p заменяют на значения γ |i − j| , где γ k – выборочные оценки ковариационной последовательности M {x(t ) x(t + k )} , M {...} – знак математического ожидания. В этом случае матрица A становится теплицевой (симметричной неотрицательно определенной и по всем диагоналям стоят одинаковые элементы), для обращения которой
существует
(Kanasewich,
1981;
быстрый Marple,
итерационный
1987),
при
метод
котором
Дарбина-Левинсона
порядок
авторегрессии
последовательно увеличивается от 1-го до искомого на единицу. Полученная таким образом оценка параметров AR(p)-модели известна как оценка ЮлаУолкера. Однако эта оценка довольно часто теряет устойчивость при выполнении итераций Дарбина-Левинсона, особенно если теплицева матрица
A имеет
диагонали, на которых стоят значения, близкие к значениям на главной диагонали матрицы (при наличии сильных монохроматических компонент в сигнале). В 1969 году Бургом была предложена модификация метода Юла-Уолкера, состоящая по-прежнему в использовании итераций Дарбина-Левинсона в
25
последовательном увеличении порядка авторегрессии. Однако на этот раз при каждом увеличении порядка p − 1 → p эти итерации используются лишь для изменения «старых» коэффициентов a j , j = 1,..., ( p − 1) , а каждый «новый» коэффициент a p (старший коэффициент модели AR(p), известный также как «коэффициент отражения»), находится из условия минимума суммы квадратов ошибок прогноза на шаг вперед и назад в силу AR(p)-модели. Одновременно для каждого текущего порядка модели авторегрессии, увеличивающегося от 1 до p , находится оценка дисперсии σ 2 .
Этот метод, который подробно изложен в
(Marple, 1987), оказался исключительно эффективным и устойчивым – именно он и будет использоваться в дальнейшем для идентификации параметров AR(p)моделей. После определения значений параметров модели (1.3.1) они могут быть использованы для построения параметрической оценки спектра мощности временного ряда: S xx (ω ) =
σ2 p
2π |1 + ∑ ak e
(1.3.5) − iω k 2
|
k =1
которая следует из представления Крамера (Brillinger, 1975) для стационарной случайной последовательности, 0 < ω < π – частота. Первичным параметром модели (1.3.1) является порядок авторегрессии p . Несмотря на многочисленные попытки дать формальный критерий определения оптимального порядка p , эта задача так и нашла окончательного решения, а предлагаемые методы не выходят за рамки эмпирических правил. Порядок ARмодели
меняется для одних и тех же данных в зависимости от целей
использования (Kashyap, Rao, 1976). Для прогноза на один или несколько шагов вперед порядок обычно небольшой и редко достигает 10. Если же целью является получение параметрической спектральной оценки (1.3.5), то порядок p имеет смысл брать значительным:
p = N /10 ÷ N / 4 . При этом надо иметь в виду, что
чем больше порядок, тем чувствительнее оценка, но, одновременно, тем она более неустойчива и содержит больше статистических флуктуаций. Пусть число отсчетов
N
временного ряда достаточно велико и его
спектральные свойства медленно меняются со временем. Тогда можно рассмотреть задачу оценки эволюции спектра мощности в скользящем временном
26
окне некоторой длины L < N со взаимным смещением ΔL значений. Пусть τ – временная координата правого конца текущего временного окна. Оценим для отсчетов τ − L + 1 ≤ t ≤ τ модель AR(p) и вычислим оценку спектра мощности (1.3.5). В этом случае ее можно записать в виде, подчеркивающем зависимость от положения и длины окна: S xx = S xx (ω ,τ | L) . С учетом разрешения по частоте Δω = 2π / L на выборке длиной L отсчетов, формулу (1.3.5) имеет смысл
применять для значений частот ω j = 2π j / L,
j = 1,..., ( L − 1) / 2 .
Построение двумерных карт или рельефов S xx (ω ,τ | L) на плоскости «частотавремя» (ω ,τ ) в русскоязычной литературе традиционно имеет аббревиатуру СВАН (спектрально-временной анализ). Обычно для этой цели используется дискретное преобразование Фурье от выборки в текущем временном окне, вычисление периодограммы и ее усреднение по частотам тем или иным способом для уменьшения дисперсии оценки. Опыт показывает, что использование ARмодели дает более устойчивые результаты. Кроме того, при использовании оценки (1.3.5) отсутствуют побочные эффекты, связанные с цикличностью дискретного преобразования Фурье от конечной выборки (Brillinger, 1975; Kanasewich, 1981). В качестве примера применения спектрального и спектрально-временного анализа рассмотрим временной ряд реконструкций зимних температур в Гренландии, график которого изображен на рис.1.2. На рис.1.5 приведен график оценки спектра мощности ряда по всей выборке с использованием модели AR(150) при общей длине ряда 1421 отсчет. Пять наиболее высоких спектральных пика помечены значениями периодов, на которых реализуется локальные максимумы. Эти периоды отражают определенные климатические циклы, из которых наибольший интерес представляют низкочастотные с периодами 54 и 205 лет. На
рис.1.6
представлена
частотно-временная
диаграмма
эволюции
десятичного логарифма спектра мощности в скользящем окне длиной L =500 лет с взаимным смещением ΔL =10 лет для периодов свыше 20 лет. В каждом окне строилась AR(50)-оценка. Из нее видно, что 200-летний пик существовал лишь до 1350 года. Далее этот пик стал эволюционировать в сторону более высоких частот и в интервале 1250-1750 гг. он слился с 25-30-летним гребнем диаграммы и сформировал спектральный пик примерно с периодами 50-60 лет, причем его интенсивность
постоянно
возрастала
к
концу
интервала
реконструкции. 27
Последний вывод находится в хорошем соответствии с ранее найденным периодом 64 года вариаций глобальной температурной аномалии, характерным для интервала 1861-2000 гг. (рис.1.1). Рис.1.5. Оценка спектра мощности временного ряда реконструкции зимних температур в Гренландии по анализу ледовых кернов (553-1973 гг., рис.1.2), модель AR(150).
Рис.1.6. Эволюция десятичного логарифма оценки спектра мощности временного ряда реконструкции зимних температур в Гренландии по анализу ледовых кернов в скользящем временном окне длиной 500 лет, со смещением 10 лет, модель AR(50).
1.4. Непрерывные вейвлет-диаграммы.
Методическим недостатком СВАН является использование окна. Если окно слишком велико, то частотно-временная диаграмма неспособна реагировать на быстрые изменения спектрального состава и на наличие короткоживущих сигналов – всплесков. Для достижения этой цели необходимо уменьшить длину
L . Но слишком малая длина окна приводит к увеличению чисто статистических флуктуаций текущих оценок спектров и СВАН-диаграмма становится слишком зашумленной и малоинформативной. Необходимо находить компромисс между устойчивостью и чувствительностью и эмпирически перебирать длины L , причем
28
для каждого значения длины надо следить, чтобы используемый порядок авторегрессии p был свой (уменьшался и увеличивался пропорционально L ). При изменении длины L одновременно меняется и максимально допустимый к рассмотрению период. Непрерывные вейвлет-преобразования (Daubechies, 1992; Chui, 1992; Mallat, 1998) призваны устранить эти недостатки и, кроме того, дать возможность отобразить на одной диаграмме сразу все интересующие периоды. Пусть ψ (t ) некоторая быстроубывающая функция, удовлетворяющая условию допустимости: +∞
∫ ψ (t ) dt = 0
+∞
и условию нормировки:
−∞
∫ |ψ (t ) |
2
dt = 1 . Непрерывным вейвлет-
−∞
преобразованием сигнала
x( s )
называется величина, зависящая от двух
параметров (t , a), a > 0 : 1 Wx(t , a) = a
+∞
+∞
⎛ s −t ⎞ ∫−∞ x(s) ⋅ψ ⎜⎝ a ⎟⎠ ds = a −∞∫ x(t + av) ⋅ψ (v) dv
(1.4.1)
Здесь t - момент времени, a > 0 - параметр масштаба, который далее часто будем называть более привычным термином «период». Величина (1.4.1) отражает поведение исследуемого сигнала в окрестности точки t
с характерным
масштабом вариаций a . Для сигнала с дискретным временем вычисление величин (1.4.1) может быть эффективно реализовано с помощью быстрого преобразования Фурье. Нашей непосредственной целью является построение 2мерной карты значений модуля величины (1.4.1): | Wx(t , a) | , которая дает наглядное представление о динамике возникновения, эволюции и исчезновения «характерных периодов» короткоживущих всплесков исследуемого сигнала. Естественно, что величина (1.4.1) сильно зависит от выбора функции ψ (t ) . Выбор той или иной функции ψ (t ) определяется тем, какого вида короткоживущие сигналы мы хотим изучать. Следует подчеркнуть, что для конечной выборки и для данного масштаба a на концах временного интервала существуют «мертвые» отрезки времени, такие, что для моментов времени t , принадлежащих этим отрезкам, «не хватает» данных либо слева, либо справа от точки t для вычисления (1.4.1). При использовании быстрого преобразования Фурье сигнал рассматривается на кольце и поэтому, если он содержит сильный низкочастотный тренд, то для моментов времени t , близких к началу и к концу выборки, возникают сильные всплески значений
29
| Wx(t , a) | , которые могут сильно маскировать «полезные» вариации величин (1.4.1) внутри интервала. Поэтому перед вычислением непрерывного вейвлетпреобразования рекомендуется избавляться от низкочастотных трендов и, кроме того, при интерпретации непрерывных вейвлет-диаграмм вводить поправки на то, что значения | Wx(t , a) | для моментов времени t , близких к началу и концу интервала задания сигнала, на самом деле не отражают истинных свойств сигнала. Для данного масштаба
a
длина «мертвых» отрезков времени,
примыкающих к концам выборки обычно пропорциональна масштабу. Для используемых ниже вейвлетов, скорость затухания которых задается множителем в виде гауссовской функции, эту длину можно положить равной 3a . Одной из наиболее популярных функций ψ (t ) является т.н. вейвлет Морле (Morlet) или комплекснозначный «модулированный гауссиан»:
ψ (t ) =
1
π
1/ 4
exp(−t 2 / 2 − iπ t )
(1.4.2)
Этот вейвлет наилучшим образом приспособлен для выделения короткоживущих гармонических всплесков (цугов) и обладает определенными свойствами оптимальности
в
поиске
компромисса
между
частотным
и
временным
разрешением (выходит на т.н. гейзенберговский предел). В качестве примера рассмотрим временной ряд палеомагнитных наклонений после перехода к равномерному шагу по времени и снятия общего тренда, график которого изображен на рис.1.3(б). Вычислим для него непрерывную вейвлетдиаграмму
| Wx(t , a) |
для вейвлета Морле (1.4.2) и при масштабах
a,
изменяющихся от 2-х до 200-х значений интервала дискретизации (в данном случае 0.5 тыс. лет). При этом значения a , для которых вычисляются (1.4.1), возьмем 100 штук с равномерным шагом в логарифмической шкале, а на диаграмме отложим вместо масштаба значения его десятичного логарифма. Результат этих оценок изображен на рис.1.7. Из нее видно, что вариации магнитного поля в прошлом были достаточно нестационарны и представляют собой «расслоенную» по масштабам структуру всплесков с характерными временами 3, 8, 18 и 32 тыс. лет. Другим популярным семейством функций ψ (t ) являются т.н. гауссовские вейвлеты, определяемые как производные от гауссиана заданного порядка m :
30
ψ m (t ) = cm
2 d m −t 2 e = (−1) m cm H m (t )e− t , m ≥ 1 m dt
(1.4.3)
Рис.1.7. Непрерывная вейвлет-диаграмма абсолютных значений преобразования Морле для временного ряда палеомагнитных наклонений (рис.1.3(б)).
Рис.1.8. Непрерывная вейвлет-диаграмма абсолютных значений преобразования с использованием 2-ой производной от гауссиана для временного ряда палеомагнитных наклонений (рис.1.3(б)).
где cm – нормировочные константы, обеспечивающие единичную квадратичную интегральную норму для ψ (t ) , H m (t ) – полиномы Эрмита, H 0 (t ) = 1, H1 (t ) = 2t , H m +1 (t ) = 2tH m (t ) − 2mH m −1 (t ) . Из них наиболее известна «мексиканская шляпа»
31
ψ 2 (t ) . Для данного порядка m функция (1.4.3) обладает свойством обнуления первых m моментов: +∞
∫tψ k
m
(t )dt = 0, k = 0,1,..., (m − 1)
(1.4.4)
−∞
Отсюда следует, что если x( s ) – полином порядка не выше m − 1 включительно, то его преобразование (1.4.1) будет тождественно равным нулю. Форма вейвлета ψ 2 (t ) ориентирована на выделение симметричных всплесков «классической» неосциллирующей формы. Вычислим диаграмму | Wx(t , a) | для того же примера ряда палеомагнитных наклонений на рис.1.3(б), для которого только что оценили диаграмму Морле (рис.1.7). Она представлена на рис.1.8. Интерпретация таких диаграмм менее содержательна, чем диаграмм Морле, так как они просто подчеркивают наличие всплесков различного масштаба, возникающих в разные моменты времени. Более содержательная интерпретация непрерывных вейвлет-диаграмм для семейства (1.4.3) дается с помощью цепей скелета максимумов модулей величин | Wx(t , a) | , о чем пойдет речь в следующем параграфе. 1.5. Скелеты максимумов модулей непрерывных вейвлетпреобразований.
Довольно часто временные ряды мониторинга имеют «серое» поведение, которое трудно охарактеризовать наличием либо каких-то амплитудных или частотных
аномалий
(«событий»),
либо
регулярными
периодическими
составляющими. Для подобных сигналов характерно увеличение спектра мощности с уменьшением частоты по степенному закону и самоподобный тип поведения при рассмотрении на различных временных масштабах. Трудность анализа таких временных рядов состоит в сложности формализации понятия временных точек смены «моды поведения» сигнала (критических точек или разладок). Другой проблемой является нахождение стационарных точек сигнала, соответствующих
локальным минимальным или максимальным значениям.
Очевидно, что тип поведения сигнала зависит от величины временного масштаба, на котором рассматривается поведение. То есть, перед анализом сигнал должен быть определенным образом сглажен (усреднен). Очевидно, что свойства сглаженного сигнала зависят от масштаба сглаживания. Например, если
32
производится обычное сглаживание путем вычисления арифметического среднего в скользящем временном окне, то таким масштабом является радиус скользящего временного окна. Далее мы будем использовать ядерное сглаживание с гауссовским ядром усреднения. Временные точки локальных минимумов и максимумов сглаженного сигнала, а также точки локального максимума модуля производной от сглаженного сигнала задают естественную фрагментацию поведения исходного сигнала для рассматриваемого масштаба времени. Назовем вышеперечисленные точки масштабно-зависимыми экстремальными точками сигнала. Сглаженный сигнал обладает большим числом экстремальных точек для малых масштабов усреднения, но с ростом масштаба число таких точек быстро уменьшается. При плавном увеличении масштаба усреднения возможно объединение экстремальных точек различного типа в цепи отдельно для точек минимума или максимума сглаженного сигнала и для точек максимальных значений модуля первой производной, причем, отдельно для отрицательных и отдельно для положительных производных. Таким образом, получаются 4 типа цепей экстремальных точек на плоскости «масштаб-время». Большая часть этих цепей прерывается с ростом масштаба, но некоторые из них «выживают» и достигают значительной длины, вплоть до максимально допустимых к рассмотрению масштабов (последнее значение зависит от длины реализации сигнала). Процедура, качественно изложенная выше, известна в непрерывном вейвлетанализе как выделение точек скелета вейвлет-преобразований (WTMM – wavelet transform modulus maxima) (Mallat, 1998). Точки скелета используются в анализе образов (для выделения границ и формализации понятия фоновой структуры) (Hummel, Moniot., 1989; Mallat, 1998). В исследовании турбулентности производится анализ мультифрактального спектра WTMM-точек, объединенных в цепи, при стремлении масштаба к нулю (т.н. спектр сингулярности) (Muzy et al., 1994; Mallat, 1998). В то же время индивидуальные особенности поведения сигнала, его «отпечаток пальца», определяются именно длинными цепями скелета. Поэтому ниже акцент будет сделан на анализе длинных цепей. Моменты времени, соответствующие началу длинных цепей (для минимальных значений масштабов, принятых к рассмотрению) мы будем рассматривать как особые точки поведения
33
исследуемого сигнала 1-го типа. Ко второму типу особых точек мы отнесем точки соединения длинных цепей локальных минимумов и максимумов усредненного сигнала. Из соображений непрерывности сглаженного сигнала вытекает, что такие длинные цепи могут либо соединится для некоторого достаточно большого масштаба либо «уйти на бесконечность», что практически означает выход цепи на некоторое ограничение по величине масштаба, вытекающее из ограниченной длины реализации сигнала. Точки соединения длинных цепей локальных максимумов и локальных минимумов сглаженного сигнала назовем точками бифуркации. Из смысла этих точек следует, что в их окрестности исследуемый сигнала
ведет
себя
примерно
как
константа
на
временном
масштабе,
соответствующей точке соединения цепей. Пусть x(t ) – анализируемый сигнал. Масштабно-зависимое сглаживание сигнала с помощью некоторого ядра усреднения дается формулой (1.2.1), которую ниже перепишем в виде: +∞
x (t , a) =
∫
x(t + av) ⋅ψ 0 (v) dv
−∞
+∞
∫ψ
0
(v) dv
(1.5.1)
−∞
где a > 0 – масштаб, а ψ 0 (t ) является некоторой быстро-затухающей функцией. В дальнейшем мы будем использовать гауссовское ядро:
ψ 0 (t ) = exp(−t 2 ) .
Определим ядро непрерывного вейвлет-преобразования: d nψ 0 (t ) ≡ (−1) n ⋅ψ (0n ) (t ) ψ n (t ) = (−1) ⋅ n dt
(1.5.2)
n
Используя формулу интегрирования по частям и свойство быстрого затухания функции ψ 0 (t ) , нетрудно получить следующую формулу для производной заданного порядка
n
от сглаженной функции (1.5.1), деленной на
n!
(коэффициент Тейлора): +∞
cn (t , a) ≡
1 d n x (t , a ) = ∫ x(t + av) ⋅ψ n (v) dv n ! dt n −∞
+∞
an
∫v
n
⋅ψ n (v) dv
(1.5.3)
−∞
Заметим, что формула (1.5.1) является частным случаем формулы (1.5.3) для n=0.
Точка максимума модуля вейвлет-преобразования (WTMM-точка) (t , a) для n ≥ 1 определяется как точка локального максимума величин | cn (t , a) | по
отношению к изменениям времени t для заданного масштаба a . Что же касается n = 0 , то для этого случая определим WTMM-точки как просто точки локальных
34
экстремумов (как минимумов, так и максимумов) сглаженного сигнала c0 (t , a) . WTMM-точки могут быть объединены в цепи, а множество всех цепей из таких точек образуют скелет непрерывного вейвлет-преобразования сигнала. Если ψ 0 (t ) является гауссовским ядром усреднения, то цепи скелета вейвлет-преобразований являются непрерывными при стремлении масштаба a → 0 (Hummel, Moniot., 1989; Mallat, 1998). WTMM-точки для первой производной c1 (t , a) выделяют моменты
времени
максимальных
масштабно-зависимых
трендов
(как
положительных, так и отрицательных) сглаженного сигнала c0 (t , a) для заданного значения a . Пусть сигнал x(t ) задан на интервале времени t ∈[0, T ] . Если момент времени t близок к началу или концу интервала [0, T ] , то сглаживающее преобразование (1.5.3) испытывает отсутствие информации о поведении сигнала x(t ) для t < 0 или для t > T . Обычно это затруднение преодолевается путем рассмотрения сигнала на кольце, вычисляя значения сигнала вне интервала [0, T ] по правилу: если t < 0 , то x(t ) = x(T + t ) и если t > T , то x(t ) = x(t − T ) . Это продолжение сигнала дает возможность вычислять преобразование (1.5.3) для всех моментов времени t ∈[0, T ] и является полезным с точки зрения использования быстрого преобразования Фурье для вычислений (1.5.3). Тем не менее, значения (1.5.3) являются искаженными на концах интервала [0, T ] и более корректным подходом является введение некоторых масштабно-зависимых «мертвых интервалов», примыкающих к началу и к концу отрезка времени [0, T ] , таких, что значения вейвлет-преобразований (1.5.3) исключаются из анализа для моментов времени, принадлежащих «мертвым интервалам». Для гуассовского ядра усреднения
ψ n (t ) ≈ 0 при | t | ≥ 3 . Следовательно, можно ввести следующее правило: если 0 ≤ t ≤ 3a или T − 3a ≤ t ≤ T то cn (t , a) исключаются из анализа
(1.5.4)
Из правила (1.5.4) следует, что максимально возможное значение масштаба amax , пригодное для анализа, определяется условием: amax = T / 6 , причем для этого значения преобразование (1.5.3) может быть вычислено лишь в единственной
точке
t =T /2.
примыкающих к точке
Правые
концы
«мертвых
интервалов»,
t = 0 , а также левые концы этих интервалов,
35
примыкающих к t = T , образуют куполообразную область допустимых к рассмотрению точек (t , a) на 2-мерной плоскости значений (t , lg(a)) .
Рис.1.9. (а) – график временного ряда среднегодовых температур в Центральной Англии, 1723-1970; (б) – длинные цепи локальных минимумов (толстые пунктирные линии) и локальных максимумов (толстые сплошные линии) усредненного для данных значений десятичного логарифма масштаба усреднения a (годы). Параметр γ = 0.1 , горизонтальная пунктирная линия определяет уровень минимальных масштабов, определяющих длинные цепи. Верхние пунктирные линии задают куполообразную границу максимально допустимых значений масштаба из условия (1.5.4).Символыкружки обозначают точки бифуркации усредненного сигнала; (в) – длинные цепи локальных максимумов абсолютных значений 1-ой производной от усредненного сигнала. Толстые пунктирные линии – цепи точек максимальных отрицательных трендов, толстые сплошные линии – цепи точек максимальных положительных трендов для данных масштабов усреднения.
36
Для временных рядов с шагом по времени Δt минимальным масштабом, допустимым к рассмотрению, будем считать период Найквиста amin = 2Δt . Введем критерий того, какая цепь скелета непрерывного вейвлет-преобразования считается длинной – если значения масштаба вдоль этой цепи, начинающейся при a = amin , превосходят пороговое значения масштаба a* = γ amax = γ (T / 6) , где amin / amax ≡ γ min ≤ γ < 1 – параметр метода. Чем ближе величина параметра γ к 1, тем меньше число «длинных» цепей. Для γ = γ min все цепи формально являются «длинными». Длинные цепи локальных экстремумов (минимумов и максимумов) значений c0 (t , a) = x (t , a ) и максимумов абсолютных значений 1-ой производной c1 (t , a) представляют особый интерес для выделения главных характеристик поведения сигнала, поскольку они дают своеобразный «отпечаток пальца» временного ряда. Рассматривая цепи максимумов модуля первой производной | c1 (t , a ) | мы будем различать их по знаку, то есть, выделять отдельно цепи максимальных масштабно-зависимых негативных ( c1 (t , a) < 0 ) и позитивных ( c1 (t , a) > 0 ) трендов. На рис.1.9 представлены длинные WTMM-цепи скелета модулей максимума непрерывных вейвлет-преобразований при использовании функций (1.5.2) для временного ряда среднегодовых температур в Центральной Англии 1723-1970 гг. (http://www-personal.buseco.monash.edu.au/~hyndman/TSDL/).
Параметр
для
выделения длинных цепей γ = 0.1 . С климатической точки зрения основной интерес представляют критические точки начал длинных цепей позитивных (1742, 1758, 1772, 1786, 1800, 1817, 1831, 1845, 1856, 1862, 1892, 1910, 1919, 1932, 1943, 1957) и негативных (1739, 1751, 1763, 1782, 1795, 1812, 1828, 1836, 1853, 1869, 1878, 1885, 1900, 1915, 1939, 1950) крупномасштабных трендов. Эти точки являются
своего
рода
временными
реперами
вариаций
климата
в
рассматриваемом регионе. 1.6. Ортогональные вейвлет-разложения.
Ортогональный кратно-разрешающий анализ (вейвлет-разложение) сигнала x( s ) от непрерывного аргумента s определяется формулой (Daubechies, 1992; Mallat, 1998):
37
x( s ) =
+∞
x α ( s ), ∑ α
x (α ) ( s ) =
( )
=−∞
+∞
∑ b α (τ α )ψ α (s − τ α ) ( )
( ) j
j =−∞
( )
( ) j
τ (jα ) = j ⋅ 2α
,
(1.6.1)
Здесь α является номером уровня детальности, b
(α ) j
(α )
= b (τ
(α ) j
+∞
)=
∫ x(s)ψ
(α )
( s − τ (jα ) ) ds
(1.6.2)
−∞
− вейвлет-коэффициенты на α -ом уровне детальности, соответствующие моменту времени τ (jα ) , ψ (α ) ( s ) являются базисными функциями α -ого уровня, которые получаются путем растяжения и переноса основной вейвлет-функции Ψ (s) :
ψ (α ) ( s) = ( 2) −α ⋅ Ψ (2−α ⋅ s),
ψ (α ) ( s − τ (jα ) ) = ( 2) −α ⋅ Ψ (2−α ⋅ s − j )
(1.6.3)
Функция Ψ ( s ) конструируется таким образом, чтобы она была финитной, имела единичную среднеквадратичную норму и бесконечное множество функций {ψ (α ) ( s − τ (jα ) ) }, − сдвинутых в точки τ (jα ) и растянутых (или сжатых) в 2α раз копий основной функции, образовывали бы ортонормальный базис в L2 (−∞, +∞) . Например, если: Ψ ( s ) = −1 для s ∈(0, 12 ]
(1.6.4)
+1 для s ∈( 12 ,1] и ноль для прочих t ,
.
тогда формула (1.6.4) соответствует разложению функции x( s ) по вейвлетам Хаара.
Функция
(1.6.4)
является
ортогональным
финитным
ортогональных
вейвлет-функций
простейшим
вейвлетом.
и
Наиболее
являются
наиболее
популярным
функции
компактным семейством
Добеши (Daubechies)
Ψ ( s ) = D2 p ( s ) порядка 2 p , которые обладают следующими свойствами: D2 p ( s ) = 0 вне интервала [− p + 1, p] ,
(1.6.5a)
+∞
∫s
k
⋅ D2 p ( s ) ds = 0
для k = 0,..., ( p − 1)
(1.6.5b)
−∞
С ростом числа p обнуляемых моментов в формуле (1.6.5b) функция D2 p ( s ) становится все более гладкой, хотя число ее непрерывных производных не является пропорциональным параметру p . Например, функция Добеши 4-го порядка
D2 p ( s )
обнуляет
нулевой
и
первый
момент
и
непрерывно
дифференцируема во всех точках, за исключением счетного множества точек вида
k 2−l для целых чисел k , l . В точках такого вида D4 ( s ) имеет левостороннюю 38
производную, но не имеет правосторонней. Отметим, что вейвлет Хаара (1.6.4) является вейвлетом Добеши 2-го порядка ( p = 1 ). Мы использовали словарь из 17 вейвлетов: 10 обычных ортогональных вейвлетов Добеши с порядками от 2 до 20 (использование
более
высоких
порядков
сопряжено
с
численной
неустойчивостью) и 7 т.н. «симлетов» - модификаций вейвлетов Добеши, в которых форма базисных функций является более симметричной, чем для обычных вейвлетов (Chui, 1992; Daubechies, 1992; Mallat, 1998). Симлеты обладают теми же свойствами компактности, ортогональности, полноты и гладкости, что и вейвлеты (1.6.5), но для порядков от 2-го до 6-го они совпадают с обычным ортогональным базисом Добеши, а затем, для порядков от 8-го до 20-го, появляются различия в форме базисной функции. Вследствие этого, общее число используемых нами вариантов ортогональных компактных базисных функций равно 17. Рассмотрим ситуацию, когда z (t ) представляет собой сигнал с дискретным временем t длиной N отсчетов, t = 1,..., N . Будем считать, что N имеет вид целого числа вида 2m - это удобно для последующего использования быстрого вейвлет-преобразования. Если N не равно 2m , то дополним сигнал z (t ) нулями до длины, которая будет равна 2m , где m − минимальное целое число, для которого N ≤ 2m . Формула кратно-разрешающего анализа в случае конечной выборки и дискретного времени: z (t ) = a
(m) 1
+
m
z ∑ β
(β )
(t ),
z
(β )
(t ) =
=1
2( m − β )
∑ c β (τ β ) ⋅ψ β (t − τ β ), ( )
j =1
( ) j
( )
( ) j
τ (j β ) = j ⋅ 2β
(1.6.6)
где z ( β ) (t ) является компонентой сигнала, принадлежащей уровню детальности с номером β , a (1m ) - константа, пропорциональная среднему значению выборки (Chui, 1992, Daubechies, 1992; Mallat, 1998; Press et al., 1996). В формуле (1.6.6) коэффициенты c (jβ ) = c ( β ) (τ (j β ) ) могут быть представлены, подобно формуле (1.6.2), в виде свертки базисной функции ψ ( β ) ( s ) от непрерывного аргумента s с некоторым сигналом z ( s) : c
(β ) j
+∞
=
∫ z (s) ⋅ψ
(β )
( s − τ (j β ) ) ds
(1.6.7)
−∞
Сигнал z ( s) от непрерывного аргумента s получается из сигнала z (t ) с дискретным временем t путем интерполяции по формуле:
39
z ( s) = ∑ z (t ) ⋅ Φ ( s − t )
(1.6.8)
t
где функция
Φ( s)
носит название масштабирующей функции вейвлет-
разложения. Например, для вейвлета Хаара Φ ( s ) = 1 для s ∈ [0,1] и Φ ( s ) = 0 для всех прочих s и, следовательно, интерполированный сигнал будет кусочнопостоянной функцией. В общем случае ортогональных вейвлетов Добеши масштабирующая функция является ортогональной основной базисной функции +∞
Ψ (s) :
∫ Ψ (s) Φ(s) ds = 0
и имеет те же свойства гладкости и компактный
−∞
носитель той же длины, что и Ψ ( s ) (но не совпадающий полностью с ним): Φ ( s ) = 0 вне интервала [0, 2 p − 1] . Если дискретный сигнал z (t ) получается из сигнала с непрерывным временем x( s ) путем взятия отсчетов с шагом Δ s по времени, то при стремлении Δ s → 0 интерполированный сигнал z ( s ) всегда стремится в среднеквадратической метрике к исходному x( s ) . Если в формуле (1.6.8) используется масштабирующая функция
Φ( s) ,
соответствующая
базису
Добеши
порядка
2p ,
то
интерполированный сигнал z ( s ) будет иметь ( p − 1) первых производных, непрерывных почти всюду, за исключением, возможно, счетного числа точек, независимо от гладкости исходного сигнала x( s ) . Но при стремлении Δ s → 0 эти производные будут стремиться в интегральной метрике к производным исходного сигнала лишь в том случае, если x( s ) будет также ( p − 1) раз дифференцируем почти всюду. Таким образом, выбор вейвлета для анализа сигнала должен соответствовать его гладкости. Если забыть о возможном происхождении сигнала
z (t )
в результате
дискретизации непрерывного сигнала x( s ) с некоторым шагом по времени Δ s , то коэффициенты c (jβ )
дискретного разложения (1.6.6) являются результатом
применения последовательной линейной фильтрации дискретного сигнала. На первом шаге происходит разделение дискретного сигнала на 2 части: вейвлеткоэффициенты 1-го уровня детальности c (1) j (или «детальный сигнал» 1-го уровня) и т.н. аппроксимирующий (сглаженный) сигнал a (1) j 1-го уровня по формуле:
40
(0) (0) c (1) a (1) a (0) j = ∑ g (t − 2 j ) ⋅ a t , j = ∑ h(t − 2 j ) ⋅ a t , t ≡ z (t ),
t
j = 1,..., N / 2 (1.6.9)
t
Коэффициенты линейного фильтра
g (k )
в формуле (1.6.9) обладают
свойством выделения высоких частот, а коэффициенты h(k ) – свойством сглаживания. Отметим, что формулы (1.6.9) включают в себя не только линейную фильтрацию,
но
и
прореживание
в
2
раза
–
поэтому
детальный
и
аппроксимирующий сигналы содержат в 2 раза меньше отсчетов, чем исходный. Из-за конечной длины выборки при применении формул (1.6.9) возникают технические сложности в начале и в конце выборки. Существуют различные приемы преодоления этих трудностей, например, рассмотрение выборки z (t ) на кольце вместо интервала. При этом могут возникать краевые искажения результатов вейвлетной фильтрации, аналогичные краевым искажениям из-за циклического эффекта дискретного преобразования Фурье (Press et al., 1996). После первого шага (1.6.9) он повторяется еще (m − 1) раз (напомним что N = 2m ): c ( βj +1) = ∑ g (t − 2 j ) ⋅ at( β ) , a ( βj +1) = ∑ h(t − 2 j ) ⋅ at( β ) , t
j = 1,..., N ⋅ 2− ( β +1) (1.6.10)
t
Таким образом, согласно формуле (1.6.10), на каждом новом уровне детальности
вейвлет-разложения
происходит
однотипное
расщепление
аппроксимирующего сигнала a (jβ ) предыдущего уровня детальности на его высокочастотную составляющую c ( βj +1) и на «еще более сглаженный» сигнал a ( βj +1) .
Число
отсчетов
в
детальном
сигнале
(то
есть
число
вейвлет-
коэффициентов) и в сглаженном (аппроксимирующем) сигнале всякий раз уменьшается в 2 раза при увеличении номера уровня детальности на единицу. Коэффициент a (1m ) в формуле (1.6.6) является аппроксимирующим «сигналом», соответствующим самому глубокому сглаживанию на последнем уровне детальности m . Коэффициенты g (k ) и h(k ) линейных фильтров (имеющих название «сопряженных зеркальных фильтров») связаны друг с другом соотношением
g (k ) = (−1)1− k h(1 − k ) , которое вытекает из масштабирующих
уравнений ортогонального кратно-разрешающего анализа: 1 Φ (t / 2) = 2
+∞
∑ h(k ) ⋅ Φ(t − k ),
k =−∞
1 Ψ (t / 2) = 2
+∞
∑ g (k ) ⋅ Φ(t − k )
(1.6.11)
k =−∞
для масштабирующей и основной базисной функций. Для финитных базисных функций Добеши
D2 p ( s )
число ненулевых коэффициентов в линейных
41
зеркальных фильтрах g (k ) и h(k ) равно порядку функции 2 p . Например, для вейвлета Хаара h(k ) = 1/ 2 для k = 0,1 и h(k ) = 0 для всех прочих k . Для функций Добеши 4-го и 6-го порядков коэффициенты зеркальных фильтров находятся аналитически из линейных уравнений, вытекающих из условия (1.6.5b) обнуления заданного числа первых моментов, но для более высоких порядков эти линейные уравнения решаются уже численно. Следует заметить, что с ростом порядка вейвлета обусловленность линейных уравнений уменьшается и растет ошибка округления. Поэтому обычно ограничиваются вейвлетами до 20-го порядка. Алгоритмически вейвлет-преобразование является линейным ортогональным преобразованием N −мерного вектора выборки z (t ) в вектор коэффициентов C z( N ) = (a (1m ) , c (1m ) ,..., (c (jβ ) , j = 1,..., nβ ),...) , длина которого также равна N и который
состоит из постоянной a (1m ) на первом месте и последовательно состыкованных друг с другом коэффициентов всех уровней детальности, начиная с m −го, (m − 1) −го и так далее, вплоть до коэффициентов первого уровня детальности, занимающего всю вторую половину вектора Cz( N ) (Press et al., 1996). Обратное преобразование вектора Cz( N ) дает исходную выборку z (t ) . Заметим, что обратное вейвлет-преобразование осуществляется также в виде последовательных шагов восстановления
аппроксимирующего
сигнала
уровня
β
из
вейвлет-
коэффициентов c ( βk +1) и аппроксимирующего сигнала a ( βk +1) уровня ( β + 1) с использованием зеркальных сопряженных фильтров по формуле: a (jβ ) = ∑ h( j − 2k ) ⋅ a ( βk +1) + ∑ g ( j − 2k ) ⋅ c ( βk +1) , k
j = 1,..., N ⋅ 2− β
(1.6.12)
k
Обратное преобразование начинается с коэффициентов a (1m ) и c (1m ) последнего (самого низкочастотного) уровня детальности с номером m и заканчивается на 1ом уровне. При этом происходит увеличение в 2 раза числа отсчетов в аппроксимирующем сигнале каждый раз при уменьшении номера уровня детальности – до тех пор, пока последовательность восстановлений не остановится на 1-ом уровне детальности и число отсчетов не станет равным N . Прямое и обратное вейвлет-преобразования (1.6.10) и (1.6.12) допускают программную реализацию в виде быстрых алгоритмов, требующих O( N ) операций, что по скорости превосходит быстрое преобразование Фурье (Chui,
42
1992, Daubechies, 1992; Mallat, 1998; Press et al., 1996). Компонента z ( β ) (t ) является результатом обратного преобразования вектора коэффициентов типа Cz( N ) , при условии обнуления всех коэффициентов, кроме соответствующих уровню β . z ( β ) (t )
Компонента
для достаточно большого значения
N
частотно
локализована в полосе: β) β) [Ω (min , Ω(max ] = [1/(2( β +1) Δ s ), 1/(2 β Δ s)]
(1.6.13)
где Δ s – длина интервала опроса. Значение коэффициента c (jβ ) отражает поведение сигнала z (t ) в окрестности точки τ (j β ) на интервале длиной p 2 β отсчетов. Следовательно, чем более гладким является вейвлет, тем шире этот интервал. Однако основные вариации (всплески) финитной базисной функции
ψ ( β ) ( s) всегда сосредоточены на интервале длиной 2β независимо от параметра гладкости p . Поэтому каждому коэффициенту c (jβ ) припишем «временную зону ответственности»
длиной
Δ T ( β ) = Δ s 2β .
Произведение
ширины
ΔΩ( β ) = 1/(2β +1 Δ s ) частотной полосы (1.6.13) на длину временного интервала ΔT ( β ) задает площадь так называемых «ящиков Гейзенберга» на плоскости «время-частота», которая равна ½ независимо от рассматриваемого уровня детальности. Самым мелкомасштабным уровнем детальности в формуле (1.6.6) является первый, общее число уровней детальности m зависит от длины выборки. Совокупность значений c (jβ ) и a (1m ) вычисляются путем прямого быстрого вейвлетпреобразования (Daubechies, 1992; Mallat, 1998; Press et al, 1996). Они однозначно определяют исходную выборку z (t ) , которая может быть восстановлена по заданным c (jβ ) и a (1m ) путем обратного быстрого вейвлет-преобразования. Уровень детальности можно ассоциировать с номером частоты (частотным дискретом) в классическом дискретном Фурье-преобразовании. Отличие вейвлет-разложения состоит в том, что набор “вейвлет-частот” значительно более редок (равномерен в логарифмической шкале), чем в Фурье-анализе. Это является платой за важное свойство – финитность базисных функций, которое отсутствует в Фурьеразложении и которое позволяет гораздо более точно определять местоположения короткоживущих аномалий - всплесков. Кроме того, финитность базисных 43
функций позволяет производить вейвлет-анализ нестационарных и негауссовых временных рядов, Фурье-анализ которых хотя формально и возможен, однако малоэффективен. Хотя обычное вейвлет-разложение обладает полезным свойствами высокой точности локализации по времени нестационарных сигналов, оборотной стороной этого свойства, в соответствии с принципом Гейзенберга, является слабое разрешение по частоте. Вейвлет-пакетное разложение позволяет частично устранить этот недостаток за счет некоторого ухудшения разрешения по времени. Реализация
пакетного
последовательных
расщепления
основана
вейвлет-преобразований
на
исходных
иерархической
схеме
коэффициентов
c (jβ ) .
Ортогональное вейвлет-пакетное разложение сигнала, аналогично формуле (1.6.6), может быть записано в виде суммы: z (t ) = a
( m) 1
+
m
∑ β
= mq +1
z
(β )
mq
q
(t ) + ∑∑ z ( β ,γ ) (t )
(1.6.14)
β =1 γ =1
Величина q может быть равна 2, 4, 8, …, то есть имеет вид q = 2r , r = 1, 2,3,... и определяет число подуровней, на которое расщепляется обычный уровень детальности. Для заданного значения параметра q максимальный номер mq < m уровня детальности β , который может быть расщеплен, определяется из условия, что он должен содержать минимум q вейвлет-коэффициентов. Компоненты z ( β ,γ ) (t )
частотно-упорядочены,
расщепляют
частотную
полосу
(1.6.13),
соответствующую уровню детальности β на q равных частей. Таким образом, сигнал z ( β ,γ ) (t ) частотно-локализован в полосе: β ,γ ) β ,γ ) β ,γ ) β) [Ω (min , Ω(max ] , Ω (min = Ω(min + (γ − 1) ⋅ ΔΩ ( β ) , γ = 1,..., q; β ,γ ) β ,γ ) β) β) Ω (max = Ω(min + ΔΩ ( β ) , ΔΩ ( β ) = (Ω (max − Ω (min )/q
(1.6.15)
Если уровню детальности с номером β соответствует nβ обычных вейвлеткоэффициентов, то каждому подуровню γ пакетного разложения соответствует nβ / q
вейвлет-пакетных
коэффициентов
c (jβ , γ ) ,
j = 1,..., nβ / q ,
«ящики
Гейзенберга» для которых имеют временную длину в q раз большую, что исходные коэффициенты c (jβ ) , но их частотная сторона в q раз меньше (следовательно, площадь «ящиков Гейзенберга» остается неизменной и равной ½).
44
Для того, чтобы получить компоненту z ( β ,γ ) (t ) , необходимо совершить цепочку обратных вейвлет-преобразований коэффициентов c (jβ , γ ) . Последний шаг в этой цепочке обратных преобразований совершается от некоторого набора коэффициентов w(jβ , γ ) , j = 1,..., nβ , которые занимают в аналоге вектора Cz( N ) те же позиции, что и обычные коэффициенты c (jβ ) разложения сигнала z (t ) . Однако обратное преобразование от них дает компоненту z ( β ,γ ) (t ) , а не z ( β ) (t ) . Назовем коэффициенты w(jβ , γ ) модифицированными вейвлет-пакетными коэффициентами сигнала z (t ) . Таким образом, модифицированные коэффициенты w(jβ , γ ) являются обычными вейвлет-коэффициентами на уровне детальности β для случая, когда на вход прямого преобразования подается не исходный сигнал, а лишь его компонента z ( β ,γ ) (t ) . Ящики Гейзенберга для коэффициентов w(jβ , γ ) имеют ту же временную длину, что и для c (jβ ) , но их частотная длина равна частотной длине коэффициентов c (jβ , γ ) . Таким образом, переход от обычных вейвлет-пакетных коэффициентов позволяющим
c (jβ , γ )
сузить
к
w(jβ , γ )
модифицированным
временной
интервал
является
неопределенности
приемом, (уменьшить
временную длину ящика Гейзенберга). Заметим, что при таком переходе энергия nβ
коэффициентов разложения сохраняется:
∑ (w j =1
( β ,γ ) 2 j
) =
nβ / q
∑ (c β γ ) j =1
( , ) 2 j
.
Если на плоскости «время-частота» построить 2-мерную карту, состоящую из частотно-упорядоченных
ящиков
Гейзенберга
модифицированных
коэффициентов w(jβ , γ ) и закрасить каждый ящик в соответствии с палитрой, пропорциональной абсолютным значениям вейвлет-пакетных коэффициентов w(jβ , γ )
(или их логарифмам), то получится диаграмма, визуализирующая
временную
динамику
основных
временных
масштабов
(или
периодов)
нестационарного сигнала. Внешне эта мозаика из вейвлет-пакетных ящиков Гейзенберга может проигрывать в эстетическом восприятии по сравнению, например, с традиционными спектрально-временными диаграммами. Однако она дает более точное и адекватное представление о частотно-временной динамике сильно нестационарного сигнала, состоящего из множества короткоживущих
45
всплесков различного масштаба, форма которых может сильно отличаться от гармонического колебания той или иной частоты. Одним из важных вопросов, который необходимо решать при применении ортогональных
вейвлет-разложений,
является
выбор
наилучшего
базиса,
например, порядка вейвлета Добеши. При выборе оптимального вейвлет-базиса наиболее часто используется критерий минимума энтропии распределения квадратов модулей вейвлет-коэффициентов: m 2( m − β )
E ( x) = −∑ β =1
∑ j =1
p (jβ ) ⋅ ln( p (jβ ) ) → min,
p (jβ ) = | c (jβ ) |2
|c α ∑ α
( ) 2 i
|
(1.6.16)
,i
Метод (1.6.16) подбирает для сигнала
z (t )
такой базис, в котором
распределение значений квадратов его вейвлет-коэффициентов максимально отличаются
от
равномерного.
Тем
самым
максимум
информации
сосредотачивается в минимальном количестве коэффициентов разложения. Часто простое
применение
критерия
(1.6.16)
дает
вполне
удовлетворительные
результаты. Однако ниже был использован также более изощренный метод подбора оптимального базиса, который имеет вид итерационной процедуры, многократно использующей критерий (1.6.16). Это связано с желанием выделить, путем применения того или иного базиса, как можно более тонкие различия в структуре сигналов. Метод был предложен в работе (Berger et al., 1994) для решения задачи очищения старых вокальных записей оперных классиков от характерных шумов, (шипение, трески, щелчки) и был назван методом последовательного когерентного отсечения (coherent basis thresholding). Кратко изложим метод в виде последовательности операций. 1. Инициализация: в рабочий буфер y (t ) помещаем исходный сигнал z (t ) . 2. Определяем порядок вейвлета из критерия (1.6.16) для сигнала y (t ) : E ( y ) → min . 3. Отсортируем вейвлет-коэффициенты c (jβ ) сигнала y (t ) для базиса, определенного в пункте 2, в порядке убывания их абсолютных величин и отсортированные коэффициенты обозначим через d j , j = 0,1,..., ( N − 1) . Таким образом, в отсортированной последовательности коэффициент d 0 является максимальным по модулю. 4. Определим минимальное целое число M = 0,1,..., ( N − 1) из условия выполнения неравенства:
46
| d M |2
N −1
∑
≤ 2
j=M + 1
|dj |
2 ⋅ ln( N − M ) (N − M )
(1.6.17)
5. Если условие (1.6.17) выполняется сразу, для значения M = 0 , то считать, что оптимальный порядок найден, и выйти из алгоритма. 6. Если ни для какого M = 0,1,..., ( N − 1) условие (1.6.17) не выполняется, то положить значение оптимального порядка вейвлета найденному в пункте 2 из условия минимума энтропии сразу после инициализации и выйти из алгоритма. 7. Обнулить все коэффициенты c (jβ ) , для которых | c (jβ ) | ≥ | d M | , совершить обратное вейвлет-преобразование с оставшимися коэффициентами, получившийся остаточный сигнал поместить в рабочий буфер y (t ) и перейти к пункту 2. Смысл этой процедуры состоит в следующем. Считается, что сигнал состоит из «полезного сигнала», вариации которого отражены в значениях вейвлеткоэффициентов, достаточно больших по модулю и из «шума», которому соответствуют все прочие коэффициенты. Задача состоит в выборе порога значений модулей коэффициентов, выше которого они отвечают «полезному сигналу», а ниже – «шуму». Неравенство (1.6.17) как раз и призвано определять такой порог. Это условия взято из формулы для вероятности асимптотических максимальных уклонений значений гауссовского белого шума W (t ) (Королюк и др., 1985)): lim Pr{ max | W (t ) |2
N →∞
0 ≤ t ≤ ( N −1)
N −1
∑ | W ( j) | j =0
2
≤
2 ln N } =1 N
(1.6.18)
где Pr{...} – вероятность события. Кроме того, в дальнейшем нам будет полезна еще одна формула, непосредственно вытекающая из (1.6.18): lim Pr{ max | W (t ) | ≤ σ 2 ⋅ ln N } = 1
N →∞
0 ≤ t ≤ ( N −1)
(1.6.19)
где σ - значение стандартного отклонения гауссовского белого шума W (t ) . Таким образом, смысл условия (1.6.17) состоит в разделении вейвлеткоэффициентов на «шумовые» и «полезные». Шумообразующими считаются те достаточно малые по модулю (нижний предел суммирования в (1.6.17) равен
M + 1 ) коэффициенты, максимальные абсолютные значения которых лежат в асимптотических пределах для белого шума (формула (1.6.18)). Но такое выделение «шума» из сигнала зависит от используемого базиса (то, что для
47
одного базиса является «шумом», для другого может не удовлетворять критерию (1.6.17)). Поэтому, выбрав базис из условия минимума энтропии (пункт 2), далее выделяется «шум» по отношению к выбранному базису (пункт 7) и уже для этого остаточного (обедненного информацией) сигнала опять ищется оптимальный базис (пункт 2) и так далее, до тех пор, пока остаточный сигнал не будет являться шумом даже по отношению к своему оптимальному базису (пункт 5). Последний определенный оптимальный базис считается оптимальным, поскольку он смог хоть что-то определить в самом обедненном остаточном сигнале. В этом есть смысл, поскольку из начального сигнала z (t ) можно извлечь информацию с помощью любого базиса, тогда как для обедненного остаточного сигнала надо поискать наилучший. После определения для данного сигнала оптимального вейвлет-базиса может быть найдена та часть минимальных по модулю вейвлет-коэффициентов, которая может быть отброшена при обратном вейвлет-преобразовании, поскольку она отвечает шуму. Для этого делается предположение, что шум в основном сосредоточен
в
детальности,
за
вариациях
на
исключением
первом,
самом
небольшого
высокочастотном
числа
точек,
в
уровне котором
сконцентрированы высокочастотные особенности поведения полезного сигнала и которым,
следовательно,
соответствуют
большие
значения
вейвлет-
коэффициентов 1-го уровня. В силу ортогональности вейлет-преобразования дисперсия вейвлет-коэффициетов равна дисперсии исходного сигнала. Поэтому оценим стандартное отклонение шума σ для вейвлет-коэффициентов на 1-м уровне детальности. При этом следует учесть, что оценка должна быть робастной, нечувствительной к возможным большим выбросам «полезных» значений вейвлет-коэффициентов
на
1-м
уровне.
Например,
можно
использовать
робастную медианную оценку стандартного отклонения для нормальной случайной величины (Huber, 1981):
σ = med{ | c (1) j | , j = 1,..., N / 2}/ 0.6745
(1.6.20)
Теперь, зная оценку σ из (1.6.20), можно оценить, согласно (1.6.19), порог тех значений модуля вейвлет-коэффициентов, ниже которого их можно обнулить, поскольку они являются носителями шумовых вариаций – он равен σ 2 ⋅ ln N . Отсюда очевидно определяется уровень
σ
Донохо-Джонстона (Donoho,
Johnstone, 1994) для сжатия сигнала: отношение числа коэффициентов, для
48
которых выполнено условие | c (jβ ) | ≤ σ 2 ⋅ ln N , к общему их числу N . Эта безразмерная величина α , 0 < α < 1 , может быть использована в дальнейшем как интегральная
характеристика
сигнала,
например,
для
решения
задач
классификации. Более распространенным применением порога Донохо-Джонстона является операция нелинейной пороговой фильтрации (thresholding) сигнала, которая заключается в выполнении следующей последовательности операций: 1) для выбранного ортогонального вейвлет-базиса совершить прямое дискретное вейвлет-преобразование; 2) отсортировать вейвлет-коэффициенты, не различая уровней детальности, в порядке возрастания их абсолютных величин; 3) положить равными нулю заданную часть α коэффициентов, минимальных по модулю (таким образом, отличными от нуля остаются лишь доля 1− α коэффициентов, имеющих наибольшие абсолютные значения); 4) совершить обратное дискретное вейвлет-преобразование. Результатом будет некоторый сигнал zT (t ) , который сохранит лишь наиболее значимые вариации исходного сигнала z (t ) , отобранные не по частотному принципу, а согласно критерию наибольших значений вейвлет-коэффициентов. Пусть z (t ) = f (t ) + W (t ) , где f (t ) - «полезный» сигнал, представляющий собой кусочно-полиномиальную функцию, а W (t ) - гауссовский белый шум с дисперсией σ 2 . Таким образом, интервал отсчетов t = 1,..., N , на которых задан
f (t ) , разбит на конечное число (не зависящее от N ) непересекающихся сегментов, на каждом из которых полезный сигнал равен полиному той или иной степени, а на граничных точках сегментов сам сигнал или его производные могут претерпевать разрывы. Пусть m - максимальная степень полиномов, а K - общее число точек разрыва f (t ) . Пусть zT (t ) - сигнал, полученный из z (t ) операцией нелинейной пороговой фильтрации с использованием порога Донохо-Джонстона и ортогонального вейвлета, обнуляющего (m + 1) моментов (условие (1.6.5b)). Тогда справедлива оценка (Donoho, Johnstone, 1994; Mallat, 1998): M {|| zT − f ||2 } ( K + 1)(m + 1) C ln 2 ( N ) ≤ ⋅ →0 N →∞ || f ||2 N ρ2
(1.6.21)
49
N
где M {...} – знак математического ожидания, || f ||2 = ∑ f 2 (t ) , C ≈ 4 / ln(2) t =1
некоторая константа, ρ 2 =|| f ||2 / σ 2 - отношение «сигнал/шум».
Рис.1.10. Верхний график (0) – микросейсмические колебания на сейсмостанции Петропавловск-Камчатский, запись широкополосной станции IRIS после усреднения и перехода к 10-секундным отсчетам, 30039 отсчетов; графики (1-9) – разложение по первым 9 уровням детальности с использованием симлета 14-го порядка.
Рассмотрим в качестве примера ортогональный вейвлет-анализ записи микросейсмических колебаний широкополосной станцией IRIS в ПетропавловскеКамчатском, сделанных за 3.5 суток перед Кроноцким замлетрясением на Камчатке
(05.12.1997,
магнитуда
7.8)
(Соболев
и
др.,
2005).
Частота
дискретизации исходной записи равна 20 Гц. На верхнем графике, помеченным цифрой «0» на рис.1.10 представлены данные после усреднения и прореживания в 200 раз, то есть после перехода к 10-секундным отсчетам. Низкочастотные колебания – это реакция широкополосного сейсмометра на приливные наклоны земной поверхности. Ниже, на графиках помеченных цифрами 1-9, представлены вейвлет-компоненты
разложения
для
первых
9
уровней
детальности
соответственно. Использовался симлет 14-го порядка, найденный из минимума энтропии распределения квадратов вейвлет-коэффициентов на первых 9 уровнях 50
детальности.
Примечательная
особенность
этого
разложения
–
наличие
низкочастотных всплесков (уровни, начиная с 4-го), из которых наиболее интенсивен в окрестности момента времени 54 часа. На первых 2-х уровнях детальности можно проследить развитие микросейсмических бурь.
Рис.1.11. Графики (1-36) – вейвлет-пакетное разложение микросейсмических колебаний (рис.1.10, график 0) первых 9 уровней детальности с расщеплением каждого уровня на 4 подуровня с использованием симлета 14-го порядка. Разложение частотноупорядочено с убыванием частот сверху вниз.
На рис.1.11 представлен результат вейвлет-пакетного разложения первых 9 уровней детальности с расщеплением каждого уровня на 4 подуровня. Итого, общее число всех подуровней равно 36. Эти вейвлет-пакетные компоненты частотно упорядочены соответственно номеру графика на рис.1.11. Каждая последовательная группа из четырех графиков дает представление расщепления каждого из уровней. Преимущество вейвлет-пакетного разложения по сравнению 51
с обычным, представленным на рис.1.10, заключается в более тонком частотном разрешении. В частности, на подуровнях с номерами от 12-го по 19-й стало заметно еще одно низкочастотное событие в окрестности момента времени 76 часов.
Рис.1.12. Диаграмма десятичных логарифмов модулей модифицированных вейвлетпакетных коэффициентов при расщеплении уровней детальности 4-9 записи в Петропавловске-Камчатском (после перехода к 10-секундным опросам) в 8 раз. Симлет 14-го порядка.
На рис.1.12 представлены «ящики Гейзенберга» - модифицированные вейвлет-пакетные коэффициенты для уровней детальности с 4-го по 9-й при еще более детальном расщеплении каждого уровня на 8 подуровней. Низкочастотные события в окрестности 54 и 76 часов, о которых говорилось выше, на этой диаграмме отчетливо выделяются по увеличению интенсивности закрашивания соответствующих ящиков. Кроме того, эта диаграмма позволяет найти еще одну особенность
данных
–
увеличение
мощности
колебаний
для
2-х
преимущественных масштабов – 2 темные полосы для значений логарифмов в окрестности -0.45 и -0.15. Более точная оценка этих масштабов сделана на основании
анализа
графика
значений
квадратов
вейвлет-пакетных
коэффициентов, усредненных внутри каждого подуровня (вейвлет-пакетный спектр). Там выявлено 2 пика на масштабах 22 и 40 минут. Для уточнения характера этих низкочастотных микросейсмических колебаний было проведено еще более глубокое усреднение и прореживание данных в 1200 раз, что эквивалентно переходу к 1-минутным отсчетам.
52
Рис.1.13. (а), тонкая линия – микросейсмические колебания на сейсмостанции Петропавловск-Камчатский, запись широкополосной станций IRIS после усреднения и перехода к минутным отсчетам, 5006 отсчетов; толстая линия – гауссовский тренд с радиусом усреднения 30 отсчетов; (б) – остаток после удаления тренда; (в) – результат пороговой фильтрации с уровнем сжатия α =0.9, вейвлет Добеши 4-го порядка.
На рис.1.13(а) представлен график этого усредненного сигнала и его гауссовский тренд, оцененный для радиуса усреднения 30 отсчетов, а на рис.1.13(б) – график сигнала после исключения низкочастотного тренда. На нем видны
периодические
асимметричные
колебания
(с
преимущественным
отклонением вниз), начиная с момента времени 25 часов. Для удаления шума была применена пороговая нелинейная фильтрация. Оптимальный вейвлет для этих данных был определен как Добеши 4-го порядка. Для него порог сжатия Донохо-Джонстона α =0.9783, но результат применения оказался слишком 53
«жестким», то есть, было удалено много коэффициентов и результирующий сигнал оказался слишком обедненным. Поэтому значение α
постепенно
понижалось и было выбрано α =0.90. Для этого варианта пороговой фильтрации результат представлен на рис.1.13(в), на котором периодическая структура последовательности асимметричных импульсов видна более отчетливо.
1.7. Мера нестационарности. При исследовании сильно зашумленных временных рядов полезно иметь некоторую статистику, дающую количественную меру различия поведения сигнала слева и справа от рассматриваемой точки. Задача построения такой меры тесно связано с задачей о разладке – определения такого момента времени, когда статистические свойства сигнала существенно изменились. Для решения задачи о разладке традиционно широко применялись модели авторегрессии (Бородкин, Мотль, 1976; Никифоров, 1983; Обнаружение изменения свойств сигналов…, 1989). Построение меры нестационарности отличается от задачи о разладке, поскольку в последней важным требованием является наискорейшее обнаружения факта резкого изменения свойств, по мере поступления новой информации. Для
обнаружения
интервалов
времени
интенсивной
перестройки
высокочастотной структуры изучаемых процессов используется метод, состоящий в оценке параметров авторегрессионной модели в двойном скользящем временном окне. Пусть x(t ) – изучаемый скалярный сигнал после устранения из него низкочастотных составляющих, т.е. частот, периоды которых соизмеримы с L – половиной длины скользящего временного окна. Пусть τ – центр двойного скользящего временного окна, в которое, тем самым, входят временные отсчеты t , удовлетворяющие условию τ − L ≤ t ≤ τ + L : Для левой и правой половин окна построим скалярную авторегрессионную модель сигнала x(t ) типа (1.3.1), которую сразу запишем в компактной форме, аналогичной (1.3.3): x(t ) = cT Y (t ) + ε (t ), Y (t ) = (− x(t − 1),..., − x(t − p),1)T , c = ( a1 ,..., a p , d )T
(1.7.1)
Полный вектор параметров модели есть θ = (cT , σ )T , где σ 2 – дисперсия остатка ε (t ) модели (1.3.1). Оценивая модель независимо по выборкам, попавшим в левую и правую половины двойного скользящего временного окна, получим два вектора параметров: θ (1) и θ (2) соответственно, которые вычисляются, для левой половины окна следующим образом, например, согласно формулам (1.3.4) или 54
методом Бурга. Обозначим Δθ = θ (2) − θ (1) - разницу между векторами оценок на левой и правой половинах скользящего временного окна. Если поведение высокочастотной составляющей изучаемого сигнала на левой и правой половинах сильно различаются, то будет увеличиваться разница Δθ . Для «взвешивания» вектора Δθ в качестве метрической матрицы логично использовать матрицу Фишера, поскольку она определяет скорость изменения логарифмической функции правдоподобия в окрестности точки максимума по параметрам: B=−
1 ∂ 2Φ , ln(Φ ) = −( L − p) ln(σ ) − 2 2σ ∂θ ∂θ
∑ ( x(t ) − c Y (t )) T
2
(1.7.2)
t
- матрицы вторых производных по параметрам от условной логарифмической функции правдоподобия авторегрессионной модели. Обозначим через B (1) и B (2) матрицы, вычисленные по левой и правой половинам скользящего окна соответственно. Тогда мерой нестационарности поведения процесса x(t ) в симметричной окрестности точки τ будет величина: r 2 (τ ) = (Δθ T B (1) Δθ + Δθ T B (2) Δθ ) /(2( L − p ))
(1.7.3)
В формуле (1.7.3) полусумма длин вектора разности параметров Δθ , измеряемых с помощью метрических матриц B (1) и B (2) , делится на ( L − p ) – число отсчетов в левой и правой частях скользящего окна за вычетом числа авторегрессионных параметров.
Такая метрика обеспечивает естественную
безразмерную меру нестационарности поведения исследуемого сигнала. Проведя несложные выкладки, нетрудно получить следующее выражение:
Δθ T BΔθ =
2(Δσ ) 2
σ2
+
ΔcT (∑ Y (t )Y T (t ))Δc t
σ 2 ( L − p)
+
4 Δ cT Δ σ ∑ ε (t )Y (t ) t
σ 3 ( L − p)
(1.7.4)
полезное при вычислении значения меры нестационарности. В работе (Любушин и др., 1999) мера (1.7.3) применялась для выделения аномалий поведения высокочастотных вариаций уровней подземных вод в группе водоносных горизонтов в Москве и Московской области. На
рис.1.14
представлены
результаты
вычисления
эволюции
меры
нестационарности для одного из самых известных климатических временных рядов – колец роста горных остистых сосен в Калифорнии на высоте 2805 м над
55
уровнем моря с географическими координатами 37.26 град. СШ, 118.10 град. ЗД. Этот дендрохронологический временной ряд (или просто дендрохронология) занимает интервал времени от –6000 г. до 1979 г. и носит специальное название «тропа Мафусаила», автор – Д. Грейбил (Methuselah Walk Pilo). Ряд свободно доступен в Интернете по нескольким адресам, в частности http://wwwpersonal.buseco.monash.edu.au/~hyndman/TSDL/. Поскольку сосны, по срезам которых строился ряд, росли на границе нижнего ареала распространения этого вида, то вариации ряда отражают силу засух на юге Сев. Америки и, косвенно, вариации климата на континенте. Этот временной ряд является объектом детального изучения для многих авторов, например (Монин, Сонечкин, 2005), где подробно изучена его частотно-временная структура с помощью непрерывных вейвлет-преобразований Морле и «мексиканская шляпа».
Рис.1.14. (а), тонкая линия – дендрохронология срезов остистой сосны в Калифорнии, 6000 г. до н.э. –1979 г.; толстая линия – гауссовское ядерное усреднение с радиусом 10 лет; (б) – эволюция меры нестационарности, оцененной в двойном скользящем окне радиуса 500 лет с помощью AR(2)-модели.
На графике 1.14(а) тонкой линией представлен сам ряд (7980 отсчетов с шагом 1 год), а толстой – его сглаженные значения с помощью ядерного гауссовского усреднения с радиусом 10 лет. На графике 1.14(б) представлена эволюция меры нестационарности, вычисленная в двойном скользящем окне радиуса 500 лет с использование авторегрессии второго порядка. Такой выбор
56
авторегрессионной модели обусловлен тем, что 2-й порядок – минимальный, который способен описывать стохастические колебания (может иметь максимум теоретического спектра внутри интервала допустимых частот). Пики меры нестационарности соответствуют критическим точкам смены типа поведения сигнала слева и справа от нее на рассматриваемом временном масштабе (500 лет). На ри.1.14(б) можно заметить 7-8 групп максимумов, последняя из которых приходится на конец 14-го века.
1.8. Мультифрактальный анализ, спектр сингулярности, постоянная Херста. Анализ фрактальных и мультифрактальных свойств временных рядов мониторинга является одним из перспективных направлений анализа данных в физике твердой Земли, метеорологии, гидрологии (Смирнов и др., 2005; Currenti et al., 2005; Ramírez-Rojas et al., 2005; Telesca et al., 2005; Turcotte, 1997). Это обусловлено способностью фрактального анализа исследовать сигналы, которые с точки зрения ковариационной и спектральной теории являются не более чем белым шумом либо броуновским движением. Одной из первых работ по анализу фрактальных свойств временных рядов являются работы американского гидролога Херста по исследованию среднегодового режима расхода воды в реках (Hurst, 1951; Feder, 1988; Mandelbrot, Wallis, 1969). Эмпирический закон Херста заключается в выполнении соотношения: R (τ ) / σ (τ ) ∼ τ H , где R(τ ) - разница между максимальными и минимальными значениями приращений наблюдаемой величины на временном интервале длиной τ , σ (τ ) - стандартное отклонение, 0 < H < 1 - постоянная, значение которой для большинства метеорологических и
гидрологических наблюдений лежит в окрестности 0.7. Для самоподобного процесса
x(t )
среднее
значений
квадрата
приращений
M {| x(t + δ t ) − x(t ) |2 } ∼ | δ t |2 H , а зависимость спектра мощности от частоты носит степенной характер S xx (ω ) ∼ ω − (2 H +1) , ω → 0 . Дальнейшее обобщение этой модели состоит в допущении зависимости постоянной Херста от времени, то есть в рассмотрении такого случайного процесса,
для
которого
M {| x(t + δ t ) − x(t ) |2 } ∼ | δ t |2 H (t ) , 0 < H (t ) < 1 .
Это
обобщение было предложено Мандельбротом (Mandelbrot, Van Ness, 1968; Mandelbrot, 1982; Feder, 1988) и названо мультифрактальным броуновским
57
движением, которое описывается плотностью распределения вероятности тех или иных значений H (t ) − т.н. мультифрактальным спектром сингулярности. Спектр сингулярности
представляет
собой
информативную
статистику,
характеризующую режим хаотических флуктуаций наблюдаемой величины. В настоящее время существуют 2 подхода для оценки спектров сингулярности временного ряда. Первый метод появился раньше и основан на анализе цепей точек максимума модулей непрерывных вейвлет-преобразований с вейвлетами, обычно равными производной той или иной степени от функции плотности распределения Гаусса (Bacry et al., 1993; Mallat, 1998; Muzy, 1994). Второй подход более близок к технике Херста и основан на анализе зависимости стандартного отклонения или размаха выборки от ее длины. В последнее время был разработан и активно применяется в различных приложениях метод анализа флуктуаций после исключения масштабно-зависимых трендов – Detrended Fluctuation Analysis (DFA) (Kantelhardt et al., 2002, 2003). Сравнительный опыт применения методов показывает, что метод DFA является более надежным и устойчивым. В то же время для специального вида самоподобных сигналов, которые могут содержать плато
постоянных
значений
(типа
известной
«чертовой
лестницы»,
конструируемой на базе канторовского множества), метод DFA неприменим и оценка,
основанная
на
непрерывных
вейвлет-преобразованиях,
имеет
преимущества. Ниже будет использован только DFA и кратко приведены основные конструкции метода. Пусть x(t ) – случайный процесс. Определим в качестве меры μ X (t , δ ) поведения сигнала
x(t )
на интервале [t , t + δ ]
модуль его приращения:
μ x (t , δ ) =| x(t + δ ) − x(t ) | и вычислим среднее значение модуля таких мер в степени q: M (δ , q ) = M {( μ x (t , δ )) q } Случайный
процесс
называется
масштабно-инвариантным,
(1.8.1) если
M (δ , q) ∼ | δ | ρ ( q ) при δ → 0 , то есть существует предел:
ρ (q) = lim δ →0
ln M (δ , q) ln | δ |
(1.8.2)
Заметим, что в определении (1.8.1-1.8.2) величина меры μ x (t , δ ) может быть взята также как размах, что ближе к традиционным конструкциям Херста:
μ x (t , δ ) = max x(u ) − min x(u ) t ≤ u ≤ t +δ
t ≤ u ≤ t +δ
(1.8.3)
58
Если
зависимость
ρ (q )
является
ρ (q ) = Hq ,
линейной:
где
H = const , 0 < H < 1 , то процесс называется монофрактальным. В частности, для классического броуновского движения
H = 0.5 . Возведение в степень
q
подчеркивает различные типы поведения сигнала: если q > 0 , то в значение меры (1.8.1) основной вклад вносят интервалы времени с большими отклонениями от тренда, а если q < 0 , то интервалы времени с малыми вариациями. Для вычисления функции ρ (q ) по конечной выборке из временного ряда x(t ), t = 1,..., N можно применить метод DFA (Kantelhardt et al., 2002). Пусть s число отсчетов, ассоциированное с варьируемым масштабом δ s : δ s = sΔt . Разобьем выборку на непересекающиеся малые интервалы длиной s отсчетов: I k( s ) = {t :1 + (k − 1) s ≤ t ≤ ks, k = 1,...,[ N / s ]}
(1.8.4)
и пусть yk( s ) (t ) = x((k − 1) s + t ), t = 1,..., s
(1.8.5)
участок временного ряда x(t ) , соответствующий интервалу I k( s ) . Пусть p (ks , m ) (t ) полином порядка m , подогнанный методом наименьших квадратов к сигналу yk( s ) (t ) . Рассмотрим отклонения от локального тренда: Δy (ks , m ) (t ) = yk( s ) (t ) − p (ks , m ) (t ), t = 1,..., s
(1.8.6)
и вычислим значение: Z
(m)
⎛ [ N / s] (q, s ) = ⎜ ∑ (max Δy (ks ,m ) (t ) − min Δy (ks ,m ) (t )) q 1≤ t ≤ s ⎝ k =1 1≤t ≤ s
1/ q
⎞ [ N / s] ⎟ ⎠
(1.8.7)
которое будем рассматривать как оценку для ( M (δ s , q))1/ q . Процедура устранения тренда на каждом малом участке длиной s отсчетов необходима в случае наличия в сигнале трендов внешнего происхождения (сезонных, приливных и т.п.). Определим теперь функцию h(q) как коэффициент линейной регрессии между значениями ln( Z ( m ) (q, s )) и ln( s ) : Z ( m ) (q, s ) ∼ s h ( q ) . Очевидно, что ρ (q ) = qh(q ) , а для монофрактального процесса h(q ) = H = const . Следующим шагом в мультифрактальном анализе (Feder, 1988) после определения функции ρ (q ) является вычисление спектра сингулярности F (α ) , который является с фрактальной размерности множества точек, в окрестности которых показатель Гельдера-Липшица для случайных реализаций процесса x(t ) равен α , то есть таких точек t , для которых | x(t + δ ) − x(t ) | ∼ | δ | α , δ → 0 . 59
Стандартный подход состоит в вычислении статистической суммы Гиббса: W ( q, s ) =
[ N / s]
∑ (max Δy k =1
1≤ t ≤ s
( s ,m) k
(t ) − min Δy (ks ,m ) (t )) q
(1.8.8)
1≤ t ≤ s
и определения показателя массы τ (q) из условия W (q, s ) ∼ sτ ( q ) , после чего спектр F (α ) вычисляется согласно формуле: F (α ) = max { min(α q − τ (q )), 0 }
(1.8.9)
q
Сравнивая (1.8.7) и (1.8.8), нетрудно заметить, что τ (q ) = ρ (q ) − 1 = qh(q) − 1 . Таким образом, F (α ) = max { min(q (α − h(q )) + 1, 0 } . q
Для монофрактального процесса, когда h(q ) = H = const , получаем, что
F ( H ) = 1 и F (α ) = 0 ∀α ≠ H . В частности, положение и ширина носителя спектра F (α ) , то есть значения α min , α max , Δα = α max − α min и α * - то значение, которое доставляет функции F (α ) максимум: F (α * ) = max F (α ) , являются α
характеристиками шума. Величину α * можно назвать обобщенным показателем Херста. Для монофрактального сигнала значение Δα должно быть равно нулю, а
α * = H . Что же касается значения F (α * ) , то оно равно фрактальной размерности точек, для окрестности которых выполняется масштабирующее соотношение M (δ , q) ∼ | δ | ρ ( q ) .
Рис.1.15
иллюстрирует
последовательные
этапы
вычисления
спектра
сингулярности для временного ряда электротеллурических потенциалов на Камчатке, данные взяты из материала статьи (Любушин, Копылова, 2004). На рис. 1.15(в) представлены графики как самих величин lg( Z ( m ) (q, s )) , так и линейных трендов, подогнанных к ним для 10 различных значений степени q для того же временного окна. Наклон графиков линейных трендов есть ничто иное, как функция
h( q ) ,
по
значениям
которой
вычисляется
показатель
массы
τ (q) = qh(q) − 1 , а далее, согласно формуле (1.8.9), и сам спектр сингулярности.
60
Рис.1.15. (а), тонкая линия – пример временного ряда (электротеллурические потенциалы); толстые линии – полиномиальные тренды 4-го порядка, подогнанные внутри непересекающихся интервалов длиной s отсчетов; (б) – разница внутри интервалов между исходными данными и трендами; (в) – графики зависимостей lg( Z (q, s)) от lg( s) с подогнанными линейными трендами для последовательных значений степени q (сверху вниз): 10, 7.5, 5, 2.5, -0.05, -2.5, -5, -7.5 и -10; (г) – спектр сингулярности.
Если оценивать спектр F (α ) в скользящем временном окне, то его эволюция может дать информацию об изменении структуры хаотических пульсаций ряда.
61
Обычно F (α * ) = 1 , но встречаются окна, для которых F (α * ) < 1 . Напомним, что в общем случае (не только для анализа временных рядов) величина F (α * ) равна фрактальной размерности носителя мультифрактальной меры (Feder, 1988). Ниже будут
проанализированы
временные
ряды
вариаций
величин
α * , Δα , F (α * ), α min , α max для данных мониторинга при их оценке в скользящем временном окне. Такой переход от исходных временных рядов к характеристикам их мультифрактальных спектров сингулярности является важной предварительно обработкой данных, освобождающих их от специфики, связанной с различной физической природой, размерностью, масштабом измерений и, одновременно, выделяющих самые общие свойства статистических флуктуаций.
Рис.1.16. Вариации параметров спектра сингулярности дендрохронологии срезов остистой сосны в Калифорнии, 6000 г. до н.э. –1979 г. при оценке в скользящем временном окне длиной 500 лет со смещением 10 лет. По временной оси отложены значения временных меток правого конца скользящего временного окна.
На рис.1.16 представлены результаты анализа дендрохронологии «тропа Мафусаила» (рис.1.14(а)) путем оценки спектра сингулярности в скользящем 62
временном окне длиной 500 лет с взаимным смещением 10 лет. Внутри каждого окна функция h(q) оценивалась как наклон прямой наилучшего приближения методом наименьших квадратов в зависимости ln( Z (0) (q, s )) от ln( s) (верхних индекс «0» означает, что тренд не удалялся – так как низкочастотные составляющие в данных имеют очень малую мощность) для s , изменяющихся от минимального значения 20 отсчетов до 0.2 от полной длины скользящего окна, то есть до 100 лет. Графики построены в зависимости от положения правого конца скользящего окна. Ширина Δα носителя спектра сингулярности сравнительно мала, из чего следует, что сам ряд по своим свойствам близок к монофракталу с показателем Херста 0.20 – средним значением вариаций α * . Однако существует характерная точка – около 1600 г. до н.э., когда носитель спектра сингулярности быстро увеличился. Отсюда следует, что в течение промежутка времени от 2100 лет до 1600 лет до н.э. в структуре хаотических пульсаций дендрохронологии, отражающих случайные вариации климата, произошли резкие изменения. Аналогичный характер имеет график вариаций Δα для временной метки около 200 лет до н.э., причем после нее ширина носителя вышла на средний уровень 0.43,
заметно
превышающий
предшествующий
фон.
Уширение
спектра
сингулярности можно интерпретировать как появление новых степеней свобода в фазовом пространстве климата (увеличение разнообразия поведения). Заметим, что часто интерес представляют лишь вариации показателя Херста. В этом случае он может быть оценен непосредственно из определения показателя, данного самим автором. Пусть x(t ), t = 1,..., N – анализируемый временной ряд; L < N – длина скользящего временного окна; τ - номер отсчета правого конца
скользящего окна, то есть мы рассматриваем моменты времени t , которые удовлетворяют условию τ − L + 1 ≤ t ≤ τ . Пусть s - длина внутреннего временного окна, которое используется внутри текущего основного окна для операций усреднения. Мы рассматриваем длины внутренних окон, удовлетворяющие условию: s ≤ L / 5 . Пусть xs(,τu) =
1 s ∑ x(u + t − 1) s t =1
(1.8.10)
− выборочная оценка среднего значения на интервале длиной s отсчетов, который лежит внутри текущего основного окна и начинается в точке u . Следующий шаг состоит в вычислении отклонений от среднего значения (1.8.10), их накопленной суммы и размаха накопленной суммы: 63
Δ xs(τ, u) (t ) = x(t ) − xs(,τu) , ξ s(,τu) (t ) = (τ ) s, u
R
= max ξ t
(τ ) s, u
(t ) − min ξ t
(τ ) s, u
t
∑Δ x τ v =1
( ) s, u
(v),
(1.8.11)
(t )
для t ∈ [u , u + s − 1], u ∈ [τ − L + 1,τ − s + 1] . Далее оцениваются дисперсия и среднее значение отношения размаха к стандартному отклонению:
(σ
1 s 1 ) = ∑ (Δxs(τ, u) (t )) 2 , RS (τ ) ( s ) = s t =1 ( L − s + 1)
(τ ) 2 s, u
τ − s +1
Rs(τ, u)
u =τ − L +1
σ s(τ, u)
∑
(1.8.12)
Показатель Херста H (τ ) в текущем временном окне оценивается как наклон кривой прямой линейной регрессии между значениями ln( RS (τ ) ( s )) и ln( s ) . Этот способ формально более прост, чем метод DFA и требует меньших длин окон, однако он сильно подвержен наличию в сигнале низкочастотных трендов, которые смещают оценку показателя Херста.
1.9. Скрытые периодичности в потоке событий. Анализ последовательностей событий является методически более сложным, чем обработка других традиционных источников информации от систем мониторинга в геофизике – временных рядов. Это обусловлено тем, что анализ точечных процессов (Cox, Lewis, 1966) не позволяет непосредственно применить чрезвычайно богатый арсенал методов, параметрических моделей и быстрых алгоритмов, разработанных в теории сигналов. Трудность состоит в том, что для применения этих методов необходимо информацию о точечных процессах предварительно привести к виду временных рядов – последовательностей значений с заданным постоянным шагом по времени. Формально этот переход не вызывает трудностей, поскольку он может быть реализован либо путем вычисления
средних
значений
от
той
или
иной
характеристики
последовательности событий (выделившейся энергии землетрясений, например) в непересекающихся временных окнах постоянной длины, либо вычисления накопленных значений тех же величин с равномерным шагом по времени (кумулятивные кривые). Однако при этом получающиеся временные ряды являются существенно негауссовыми и содержат или сильные выбросы значений или ступенеобразные особенности (для кумулятивных кривых), обусловленные
64
временной
неоднородностью
последовательности
событий
(затишьями
и
группами). Классические методы анализа сигналов, основанные на использовании преобразования Фурье и вычислении ковариаций, хотя формально и применимы к обработке таких временных рядов, малоэффективны, в силу возникающих вследствие выбросов (или ступеней) сильных смещений оценок. Даже
такая
специальных
рутинная
подходов.
периодических
операция, Ниже
компонент
в
как
спектральный
рассматривается
последовательности
анализ,
метод
для
событий,
требует
выделения
который
был
предложен в работе (Любушин и др., 1998). Пусть ti , i = 1,..., N – времена последовательности событий, наблюдаемых на интервале (0, T ] . Рассмотрим следующую модель интенсивности, содержащую периодическую компоненту:
λ (t ) = μ (1 + a cos(ωt + ϕ ))
(1.9.1)
где частота ω , амплитуда a, 0 ≤ a ≤1 , фазовый угол ϕ , ϕ ∈ [0, 2π ] и множитель
μ >0
(описывающий
пуассоновскую
часть
интенсивности)
являются
параметрами модели. Таким образом, пуассоновская часть интенсивности модулируется гармоническим колебанием. Зафиксируем какое-то значение частоты ω . Логарифмическая функция правдоподобия (Cox, Lewis, 1966) для серии наблюденных событий равна: T
ln L( μ , a, ϕ | ω ) = ∑ ln(λ (ti )) − ∫ λ ( s )ds = ti
0
μa = N ln( μ ) + ∑ ln(1 + a cos(ωti + ϕ )) − μT − [sin(ωT + ϕ ) − sin(ϕ )] ω t
(1.9.2)
i
Взяв максимум выражения (1.9.2) по отношению к параметру μ нетрудно найти что:
μ = μˆ (a, ϕ | ω ) =
N T + a(sin(ωT + ϕ ) − sin(ϕ )) / ω
(1.9.3)
Подставляя (1.9.3) в формулу (1.9.2) получаем ln( L( μˆ , a, ϕ | ω )) = ∑ ln(1 + a cos(ωti + ϕ )) + N ⋅ ln( μˆ (a, ϕ | ω )) − N
(1.9.4)
ti
65
Следует заметить, что выражение μˆ (a = 0, ϕ | ω ) ≡ μˆ 0 = N / T является оценкой интенсивности
процесса
при
условии,
что
он
является
однородным
пуассоновским (чисто случайным). Таким образом, приращение логарифмической функции правдоподобия вследствие рассмотрения более богатой, чем для чисто случайного потока событий, модели интенсивности с гармонической компонентой с заданной частотой ω равно: Δ ln L(a, ϕ | ω ) = ∑ ln(1 + a cos(ωti + ϕ )) + N ⋅ ln( μˆ (a, ϕ | ω ) / μˆ 0 )
(1.9.5)
ti
Пусть R (ω ) = max Δ ln L(a, ϕ | ω ), 0 ≤ a ≤ 1, ϕ ∈ [0, 2π ]
(1.9.6)
a ,ϕ
Функция (1.9.6) может рассматриваться как обобщение спектра для последовательности событий. График этой функции показывает насколько «более выгодна» периодическая модель интенсивности по сравнению с чисто случайной моделью.
Максимальные
значения
функции
(1.9.6)
выделяют
частоты,
присутствующие в потоке событий. Следующим очевидным обобщением метода является вычисление функции (1.9.6), используя наблюденные моменты времени не на всем интервале (0, T ] , но внутри скользящего временного окна заданной длины L . Пусть τ – время правого конца скользящего временного окна. Тогда выражение (1.9.6) становится функцией от 2-х аргументов: R(ω ,τ | L) , которая может быть визуализирована в виде 2-мерных карт или 3-мерных рельефов на плоскости аргументов (ω ,τ ) . Эта частотно-временная диаграмма позволяет исследовать динамику возникновения и развития периодических компонент внутри исследуемого потока событий (Любушин, 2002(c); Соболев, 2003, 2004; Соболев и др., 2005). Рассмотрим два примера применения этой методики. Первый пример относится к исследованию сейсмического режима в большой окрестности эпицентра землетрясения на Суматре 26.12.2004. Это сейсмическое событие – одно из самых мощных за последние 100 лет, его магнитуда равна 9. На рис.1.17(а) изображены эпицентры всех землетрясений в Юго-Восточной Азии с магнитудой не менее 4.5 и глубиной эпицентра не более 100 км с начала 1963 года по момент землетрясения. Данные взяты из глобальной базы данных по 66
землетрясениям,
находящейся
по
адресу:
http://neic.usgs.gov/neis/epic/epic_global.html. Начиная с 1963 года, с начала работы глобальной системы сейсмических наблюдений, магнитуда 4.5 становится статистически значимой в этом регионе. На рис.1.17(а) большим серым кружком обозначен эпицентр землетрясения, имевший координаты 95.85 град. ВД и 3.32 град. СШ. Прямоугольной рамкой выделена окрестность землетрясения – как видно из рисунка, она весьма значительна, между 90 и 101 град. ВД и 3 град. ЮШ и 10 град. СШ. За рассматриваемые почти 40 лет наблюдений там произошло 1387 событий с магнитудами
свыше
4.5
и
глубинами
эпицентров
не
более
100
км.
Последовательность этих событий вместе с их магнитудами изображена на рис.1.17(б). Последнее событие – это само катастрофическое землетрясение, оно показано как временной репер, но вся обработка производилась по событиям строго до момента главного толчка. Наконец, на рис.1.17(в) изображена частотновременная диаграмма статистики R(ω ,τ | L) , которая оценивалась в скользящем временном окне длиной 1000 суток со смещением 10 суток для пробных значений периодов (соответствующих частоте ω в формуле (1.9.1)) от 30 до 1000 суток. Эти периоды образовывали равномерную логарифмическую шкалу. Поскольку из временной последовательности не устранялись афтершоки, то частотновременная диаграмма имеет характерную линейчатую структуру с умеренными всплесками статистики (1.9.6) в афтершоковых сериях сильных землетрясений. Диаграмма на рис.1.17(в) имеет два существенных всплеска. Один – на максимальных периодах 800-1000 суток для временных меток правого конца окна от 5000 до 6000 дней от начала 1963 г. Величина этого всплеска приращения логарифмической функции правдоподобия равна 20. Второй и наиболее значительный (амплитуда всплеска = 25.8, к сожалению, из-за невозможности использовать цвет это не совсем четко видно на диаграмме) возник внутри афтершоковой серии предыдущего сильного землетрясения (02.11.2002, M=7.6, широта=2.82,
долгота=96.08),
происшедшего
за
2
года
до
катастрофы.
Характерный период этого второго всплеска – примерно 250-320 суток. На этих периодах за все время рассмотрения не было ни одного столь же значительного увеличения, несмотря на то, что землетрясения такой силы были в реализации, представленной
на
рис.1.17(а).
Таким
образом,
эту
частотно-временную
аномалию можно рассматривать как своего рода предвестник землетрясения на
67
Суматре, детектированного за 2 года до события, после того как правая часть скользящего окна достаточно глубоко вошла в серию афтершоков предыдущего толчка.
Рис.1.17. (а) – распределение эпицентров землетрясений с магнитудами не менее 4.5 и глубинами эпицентров не более 100 км в Юго-Восточной Азии за период 1963-2004 гг. (строго до 26.12.2004), большой кружок – эпицентр землетрясения на Суматре 26.12.2004, M=9; прямоугольником выделена область рассмотрения сейсмического режима до момента толчка; (б) – последовательность сейсмических событий вместе со значениями их магнитуд за период 1963-2004 гг. внутри прямоугольной рамки на (а); (в) – эволюция приращения логарифмической функции правдоподобия при оценке в скользящем окне длиной 1000 дней для периодов от 30 до 1000 суток.
68
Для
проверки
статистической
значимости
этого
предвестника
была
сгенерирована серия из 105 событий, моменты времени которых распределены случайно, согласно распределению Пуассона с интенсивностью, равной средней интенсивности событий 1.17(б) и для этой серии оценена эволюция приращения логарифмической функции правдоподобия с теми же параметрами, что и для диаграммы на рис.1.17(в). В результате максимальный всплеск статистики (1.9.6) оказался равным 10.8 – это свидетельствует о статистической значимости всплеска перед землетрясением на диаграмме рис.1.17(в). Заметим, что в работе (Соболев, 2003), используя эту же программу выделения
периодических
компонент
в
сейсмическом
режиме,
удалось
обнаружить предвестник Кроноцого землетрясения на Камчатке (M=7.8, 05.12.1997) в виде эволюции периода всплеска статистики (1.9.6) от малых периодов к большим по мере приближения скользящего окна к моменту толчка. Следующий пример применения метода выделения периодических компонент в потоке событий относится к временному ряду ежедневных расходов воды в Рейне, измеренных в Кельне за период с 01.11.1816 по 31.05.1997, всего 65956 отсчетов. Данные принадлежат Центру по глобальным данным расхода рек в г. Кобленце, Германия и были любезно предоставлены автору доктором Питером Ван Гельдером из Технического университета г. Дельфты, Нидерланды. На рис.1.18(а) представлен график временного ряда. Он является существенно негауссовским. Рассмотрим моменты времени максимальных расходов воды, превосходящих уровень, равный медиане ряда плюс четыре медианных отклонения – этот уровень обозначен на рис.1.18(а) толстой горизонтальной линией. Моменты времени этих пиковых значений расхода воды формируют некоторую последовательность событий, к изучению свойств которой может быть применен вышеизложенный метод.
69
Рис.1.18. (а) – график ежесуточных расходов воды в Рейне (Кельн) за период 18161997 гг., толстой горизонтальной линией отмечен уровень, моменты времени пиковых выбросов за который рассматриваются как точечный процесс; (б) – эволюция приращения логарифмической функции правдоподобия при оценке в скользящем окне длиной 24 года.
На рис.1.18(б) изображена частотно-временная диаграмма приращения логарифмической функции правдоподобия при оценке в скользящем окне длиной 24 года (8766 дней) со смещением 365 дней (1 год). Можно выделить основную особенность гидрологического режима: наличие периодических компонент в максимальных расходах с периодами от 4 до 8 лет (к этому интервалу принадлежит «библейский гидрологический цикл» Нила, равный 7 годам), причем максимальными эти периодические компоненты были в интервалы времени 18251880 и 1905-1970 гг. (с учетом 24-летней длины окна). Определение начала такого цикла может быть прогностическим признаком для усиления опасности наводнений. В работах (Соболев, 2004; Соболев и др., 2005) этот метод применялся для изучения периодической структуры выбросов микросейсмических колебаний перед сильными землетрясениями.
70
ГЛАВА 2. МЕТОДЫ АНАЛИЗ МНОГОМЕРНЫХ ВРЕМЕННЫХ РЯДОВ.
В этой главе излагаются методы анализа многомерных сигналов. Также как и в первой главе, в процессе изложения методы иллюстрируются примерами обработки реальных данных систем мониторинга. Рассмотрены следующие сигналы: среднемесячные стоки Амура (1896-1985 гг.); трехкомпонентные записи сейсмических событий в глубоких угольных шахтах Силезии (Чехия); вариации атмосферного давления и уровня подземных вод в скважинах (Обнинск, 1986 г.; Москва, 1993-2005 гг.); среднемесячные стоки Рейна (1817-1996 гг.), Эльбы (1851-1984 гг.) и Луары (1863-1979 гг.); временные ряды скорости ветра на 15 метеостанциях Атлантического побережья США (1990-1995 гг.); ежедневные стоимости акций IBM, унции золота, японской йены и интегрированного индекса Standard & Poor`s (1980-2003 гг.); совместные вариации двух дендрохронологий в Калифорнии и Швеции и реконструкций зимних температур в Гренландии за период 553-1975 гг.; сейсмический режим Калифорнии (1963-2005 гг.).
2.1. Главные компоненты, канонические корреляции, факторный и кластерный анализ. Перечисленные в заголовке параграфа методы составляют содержание классического многомерного анализа (Айвазян и др., 1989; Harman, 1967; Duda, Hart, 1973; Lawley, Maxwell, 1971; Rao, 1965). Поскольку эти подходы детально описаны в классических монографиях по многомерной статистике, ниже будут лишь кратко изложены их основные конструкции, которые понадобятся в дальнейшем. Метод
главных
компонент
наиболее
прост
и
популярен.
Пусть
Y ( i ) , i = 1,..., N - «облако» из p -мерных векторов результатов наблюдений, Y ( i ) = (Y 1(i ) ,...., Y (pi ) )T . Компоненты векторов могут представлять собой физически
разные величины и измеряться в различных единицах. В этом случае необходимо выполнить предварительное нормализующее преобразование данных: 71
X (j i ) =
где μ j =
N
1 N
∑ Y j(i ) , σ 2j = i =1
(Y j(i ) − μ j )
σj N
1 N
∑ (Y i =1
(i ) j
, i = 1,..., N ; j = 1,..., p
(2.1.1)
− μ j ) 2 - выборочные оценки средних значений и
дисперсий по каждой из компонент векторов исходных данных. Следующим шагом является выборочная оценка ковариационной матрицы RXX размером p × p , состоящей из элементов: (k , j ) rXX =
N
1 N
∑X i =1
(i ) k
X (ji ) , k , j = 1,..., p
(2.1.2)
В случая выполнения предварительных преобразований (2.1.1) матрица RXX состоит из выборочных оценок попарных коэффициентов корреляции между скалярными компонентами исходных векторов данных, а на ее диагонали стоят единицы. Рассмотрим
N
величин
ξ (i ) , i = 1,..., N , определяемых как скалярное
произведение векторов исходных данных на некоторый вектор φ : ξ (i ) = φ T X ( i ) . Найдем вектор φ из решения задачи на максимум выборочной оценки дисперсии величин ξ (i ) , при условии единичной нормы вектора φ :
σ ξ2 =
N
1 N
∑ (ξ
) → max, φ T φ = 1
(i ) 2
i =1
(2.1.3)
φ
Решение задачи (2.1.3) легко получается методом множителей Лагранжа и оно заключается в том, что в качестве вектора φ надо взять собственный вектор φ 1 матрицы RXX , соответствующий ее максимальному собственному числу λ 1 : RXX φ 1 = λ 1φ 1 . В этом случае скалярные величины ξ 1(i ) = φ 1T X (i ) , i = 1,..., N носят название первой главной компоненты исходных данных, причем максимум в задаче (2.1.3) равен максимальному собственному числу: σ ξ21 = λ 1 . Если упорядочить собственные числа матрицы RXX по убыванию: λ 1 ≥ λ 2 ≥ ... ≥ λ p и обозначить через φ j собственный вектор, соответствующий числу λ j , то скалярные величины ξ (ji ) = φ Tj X (i ) , i = 1,..., N ; j = 1,..., p называются j -ой главной компонентой
и
имеют
выборочные
дисперсии,
равные
λj.
В
силу
ортонормальности системы собственных векторов симметричной неотрицательно 72
определенной матрицы RXX главные компоненты с различными номерами N
ортогональны друг другу:
∑ξ i =1
ξ (ki ) = 0 ∀ k ≠ j , что влечет за собой их
(i ) j
независимость в случае гауссовского совместного распределения исходных данных. Основное цель использования главных компонент вместо исходных состоит в уменьшении размерности данных. Если несколько первых главных компонент заключают в себе большую часть полной дисперсии данных, то можно ограничится рассмотрением только их значений. Для формализации этого правила рассматривают отношение суммы первых m собственных чисел матрицы m
RXX к полной сумме: r (m) = ∑ λ j j =1
p
∑λ j =1
j
. Эта величина по построению не
превосходит 1 и показывает, какая доля полной дисперсии заключается в первых главных компонентах. Заметим, что если выполнено предварительное
m
преобразование (2.1.1), то полная дисперсия равна размерности данных: p
∑λ j =1
j
= tr ( RXX ) = p . Критерием выбора числа первых главных компонент является
обычно условие первого превышения величиной r (m) некоторой критической доли общей дисперсии, например 0.9. Канонические корреляции являются обобщением обычного коэффициента
корреляции на случай, когда вместо выборок двух скалярных случайных величин рассматриваются выборки двух случайных векторов разной размерности и необходимо построить некоторую меру, аналогичную обычному коэффициенту корреляции, которая могла бы количественно описать «силу» линейных связей между двумя популяциями случайных векторов. Эта конструкции была предложена в работе (Hotelling, 1936). Пусть имеются результаты наблюдений p -мерных векторов X (i ) , i = 1,..., N и q -мерных векторов Z (i ) , i = 1,..., N , причем, если это необходимо, для них выполнено нормирующее преобразование (2.1.1). Для определенности будем считать, что p ≤ q . Снова рассмотрим N величин ξ (i ) , i = 1,..., N , определяемых как скалярное произведение векторов исходных данных на некоторый p -мерный вектор φ : ξ (i ) = φ T X ( i ) , но на этот раз совместно с еще одним набором N величин
73
ς (i ) , i = 1,..., N , определяемых как скалярное произведение векторов исходных данных на некоторый q -мерный вектор ψ : ς (i ) = ψ T Z (i ) . Найдем неизвестные векторы φ и ψ из условия максимума квадрата модуля выборочного коэффициента корреляции между ξ (i ) и ς (i ) :
ρ2 =
⎛ N (i ) (i ) ⎞ ⎜ ∑ξ ς ⎟ ⎝ i =1 ⎠ N
∑ (ξ
(i ) 2
)
i =1
N
∑ (ς
2
→ max
(i ) 2
)
φ ,ψ
(2.1.4)
i =1
Рассмотрим, наряду с матрицей RXX размером p × p , еще 2 матрицы: RZZ размером q × q и RXZ размером p × q с элементами
( m,n ) r ZZ =
N
1 N
∑ Z m(i ) Z n(i ) ; r (XZk ,m) = i =1
N
1 N
∑X i =1
(i ) k
Z m( k ) ; m, n = 1,..., q; k = 1,..., p
(2.1.5)
Тогда формулу (2.1.4) можно переписать в виде:
ρ = 2
(φ
T
R XZψ )
2
φ T R XX φ ⋅ψ T R ZZψ
→ max φ ,ψ
(2.1.6)
Выражение (2.1.6) не зависит от длин векторов φ и ψ . Поэтому можно рассмотреть вместо (2.1.6) следующую задачу на условный максимум:
ρ 2 = (φ T R XZψ ) → max; φ T R XX φ = 1; ψ T R ZZψ = 1 2
φ ,ψ
(2.1.7)
Решая (2.1.7) методом множителей Лагранжа, нетрудно получить необходимые условия максимума в виде: T R XZψ = ρ R XX φ , R ZX φ = ρ R ZZψ , R ZX = RXZ
(2.1.8)
откуда вытекают следующие обобщенные задачи на собственные значения:
74
−1 −1 R ZX R XX R XZψ = ρ 2 R ZZψ , R XZ R ZZ R ZX φ = ρ 2 R XX φ
(2.1.9)
−1 2 −1 2 Если ввести новые вектора u = R XX φ , w = R ZZ ψ , то уравнения (2.1.9) могут быть
переписаны в новой форме, как задача на собственные значения для симметричных неотрицательно определенных матриц U и W размером p × p и q×q : Uu = ρ 2u , Wψ = ρ 2ψ −1 2 −1 −1 2 U = R XX R XZ R ZZ R ZX R XX
(2.1.10)
−1 2 −1 −1 2 W = R ZZ R ZX R XX R XZ R ZZ
Напомним, что p ≤ q . Доказывается (Rao, 1965), что матрицы U и W имеют
p одинаковых собственных числа меньших единицы: ρ k2 , k = 1,..., p; ρ k2 ≤ 1 , оставшиеся (q − p ) собственных чисел матрицы W равны нулю. Упорядочим первые ненулевые собственные числа в порядке убывания: ρ 12 ≥ ρ 22 ≥ ... ≥ ρ p2 и пусть uk , wk , k = 1,..., p - собственные вектора матриц U и W , соответствующие собственному числу ρ k2 . Этим векторам соответствуют «старые» векторы 12 12 φ k = R XX u k , ψ k = R ZZ wk .
Решение
задачи
(2.1.4)
дается
векторами
φ 1 , ψ 1 , соответствующими
максимальному собственному числу ρ 12 , этому же числу равен максимум квадрата коэффициента корреляции в (2.1.4). Величина ρ 12 называется квадратом первой канонической корреляции между векторами X
и Z , она является
количественной мерой «силы» линейной зависимости между этими случайными векторами.
Скалярные
величины
ξ (ji ) = φ jT X ( i )
и
ς (ki ) = ψ kT Z (i ) ,
i = 1,..., N ,
называются каноническими компонентами с соответствующими номерами j и k для пары векторов X и Z . Если обозначить через cor ( x, y ) выборочную оценку коэффициента корреляции между случайными величинами ( x, y ) , то для канонических компонент выполняются следующие условия: cor (ξ j , ξ k ) = δ jk , cor (ς j , ζ k ) = δ jk , cor (ξ j , ζ k ) = ρ jδ jk
(2.1.11)
75
где δ jk – символ Кронекера, равный единице при совпадении индексов и нулю в противном случае. Канонические корреляции в дальнейшем будет необходимы для построения вейвлетных мер синхронного поведения и агрегированного сигнала. Факторный анализ является наиболее тонким инструментом классических
многомерных методов статистики. Довольно часто в прикладных задачах его объединяют или путают с методом главных компонент, хотя между ними есть принципиальное различие, заключающееся в том, что факторный анализ основан на анализе совокупности значений всех попарных корреляций, тогда как метод главных компонент – лишь значений дисперсий проекций исходного облака данных на различные плоскости. Пусть снова имеется N p -мерных векторов X (i ) , i = 1,..., N . Теперь будем считать, что предварительная нормировка исходных данных (2.1.1) выполнена обязательно и, таким образом, выборочная оценка ковариационной матрицы RXX состоит значений корреляций, а по диагонали этой матрицы стоят единицы и, следовательно, она может быть названа корреляционной. Модель факторного анализа можно записать в виде: X = Λ⋅ f +e
Здесь f - вектор размерности q
(2.1.12)
p , состоящий из скрытых факторов –
некоторых случайных векторов, которые «управляют» значениями скалярных компонент многомерного вектора
X
посредством умножения на матрицу
факторных нагрузок Λ размером p строк на q столбцов. Элементы матрицы Λ = (λ jα ), j = 1,..., p; α = 1,..., q
являются неизвестными параметрами модели,
которые необходимо определить, имея выборочную оценку RXX корреляционной матрицы исходных данных. Пока будем считать, что число скрытых параметров
q известно. Относительно свойств случайного вектора f предполагается, что его среднее равно нулю, M { f } = 0 , а его ковариационная матрица
единична
M { f ⋅ f T } = I q , где I q - q -мерная единичная матрица.
76
Это условие означает ортогональность факторов (в гауссовском случае – их независимость). Условие равенства единице дисперсий ортогональных факторов является своего рода нормировкой, так как в противном случае этого можно добиться масштабированием элементов матрицы Λ . Вектор e в формуле (2.1.12) имеет ту же размерность, что и исходный вектор X и состоит из случайных величин, описывающих шум по каждой из компонент вектора X , то есть, не несущих полезной информации и состоящих, например, из ошибок измерений. Так как шумы по различным компонентами должны быть независимы, то относительно
вектора
ковариационная
предполагается,
e
матрица
что
он
имеет
центрирован
диагональный
и
его вид:
M {e ⋅ eT } = Ψ 2 = diag (ψ 12 ,....,ψ 2p } , где ψ 2j , j = 1,..., p - т.н. остаточные дисперсии
или дисперсии шумов. Элементы диагональной матрицы Ψ 2 также являются параметрами модели (2.1.12). Существуют несколько способов идентификации параметров модели (2.1.12), но среди них наиболее надежным и простым является метод минимальных остатков (Harman, 1967). В силу условий диагональности ковариационных матриц векторов f и e нетрудно получить, что в силу модели (2.1.12) ковариационная матрица вектора X равна Σ = M { X ⋅ X T } = Λ ⋅ ΛT + Ψ 2
(2.1.13)
Метод минимальных остатков заключается в определении элементов матрицы Λ из условия минимума суммы квадратов разностей между выборочными оценками и теоретическими значениями попарных коэффициентов корреляции. Тем самым, критерием близости модели к данным является близость всех теоретических коэффициентов корреляции их выборочным оценкам. Обозначим через r ij элементы матрицы
RXX . Тогда необходимо минимизировать следующую
функцию от элементов матрицы факторных нагрузок: p −1
Φ(Λ) = ∑
p
∑
j =1 i = j +1
q
(r ij − ∑ λ jα λiα ) 2 → min α =1
Λ
(2.1.14)
При этом на элементы матрицы Λ должны быть наложены ограничения:
77
q
λ α ≤ 1, j = 1,..., p ∑ α 2 j
=1
вытекающие
из
условия
равенства
(2.1.15)
единице
диагональных
элементов
теоретической матрицы корреляций (2.1.13). Стоит отметить, что задача определения матрицы Λ независима от определения диагональной матрицы остаточных дисперсий Ψ 2 . После того, как задача на минимум (2.1.14) при ограничениях (2.1.15) решена, остаточные дисперсии находятся автоматически:
q
ψ 2j = 1 − ∑ λ j2α ,
j = 1,..., p
(2.1.16)
α =1
Матрица Λ определяется неоднозначно, поскольку любая другая матрица, равная ΛC где C - ортогональная матрица размером q × q : CC T = C T C = I q , также будет удовлетворять модели (2.1.12). Эта неоднозначность используется в факторном анализе для преобразования матрицы нагрузок к наиболее простому виду, под которым понимается малость по абсолютной величине как можно большего числа элементов матрицы Λ . Упрощение матрицы факторных нагрузок называется вращением факторов, поскольку его можно представить как рассмотрение нового вектора факторов Cf вместо f , а умножение вектора на ортогональную матрицу имеет геометрическую интерпретацию вращения вектора в пространстве соответствующей размерности. Обозначим через
μα =
p
1 p
∑λα , i =1
α = 1,..., q
2 i
(2.1.17)
среднее значение квадрата нагрузок фактора с номером α , вычисленное по всем строкам матрицы Λ . Пусть
sα = 2
p
1 p
∑ (λ i =1
2 iα
− μα ) = 2
p
1 p
∑λ i =1
4 iα
−
1 p2
⎛ p 2⎞ ⎜ ∑ λiα ⎟ ⎝ i =1 ⎠
2
(2.1.18)
78
- оценка дисперсии квадрата нагрузок фактора с номером α . Чем проще строка матрицы Λ с номером α , тем ближе значения λi2α к нулю или к единице, тем больше их отклонения от среднего значения (2.1.17) и, следовательно, тем больше величина (2.1.18). На этих соображениях основан метод вращения факторов, известный как varimax и состоящий в минимизации критерия:
k
Q(C ) = ∑ sα2 → min
(2.1.19)
C
α =1
по всем ортогональным матрицам C . После определения матрицы факторных нагрузок финальным шагом анализа является вычисление собственно реализаций ортогональных факторов – облака из N штук q -мерных векторов f . Наиболее простая оценка следует из условия, что
вектор шумов e распределен согласно p -мерному нормальному распределению с ковариационной
матрицей
Ψ 2 . В этом
случае
оценкой
максимального
правдоподобия будет оценка взвешенного метода наименьших квадратов: eT ⋅ Ψ −2 ⋅ e → min, f
e = X −Λ⋅ f
⇒
f = (ΛT Ψ −2 Λ ) −1 ΛT Ψ −2 ⋅ X
(2.1.20)
Однако оценка (2.1.20) дает вектор общих факторов с недиагональной ковариационной матрицей. Для того, чтобы компоненты вектора факторов были ортогональны, следует применять модификацию оценки (2.1.20), предложенную в (Anderson, Rubin, 1956)
f = (ΛT Ψ−2ΣΨ−2Λ)−1 2 ΛT Ψ−2 ⋅ X , Σ = ΛΛT + Ψ2
(2.1.21)
Цель получения реализаций вектора общих факторов f - та же самая, что и в методе главных компонент: снижение размерности задачи. Вопрос о выборе числа q общих факторов – размерности вектора f является самым трудным в факторном анализе. Для его решения был предложен критерий Риппе (Lawley, Maxwell, 1971), который опирается на предположение о нормальности распределения векторов X . Однако этот критерий показал очень 79
сильную чувствительность к малым отклонениям от нормальности, что делает его практически неприменимым. Если отсутствует априорная информация о числе q , то можно получить оценку максимально допустимого числа общих факторов, начав решать задачу с минимального q = 1 и постепенно увеличивать q на единицу до тех пор, пока модель факторного анализа не выродится (общее число параметров станет избыточным). После этого можно взять в качестве q последнее максимальное значение перед вырождением задачи. Вырождение задачи факторного анализа называется «случаем Хейвуда» и заключается в обнулении остаточной дисперсии ψ 2j для одного или нескольких компонент вектора X . Практически вместо обнуления наблюдается резкое уменьшение остаточной дисперсии для той или иной компоненты по сравнению с прочими (на несколько порядков). Именно этот метод выбора q использовался в дальнейшем. Кластерный анализ является набором эмпирических правил разбиения
«облака» исходных данных на сравнительно небольшое число «компактных» групп или кластеров. Определение критерия компактности множества объектов зависит от типа данных и целей исследования, поскольку кластерный анализ сам по себе является лишь вспомогательным инструментов представления данных и весь центр тяжести исследования переносится на содержательную интерпретацию полученных кластеров. Например, после снижения размерности данных с помощью метода главных компонент или факторного анализа возникает желание разобраться со структурой преобразованных данных и эту задачу может решить кластерный анализ. Ниже использовался популярный метод ISODATA (Айвазян и др., 1989; Duda, Hart, 1973). При этом будем считать, что объекты классификации представляют собой точки в многомерном евклидовом пространстве и между ними определено понятие расстояния (метрики), под которым для простоты будем понимать обычное евклидово расстояние между точками. Обобщение на более сложные понятия расстояние довольно очевидно. Пусть имеется облако многомерных векторов
ξ.
Внутри
минимального
параллелепипеда,
содержащего
классифицируемые точки ξ , случайным образом располагаются центры пробных кластеров, причем число q ≥ 2
таких кластеров фиксировано. Обозначим
символом Γ начальное случайное положение пробных кластеров. Для заданного расположения центров кластеров производится пробное разбиение множества
80
точек по принципу минимума расстояния до того или иного центра. Пусть ck , k = 1,..., q - вектора центров кластеров, nk - число точек в k -ом кластере, q
∑n k =1
k
=M - общее число точек в разбиваемом множестве. Пусть Bk - множество
векторов, принадлежащих k -му кластеру. Вычислим вектора центров тяжестей получившихся кластеров: rk = ∑ ξ nk . Если для всех ck = rk , то разбиение ξ ∈Bk
завершается. В противном случае вектора центров кластеров ck перемещаются в центры тяжести rk , производится новое разбиение на кластеры, вычисляются новые центры тяжестей, проверяется условие завершения разбиения и т.д. Процедура довольно быстро сходится. Однако то разбиение на кластеры, которое получилось по завершению итераций, зависит от случайных положений центров пробных кластеров Γ в самом начале итераций. Качество финального разбиения оценивается критерием компактности кластеров:
q
J (q | Γ) = ∑ ∑ | ξ − ck |2
(2.1.22)
k =1 ξ ∈Bk
Для заданного числа кластеров q естественно искать такое случайное начальное расположение Γ , для которого величина (2.1.22) минимальна. Это достигается методом Монте-Карло: случайные эксперименты по вбрасыванию центров пробных кластеров внутрь облака точек повторяются большое число раз (ниже, при анализе конкретных данных, мы использовали 104 попыток), после чего выбирается то разбиение, для которого реализовался минимум по Γ . Далее возникает задача определения оптимального числа кластеров, на которое следует разбить множество признаков. Пусть J 0 (q) = min J (q | Γ) . Если Γ
последовательно уменьшать число пробных кластеров
q
от некоторого
достаточно большого значения до минимального q = 2 , то величина J 0 (q ) будет монотонно увеличиваться, однако при оптимальном значении кластеров (если такое существует) она будет претерпевать излом. Более эффективный метод выявления оптимального числа кластеров состоит в использовании псевдо-Fстатистики (Vogel, Wong, 1978):
81
q
PFS (q) = ( M − q) ⋅ ∑ | ck − r0 |2 ((q − 1) ⋅ J 0 (q))
(2.1.23)
k =1
где r0 = ∑ ξ M - общий центр тяжести всего классифицируемого множества точек. Оптимальному значению числа кластеров соответствует точка максимума функции (2.1.23). В качестве примера рассмотрим задачу факторного анализа среднемесячных расходов воды в реке Амур. Временные ряды среднемесячных речных стоков представляют
собой
типичный
пример
периодически-коррелированных
случайных процессов (Рытов, 1976; Раткович, Болгов, 1997). Случайный процесс x(t ) с дискретным временем t называется периодически коррелированным случайным процессом с периодом T , если его среднее значение mx (t ) = M {x(t )} и ковариационная функция Cxx (t , s ) = M {( x(t ) − mx (t ))( x( s) − mx ( s ))} периодичны с периодом T : mx (t + T ) = mx (t ) ; Cxx (t + T , s + T ) = Cxx (t , s ) . Для среднемесячных речных стоков таким естественным сезонным периодом является значение T = 12 . Вопросам прогноза среднемесячных речных стоков с помощью различных методов посвящена работа (Писаренко и др., 2005). Определим годовую форму речного стока как Y ( j ) = M {x( j + Tk )},
j = 1,..., T ; k = 0,1,.... , то есть среднее
значение стока по каждому месяцу с номером j . Далее обозначим через Δx j (τ ) разницу между текущим значением среднемесячного расхода воды и значением годовой формы Δx j (τ ) = x(t j (τ )) − Y ( j ),
j = 1,..., T ; τ = 1,..., M
(2.1.24)
где t j (τ ) - последовательность временных отсчетов, соответствующих месяцу с номером j , τ - индекс, нумерующий годы измерений речного стока, M = [ N / T ] - число полных лет наблюдений, N - число среднемесячных отсчетов в выборке. Таким образом, Δx j (τ ) представляет собой прямоугольную матрицу данных размером T × M или облако из M штук T -мерных векторов.
82
Рис.2.1. Римскими цифрами пронумерованы отклонения среднемесячных стоков Амура (1896-1985 гг.) от годовой формы. Внизу рисунка приведены графики самой годовой формы и двух ортогональных общих факторов. Указаны максимальные коэффициенты корреляции каждого из факторов с соответствующим месяцем.
83
На рис.2.1 представлены результаты факторного анализа матрицы данных отклонений от годовой форма речного стока Амура по наблюдениям за среднемесячным стоком в период 1896-1985 гг., данные получены от М.В.Болгова (Институт водных проблем РАН). Заметим, что глобальные данные по среднемесячным
речным
стокам
имеются
в
Интернете
по
адресу
http://www.rivdis.sr.unh.edu/maps/ . На рис.2.1 представлены графики годовой формы Амура и отклонений от нее по каждому месяцу. Последовательное увеличение числа общих ортогональных факторов привело к вырождению задачи (2.1.12) при трех факторах. Следовательно, максимальное допустимое число факторов равно двум. Их графики также представлены на рис.2.1 (оценка согласно формуле (2.1.21)). Первый ортогональный фактор имеет максимальный по модулю коэффициент корреляции 0.95 с февралем, а второй – максимальный коэффициент корреляции 0.96 с ноябрем. Таким образом, водный режим этих двух «тихих» месяцев содержит основные черты поведения, определяющие детерминистическую компоненту режима среднемесячных стоков. Для иллюстрации кластерного анализа рассмотрим задачу классификации трехкомпонентных записей слабых сейсмических событий в глубоких шахтах (Любушин и др., 2004(a)). Проблема классификации элементов большого массива сейсмических записей является актуальной задачей в различных областях сейсмологии и сейсморазведки. Для ее решения традиционно применяют широкий набор статистических подходов, опирающихся на идеи спектрального анализа, распознавания образов, синтаксических процедур и т.д. (Seismic signal analysis and discrimination, 1982). В задачах классификации эффективность в решающей
степени
определяется
удачным
выбором
вектора
признаков
небольшой размерности, характеризующих классифицируемый объект (Айвазян и др., 1989; Вапник, Червоненкис, 1974; Duda, Hart, 1973). Поэтому вопрос о выборе признаков, характеризующих сейсмическую запись, является ключевым при попытках разделить множество сигналов на отдельные подмножества – кластеры. Ниже в качестве признака, характеризующего скалярную сейсмическую запись, предлагается рассматривать т.н. уровень вейвлет-сжатия ДонохоДжонстона α , определенный в параграфе 1.6. Напомним, что α изменяется в пределах от 0 до 1 и задает ту часть коэффициентов разложения сигнала по базису ортогональных финитных функций (вейвлетов), которая может быть отброшена без существенной потери информации о сигнале. Величина уровня α
84
зависит
от
предшествует
выбора
базиса
процедура
вейвлет-функций.
последовательного
Вычислению
когерентного
признака отсечения
α для
определения базиса, по которому будет раскладываться сигнал, изложенная в 1.6, формула (1.6.17). При наличии примерно одинакового уровня шума в анализируемом множестве сигналов, признак α
характеризует
«насыщенность» сигнала
разнообразными элементами поведения: чем ближе величина α к 1, тем сигнал «проще» и может быть адекватно описан меньшим количеством коэффициентов оптимального вейвлет-базиса. Таким образом, от каждой трехкомпонентной сейсмической записи получается 3-мерный вектор безразмерных признаков – уровней сжатия каждой компоненты. Далее полученное облако 3-мерных векторов подвергается процедуре кластерного анализа методом ISODATA итерационной минимизации функционала компактности (2.1.22) разбиения множества векторов на заданное пробное число кластеров. Оптимальное число кластеров определяется из условия максимума псевдо-F-статистики (2.1.23).
Рис.2.2. Фрагменты исходных записей сейсмических событий в шахтах Силезского угольного бассейна (Чехия) из общего массива 111 трехкомпонентных записей. В качестве примеров выбраны те записи, которые в дальнейшем окажутся "наиболее типичными" для получившихся 3-х кластеров (см. рис.2.4).
85
Проанализирован набор данных, состоящий из 111 сейсмических 3компонентных записей сейсмических событий в шахтах Силезского угольного бассейна, зарегистрированных сотрудниками Института геоники Академии наук Чехии (г.Острава). Частота дискретизации записей составляет 100 Гц, длина – от 1080 до 883 отсчетов, включая участок фона перед событием. Регистрация велась с мая по июль 2000 года сейсмической сетью, состоящей из 4-х 3-компонентных сейсмоприемников.
Если
событие
регистрировалось
более
чем
одним
сейсмометром, то экспертно отбиралась лишь одна запись, соответствующая наилучшему отношению «сигнал/шум». На рис.2.2 изображены графики 3-х таких записей, причем их отбор был осуществлен уже после проведения классификации данных по принципу наименьшего расстояния в пространстве признаков до центров получившихся 3-х кластеров. В этом смысле они являются «наиболее типичными представителями» своих кластеров. Поскольку интерес представляет классификация сигналов после события, то перед процедурой кластерного анализа было проведено отсечение начальных участков записей, содержащих лишь фоновые сейсмические колебания. В результате число отсчетов уменьшилось и стало варьироваться от 748 до 414. В дальнейшем, для учета пространственной структуры сейсмических записей, был осуществлен переход к ортогональным главным компонентами. Были оценены ковариационные матрицы 3×3, определены их собственные числа и вектора и вычислены проекции 3-мерных сейсмических сигналов на собственные вектора ковариационной матрицы. Таким образом, были получены 1-е, 2-е и 3-и главные компоненты (в порядке уменьшения значений соответствующих собственных чисел) исходных данных, после отсечения начальных участков, которые далее были подвергнуты процедуре кластерного анализа. Сначала для каждой из 333=3×111 главных компонент были определены оптимальные
порядки
ортогональных
вейвлетов
Добеши
методом
последовательного когерентного отсечения. Диапазон найденных оптимальных порядков вейвлетов весьма велик. Приведем для каждого числа обнуляемых моментов базисных функций сколько случаев выпало соответствующему вейвлету быть оптимальным. Тем самым мы не различаем обычные вейвлеты Добеши и симлеты, поскольку их гладкость и длина носителя одинаковы. Один обнуляемый момент (вейвлет Хаара) встретился лишь в 1 случае, 2 обнуляемых
86
момента – в 15 случаев, 3 – 16, 4 – 33, 5 – 61, 6 – 19, 7 – 33, 8 – 44, 9 – 55, 10 – 56. Таким образом, в гистограмме числа обнуляемых моментов есть 2 максимума: 5 и 10, разделенных довольно резким провалом на числе моментов 6.
Рис.2.3. Графики функции компактности (а) и псевдо-F-статистики (б) в зависимости от пробного числа кластеров. Наилучшее число кластеров равно3 и соответствует максимуму на графике (б). (в) и (г) – облако классифицируемых 3-мерных векторов значений порогов сжатия главных компонент 3-мерных сейсмических записей в проекциях на 2 перпендикулярные координатные плоскости. Точки представлены метками – номерами кластеров для наилучшего разбиения на 3 кластера.
На рис.2.3(а) и 2.3(б) представлены графики зависимостей функции компактности J 0 (q) и псевдо-F-статистики PFS (q ) в зависимости от числа пробных кластеров q . Из них видно, что оптимальному числу кластеров соответствует значение q = 3 , причем на графике PFS (q ) виден еще один локальный максимум, соответствующий возможному разбиению на 7 кластеров, 87
но этот вариант значительно менее статистически обоснован. На рис.2.3(в) и 2.3(г) представлены проекции 3-мерных векторов признаков (порогов сжатия для главных компонент) на 2 координатные плоскости, причем каждой точке приписана метка номера кластера, которому она принадлежит. Число элементов в кластерах следующее: 1-й кластер содержит 51 вектор, 2-й – 52 вектора, 3-й – 8 векторов.
Рис.2.4. "Центральные" записи из кластеров в проекциях на главные оси, первые 500 отсчетов после первых вступлений.
На рис.2.4 изображены главные компоненты тех записей из соответствующих кластеров, векторы признаков которых оказались наиболее близкими к центрам кластеров. Как уже говорилось выше, им же соответствуют исходные записи на рис.1. Из этих графиков легко заметны существенные различия в характере поведения сигналов. Например, поведение главных компонент 1-го кластера является
визуально
наиболее
простым
и
низкочастотным.
Поэтому
неудивительно, что значения уровней сжатия для 1-го кластера оказались максимальными, поскольку для описания простого поведения достаточно сохранение сравнительно небольшого процента наибольших по модулю вейвлет-
88
коэффициентов. С этой же точки зрения естественными представляются малые уровни сжатия для элементов 3-го кластера, поскольку видно, что разнообразие элементов поведения для наиболее типичного представителя этого кластера максимально. Получившееся разделение на 3 кластера, скорее всего, отражает три возможных типа подвижек в эпицентре сейсмических событий: 1-й и 2-й кластеры (самые многочисленные), по всей видимости, соответствуют сдвигу и сбросу, как наиболее типичным скольжениям по нарушениям сплошности в горном массиве. Что же касается 3-го типа (всего 7% от общего числа событий), то его предположительно относим к наиболее редкому механизму – отрыву. 2.2. Спектры когерентности, частотные функции отклика, компенсация помех.
В этом параграфе будет рассмотрен случай двух временных рядов, причем, один из них считается «входом», а другой – «выходом». Подобное разделение часто является достаточно очевидным из физических соображений, например, «вход» - это вариации атмосферного давления, а «выход» - это вариации уровня подземных вод в скважине с открытым устьем, пробуренным до водоносного горизонта. Но часто встречается разделение на «вход-выход», использующее чисто
формальную
модель
линейного
«черного
ящика»,
стационарных входного и выходного воздействий x(t ) и y (t )
которая
для
в частотном
представлении может быть выражена формулой: dYω = H (ω )dX ω + dEω
(2.2.1)
где H (ω ) - частотная передаточная комплексная функция, dX ω , dYω , dEω бесконечно-малые приращения ортогональных стохастических спектральных мер (в
физике
их
часто
называют
«Фурье-компоненты»)
соответствующих
стационарных последовательностей x(t ), y (t ), ε (t ), t = 0, ± 1, ± 2, ... . Здесь ε (t ) остаточный сигнал или часть выхода Стохастические
спектральные
меры
y (t ) , не зависящая от входа задают
каноническое
x(t ) .
представление
стационарного процесса или интегральное представление Крамера (Anderson, 1971; Brillinger, 1975):
89
+π
x(t ) = mx +
∫π e
iωt
(2.2.2)
dX ω
−
Аналогично записываются представления Крамера для y (t ), ε (t ) . Величина mx есть среднее значения процесса. В дальнейшем мы будем полагать все средние нулевыми (без ограничения общности). В силу дискретности времени в формуле (2.2.1) интервал интегрирования есть отрезок [−π , +π ] , а не ( −∞, +∞ ) , как было бы
для
представления
Крамера
для
непрерывного
времени.
Интервал
интегрирования в (2.2.2) можно выбрать также [0, 2π ] . Величина dX ω есть приращения комплексной стохастической меры в окрестности частоты ω , которые обладают следующими свойствами: M {dX ω } = 0, M {dX ω dX λ* } = 0, ω ≠ λ , M {dX ω dX ω* } = M { | dX ω |2 } = S XX (ω ) d ω
(2.2.3)
где S xx (ω ) - спектр мощности сигнала x(t ) :
S xx (ω ) =
+∞
1 2π
∑R
k =−∞
xx
(k )e −iωτ , Rxx (k ) = M {x(t ) x* (t + k )}, k = 0, ± 1, ± 2, ...
(2.2.4)
где Rxx (k ) - ковариационная последовательность стационарного сигнала x(t ) . Формула (2.2.4) есть ничто иное, как ряд Фурье 2π -периодической функции S xx (ω ) с коэффициентами Фурье, равными Rxx (k ) . Доказывается, что предел ряда
(2.2.4), если он сходится, является вещественной и неотрицательной функцией. В силу того, что Rxx (k ) являются коэффициентами Фурье для S xx (ω ) , можно записать: +π
Rxx (k ) =
∫π S
xx
(ω )eiω k dω
(2.2.5)
−
Для стационарных и взаимно стационарных сигналов x(t ) и y (t ) комплексный кросс-спектр S xy (ω ) определяется аналогично (2.2.4):
90
S xy (ω ) =
+∞
1 2π
∑R
k =−∞
xy
(k )e − iωτ , Rxy (k ) = M {x(t ) y* (t + k )}, k = 0, ± 1, ± 2, ...
(2.2.6)
где Rxy (k ) – есть кроссковариационная последовательность сигналов x(t ) и y (t ) , S xy (ω ) = S xy* (ω ) . Из представления Крамера (2.2.2) вытекает, что
M {dX ω dYω* } = S xy (ω ) d ω
(2.2.7)
В силу независимости ε (t ) от x(t ) Фурье-компоненты dEω и dX ω ортогональны: M {dEω dX ω*} = 0 . Отсюда следует: H (ω ) = M {dYω dX ω* } / M {dX ω dX ω* } = S yx (ω ) / S xx (ω )
(2.2.8)
Формула (2.2.8) дает решение для задачи нахождения оптимальной передаточной функции из условия минимума спектра мощности остатка: Sεε (ω ) dω = M { | dEω |2 } = M { | dYω − HdX ω |2 } → min H
(2.2.9)
Если продифференцировать выражение (2.2.9) по H и приравнять производную нулю, то получится уравнение (2.2.8). Если последовательности
x(t ) и
y (t ) конечны: t = 0, 1, ..., ( N − 1) , то
передаточная функция может быть оценена с использованием дискретных преобразований Фурье (ДПФ):
d x( N ) (ω j ) =
( N −1)
∑ x(t )e t =0
− iω j t
, ω j = jΔ ω , Δ ω =
2π , N
j = 0,1,..., ( N − 1)
(2.2.10)
значения d y( N ) (ω j ) определяются аналогично. Для вычисления величин (2.2.10) используют ее эффективную программную реализацию – быстрое преобразование Фурье (БПФ), которое обычно требует выполнения условия N = 2m . Если N не равно 2m , то дополним сигнал x(t ) нулями до длины, которая будет равна 2m , где 91
m − минимальное целое число, для которого N ≤ 2m . Дискретное преобразование
Фурье обратимо:
x(t ) =
1 N
( N −1)
∑d j =0
(N ) x
(ω j )e
iω j t
(2.2.11)
Связь между ДПФ (2.2.10) и представлением Крамера (2.2.2) может быть легко получена из следующих нестрогих рассуждений. Если число отсчетов N в выборке достаточно велико, то интеграл (2.2.2) можно приближенно записать в виде: +π
x(t ) =
∫ e dX ω = iω t
−π
2π
N −1
0
j =0
iωt ∫ e dX ω ≈ ∑ e
iω j t
ΔX ω j
(2.2.12)
где ΔX ω j - значение стохастической спектральной меры интервала [ω j , ω j + Δω ] ,
ω j = 2π j / N . Сравнивая (2.2.11) и (2.2.12), получаем: ΔX ω ≈ dY( N ) (ω j ) / N . Отсюда j
следует идея построения непараметрических оценок спектров мощности: M {| ΔX ω j |2 } ≈ S xx (ω j )Δω ≈ M {| d x( N ) (ω j ) |2 }/ N 2
(2.2.13)
Подставляя в (2.2.14) Δ ω = 2π / N , получим:
S xx (ω j ) ≈ M { I xx( N ) (ω j ) } , I xx( N ) (ω j ) =
| d x( N ) (ω j ) |2 2π N
(2.2.14)
где I xx( N ) (ω j ) - периодограмма. Доказывается (Brillinger, 1975), что
M{I
(N ) xx
(ω ) } =
+π
∫π S
xx
(λ ) Φ ( N ) (ω − λ ) d λ → S xx (ω ),
−
1 sin 2 ( N ω / 2) Φ ( N ) (ω ) = 2π N sin 2 (ω / 2)
N →∞
(2.2.15)
92
Φ ( N ) (ω ) - ядро Фейера, Φ ( N ) (ω ) → δ (ω ) - стремится к дельта-функции Дирака. N →∞
Формула (2.2.15) может быть записана также в следующем виде:
M { I xx( N ) (ω ) } =
∞
если
∑ | kR
k =−∞
XX
1 2π
N
∑ (1− | k | / N ) R
xx
k =− N
(k )e− iω k = S xx (ω ) + O(1/ N )
(2.2.16)
(k ) | < ∞ . Таким образом, смещение периодограммы имеет порядок
N −1 . Это смещение можно уменьшить за счет предварительного сглаживания
выборки на концах (т.н. tapering). В случае предварительного сглаживания ДПФ запишется в виде:
d x( N ) (ω j ) =
( N −1)
∑ g (t / N ) x(t )e
− iω j t
(2.2.17)
t =0
где 0 ≤ g (u ) ≤ 1, u ∈ [0,1] - т.н. функция окна. Функция
g (u )
выбирается
симметричной относительно ½ и плавно спадающей к границам отрезка [0,1] . Ниже всюду будет применяться популярное косинусное окно сглаживания: 0 ≤ u <α ⎧ (1 − cos(π u / α )) / 2, ⎪ g (u ) = ⎨1, α ≤ u ≤ 1 − α , 0 < α < 0.5 ⎪ (1 − cos(π (1 − u ) / α )) / 2, 1 − α < u ≤ 1 ⎩
(2.2.18)
где α – часть длины интервала наблюдений или временного окна, которая «жертвуется» на операцию сглаживания выборки с целью уменьшения смещения оценки, всюду ниже бралось значение α = 0.125 . В случае применения формулы (2.2.17) вместо (2.2.10) выражение для периодограммы модифицируется:
I
(N ) xx
(ω j ) = | d
(N ) x
N −1
(ω j ) | / (2π ∑ g 2 (k / N )) 2
(2.2.19)
k =0
Математическое ожидание модифицированной периодограммы (2.2.19) равно
93
M{I
(N ) xx
(ω ) } =
+π
∫π S
xx
(λ )K ( N ) (ω − λ ) d λ
(2.2.20)
−
где
K ( N ) (ω ) = | G ( N ) (ω ) |2 /
π
N −1
−π
k =0
(N ) 2 (N ) − iω k ∫ | G (λ ) | d λ , G (ω ) = ∑ g (k / N ) ⋅ e
(2.2.21)
Модифицированная периодограмма (2.2.19) имеет смещение порядка N −2 :
M { I xx( N ) (ω ) } = S xx (ω ) −
κ d 2 S xx (ω ) + O( N −4 ) N 2 dω 2
(2.2.22)
где κ - постоянная, равная коэффициенту при члене 2-го порядка малости разложения в ряд Тейлора функции:
+π
∫π K
−
(N )
(ω )e
iωu
∑ g (s / N ) g ((s + u) / N ) dω = = 1 + κ (u / N ) ∑ g (s / N ) s
2
2
+ O((u / N ) 4 )
(2.2.23)
s
В силу симметрии функции g (u ) относительно ½ в разложении (2.2.23) присутствуют только четные степени малой величины u / N . Из формулы (2.2.22) следует, что сглаживание выборки временным окном g (u ) дает существенное уменьшение смещения лишь для достаточно гладких спектров мощности, когда вторая производная равномерно ограничена. Асимптотическая дисперсия периодограммы: M {| I xx( N ) (ω ) − S xx (ω ) |2 } → S xx2 (ω ) N →∞
(2.2.24)
причем асимптотическое распределение периодограммы для стационарных в узком смысле гауссовских процессов есть:
I xx( N ) (ω ) ∼ S xx (ω ) N →∞
χ 22 2
(2.2.25)
94
Следовательно, периодограмма является асимптотически несмещенной, но несостоятельной оценкой спектра мощности, поскольку ее дисперсия не уменьшается с ростом числа отсчетов. Для получения состоятельной оценки спектра
мощности
надо
уменьшить
дисперсию
периодограммы.
Самый
распространенный способ заключается в ее сглаживании в некотором частотном окне заданного радиуса m :
Sˆxx( N ) (ω j ) =
m 1 ∑ I xx( N ) (ω j + k Δω ), ω j + k Δω = ω j +k (2m + 1) k =− m
(2.2.26)
При приближении значения частоты ω j к нулевой радиус частотного окна усреднения в формуле (2.2.26) будет уменьшаться – это является отражением того факта, что статистически значимая оценка амплитуды гармоники возможно лишь в случае, если ее период укладывается достаточно много раз на длине выборки. При использовании оценки (2.2.26) имеют место следующие соотношения: S 2 (ω ) M {Sˆxx( N ) (ω j ) } → S xx (ω j ), M {| Sˆxx( N ) (ω j ) − S xx (ω j ) |2 } → xx j N →∞ N →∞ (2m + 1)
(2.2.27)
Асимптотическое распределение оценки (2.2.26) для стационарных в узком смысле гауссовских процессов есть:
Sˆxx( N ) (ω j ) ∼
N →∞
S xx (ω j )
2 χ 2(2 m +1)
(2.2.28)
2(2m + 1)
Если значения m сделать зависимым от N и обеспечить m( N ) → ∞ , то оценка N →∞
(2.2.26)
будет
асимптотически
состоятельной.
Аналогично
строятся
+m d x( N ) (ω j )(d y( N ) (ω j ))* 1 (N ) (N ) I ( k ), I ( ) + Δ = ω ω ω ∑ xy j xy j (2m + 1) k =− m 2π N
(2.2.29)
периодограммные оценки кросс-спектра:
Sˆxy( N ) (ω j ) =
Оценка переходной функции вычисляется, согласно (2.2.8), по формуле
95
Hˆ ( N ) (ω ) = Sˆ yx( N ) (ω ) / Sˆxx( N ) (ω ),
Aˆ ( N ) (ω ) = | Hˆ ( N ) (ω ) |
(2.2.30)
Асимптотическая при N → ∞ дисперсия оценки Aˆ ( N ) (ω ) амплитудной частотной переходной функции равна:
var{ Aˆ (ω ) } =
S yy (ω ) 1 (1 − γ xy2 (ω )) (2m + 1) S xx (ω )
(2.2.31)
где
γ xy2 (ω ) = | S xy (ω ) | 2 / ( S xx (ω ) S yy (ω )), 0 ≤ γ xy2 (ω ) ≤ 1
(2.2.32)
− квадрат модуля спектра когерентности, который можно интерпретировать как частотно-зависимый квадрат коэффициента корреляции между двумя процессами (Jenkins, Watts, 1968). Значение квадрата модуля спектра когерентности может быть оценено по формуле: (γˆxy( N ) (ω )) 2 = | Sˆxy( N ) (ω ) | 2 / ( Sˆxx( N ) (ω ) Sˆ yy( N ) (ω ))
(2.2.33)
Асимптотическая дисперсия оценки квадрата модуля спектра когерентности равна:
var{(γˆxy( N ) (ω )) 2 } =
2 (1 − γ xy2 (ω )) 2 ⋅ γ xy2 (ω ) (2m + 1)
(2.2.34)
Из формулы (2.2.34) видно, что если имеет место либо полная коррелированность
γ xy2 (ω ) = 1 , либо полная некоррелированность γ xy2 (ω ) = 0 , то var{(γˆxy( N ) (ω )) 2 } = 0 . Если вход «черного ящика» является n -мерным векторным, то в формуле (2.2.8) H (ω ) является также n -мерной векторной комплексной передаточной функцией и она запишется в следующем виде: dYω = ( H (ω )) T dX ω + dEω
(2.2.35)
96
где
dX ω
−
ортогональных
n -мерный
вектор-столбец,
спектральных
мер
составленный
скалярных
из
процессов,
приращений
формирующих
векторный вход. В этом случае формула (2.2.8) для оптимальной передаточной функции примет вид: H (ω ) = S xx−1 (ω ) S yx (ω )
(2.2.36)
где M {dX ω (dX ω* )T } = S xx (ω ) dω , S xx (ω ) - квадратная размером n × n эрмитова (то есть
не
меняется
при
транспонировании
и
комплексном
сопряжении)
неотрицательно определенная спектральная матрица входных сигналов, на диагонали которой стоят спектры мощности скалярных входных сигналов, а вне диагонали – их взаимные кросс-спектры,
M {dYω dX ω* } = S yx (ω ) d ω , S yx (ω ) -
векторная комплексная функция частоты, состоящая из кросс-спектров выходного сигнала со всеми скалярными входными воздействиями. Оценка векторной переходной функции строится совершенно аналогично случаю скалярного входа: надо вычислить все периодограммы и кросспериодограммы, усреднить их и получить оценки всех спектров и кросс-спектров, а затем сформировать их них оценки матриц S xx (ω ) и S yx (ω ) и применить формулу (2.2.36). Оценка
переходных
частотных
функций
позволяет
решить
задачу
компенсации влияния входных воздействий и нахождения временной реализации остатка ε (t ) . Пусть
Hˆ ( N ) (ω )
− оценка векторной переходной функции,
полученная по реализациям входных воздействий и выхода «черного ящика». Далее, пусть d (yN ) (ω j ) - значения ДПФ выхода, а d (xN ) (ω j ) − комплексный вектор, составленный из ДПФ всех входных воздействий. Тогда нетрудно определить значения ДПФ от некоторого гипотетического «очищенного» сигнала ε (t ) согласно формуле: dε( N ) (ω j ) = d y( N ) (ω j ) − ( Hˆ ( N ) (ω )) T d x( N ) (ω j )
(2.2.37)
Применяя обратное ДПФ к значениям (2.2.37), получим временную реализацию:
97
1 ε (t ) = N
( N −1)
∑ dε
(N )
j =0
(ω j )e
iω j t
(2.2.38)
Если переходные свойства черного ящика медленно меняются со временем, то возможна реализация оценивания и компенсации в адаптивном варианте, в скользящем временном окне. В этом случае выбирается некоторая длина временного окна в L отсчетов, а само окно смещается по временной оси слева направо на заданную величину ΔL (также число отсчетов), 1≤ ΔL ≤ L . Для каждого
положения
временного
окна
независимо
вычисляются
все
вышеизложенные оценки. При этом переходная функция получается зависящей не только от частоты ω , но и от временной координаты текущего окна обработки. Выберем в качестве такой координаты правый конец окна и обозначим его τ . Таким образом, производится анализ фрагмента сигналов для временных отсчетов t , удовлетворяющих неравенству: τ − L + 1 ≤ t ≤ τ . Поэтому оценки переходной функции в текущем временном окне можно записать так: Hˆ ( L ) (ω , τ ) . Абсолютные значения
компонент
комплексного
вектора
Hˆ ( L ) (ω , τ )
могут
быть
визуализированы на плоскости (ω , τ ) в виде некоторых частотно-временных диаграмм и особенности таких диаграмм могут быть важной информацией об изменении внутренних свойств «черного ящика». Если целью адаптивной обработки является лишь оценка изменения передаточных свойств, то выбор смещения окна ΔL может быть достаточно произвольным и диктоваться соображениями удобства или быстроты счета. Если же целью является компенсация влияния входных воздействий, то необходимо выбрать значение смещения минимальным ΔL = 1 , чтобы избежать артефактов в компенсированном сигнале. Выходной сигнал фильтра компенсации должен быть также записан в виде, подчеркивающем его зависимость от положения и длины скользящего
временного
окна:
ε ( L ) (t ,τ ), τ − L + 1 ≤ t ≤ τ .
Из
выходов
компенсирующего фильтра для каждого временного окна формируется итоговый сигнал ε (0L ) (t ), 0 ≤ t ≤ ( N − 1) адаптивной компенсации. При этом для первого скользящего окна (примыкающего к первому отсчету) выходной сигнал ε (0L ) (t ) формируется из значений ε ( L ) (t ,τ ) на первой половине окна, для последнего временного окна (примыкающего к последнему отсчету) – из значений ε ( L ) (t ,τ )
98
на второй половине окна. Для всех прочих временных окон ε (0L ) (t ) формируется из единственного значения ε ( L ) (t ,τ ) , соответствующего одному центральному отсчету внутри окна. Большая часть временных рядов систем мониторинга природных объектов является низкочастотными, то есть с уменьшением частоты спектр мощности растет, причем часто по степенному закону. Последнее означает сильную нестационарность временного ряда на любых, сколь угодно больших временных интервалах. Поэтому применение линейных оценок переходных функций непосредственно к исходным данным невозможно. Общим приемом борьбы с нестационарным поведением является переход от исходных временных рядов к рядам в приращениях ξ (t ) = x(t ) − x(t − 1) . Взятие приращений с частотной точки зрения является линейным фильтром с переходной функцией 1 − e −iω . Поскольку в формулах (2.2.30) и (2.2.36) фигурирует отношение спектров, то одновременное применение одного и того же линейного фильтра ко всем входным и выходным сигналам формально не должно влиять на оценку переходной функции «черного ящика». Но фактически переход к приращениям и, как следствие, подавление низких частот, положительно влияет на качество оценки, так как при этом сильно уменьшается проявление циклического эффекта дискретного преобразования Фурье от конечной выборки. При
переходе
к
приращениям
происходит
подавление
низких
и
подчеркивание высоких частот. В исходных данных могут быть достаточно резкие вариации сигналов, обловленных как самой природой измеряемых величин, так и сбоями системы регистрации. В приращениях эти особенности будут проявляться в наличии достаточно редких, но высокоамплитудных выбросов. Поскольку линейные частотно-зависимые оценки переходных функций отклика фактически используют метод наименьших квадратов (формула (2.2.9)), то выбросы приводят к смещению оценок, что является известной проблемой метода
наименьших
квадратов.
Поэтому
всюду
ниже,
перед
оценкой
передаточных функций в текущем временном окне, производилась операция т.н. «винзоризации» (Huber, 1981) или итеративного устранения больших выбросов: вычисление среднего значения x , стандартного отклонения σ , операции срезки значений временного ряда внутри текущего окна, выпадающих за уровни x ± 3σ , и повторения этой последовательности 3-х операций до тех пор, пока значения x и σ не перестанут меняться. 99
Если решается задача компенсации внешних помех («входных» воздействий), то предварительные операции перехода к приращениям, винзоризации и косинусного сглаживания на концах (формула (2.2.18)) производятся лишь для оценки передаточной функции. После того, как функция отклика оценена, для совершения
самой
операции
компенсации
необходим
лишь
переход
к
приращениям, так все прочие операции, очевидно, исказят компенсированный сигнал ε (0L ) (t ) . Что же касается перехода к приращениям, то эта линейная операция легко обратима путем последовательного суммирования всех отсчетов (интегрирования), начиная с некоторого начального значения. Выбор начального значения
достаточно
произволен
и
не
влияет
на
форму
полученного
компенсированного сигнала. Для того, чтобы было удобно сравнивать результат компенсации с исходным временным рядом, обычно начальное значение для интегрирования
временного
ряда
компенсированных
приращений
ε (0L ) (t )
выбирают равным начальному значению исходного сигнала. В работе (Любушин, 1993; Любушин, Латынина, 1993) описанная выше методика была применена для совместной компенсации влияния температуры и атмосферного давления на показания деформометров в эпицентральной зоне Рачинского землетрясения в Грузии в 1992 г. Другим
методом
оценки
переходных
частотных
функций
является
использование параметрических моделей. Изложим кратко эту методику лишь для скалярных входного и выходного воздействий x(t ) и y (t ) . Ее обобщение на многомерный случай довольно громоздко и неустойчиво с вычислительной точки зрения. Рассмотрим модель, описывающую связь между двумя случайным процессами (Kashyap, Rao, 1976):
p
q
m
k =1
j =1
k =1
y (t ) + ∑ ak y (t − k ) = b0 x(t ) + ∑ b j x(t − j ) + d + ∑ γ k g k (t ) +ε (t )
(2.2.39)
Здесь ak , k = 1,..., p , b j , j = 0,..., q , d , γ k , k = 1,..., m − искомые параметры модели, d – параметр статического смещения, g k (t ) − заданные детерминированные
функции времени, описывающие тренды, например, циклические (1.1.1), ε (t ) – белый шум с нулевым средним и дисперсией σ 2 . Аналогично формулам (1.1.4, 1.1.5, 1.3.2) введем ( p + q + m + 2) -мерные векторы: 100
Z (t ) = (− y (t − 1),..., − y (t − p), x(t ), x(t − 1),..., x(t − q),1, g1 (t ),..., g m (t ))T c = (a1 ,..., a p , b0 , b1 ,..., bq , d , γ 1 ,..., γ m )T
(2.2.40)
и запишем (2.2.39) в компактной форме, аналогично (1.3.3): x(t ) = cT Z (t ) + ε (t )
(2.2.41)
Для идентификации параметров модели (2.2.41) применялся робастный метод, описанный в п.1.1 (формулы (1.1.7)−(1.1.10)), который является методом максимального правдоподобия для плотности (1.1.3) распределения остатка идентификации ε (t ) .
Заметим, что в случае предварительного перехода к m
приращениям использование слагаемого
∑γ k =1
k
g k (t )
в (2.2.39) может быть
излишним, так как низкочастотные вариации в этом случае устранены операцией дифференцирования.
Также
излишней
является
операция
винзоризации,
поскольку используется робастный метод максимального правдоподобия. После оценки параметров модели (2.2.39) передаточная функция «черного ящика» вычисляется в виде отношения двух комплекснозначных полиномов от частоты по формуле: q
p
j =1
k =1
H (ω ) = (b0 + ∑ b j e − ijω ) (1 + ∑ ak e − ikω )
(2.2.42)
Для выбора значений первичных (или структурных) параметров p, q, m можно воспользоваться критерием Акаике (Akaike, 1974; Kashyap, Rao, 1976), который в общем случае формулируется как поиск такого числа параметров модели или даже такой модели для рассматриваемого набора данных X , которые реализуют минимум величины: AIC = − max(ln(Λ ( X | ϑ )) + nP → min ϑ
(2.2.43)
Здесь ϑ - вектор параметров статистической модели, Λ ( X | ϑ ) - функция правдоподобия модели, nP - число параметров или размерность вектора ϑ .
101
Аббревиатура AIC означает Akaike Informational Criterion – информационный критерий Акаике. В случае модели (2.2.39) критерий (2.2.43) можно записать в виде: AIC = L ln( s ) + ( p + q + m) → min
(2.2.44)
p ,q ,m
здесь L - длина временного окна в отсчетах или всей выборки, s - оценка параметра масштаба плотности распределения (1.1.3) остатка ε (t ) . С увеличением общего числа ( p + q + m) параметров модели оценка s монотонно невозрастает (чаще всего монотонно убывает, в силу подгонки к одним и тем же данным более богатой модели), поэтому левая часть выражения (2.2.43) достигает минимума при некотором их наборе. При оценке в скользящем временном окне применение критерия (2.2.44) затруднено, так он может выдавать разные сочетания p, q, m для разных окон. Поэтому в этом случае поневоле необходимо руководствоваться неформальными
соображениями
здравого
смысла,
например,
определить
структуру модели лишь для первого окна, а для всех прочих уже применять ее одинаковой. При оценке функции отклика в скользящем временном окне величина AIC становится полезной статистикой, реагирующей на изменение передаточных свойств временных рядов. В частности, если она претерпевает увеличение по сравнению с соседними окнами, то это может говорить об изменении характера связи или о ее существенном отклонении от линейного закона. В работах (Любушин и др., 1992; Любушин, Малугин, 1993; Любушин, Лежнев, 1995) параметрический метод оценки функции отклика был применен для
задачи
исследования
нестационарных
частотно-зависимых
откликов
деформаций и уровня подземных вод на атмосферное давление. Оба метода, основанный на преобразовании Фурье и параметрический, дают приблизительно одни и те же оценки, но параметрический метод обеспечивает более гладкие зависимости оценок от частоты. Обычный путь получения оценок состоит в использовании обоих подходов и выбора такой параметрической модели, которая наилучшим
образом
подтверждается
как
критерием
Акаике,
так
и
непараметрической оценкой. В качестве первого примера, рассмотрим временные ряды вариаций уровня подземных вод и атмосферного давления, измеренные в Обнинске с 05.06.1986, начало в 12:00, длина временных рядов – 7209 часовых отсчетов. Скважина
102
пробурена до водоносного горизонта на глубине 200 м, измерения выполнены В.А. Малугиным.
Рис.2.5. (а) и (б) – вариации атмосферного давления и уровня подземных вод в скважине, вскрывающей водоносный горизонт на глубине 200 м в Обнинске, начало измерений – 05.06.1986, 12:00, длина временных рядов 7209 часов; (в) – результат компенсации влияния атмосферного давления на уровень в скользящем временном окне длиной 672 часа (28 суток); (г) – поведения критерия AIC (формула (2.2.43)) при оценивании модели (2.2.39) в скользящем временном окне длиной 672 часа со смещение 24 часа для модели p = 1, q = 5, m = 0 ; (д) – частотно-временная диаграмма эволюции амплитудной передаточной функции.
Исходные данные изображены на рис.2.5(а) и 2.5(б). Видна сильная корреляция на низких, доминирующих, частотах. На рис.2.5(в) представлен
103
график компенсированного уровня подземных вод в скользящем временном окне длиной 672 часа (28 суток). Далее для этой пары временных рядов была проведена параметрическая
оценка амплитудной частотной передаточной
функции в скользящем временном окне той же длины 672 отсчета, взятом со смещением 24 часа. Использовалась модель (2.2.39), причем p = 1, q = 5, m = 0 . На частотно-временной диаграмме рис.2.5(д) представлена эволюция амплитудной частотной передаточной функции в зависимости от положения правого конца скользящего временного окна. Видно, что в конце интервала наблюдения имеется аномалия функции отклика, заключающаяся в значительном уменьшении амплитуды отклика, особенно на высоких частотах. Эта же аномалия отчетливо видна на графике критерия AIC в виде его увеличения – рис.2.5(г). Как показано в (Любушин, Малугин, 1993), в этот же интервал времени произошло увеличение спектра мощности вариаций атмосферного давления на периодах от 2-х до 10 часов. Было сделано предположение, что наложение мозаичности высокочастотных вариаций атмосферного давления на этих периодах на мозаичность блокового строения земной коры может приводить к увеличению
вертикальных
движений
малых
блоков
и,
как
следствие,
уменьшению прочности самых верхних слоев коры. Влияние атмосферного давления на уровень подземных вод в скважине складывается из двух, противоположно
направленных
воздействий.
Первое
воздействие
–
это
заталкивающее влияние атмосферного давления через открытое устье скважины, а второе – выталкивающее, поскольку увеличение давления на участок коры в окрестности
скважина
передается
на
водоносный
горизонт.
Обычно
заталкивающее влияние превосходит выталкивающее, что отчетливо заметно по антикоррелированности вариаций на рис.2.5(а) и 2.5(б). Но если прочность верхних слоев земной коры ослабла, то выталкивающее воздействие начинает более серьезно конкурировать с заталкивающим, что и проявляется в уменьшении амплитуды отклика на рис.2.5(д). Этот эффект довольно скрытен и незаметен по вариациям исходных данных, тогда как оценка передаточной функции в скользящем окне позволяет его детектировать. Таким образом, этот метод может быть использован для контроля за прочностными
свойствами
земной
коры.
Фактически
он
основан
на
использовании вариаций атмосферного давления как мощного естественного зондирующего сигнала. Заметим, что тот же эффект был обнаружен по другим
104
уровнемерным данным (Любушин, Лежнев, 1995; Копылова и др., 2000), тогда как при аналогичном анализе деформометрических данных (Любушин и др., 1992) он не был обнаружен. Второй пример также касается данных вариаций уровня подземных вод, измерения
проведены
в
Москве
(территория
Центрального
института
травматологии и ортопедии). Измерения проведены О.С. Казанцевой. Особую ценность этим наблюдениям придает сочетание их длительности (с февраля 1993 г. по начало 2005 г., т.е. около 12 лет) с их точностью (0.1 мм водного столба), высокой частотой опроса датчиков (1 раз в 10 минут) и комплексированием одновременными наблюдениями за изменениями атмосферного давления. Скважина пробурена на глубину 404 метра, имеет абсолютную отметку установившегося уровня -79 м. На рис.2.6(а) и 2.6(б) представлены исходные графики наблюдений за вариациями уровней в скважине и вариациями давления за период времени с 02 февраля 1993 г. по 01 января 2005 г. Уровень имеет два четко выраженных подъема от исходного значения на 3 метра за периоды времени по 3.5 года, затем, в течение примерно 3.5 лет уровень оставался в пределах 0.5 -0.8 м, и с 2004 г. началось его снижение, достигшее к началу 2005 г. -2 м. Годовые вариации уровня выражены слабо. Оценки передаточных функций строились непараметрическим методом, основанным на преобразовании Фурье «входных» (атмосферное давление) и «выходных» (вариации уровня) сигналов, вычислении их взаимной спектральной функции и спектра мощности «входа» (с помощью усреднения периодограмм и кросс-периодограммы) и отношения кросс-спектра к спектру мощности (формулы (2.2.17), (2.2.19), (2.2.29), (2.2.30)). Большой диапазон периодов создавал технические трудности для получения оценки сразу по всей выборке. Поэтому оценки строились сшиванием 3-х различных оценок. Для периодов от 20 минут до 10 часов оценка строилась путем усреднения для каждого значения частоты периодограмм исходных 10-минутных временных рядов, полученных в скользящих временных окнах длиной 2048 отсчетов (с предварительным удалением локальных линейных трендов в каждом окне и последующим переходом к приращениям) и завершающим усреднением по частоте скользящим частотным окном радиуса 20 значений частоты (9.7⋅10−4 мин−1). Для периодов от 10 до 100 часов оценка строилась аналогично, но для
105
временных рядов после перехода к 1-часовым отсчетам (путем усреднения и прореживания в 6 раз исходных рядов), при этом радиус окна частотного усреднения стал равен 9.7⋅10−3 час−1. Наконец, для оценки для периодов от 100 до 30000 часов осуществлялся предварительный переход (после усреднения и прореживание исходных данных в 144 раза) к 1-суточным отсчетам, оценка строилась аналогично, но при этом длина скользящего временного окна бралась 1024 отсчета, а радиус частотного усреднения – 10 значений частоты (9.7⋅10−3 сут−1). На рис.2.6(в) представлены графики оценок квадрата модуля спектра когерентности (2.2.33) и амплитудной частотной передаточной функции. Передаточная функция имеет классический вид с интервалом постоянных значений («рабочий диапазон прибора») для периодов от 20 до 1000 часов. При удалении значений периода от этого «рабочего диапазона» передаточная функция плавно уменьшается. На рис.2.6(д) показан фрагмент исходных данных (серая линия) и компенсированных от влияния атмосферного давления с использованием частотной передаточной функции, оцененной выше (черная линия). Длина фрагмента – 1500 часов (для всей выборки сравнение затруднено из-за сильного доминирования низких частот с периодами 3.5 года). Для компенсации использовалась вся выборка сразу, то есть не в скользящем временном окне, поскольку для этого горизонта переходная функция довольно стационарна (напомним, что глубина залегания пласта 400 м – в 2 раза глубже, чем в предыдущем примере). Из сравнения исходных и компенсированных сигналов на рис.2.6(д) видно, насколько приливные вариации уровня «тонули» среди шума, обусловленного влиянием атмосферного давления. На рис.2.6(е) представлены графики оценок спектров мощности исходных данных (серая линия) и компенсированных (черная линия). Для того, чтобы была возможность визуализировать спектр мощности для всех периодов, доступных для оценки вследствие очень длинной реализации, был применен метод Бурга (формула (1.3.5)) после перехода путем усреднения и прореживания данных в 6 раз к интервалу дискретизации 1 час, что обеспечило 113089 отсчетов. Была взята вся выборка и использовалась модель авторегрессии 2000-го порядка (менее 2% от длины выборки).
106
Рис.2.6. (а) и (б) – вариации атмосферного давления и уровня подземных вод в скважине, вскрывающей водоносный горизонт на глубине 400 м в Москве, интервал наблюдений 1993-2005 гг.; (в) и (г) – непараметрические оценки квадрата модуля спектра когерентности и амплитудной передаточной функции от давления к уровню; (д) – графики фрагмента длиной 1500 часов исходного временного ряда уровня подземных (серая линия) и компенсированного от влияния давления (черная линия); (е) – оценки спектров мощности по всей выборке исходных данных уровня (серая линия) и компенсированного от влияния давления (черная линия).
107
В результате были получены оценки для периодов от 2 до 105 часов. Видно, что очень надежно выделяются 12 и 24-часовые группы приливных гармоник, причем спектральные пики на периодах, соответствующих высшим обертонам суточного колебания – 8, 6, 4 и т.д. часов, присутствующие на спектре мощности исходного сигнала, после компенсации исчезли. Это говорит о том, что они обусловлены
влиянием
негармонической
формы
суточного
колебания
атмосферного давления. Кроме того, следует подчеркнуть выпрямление графика спектра мощности (в двойном логарифмическом масштабе) после компенсации влияния давления – полностью исчез «горб» на спектре мощности для периодов от 10 до 3000 часов. Третий пример касается анализа показаний двукоординатных маятниковых наклономеров, установленных в подземной штольне в Обнинске. Наблюдения были выполнены Г.А. Гусевым. Всего в штольне (на глубине 30 м) была создана микросеть из 4-х наклономеров, находящихся на расстоянии 5 м друг от друга, интервал дискретизации 1 час, период наблюдений: 01.03.1988-31.10.1988, всего 5867 часовых отсчетов. Одновременно измерялись наклоны в направлениях СЮ и ВЗ. Для одной пары соседних наклономеров была замечена особенность, которая иллюстрируется графиками на рис.2.7(а) и 2.7(б). На них изображены фрагменты записей длиной 1000 часов для этой пары приборов для направления ВЗ – видно, что сигналы коррелированны на малых периодах вариаций (в частности, на приливных вариациях наклонов) и антикоррелированы на больших периодах. Для получения количественной оценки этого эффекта были вычислены квадраты модулей спектров когерентности и косинуса разности фаз как для наклонов в азимуте ВЗ, так и для азимута СЮ (Гусев и др., 1994). Под разностью фаз подразумевается функция частоты θ (ω ) , следующая из представления Эйлера комплексной
передаточной
функции:
H (ω ) =| H (ω ) | (cos(θ (ω )) + i sin(θ (ω ))) .
Оценки строились в скользящих окнах длиной 2048 отсчетов, в каждом окне перед вычислением периодограмм производилось устранение общего линейного тренда в пределах окна, переход к приращениям, косинусное сглаживание на концах и винзоризация. Далее периодограммы от каждого окна усреднялись, а полученные усредненные функции частоты дополнительно сглаживались в частотном временном окне радиуса 10 значений частотных дискретов. После
108
этого производилось вычисление оценок. На рис.2.7(в) и 2.7(г) представлены графики оценок квадратов модулей спектров когерентности для ВЗ и СЮ.
Рис.2.7. (а) и (б) – фрагменты длиной 1000 часов записей наклонов ВЗ (Обнинск, 01.03.1988-31.10.1988, расстояние между наклономерами – 5 метров), видна коррелированность на малых периодах и антикоррелированность на больших; (в) и (г) – оценки квадрата модуля спектра когерентности для наклонов ВЗ и СЮ; (д) и (е) – оценки косинуса разности фаз для наклонов ВЗ и СЮ, резкий скачок фазы на 180o для наклонов ВЗ ((д), поперек разлома) для периодов от 30 до 32 часов.
109
Видно, что обе пары сигналов хорошо коррелированны на периодах в полусуточной и суточной приливных полосах. В окрестности периода 32 часа когерентность для ВЗ падает до нуля. При этом косинус разности фаз ВЗ, как это видно из рис.2.7(д), претерпевает резкий разрыв на 180 градусов. Таким образом, 32 часа есть граница между периодами положительной и отрицательной коррелированности вариаций. В то же время на рис.2.7(е), где изображен график косинуса разности фаз для СЮ, видно, что вариации для 2-х приборов положительно коррелированны на всех периодах, за исключением шума на самых высоких частотах, где когерентность близка к нулю и, согласно (2.2.31) дисперсия оценок разности фаз максимальна. Объяснение этому эффекту кроется в наличие разлома, проходящего в направлении СЮ между рассматриваемой парой наклономеров. Таким образом, измерения ВЗ проводились перпендикулярно разлому, тогда как СЮ – вдоль него. Положительная корреляция на малых периодах, а точнее, внутри приливных частотных полос, объясняется тем, что приливное воздействие является глобальной причиной, не замечающей локальные особенности строения земной коры в месте проведения измерений. Отрицательная корреляция для больших периодов объясняется тем, что вариации на этих периодов обусловлены изменениями атмосферного давления, которое прогибает земную кору в месте разлома и делает вариации наклонов по разные стороны от разлома в перпендикулярном направлении противоположного знака. Таким образом, оценка косинуса разности фаз между последовательными парами наклономеров, образующих линейный профиль, дает метод выделения скрытых разломов земной коры.
2.3. Канонические когерентности и спектральные меры синхронного поведения. В этом параграфе будут изложены метода анализа большого числа временных рядов с помощью спектрального подхода. Квадратичный спектр когерентности двух процессов (2.2.32) можно определить, как квадрат коэффициента корреляции этих процессов на частоте ω . Канонические когерентности являются обобщением понятия спектра когерентности на ситуацию, когда вместо пары скалярных временных рядов необходимо исследовать связь на различных частотах между двумя векторными временными рядами: m -мерным рядом X (t ) и n -мерным
110
рядом Y (t ) . Без ограничения общности будем считать, что n ≤ m . По своей конструкции канонические когерентности ничем не отличаются от канонических корреляций,
определенных
называемая
квадратом
формулами
модуля
(2.1.6)-(2.1.10).
первой
Величина
(максимальной)
ρ 12 (ω ) ,
канонической
когерентности рядов X (t ) и Y (t ) (Brillinger, 1975; Hanan, 1970), которая в данном случае заменяет обычный спектр когерентности, вычисляется как максимальное собственное число эрмитовой матрицы U (ω ) = S −xx1/ 2 S xy S yy−1S yx S −xx1/ 2
(2.3.1)
Нетрудно заметить, что выражение в правой части формулы (2.3.1) полностью аналогично формуле (2.1.10). Здесь ω - частота, S xx (ω ) - спектральная матрица размером
m×m
временного
ряда
X (t ) ,
S xy (ω )
-
кросс-спектральная
прямоугольная матрица размером m × n , S yx (ω ) = S xyH (ω ) , “ H ” – знак эрмитова сопряжения. Величина ρ 12 (ω ) заменяет квадрат модуля спектра когерентности в случае двух многомерных сигналов. Введем понятие покомпонентных канонических когерентностей ν i2 (ω ) q мерного временного ряда Z (t ) (Любушин, 1998(a)) как квадратов модулей максимальной канонической когерентности в ситуации, когда в формуле (2.3.1) в качестве ряда Y (t ) берется i -ая скалярная компонента q -мерного ряда Z (t ) , а в качестве X (t ) − (q − 1) -мерный ряд, состоящий из прочих компонент. Величина
ν i2 (ω ) , таким образом, характеризует связанность на частоте ω вариаций i -ой компоненты с вариациями совокупности всех прочих компонент. Введение покомпонентных канонических когерентностей позволяет определить еще одну частотно-зависимую статистику κ (ω ) , характеризующую связанность на частоте
ω вариаций всех компонент векторного ряда Z (t ) : q
κ (ω ) = ∏ν i (ω )
(2.3.2)
i =1
Заметим, что, в силу построения, значение величины κ (ω ) принадлежат интервалу [0,1] и чем ближе соответствующее значение к единице, тем сильнее связь между вариациями компонент многомерного временного ряда Z (t ) на частоте ω . Следует подчеркнуть, что сравнение абсолютных значений статистики
κ (ω )
возможно лишь для одного и того же числа
q
одновременно
111
обрабатываемых временных рядов – поскольку, в силу формулы (2.3.2), при росте q величина κ (ω ) убывает, как произведение q величин, меньших единицы. Если q = 2 , то мера (2.3.2) становится обычным квадратом модуля спектра когерентности. Чтобы оценить изменчивость во времени взаимодействия регистрируемых процессов, необходимо производить вычисления в скользящем временном окне заданной длины. Пусть τ - временная координата окна длиной L отсчетов. Вычисляя спектральные матрицы для выборок, попавших во временное окно τ , получим двухпараметрическую функцию κ (τ , ω ) . Всплески величины κ (τ , ω ) будут определять частотные полосы и временные интервалы увеличения коллективного поведения совместно анализируемых процессов. Для реализации этого алгоритма необходимо иметь в каждом временном окне оценку спектральной матрицы S zz (τ , ω ) размером q × q . Возможно использование непараметрических оценок для вычисления элементов
σ jk (ω ,τ ) матрицы
S zz (τ , ω ) , путем усреднения по частоте (формула (2.2.26)) попарных произведений дискретных преобразований Фурье (2.2.17):
σ jk (ωr ) = d
( L) k
(ωr ) =
m d (j L ) (ω )(d k( L ) (ω ))* 1 ( L) (L) + Δ = I ( ω s ω ), I ( ω ) ∑ jk r jk (2m + 1) s =− m 2π L ( L −1)
∑ z (t )e t =0
k
− iωr t
2π , ωr = r Δ ω , Δ ω = , r = 0,1,...., L − 1 L
(2.3.3)
где zk (t ) - k -ая компонента векторного временного ряда Z (t ) после всех предварительных операций внутри текущего окна: снятия линейного тренда, перехода к приращениям, если это необходимо, нормировки на единичную дисперсию (2.1.1) внутри окна, винзоризации и косинусного сглаживания на концах; m ≥ 1 - радиус окна частотного сглаживания периодограмм. Оценка спектральной матрицы (2.3.3) является структурно устойчивой при больших значениях длины окна L (Brillinger, 1975; Hanan, 1970). Однако ее разрешающая способность по частоте неудовлетворительна при малых длинах окон. Поэтому ниже предпочтение отдается использованию модели векторной авторегрессии (Marple (Jr.), 1987). Метод заключается в оценке параметров модели: p
Z (t ) + ∑ A k ⋅Z (t − k ) = e(t )
(2.3.4)
k =1
112
Здесь A k - матрицы авторегрессионных параметров размером q × q , p - порядок авторегрессии, e(t ) - q -мерный временной ряд остатков идентификации, относительно которого предполагается, что он является последовательностью независимых
случайных
векторов
с
нулевым
средним
и
неизвестной
ковариационной матрицей Φ = M {e(t )eT (t )} , которая считается независящей от времени. Важно отметить, что модель (2.3.4) также строится после всех вышеперечисленных предварительных операций за исключением косинусного сглаживания. Эти операции осуществляются независимо в каждом временном окне обработки и для каждой скалярной компоненты многомерного ряда. Их смысл
состоит
в
том,
чтобы
устранить
влияние
разномасштабности
обрабатываемых рядов. Для оценки матриц A k и Φ используется рекуррентная процедура Дарбина-Левинсона (Marple (Jr.), 1987), для которой необходимо предварительно
вычислить
выборочные
оценки
ковариационных
матриц
R k = M {Z (t ) Z T (t + k )}, k = 0,1,..., p .
Оценка спектральной матрицы вычисляется по формуле: p
S zz (ω ) = F −1 (ω ) ⋅ Φ ⋅ F − H (ω ), F (ω ) = E + ∑ A k ⋅ exp(−iω k )
(2.3.5)
k =1
E - единичная матрица размером q × q . Оценка (2.3.5) обладает хорошей разрешающей способностью по частоте для коротких выборок и поэтому более предпочтительна для оценок в скользящем временном окне, чем (2.3.3). Для выбора порядка авторегрессии p не существует надежных формализованных процедур. В расчетах выбор
p
производился методом проб, как такое
минимальное значение, для которого дальнейшее увеличение не приводит к существенному изменению основных элементов поведения зависимости κ (τ , ω ) . В качестве еще одной частотно-зависимой меры коллективного поведения компонент векторного временного ряда можно обобщить статистику, введенную в (Samson, Olson, 1980) для исследования поляризационных свойств сейсмических волн:
γ (ω ) =
q ⋅ tr ( S zz2 (ω )) − (tr ( S zz (ω ))) 2 , 0 ≤ γ (ω ) ≤ 1 (q − 1) ⋅ (tr ( S zz (ω ))) 2
(2.3.6)
Величина (2.3.6) дает меру вырожденности матрицы S zz (ω ) и, косвенно, наличию коллективной компоненты в векторном сигнале Z (t ) . Однако сравнение
113
(2.3.6) и (2.3.2) для тестовых сигналов показывает преимущество (2.3.2). Это вполне естественно, так как мера (2.3.2) строится непосредственно из соображений выделения когерентных вариаций. Рассмотрим в качестве примера задачу оценки синхронности шумовых компонент среднемесячных речных стоков для различных месяцев внутри годового сезона. Временные ряды среднемесячных речных стоков являются периодически-коррелированными
процессами
с
периодом
12,
как
уже
обсуждалось в конце параграфа 2.1.
Рис.2.8. (а) – график временного ряда среднемесячных расходов воды в Рейне (Кельн), 1817-1996 гг.; (б) – средние значения расходов воды каждый месяц (годовая форма), по оси абсцисс – номер месяца; далее римскими цифрами обозначены графики отклонений среднего расхода воды каждого месяца от своих средних значений.
114
На рис.2.8(а) представлен график среднемесячного стока Рейна (Кельн) с 1817 по 1996 гг. (180 лет наблюдений). Этот временной ряд (но для среднесуточных стоков) уже анализировался с точки зрения наличия периодической структуры в последовательности моментов времени (дней) больших расходов воды (рис.1.18). На рис.2.8(б) представлен график годовой формы среднемесячных стоков Рейна, а на остальных графиках рис.2.8, помеченных римскими цифрами, изображены последовательности отклонений для каждого из месяцев соответственно от средних значений годовой формы. Итого получилось 12 сигналов длительностью 180 отсчетов (лет наблюдений). Следовательно, каждый год можно описать 12 случайными величинами и их можно интерпретировать как многомерный вектор наблюдений шумов в данных среднемесячных стоков. Поставим задачу оценки степени синхронности вариаций этих шумовых компонент для различных периодов и в скользящем временном окне. Смысл этой задачи состоит в том, чтобы найти сигнал синхронизации, который, возможно, связан с вариациями климата, находящих свое отражение в изменчивости водного режима рек. Для оценки было взято скользящее окно длиной 50 лет, смещаемое на 1 год и использовалась модель 12-мерной векторной авторегрессии 1-го порядка. Операция
перехода
к
приращениям
внутри
каждого
окна,
ввиду
высокочастотного (стационарного) характера шумов (рис.2.8) не производилась. На рис.2.9(б) представлена статистика κ (τ , ω ) для этого варианта расчетов. Из нее следует, что интервал времени от 1817 до 1876 г. характеризуется малой степенью когерентности шумов. Далее появляется низкочастотная когерентность на периодах 10-50 лет, которая сменяется когерентностью на малых периодах, от 2 до 5 лет. Интервал этого изменения, с учетом длины окна: 1900-1950 гг. Следовательно, в этот промежуток времени изменились свойства когерентности гидрологических шумов. Заметим, что этот интервал считается началом «глобального потепления». К сожалению, временные ряды среднемесячных стоков в основном начинаются в конце 19-го – начале 20-го веков. Однако для Европы имеются такие ряды для Эльбы в верхнем течении (территория Чехии), с 1851 по 1984 гг. и для Луары (Франция), 1863-1979 гг. При выборе гидрологических данных важным обстоятельством является условие, чтобы режим речного стока не был «зарегулирован» работой гидротехнических сооружений и мелиорацией. На рис.2.9(б) и 2.9(в) изображены частотно-временные диаграммы спектральной 115
меры когерентного поведения, оцененные с теми же параметрами, что и для Рейна, для Эльбы и Луары, временные метки диаграмм синхронизированы.
Рис.2.9. Оценка спектральной меры когерентности для 12-мерных временных рядов отклонения среднего расхода воды каждого месяца от своих средних значений (годовой формы). Оценка без перехода к приращениям, AR(1)-модель, длина окна = 50 лет, смещение = 1 год. Диаграммы: (а) – для Рейна (см. рис.2.8), 1817-1996 гг.; (б) – для Эльбы (в верхнем течении, Чехия), 1851-1984 гг.; (в) – для Луары, 1863-1979 гг.; по временным осям отложено значение правого конца скользящего временного окна. Максимальное значение на диаграммах практически одинаково.
Видно, что для Эльбы (рис.2.9(б)) временной интервал падения когерентности для низких частот с результатом для Рейна, но последующая когерентность проявляется по-прежнему на низких частотах, в отличие от Рейна. Что же касается Луары (рис.2.9(в)), то ее диаграмма больше похожа на Рейн, так как увеличение когерентности также происходит на высоких частотах и примерно в тот же интервал времени, с небольшим запаздыванием в 8-10 лет. Следовательно, для всех 3-х рек интервал времени 1900-1950 гг. – это переходной период малой когерентности шумов. Можно выдвинуть гипотезу, что этот
эффект
является
проявлением
общего
регионального
эффекта
климатического происхождения. Есть еще одна особенность диаграмм на рис.2.9, 116
которая
явно
имеет
неслучайный
характер
–
максимальные
значения
когерентности на всех трех диаграммах равны соответственно 0.38, 0.39 и 0.38 для Рейна, Эльбы и Луары и эти максимумы достигаются на различных периодах, но в конце своих интервалов наблюдений, ближе к концу XX века.
2.4. Вейвлетные меры когерентности. В этом параграфе строится мера когерентного поведения, аналогичная спектральной мере (2.3.2), но основанная на разложении сигналов по ортогональным финитным базисным функциям – вейвлетам. В конечном итоге, классические идеи Хотеллинга о канонических корреляциях применяются к коэффициентам вейвлет-разложений на различных уровнях детальности. Метод, излагаемый ниже (Lyubushin, 1999; Любушин, 2000(a), 2002; Любушин,
Копылова,
2004),
строит
оценку
масштабно-зависимой
меры
когерентного поведения многомерного временного ряда Z (t ) в скользящем временном окне заданной длины N отсчетов. Пусть q ≥ 3 - общее число одновременно анализируемых временных рядов, Z (t ) = ( Z1 (t ),..., Z q (t ))T , а τ положение правого конца скользящего временного окна длиной N отсчетов. Для краткости будем употреблять словосочетание «временное окно
τ » для
обозначения выборок векторного временного ряда для моментов времени, удовлетворяющих неравенствам:
τ − N + 1 ≤ t ≥ τ . Для каждого положения
временного окна (смещаемого вправо на один отсчет) анализ производится независимо от анализа в других окнах. Перед вейвлет-разложением фрагментов анализируемых временных рядов, попавших в текущее временное окно, каждый из них подвергается последовательности следующих операций: (i)
устраняется общий линейный тренд в пределах временного окна;
(ii)
осуществляется переход от исходных значений к приращениям между
соседними значениями времени; (iii)
находится робастная выборочная оценка стандартного отклонения и
осуществляется деление каждого значения на эту оценку; (iv)
производилась операция сглаживания на концах окна косинусной
весовой функцией (2.2.18); (v)
выборка внутри окна дополняется нулями до полной длины
M = min{2m : 2m ≥ N } отсчетов.
117
Операция (i) устраняет самые сильные низкочастотные вариации сигналов, которые в пределах окна не могут быть статистически представительными. Операция (ii) перехода к приращениям является стандартным шагом в анализе временных рядов для увеличения стационарности выборок на коротких временных окнах при доминировании низких частот и поэтому она зависит от характера одновременно обрабатываемых сигналов. Если временные ряды высокочастотные, то операция (ii) опускается. Ее негативным свойством является увеличение амплитуды высокочастотного шума. Однако многомерный анализ позволяет избавиться от индивидуальных шумов, присущих только тому или иному временному ряду. Операция (iii) строит оценку с помощью операции винзоризации, описанной в п.2.2. Деление каждого из сигналов внутри окна на его стандартное отклонение уравнивает различные временные ряды путем приведения энергии их вариаций к одному и тому же значению. Хотя формально последующий канонический анализ коэффициентов вейвлет-разложений инвариантен относительно преобразований масштаба временных рядов, такая операция является полезной для уменьшения ошибок округления. Операция оконного сглаживания (iv) необходима для уменьшения негативного влияния циклического эффекта дискретного вейвлетпреобразования (Press et al., 1996). Наконец, последняя операция (v) необходима для последующего применения быстрого дискретного вейвлет-преобразования. Затем осуществляется дискретное вейвлет-преобразование с использованием одного из ортогональных финитных базисов от фрагмента каждого из анализируемых временных рядов внутри текущего окна после предварительных операций (i)-(iv). После осуществления вейвлет-преобразований для каждого временного окна τ
получается множество таблиц вейвлет-коэффициентов
размером q × M β : c (τk,rβ ) , k = 1,..., q; r = 1,..., M β = 2( m − β ) ; β = 1,..., m
(2.4.1)
Здесь β - номер уровня детальности вейвлет-разложения. Число m - степень двойки в представлении M = 2m для минимального целого числа такого вида, не меньшего, чем длина временного окна N . На каждом уровне детальности общее число коэффициентов равно
M β = 2( m − β ) . Индекс
k
в формуле (2.4.1)
соответствует положению временного интервала внутри скользящего окна, значения на котором влияют на значение коэффициента на уровне детальности
118
β . Однако часть этих коэффициентов может соответствовать нулевому дополнению выборки в пункте (iv) предварительных преобразований. Поэтому реальное число коэффициентов на уровне β , отражающее поведение сигнала внутри окна, равно Lβ ( N ) = 2( m − β ) ( N / M ) = 2− β N . Обозначим через Q (τ , β ) множество из Lβ ( N ) q -мерных векторов вейвлеткоэффициентов, образующих столбцы таблицы (2.4.1), отбрасывая столбцы, соответствующие дополнению нулями в операции (v). Поскольку число вейвлеткоэффициентов убывает с ростом номера уровня детальности в геометрической прогрессии с показателем 2, то Lβ ( N ) убывает с той же скоростью и может так случится, что, начиная с некоторого уровня β все Lβ ( N ) будут равны нулю, т.е. множества Q (τ , β ) будут пустыми. Для того чтобы все последующие оценки, выполненные для коэффициентов уровня β в текущем временном окне, были статистически
значимыми,
введем
порог
представительности
Lmin
–
положительное целое число, смысл которого заключается в том, что оценки вычисляются лишь для тех уровней детальности β , для которых Lβ ( N ) ≥ Lmin
(2.4.2)
Таким образом, длина окна N и порог представительности Lmin вместе задают
максимально
возможный
уровень
детальности
β max ,
вейвлет-
коэффициенты которого могут быть включены в анализ. Обозначим через R (τ , β ) матрицы размером q × q , которые представляют собой выборочные оценки ковариационных матриц непустых множеств векторов Q (τ , β ) :
R (τ , β ) = r
(τ , β ) jk
=
1 Lβ ( N )
∑
z ∈ Q (τ ,β ) Lβ ( N )
1 Lβ ( N )
∑c r =1
z ⋅ z T = || r (τjk, β ) ||, (2.4.3)
(τ , β ) (τ , β ) jr kr
c
,
j , k = 1,..., q
где z − q -мерные вектор-столбцы вейвлет-коэффицентов уровня детальности β , попавших во временное окно τ . При вычислении (2.4.3) из векторов z не вычитается выборочное среднее, поскольку математическое ожидание вейвлеткоэффициентов равно нулю. Разделим компоненты векторов z на две части:
119
скаляр z1 и (q − 1) -мерный вектор-столбец остальных компонент ξ = ( z2 ,..., zq )T . Далее повторим операции вычисления канонической корреляции, изложенные в п.2.1, но для случая, когда размерность одного из вектором равна 1. Умножив скалярно каждый вектор ξ на некоторый неизвестный пока вектор ϕ , получим множество скалярных величин ς 1 = ϕ T ξ . Найдем вектор ϕ из условия, чтобы квадрат модуля коэффициента корреляции между множествами скалярных величин z1 и ς 1 был максимален. Эта задача представляет собой частный случай классической задачи Хотеллинга о канонических корреляциях, решение которой в общем случае изложено в формулах (2.1.6)-(2.1.10). Вектор ϕ находится как собственный вектор, соответствующий максимальному собственному числу ν 12 , 0 ≤ ν 12 ≤ 1 , которое как раз и равно максимуму квадрата модуля коэффициента корреляции между значениями z1 и ς 1 , следующей матрицы размером (q − 1) × (q − 1) (Hotelling, 1936; Rao, 1965): Sξξ−1Sξ z1 S z−11z1 S z1ξ
(2.4.4)
где S z1z1 = M {z12 }, S z1ξ = SξTz1 = M {z1ξ T }, Sξξ = M {ξ ⋅ ξ T } . Очевидно, что матрицы в формуле (2.4.4) являются подматрицами общей матрицы ковариаций размером
q × q S zz = M {z ⋅ z T } . Заменив матрицу S zz в (2.4.4) на ее выборочную оценку (2.4.3), можно реально вычислить вектор ϕ , собственное число ν 12 (τ , β ) и множество из Lβ ( N ) скалярных
значений
каноническими
ς (τ1 ,rβ ) , r = 1,..., Lβ ( N ) ,
вейвлет-коэффициентами
которые
назовем
временного
ряда
значения
Z1 (t )
соответствующими уровню детальности β во временном окне τ . Что же касается величины ν 12 (τ , β ) , то ее естественно назвать квадратом канонической
корреляции первой скалярной компоненты векторного временного ряда Z (t ) со всеми прочими компонентами на уровне детальности β во временном окне τ . Проделав аналогичные операции со всеми прочими компонентами вектора
z ∈ Q (τ , β ) , получим таблицу размером q × Lβ ( N ) , состоящую из канонических вейвлет-коэффициентов для всех компонент векторного временного ряда для рассматриваемого уровня детальности β во временном окне τ :
120
ς (τk ,rβ ) , k = 1,..., q; r = 1,..., Lβ ( N ); β = 1,..., β max
(2.4.5)
и q значений квадратов канонических корреляций:
ν k2 = ν k2 (τ , β ), k = 1,..., q
(2.4.6)
Подчеркнем, что в результате этих операций произошел переход от таблицы (2.4.1) исходных вейвлет-коэффициентов к таблице (2.4.5) канонических коэффициентов. Таблицу (2.4.5) можно представить также в виде аналога множества Q (τ , β ) - как множество Θ(τ , β ) , состоящее из q -мерных векторовстолбцов таблицы (2.4.5). В дальнейшем из величин (2.4.6) будем извлекать положительный квадратный корень. Поскольку с ростом номера уровня детальности число вейвлеткоэффициентов,
принимающих
участие
в
оценке
величины
ν k (τ , β )
экспоненциально уменьшается, то, для уменьшения статистических флуктуаций оценки введем дополнительное усреднение по некоторому числу коэффициентов, полученных на предыдущих окнах: mβ
ν k (τ , β ) = ∑ν k (τ − s + 1, β ) / mβ , mβ = 2β
(2.4.7)
s =1
Чем выше уровень детальности, тем более глубоким является усреднение (2.4.7) по прошлым временным окнам, что значительно уменьшает зависимость амплитуды разброса статистических флуктуаций оценки (2.4.7) от номера уровня детальности и делает этот разброс примерно одинаковым для разных β . Согласно формуле (2.4.7) эффективная длина временного окна становится масштабнозависимой и равной N (eβ ) = N + 2 β − 1 . Вейвлетную меру когерентности определим формулой: q
κ (τ , β ) = ∏ν k (τ , β )
(2.4.8)
k =1
Значение меры (2.4.8) могут лежать в пределах от 0 до 1. Чем значение (2.4.8) больше, тем сильнее совокупная связь между всеми анализируемыми процессами на масштабах, соответствующих номеру β . Следует подчеркнуть, что величина (2.4.8) есть произведение q неотрицательных величин по модулю меньших 1. Поэтому чем больше число q анализируемых рядов, тем меньше абсолютные значения κ (τ , β ) . Вследствие этого сравнение абсолютных значений статистики
121
(2.4.8) возможно лишь при одинаковом значении числа рядов q . Наибольший интерес представляют не абсолютные значения (2.4.8), а ее относительные величины для различных τ . Для того, чтобы было возможно сравнивать вариации меры когерентности для разных уровней детальности одновременно условимся, что временной индекс τ в формуле (2.4.8) будет стартовать со значения N ( eβmax ) = N + 2 βmax − 1 (само значение
κ (τ , β ) основано на информации о рядах строго для временных индексов t : τ − N (eβ ) ≤ t ≤ τ ).
При рассмотрении конструкции агрегированных сигналов нам потребуется множество, состоящее из Lβ ( N ) скалярных величин χ (τr , β ) , r = 1,..., Lβ ( N ) , которые являются главными компонентами множества векторов Θ(τ , β ) . То есть, совершенно аналогично формуле (2.4.3), вычисляется выборочная оценка ковариационной матрицы канонических вейвлет-коэффициентов:
P (τ , β ) = p
(τ , β ) jk
=
1 Lβ ( N )
∑
z ∈ Θ(τ ,β ) Lβ ( N )
1 Lβ ( N )
∑ς r =1
z ⋅ z T = || p (τ jk, β ) ||, (2.4.9)
(τ , β ) jr
ς
(τ , β ) kr
,
j , k = 1,..., q
находится собственный q -мерный вектор (ψ (τ1 , β ) ,...,ψ (τq, β ) )T матрицы (2.4.9), соответствующий ее максимальному собственному числу и вычисляются значения: q
χ (τr , β ) = ∑ψ (τk ,β )ς (τkr,β ) , r = 1,..., Lβ ( N ); β = 1,..., β max
(2.4.10)
k =1
Значения (2.4.10) назовем агрегированными вейвлет-коэффициентами. Таким образом,
агрегированные
коэффициенты
являются
значениями
главной
компоненты канонических коэффициентов (2.4.5). В дальнейшем, с помощью обратного вейвлет-преобразования от агрегированных коэффициентов будет строится т.н. вейвлет-агрегированный сигнал. Одним из основных свойств вейвлетов, которое делает их привлекательными для использования в задачах сжатия информации – это то, что они аккумулирует максимум информации в очень небольшом числе (в процентном отношении к общему количеству) вейвлет-коэффициентов (Daubechies, 1992; Press et al., 1996, Mallat, 1998). Как следствие этого качества, множества вейвлет-коэффициентов характеризуются наличием больших выбросов, которые нельзя интерпретировать
122
как результат ошибок измерений или сбоев систем регистрации. Наличие этих выбросов ставит ограничения на используемые методы анализа данных, основанные на переходе из временной области в область вейвлет-коэффициентов (что аналогично переходу в частотную область при классическом Фурье-анализе), поскольку множество коэффициентов представляет собой, таким образом, существенно
негуассовскую
выборку.
Поэтому
выводы,
основанные
на
использовании классических регрессионных процедур, основанных на методе наименьших квадратов, а также классических методов многомерного анализа, основанных на обычных выборочных оценках ковариационных матриц и их собственных чисел и векторов, при условии их применения к множествам вейвлет-коэффициентов, должны приниматься с известной осторожностью и с осознанием того, что часть полезной информации может быть пропущена именно из-за неполного соответствия применяемых методов природе обрабатываемых данных. В статистике проблема устойчивости полученных выводов к нарушению предположений о природе данных известна как проблема робастности статистических методов и впервые систематически изложена в классической монографии (Huber, 1981), хотя неустойчивость методов типа наименьших квадратов к наличию небольшого числа выбросов в данных известна давно и была осознана многими статистиками-практиками (в том числе и геофизиками, например, Г. Джеффрисом) много раньше работ Хьюбера – уже в конце 19-го и начале 20-го веков. В это же время были предложены методы, повышающие устойчивость выводов к наличию выбросов, основное свойство которых состоит в отказе от квадратичной меры оценки качества подгонки и переходу к другим мерам, растущим не так быстро, как квадрат, например, к модулю невязок. Платой за увеличение устойчивости результатов статистической обработки является существенное усложнение вычислительных процедур и увеличение времени счета. Для того, чтобы построить робастные аналоги величин (2.4.5), (2.4.8) и (2.4.10) заметим следующее. Вернемся к рассмотрению множества Q (τ , β ) векторов исходных вейвлет-кэффициентов (2.4.1). Рассмотрим задачу регрессии (q − 1) мерного случайного вектора ξ = ( z2 ,..., zq )T
на скалярную случайную величину
z1 , т.е. задачу оценки вектора u регрессионных коэффициентов в линейной формуле: 123
z1 =
q −1
∑u z i =1
i i +1
+ ε1 = u T ξ + ε1
(2.4.11)
где ε1 - регрессионный остаток. Если вектор u определять методом наименьших квадратов: q −1
∑
z∈Q(τ ,β )
(∑ ui zi +1 − z1 ) 2 = i =1
∑
z∈Q (τ ,β )
(u T ξ − z1 ) 2 → min u
(2.4.12)
то его оценка легко находится: uˆ = Sξξ−1 ⋅ Sξ z1
(2.4.13)
Введем обозначение:
ξˆ1 = uˆ T ξ
(2.4.14)
- оценка регрессионного вклада в формуле (2.4.11). Поскольку cov( z1 , ξˆ1 ) = cov( z1 , Sξξ−1Sξ z1ξ ) = S z1ξ Sξξ−1Sξ z1
(2.4.15)
то нетрудно показать, что квадрат модуля коэффициента корреляции между (2.4.14) и z1 равен значению S z1ξ Sξξ−1Sξ z1 S z−11z1 , а это есть ничто иное, как максимальное собственное число матрицы (2.4.4) (Rao, 1965). Таким образом, значения первой канонической вейвлет-компоненты могут быть определены как ξˆ1 = uˆ T ξ из решения регрессионной задачи (2.4.11)-(2.4.12). Аналогичное утверждение, очевидно, имеет место и для всех прочих канонических вейвлет-компонент. Этот факт открывает возможность определения канонических вейвлет-компонент как решения регрессионной задачи (2.4.12) в ее робастной модификации, т.е. вместо (2.4.12) решать задачу:
∑
z∈Q
( τ ,β )
q −1
| ∑ ui zi +1 − z1 | = i =1
∑
z∈Q
(τ ,β )
| uT ξ − z1 | → min u
(2.4.16)
Очевидно, что решение задачи (2.4.16) много сложнее, чем (2.4.12), не может быть выражено простой формулой типа (2.4.13) и нуждается в итерационной процедуре. В данной реализации задача (2.4.16) решалась следующим образом. Организовывалась последовательность итераций методом градиентного спуска, в котором в качестве градиента брался обобщенный градиент недифференцируемой функции (2.4.16) (Clarke, 1975; Шор, 1979) по компонентам искомого вектора u . Шаг вдоль обобщенного антиградиента вычислялся путем решения задачи
124
одномерной минимизации методом золотого сечения. В качестве начального приближения для градиентной итерационной процедуры бралось решение метода наименьших квадратов по формуле (2.4.13), в которой ковариационные матрицы оценивались по обычным формулам типа (2.4.3), но перед оценкой матриц данные подвергались процедуре винзоризации. Следует подчеркнуть, что винзоризизация вейвлет-коэффициентов
использовалась
лишь
для
выборочных
оценок
ковариационных матриц для получения начального приближения – весь прочий анализ производился с исходными коэффициентами (после предварительных операций (i)-(v)). Условие остановки градиентной процедуры заключалось либо в том, что общее число итераций (т.е. вычислений градиента) достигло 10000, либо в том, что шаг вдоль антиградиента, найденный в методе золотого сечения, становился слишком малым. После остановки градиентной процедуры считалось, что решение задачи (2.4.16) приближенно найдено и вычислялась каноническая вейвлет-компонента по формуле (2.4.14). Аналогичная процедура повторялась для всех компонент. В результате получается таблица робастных канонических
вейвлет-коэффициентов, аналогичная (2.4.5), элементы которой пометим знаком «тильда», для различения с (2.4.5):
ς (τk ,rβ ) , k = 1,..., q; r = 1,..., Lβ ( N ); β = 1,..., β max Как
только
что
отмечалось,
величина
ν 1 (τ , β )
(2.4.17)
являются
обычным
коэффициентом корреляции между регрессионным вкладом ξˆ1 задачи (2.4.12) и выделенной скалярной компонентой
z1 . Воспользуемся этим фактом для
получения робастного аналога ν 1 (τ , β ) и используем не классическую формулу для вычисления выборочного значения коэффициента корреляции, а ее робастную модификацию (Huber, 1981). Согласно ей коэффициент корреляции между выборками x(r ), y (r ), r = 1,..., n можно вычислить по формуле: S (z 2 ) − S (z 2 ) ρ ( x, y ) = S(z 2 ) + S (z 2 )
(2.4.18)
где
z (r ) = a ⋅ x(r ) + b ⋅ y (r ), z (r ) = a ⋅ x(r ) − b ⋅ y (r ), a = 1/ S ( x), b = 1/ S ( y ), S ( x) = med | x − med ( x) |
(2.4.19)
125
med ( x) означает медиану выборки x , а S ( x) означает абсолютное медианное отклонение выборки x . Заменяя в формулах (2.4.18) и (2.4.19) x(r ) на ς (τk ,rβ ) , y (r ) на c (τk,rβ ) , а n на
Lβ ( N ) , получим робастное значение ν k ( β ,τ )
коэффициента корреляции,
описывающего силу связанности процесса с номером k со всеми прочими сигналами. Подчеркнем, что робастность метода проявляется в двух местах: при решении задачи минимизации (2.4.16), где используется метод наименьших модулей вместо наименьших квадратов, и при вычислении коэффициента корреляции по формуле (2.4.18). Робастную
вейвлетную
меру
когерентности
определим
формулой,
аналогичной (2.4.8): q
κ (τ , β ) = ∏ | ν k (τ , β ) |
(2.4.20)
k =1
где mβ
ν k (τ , β ) = ∑ν k (τ − s + 1, β ) / mβ , mβ = 2β
(2.4.21)
s =1
Для
того,
чтобы
вычислить
робастные
агрегированные
вейвлет-
коэффициенты, аналогичные, следует вспомнить известный факт, относящийся к методу главных компонент (Rao, 1965): собственный вектор, соответствующий максимальному собственному числу ковариационной матрицы (2.4.9), является решением задачи на условный максимум: Lβ ( N ) q
∑ r =1
∑ (ς (τkr,β )ψ (τk,β ) )2 → max, k =1
ψ
q
∑ (ψ τ β ) k =1
( , ) 2 k
=1
(2.4.22)
Из формул (2.4.22) естественным образом вытекает робастная формулировка задачи нахождения главных компонент: Lβ ( N ) q
∑ r =1
∑ | ς (τk,βr )ψ (τk,β ) | → max, k =1
ψ
q
∑ (ψ τ β ) k =1
( , ) 2 k
=1
(2.4.23)
Решение задачи (2.4.23) находилось итерационной процедурой. В качестве начального приближения для вектора ψ (τ , β )
брался собственный вектор
ковариационной матрицы робастных канонических вейвлет-коэффициентов (2.4.17), соответствующий максимальному собственному числу. При этом выборочная оценка ковариационных матриц также строилась лишь после винзоризации. Далее задача (2.4.23) решалась градиентным (вместо обычного
126
градиента – обобщенный градиент) методом с проекцией градиентного шага на единичную сферу. Метод выбора шага вдоль градиента и условия остановки итераций использовались те же самые, что и при решении задачи (2.4.16). После решения задачи (2.4.23), которое обозначим ψ (τk , β ) , вычислялись
робастные агрегированные вейвлет-коэффициенты: q
χ (τr , β ) = ∑ψ (τk ,β )ς (τkr, β ) , r = 1,..., Lβ ( N ); β = 1,..., β max
(2.4.24)
k =1
Обратное вейвлет-преобразованием от коэффициентов (2.4.24) будет определять робастный вейвлет-агрегированный сигнал. Нетрудно заметить, что метод построения вейвлетных мер когерентности содержит следующие три свободных параметра: N - длина временного окна; Lmin - порог представительности для проверки условия (2.4.2) и, наконец, тип ортогонального финитного базиса, по которому раскладываются сигналы. Можно избавиться от необходимости выбора вейвлета. Ограничимся, например, 10 обычными вейвлетами Добеши и пусть γ = 1,..., mγ - индекс, нумерующий число моментов, обнуляемых материнской базисной функций (формула (1.4.4)). Тогда
mγ = 10 . Пусть κ (τ , β | γ ) - обычная вейвлетная мера когерентности (2.4.8), а
κ (τ , β | γ ) - ее робастный аналог (2.4.20), построенные с помощью вейвлета, обнуляющего γ моментов. Усреднив эти меры по всем используемым базисам, получим много-базисные вейвлетные меры когерентности:
μ (τ , β ) =
mγ
1 mγ
κ (τ , β | γ ), ∑ γ
μ (τ , β ) =
=1
mγ
1 mγ
κ (τ , β | γ ) ∑ γ
(2.4.25)
=1
В качестве первого примера применения вейвлетных мер когерентности рассмотрим временные ряды скорости ветра, измеренные на 15 станций вдоль атлантического побережья США. Эти ряды являются частью базы данных по измерению метеорологических параметров с интервалом дискретизации 1 час на 262 метеостанциях США в течение 6 лет: 1990-1995 (NOAA National Data Centers CD-ROM: Hourly United States Weather Observations 1990–1995). Информация о данных доступна в Интернете по адресу: http://ols.nndc.noaa.gov/plolstore/plsql/olstore.prodspecific?prodnum=C00452-CDR-A0001)
Общая
длина
временных
рядов
для
исходных
часовых
интервалов
дискретизации равна 52583 отсчета. Перед обработкой данные были усреднены и прорежены в 6 раз. Таким образом, рассматриваются средние значения скорости
127
ветра в последовательные интервалы длиной 6 часов, с начала 1990 г. по конец 1995 г., всего 8763 отсчета. На рис.2.10(а) схематически изображены места проведения измерений с оригинальными цифровыми идентификаторами всех 15 метеостанций. Справа на рис.2.10 для всех пунктов измерения представлены в колонку параллельные графики данных с 6-часовыми отсчетами и с одинаковым масштабом по оси ординат в «естественном порядке» размещения станций вдоль побережья – с севера на юг. На рис.2.10(б1)-2.10(б4) представлены значения робастной когерентной меры (2.4.20), полученной в скользящем временном окне длиной 365 отсчетов. Поскольку интервал дискретизации равен 6 часам или 0.25 суток, эта длина окна равна четверти года, то есть длине сезона. При такой длине можно детектировать вариации
когерентности,
обусловленные
годовым
циклом
изменения
атмосферной циркуляции. Использовался вейвлет Хаара, так как он лучше всего подходит для анализа сигналов с резкими изменениями амплитуды. Порог представительности
Lmin = 16 . Это значение, вместе с выбранной длиной окна N = 365 , определяет максимальный уровень детальности вейвлет-разложения, доступный для анализа:
β max = 4 . Каждому уровню детальности, в соответствии с формулой (1.6.13) сопоставляется преимущественная частотная полоса с периодами: 0.5.-1, 1-2, 2-4 и 4-8 суток. Заметим, что, несмотря на большое число совместно анализируемых сигналов (15 штук), максимальные значения меры (2.4.20) довольно велики и они растут вместе с ростом уровня детальности (увеличением периодов исследуемых вариаций), что вполне естественно. Графики особенность:
рис.2.10(б1)-2.10(б4) для
вариаций
имеют
скорости
ветра
следующую с
примечательную
временными
масштабами
(периодами) от 0.5 до 1 суток (рис.2.10(б1)) мера когерентности периодична с годовым периодом и максимумом, выпадающим на летние месяцы. Это соответствует летним суточным бризам с суши на море и обратно в течение летних антициклонов. На втором уровне детальности, для периодов от 1 до 2 суток, годовая периодичность меры когерентности разрушается и сам график ее вариаций становится довольно хаотичным (рис.2.10(б2)).
128
Рис.2.10. (а) – схема расположения 15 метеорологических станций на Восточном побережье США с их цифровыми идентификаторами; справа идет колонка графиков скорости ветра на этих станциях, усредненной за последовательные интервалы времени длиной 6 часов, в указанном стрелкой порядке в направлении Север-Юг; слева графики (б1)-(б4) представляют эволюции робастной вейвлетной меры когерентности в зависимости от временной метки правого конца скользящего окна для первых 4-х уровней детальности, оцененной в скользящем временном окне длиной 365 6-часовых отсчетов (0.25 года или длительность сезона), использовался вейвлет Хаара, параметр Lmin = 16 . Уровень 1 соответствует временным масштабам вариаций от 0.5 до 1 суток, 2-й – от 1 до 2 суток, 3-й – от 2 до 4 суток и 4-й – от 4 до 8 суток.
129
Однако далее, с увеличением периода рассматриваемых вариаций, для уровней 3 и 4 (периоды 2-4 и 4-8 суток, рис.2.10(б3) и 2.10(б4)) годовая периодичность
восстанавливается,
но
она
приобретает
вид,
анти-
коррелированный с рис.2.10(б1), то есть максимумы меры когерентности выпадают теперь на зимние месяцы, что соответствует зимним антициклонам, распространяющимся с севера на юг, из Арктики и доходящих часто до Флориды. Характерный
масштаб
вариаций
скорости
ветра,
обусловленный
этими
процессами, как раз и составляет несколько суток. Второй пример применения вейвлетных мер когерентности несколько выпадает из основного направления монографии, но, тем не менее, представляет интерес с общей точки зрения обработки данных мониторинга. Этот пример относится к анализу финансовых временных рядов: стоимостей различных акций и сырья к концу дня торгов. На рис.2.11 слева представлены графики ежедневных приращений логарифма стоимости (т.н. log-returns) акций IBM, унции золота, японской йены и интегрированного индекса Standard & Poor`s (сверху вниз) на Нью-Йоркской бирже с 01.10.1980 по 30.09.2003. Значения цен в выходные и праздники восполнены значениями в предыдущий день торгов. Данные могут быть
свободно
найдены
в
Интернете,
например
по
адресу:
http://libraries.mit.edu/index.html. В течение этого промежутка времени произошло событие, которое традиционно является объектом интенсивных исследований в финансовой статистике, своего рода «финансовое землетрясение» или «черный понедельник» 19.10.1987, 2575-й день. Это событие отмечено резким скачком вниз на графике S&P. Возникает вопрос, были ли какие-нибудь особенности в поведении сигналов перед этим катастрофическим изменением – это своего рода также задача поиска предвестников. Известны исследования (Sornette et al., 1996) по поиску такого рода предвестников в виде сценария увеличения частоты флуктуаций цен (т.н. «лог-периодичность»). Однако эти исследования касаются анализа каждого из рядов отдельно друг от друга. Рассмотрим ту же задачу с точки зрения поиска коллективных компонент в совокупности финансовых сигналах. Выбранные для анализа
временные
ряды
характерны
длительной
историей,
прочие
многочисленные данные такого вида обычно начинаются с конца 1980-х или даже начала 1990-х годов.
130
Рис.2.11. Слева – графики ежедневных приращений логарифма стоимости акций IBM, унции золота, японской йены и интегрированного индекса Standard & Poor`s (сверху вниз) на Нью-Йоркской бирже с 01.10.1980 по 30.09.2003. Значения цен в выходные и праздники восполнены значениями в предыдущий день торгов. Справа, (а1)-(а4): графики эволюции много-базисной робастной меры когерентности (2.4.25) в зависимости от временной метки правого конца скользящего окна для первых 4-х уровней детальности, оцененной в скользящем временном окне длиной 365 суток, параметр Lmin = 16 . Уровень 1 соответствует временным масштабам вариаций от 2 до 4 суток, 2-й – от 4 до 8 суток, 3-й – от 8 до 16 суток и 4-й – от 16 до 32 суток. Вертикальной штриховой линией отмечен «черный понедельник» 19.10.1987.
Справа на рис.2.11 на графиках 2.11(а1)-2.11(а4) представлены эволюции много-базисной робастной меры когерентности μ (τ , β ) из (2.4.25) в зависимости от временной метки правого конца скользящего окна для первых 4-х уровней детальности, оцененной в скользящем временном окне длиной 365 суток, параметр Lmin = 16 . Таким образом, выбрана годовая длина окна. Как обычно, уровень 1 (рис.2.11(а1)) соответствует временным масштабам вариаций от 2 до 4 суток. Далее, сверху вниз: 2-й – от 4 до 8 суток, 3-й – от 8 до 16 суток и 4-й – от 16 131
до 32 суток. Видно, что это событие «перегрева рынка» предвещается почти за 1000 дней всплеском меры синхронизации для всех уровней детальности и последующим спадом к началу события (типичная «бухтообразная аномалия»). Кроме того, видно, что участники торгов сделали выводы из этой катастрофы и последующая динамика рынка уже не выходит на столь сильное когерентное поведение.
2.5. Агрегированные сигналы. Качественно агрегированный сигнал можно описать как такой скалярный сигнал, который в максимальной степени аккумулирует в себе наиболее общие вариации, присутствующие сразу во всех анализируемых процессах. В то же время метод агрегирования подавляет те составляющие, которые характерны только для одного процесса и имеющих, как правило, характер локальных помех, обусловленных
спецификой
места
проведения
измерений,
техногенными
причинами или ошибками измерений. Агрегированный сигнал строится в два этапа. На первом этапе исходный многомерный ряд заменяется на многомерный же ряд т.н. канонических компонент, которые сохраняют общие сигналы и освобождены от локальных. На втором этапе общие сигналы дополнительно усиливаются путем построения одного скалярного ряда − их первой главной компоненты,
который
и
назван
агрегированным
сигналом
исходного
многомерного временного ряда. В зависимости от того, используются для разложения сигнала классические Фурье-методы или вейвлет-разложения, агрегированный сигнал будет называться Фурье-агрегированным или вейвлетагрегированным. Фурье-агрегированный сигнал был предложен и применен для анализа геофизических временных рядов в (Любушин, 1998(b)), а вейвлетагрегированный – в (Lyubushin, 1999(a)), Любушин, 2000(a)). Начнем с Фурье-агрегированного сигнала, который предназначен для выделения общих стационарных гармонических колебаний и основан на анализе не в скользящем временном окне сравнительно небольшой длины, а по всей имеющейся выборке. Точно также как в п.2.3, рассмотрим q -мерный временной ряда Z (t ) . Выделим из многомерного ряда наблюдений Z (t ) i -ую скалярную компоненту Z i (t ) и постараемся так профильтровать (q − 1) -мерный ряд Z (i ) (t ) , составленный из оставшихся компонент, чтобы получившийся на выходе фильтра
132
скалярный сигнал C (iZ ) (t ) имел бы с выделенным рядом Z i (t ) максимальную когерентность на каждой частоте. Для этого необходимо в качестве многомерного частотного фильтра использовать компоненты собственного вектора матрицы (2.3.1), в которой в качестве Y (t ) фигурирует Z i (t ) , а в качестве X (t ) – Z (i ) (t ) . Фильтром
служат
компоненты
собственного
вектора,
соответствующие
максимальному собственному числу этой матрицы, которое, как нетрудно видеть, равно ν i2 (ω ) - покомпонентной квадратичной канонической когерентности, введенной в п.2.3. Смысл подобной операции состоит в том, что если в компоненте Z i (t ) присутствуют помехи, характерные только для этого ряда и отсутствующие в других компонентах ряда Z (t ) , то в сигнале C (iZ ) (t ) они отсутствуют просто в силу построения. В то же время в ряду C (iZ ) (t ) сохраняются все составляющие компоненты Z i (t ) , общие для остальных составляющих ряда
Z (t )
Z (i ) (t ) . Назовем ряд C (iZ ) (t )
– сигнала
канонической компонентой
скалярного ряда Z i (t ) . Определим агрегированный сигнал AZ (t ) многомерного временного ряда Z (t ) как первую главную спектральную компоненту многомерного ряда C ( Z ) (t ) , составленного
из
канонических
компонент
C (iZ ) (t )
каждого
скалярного
временного ряда, образующего исходный ряд Z (t ) . Напомним, что главной спектральной компонентой в частотной области называется проекция вектора преобразований
Фурье
от
исходных
сигналов
на
собственный
вектор
спектральной матрицы, соответствующий максимальному собственному числу. Главная компонента во временном представлении получается обратным преобразованием Фурье от главной компоненты в частотном представлении. Подчеркнем отличие ряда AZ (t ) от простой первой главной компоненты. И в том и в другом случае ряды определяются путем многомерных фильтраций, в которых в качестве многомерных частотных фильтров берутся собственные вектора спектральных матриц, соответствующих их максимальным собственным числам. Однако для обычной первой главной компоненты такой спектральной матрицей является матрица исходного временного ряда Z (t ) , а для AZ (t ) - спектральная матрица ряда C ( Z ) (t ) . Хотя в ходе и той и другой фильтрации происходит
133
выделение общих составляющих, агрегированный сигнал
AZ (t )
обладает
преимуществом, поскольку в ходе его построения уничтожаются индивидуальные помехи. В отличие от оценки в скользящем временном окне, для оценки спектральной матрицы, необходимой для построения агрегированного сигнал, использовалась непараметрическая оценка (2.3.3), путем частотного усреднения периодограмм и кросс-периодограмм. Такой выбор связан с большей структурной устойчивостью классических периодограммных оценок спектров мощности при наличии длинных
временных
рядов
по
сравнению
с
параметрическими
авторегрессионными оценками спектральных матриц (2.3.5), которые обладают преимуществами лишь для коротких выборок. Использовалось глубокое усреднение (сглаживание) периодограмм в частотном окне длиной 1/32 часть от общего
числа
частотных
дискретов.
Если
временные
ряды
обладали
доминирующими низкими частотами, то осуществлялся предварительный переход к приращениям и нормировка на единичную выборочную дисперсию. Перед вычислением спектральных матриц данные подвергались процедурам винзоризации и косинусного сглаживания на концах с помощью весовой функции (2.2.18). Однако эти операции выполнялись лишь для оценки спектральной матрицы. Затем, для вычисления канонических компонент C (iZ ) (t ) данные еще раз преобразовывались в частотное представление с помощью быстрого дискретного преобразования Фурье, но уже без сглаживания и итеративного устранения выбросов, а получившиеся многомерные преобразования Фурье проецировались на собственные вектора. Точно такая же последовательность операций повторялась для вычисления агрегированного сигнала: сначала вычисление спектральной матрицы канонических компонент, нахождение для каждого значения частоты собственного вектора, соответствующего максимальному собственному числу, проекция Фурье-представлений канонических компонент на этот вектор и, наконец, обратное преобразование Фурье от результата проецирования с целью получения временной реализации агрегированного сигнала AZ (t ) . Если осуществлялся переход от исходных временных рядов к рядам в приращениях, то агрегированный сигнал также будет построен для приращений. Поэтому финальная операция в этом случае заключается в интегрировании ряда, то есть вычислении в каждый момент времени суммы текущего и всех 134
предыдущих значений.
Отметим, что агрегированный сигнал не имеет
физической размерности, поскольку он строится после последовательности операций нормировки исходных данных, его смысл состоит лишь формальном выделении наиболее общих гармонических вариаций.
Рис.2.12. Сверху вниз представлены графики трех климатических временных рядов: двух дендрохронологий из Калифорнии (остистая сосна) и Швеции (шотландская сосна) и реконструкции зимних температур в Гренландии по ледовым кернам, относящихся к интервалу времени 553-1973 гг. Временные ряды приведены (путем усреднения и прореживания) к интервалу дискретизации 5 лет. Далее идут графики их Фурье-агрегированного сигнала и оценок спектров мощности как исходных рядов, так и агрегированного сигнала. Из сравнения спектров видно, что общей периодической компонентой рядов является лишь 56-годовая периодичность.
135
На рис.2.12 представлены результаты применения Фурье-агрегированного сигнала к совместному анализу 3-х климатических временных рядов: двух дендрохронологий, относящихся к Калифорнии и Швеции и реконструкции зимних температур в Гренландии. Первый ряд (Калифорния, «тропа Мафусаила») уже анализировался с точки зрения поиска в нем характерных точек разладки поведения – см. рис.1.4 и 1.16. В данном случае из этого временного ряд взята для анализа лишь последняя часть, с 553 по 1973 г. Это связано с тем, что его необходимо было анализировать совместно с другими рядами, а для гренландского временного ряда интервал времени – 553-1973 гг. Кроме того, для подавления высокочастотного шума ряд усреднялся и прореживался в 5 раз. Таким образом, на рис.2.12 он представлен с интервалом
дискретизации
5
лет.
То
же
самое
было
проделано
для
дендрохронологии из Швеции (дерево – шотландская сосна, 500-1980 г.): сначала был взят кусок ряда, относящийся к 553-1973 гг., а потом он усреднялся и прореживался в 5 раз. Временной ряд реконструкций зимних температур в Гренландии по анализу ледовых кернов также уже анализировался – см. рис.1.2, 1.5 и 1.6. В данном примере этот сигнал лишь приводился к общему шагу дискретизации 5 лет. Итак, на верхних 3-х графиках рис.2.12 представлены синхронные временные ряды, отражающие вариации климата в 3-х сильно разнесенных друг от друга точках наблюдения в Северном полушарии, с шагом по времени 5 лет, общее число отсчетов – 284. Ниже изображен график их Фурье-агрегированного сигнала. Поскольку исходные данные имеют высокочастотный характер, перед вычислением спектральной матрицы переход к приращениям не производился. Важным вопросом в исследовании климата является его спектроскопия, то есть, какие периоды вариаций климата были в прошлом, а какие сейчас (Монин, Сонечкин, 2005; Schlesinger, Ramankutty, 1994). Этому же вопросу посвящена отчасти и работа (Klyashtorin, Lyubushin, 2003), см. рис.1.1, 1.5 и 1.6. Обычный спектральный анализ различных климатических временных рядов дает разные периоды статистически значимых спектральных пиков. Часть этих пиков обусловлена местными причинами, а часть – глобальными. На рис.2.12 представлены графики оценок спектральных плотностей всех исходных временных рядов, а также их агрегированного сигнала (AR(86)-оценки). Из сравнения оценок спектральных плотностей видно, что общей периодической
136
составляющей этих данных за последние 1400 лет можно назвать лишь колебание, имеющей период 56 лет. Все прочие спектральные пики имеют локальный характер и обусловлены местными причинами. Особенно эффективно процедурой агрегации был подавлен шум в высокочастотной части спектра, для периодов от 10 до 50 лет. Вейвлет-агрегированный
сигнал
строится
аналогично
Фурье-
агрегированному, но имеет специфику, вытекающую из финитности базисных функций. Отличие состоит в том, что для вейвлет-агрегации опять вводится скользящее временное окно некоторой длины
N
отсчетов. Раньше, при
конструировании мер когерентности (2.4.8) и (2.4.20), для каждого положения скользящего временного окна, после выполнения предварительных операций (i)(v), фрагменты временного ряда внутри окна подвергались независимому («короткому»)
дискретному
вейвлет-преобразованию.
Для
вычисления
агрегированного сигнала ряды подвергаются дискретному преобразованию лишь один раз («длинное» преобразование), а смысл временного окна состоит в том, что вычисление агрегированных вейвлет-коэффициентов (2.4.10) или робастных агрегированных вейвлет-коэффициентов (2.4.24) производится лишь для тех канонических коэффициентов (2.4.5) и (2.4.17), для которых носители исходных коэффициентов (2.4.1) лежат внутри текущего временного окна τ длиной N отсчетов. Каждый вейвлет-коэффициент c (jβ ) уровня детальности β
вычисляется,
согласно формуле (1.6.7), по вариациям исходного временного ряда в окрестности отсчета τ (j β ) , где τ (j β ) = j ⋅ 2 β , j = 1,..., M β , где M β - число вейвлет-коэффициентов на уровне детальности β для всей длительности временных рядов (а не для длины окна N ). При использовании ортогональных вейвлетов Добеши (1.6.5) порядка 2 p , радиус окрестности точки τ (j β ) , поведение сигнала внутри которой влияет на значение коэффициента c (jβ ) , равен p ⋅ 2( β −1) отсчетов. При вычислении агрегированного сигнала, для каждого положения τ правого конца и для каждого уровня детальности β рассматриваются лишь те вейвлеткоэффициенты c (jβ ) , для которых выполняется условие:
τ (j β ) + p ⋅ 2( β −1) ≤ τ , (τ − N + 1) ≤ τ (j β ) − p ⋅ 2( β −1)
(2.5.1)
137
где p – число обнуляемых моментов для используемой базисной функции Добеши. Обозначим через L (βA) ( N ) число коэффициентов, удовлетворяющих условию
(2.5.1).
Верхний
индекс
«(A)»
подчеркивает
отличие
числа
коэффициентов в данном случае от введенного ранее (п.2.4) числа Lβ ( N ) при вычислении оконных мер когерентности (2.4.8) и (2.4.20). Как и ранее, рассматриваются лишь те уровни детальности, для которых выполняется условие, аналогичное (2.4.2): L (βA) ( N ) ≥ Lmin
(2.5.2)
Заметим, что условие (2.5.2), в силу (2.5.1), теперь зависит от типа базиса. Для данной длины окна N и для уровней детальности β , удовлетворяющих (2.5.2), в первом окне адаптации, для τ = N , запомним все L (βA) ( N ) q -мерных векторов агрегированных коэффициентов (2.4.10) или (2.4.24). Далее, смещая окно вправо на один отсчет, повторяем независимо в каждом окне адаптации всю процедуру
определения
вектора
агрегированных
коэффициентов,
однако
вычисляем и запоминаем не все облако L (βA) ( N ) q -мерных векторов для данного окна, а лишь один вектор, соответствующий правому концу окна, моменту времени τ . Тем самым производится адаптация агрегированных вейвлеткоэффициентов к совокупному поведению многомерного сигнала на прошлом временном окне длиной N коэффициентов
отсчетов. Полученные значения агегированных
рассматриваются
как
вейвлет-коэффициенты
некоторого
скалярного сигнала W (t ) , который может быть найден путем обратного быстрого вейвлет-преобразования и который назовем вейвлет-агрегированным сигналом. Таким образом, вейвлет-агрегированный сигнал − это такой сигнал, вейвлеткоэффиценты
которого
коэффициентов
исходных
суть
главные
временных
значения
канонических
вейвлет-
рядов,
полученные
в
скользящем
схема
вычисления
агрегированных
временном окне. В
зависимости
от
того,
какая
коэффициентов используется – обычная (2.4.3)-(2.4.10) или робастная (2.4.16)(2.4.24),
вейвлет-агрегированный
сигнал
также
является
либо
просто
агрегированным, либо робастным агрегированным. Длину окна N можно взять равной полной длине временных рядов – в этом случае вейвлет-агрегированный сигнал будет неадаптивным, подобно Фурье-агрегированному.
138
Предварительные операции для временных рядов при вычислении вейвлетагрегированного сигнала состоят в переходе к приращениям, если это необходимо из-за доминирования низкочастотных вариаций, и масштабировании каждой скалярной компоненты Z k (t ), k = 1,..., q многомерного ряда путем замены ее значений на величины U k (t ) согласно следующим правилам: (min) U k (t ) = Z k (t ) ( Z (max) k (1, N ) − Z k (1, N )) для 1 ≤ t ≤ N (min) U k (t ) = Z k (t ) ( Z (max) k (τ − N + 1,τ ) − Z k (τ − N + 1,τ )) для t > N
Z (max) Z (min) k ( r , s ) = max Z (t ), k ( r , s ) = min Z (t ) r ≤t ≤s
r ≤t ≤s
(2.5.3(a)) (2.5.3(b)) (2.5.3(c))
Операции (2.5.3) нормируют каждый временной ряд: в первом окне адаптации на единичный размах (формула (2.5.3(a)), а в последующих окнах, смещаемых на один отсчет вправо, нормировка производится только для самого правого отсчета
τ , не затрагивая результатов предыдущих нормировок (формула (2.5.3(b)). Тем самым достигается адаптация к однородному масштабу вариаций исходных временных рядов в окне длиной N отсчетов только слева от текущей точки. Такая идеология лево-ориентированного окна адаптации будет соблюдаться и ниже, поскольку она нацелена именно на выделение предвестниковых эффектов, исключая влияние последующих изменений сигналов “на прошлое”. Еще раз подчеркнем, что если обрабатывать не всю выборку, а лишь начальный кусок произвольной длины, то отбрасывание из обработки последней порции данных никак не скажется на результате анализа первой части данных и агрегированный сигнал на начальном интервале времени будет иметь тот же вид, что и при обработке всей информации. Поскольку для каждого положения τ временного окна процесс вычисления агрегированных коэффициентов включает в себя, в качестве «побочного результата», также и вычисление канонических корреляций для каждого уровня детальности, удовлетворяющего условию (2.5.2), то в результате получим величины, аналогичные оконным мерам когерентности (2.4.8) и (2.4.20), но которые мы будем отличать также добавлением верхнего индекса «(A)»: q
q
k =1
k =1
κ ( A) (τ , β ) = ∏ν (kA) (τ , β ), κ ( A) (τ , β ) = ∏ |ν (kA) (τ , β ) |
(2.5.4)
где ν (kA) (τ , β ) и ν (kA) (τ , β ) - обычные и робастные канонические корреляции вейвлет-коэффициентов на уровне детальности β , вычисляемые по исходным
139
коэффициентам,
удовлетворяющих
условиям
(2.5.1),
(2.5.2)
после
предварительных преобразований (2.5.3).
Рис.2.13. Графики агрегированных сигналов временных рядов скорости ветра (серые линии), измеренных в 15 пунктах вдоль Атлантического побережья США в 1990-1995 гг. (рис.2.10): (а) – Фурье-агрегированный сигнал; (б) – обычный вейвлетагрегированный сигнал, (в) – робастный вейвлет-агрегированный сигнал. Использовался вейвлет Хаара, порог представительности Lmin = 16 , временное окно – вся длина рядов. На каждом графике поверх серых линий черными толстыми линиями изображены кривые агрегированных сигналов после их вейвлет-сжатия с уровнем сжатия α = 0.995 . Для сжатия использовались базисы: для Фурье-агрегированного сигнала – симлет 20-го порядка; для вейвлет-агрегированных сигналов – вейвлет Хаара.
Отличие этих мер когерентности от введенных ранее (2.4.8) и (2.4.20) заключается в различной предварительной обработке сигналов. Для оконных мер (2.4.8) и (2.4.20) используется нормировка на единичную выборочную дисперсию и процедура сглаживания на концах окна с помощью косинусной весовой 140
функции (2.2.18). Для мер (2.5.4) используется лишь лево-ориентированная нормировка на единичный размах (2.5.3). Сглаживание на концах при агрегировании является излишней операцией, поскольку используется «длинное» вейвлет-преобразование и искажения из-за конечной длины возможны лишь в самом начале и конце выборок, но они ослабляются переходом к приращениям (если это необходимо). Для определенного типа сигналов, например, характерной особенностью
которых
являются
очень
большие
и
резкие
изменения,
использование мер (2.5.4) предпочтительнее, чем мер (2.4.8) и (2.4.20). На рис.2.13 представлены графики агрегированных сигналов временных рядов скорости ветра, измеренных в 15 пунктах вдоль Атлантического побережья США в 1990-1995 гг. (рис.2.10). На рис.2.13(а) изображен график Фурьеагрегированного сигнала, а на 2.13(б) и 2.13(в) – вейвлет-агрегированных сигналов обоих типов. Использовался вейвлет Хаара, порог представительности
Lmin = 16 , временное окно – вся длина рядов. На рис.2.13(а), серая линия, видна сильная сезонная составляющая, которая на исходных данных на рис.2.10 выражена значительно слабее. На графиках вейвлет-агрегированных сигналов (рис.2.13(б) и 2.13(в), серые линии) выделены общие всплески в начале 1992-го года и в конце зимы 1993-го, связанные, по всей видимости, с сильными штормами в Атлантическом океане, причем, робастный агрегированный сигнал выделяет эти общие особенности из фона соседних флуктуаций сильнее. На каждом графике поверх серых линий черными толстыми линиями изображены кривые агрегированных сигналов после их вейвлет-сжатия с уровнем сжатия α = 0.995 . Для сжатия использовались базисы: для Фурье-агрегиованного сигнала – симлет 20-го порядка; для вейвлет-агрегированных сигналов – вейвлет Хаара. Цель этих операций состоит в том, чтобы подчеркнуть наиболее энергонасыщенные вариации сигналов, вне зависимости от их характерных временных масштабов. Для Фурье-агрегированного сигнала (рис.2.13(а), черная линия) такой вариацией является, прежде всего, сезонная периодическая компонента. Однако на нее накладываются короткопериодные возмущения, которые, как и следовало ожидать, концентрируются около годовых временных меток, кратных 365 суткам, то есть в осенне-зимний сезон. Для вейвлет-агрегированных сигналов (рис.2.13(б) и 2.13(в), черные линии) после сжатия также видна сезонная периодичность концентрации наиболее сильных общих вариаций, но они имеют больше
141
индивидуальных особенностей всплесков, по которым можно сравнить их интенсивность. Заметим, что робастный агрегированный сигнал больше содержит больше общих крупномасштабных временных вариаций, чем результат обычной агрегации. Если число одновременно анализируемых сигналов очень велико (несколько десятков), то возможна их иерархическая агрегация, то есть, разбить их на несколько групп, не более 10-15 сигналов в каждой группе (по смыслу исследуемых величин или по географической близости пунктов проведения измерений) и построить для каждой группы свой агрегированный сигнал, а затем провести вторичную агрегация – вычислить агрегированный сигнал от агрегированных сигналов первого уровня. Такой метод был использован в работе (Любушин и др., 2002) для совместного анализа большого числа временных рядов службы скорой помощи в Москве в 1995-1998 гг.
2.6. Анализ взаимодействия нескольких потоков сейсмических событий. Рассмотрим вопрос о связи между собой сейсмических режимов нескольких активных регионов. Эта задача может быть решена методами, изложенными в этой главе выше, если перейти от последовательностей сейсмических событий к обычным временным рядам с равномерным шагом по времени. Однако такой переход может приводить к возникновению сигналов, имеющих вид длинных плато постоянных значений (сейсмические затишья), прерываемых сильными изменениями, соответствующими активизации сейсмичности. Тем не менее, такой анализ возможен, если применять вейвлет-разложения по базису Хаара, о чем пойдет речь ниже, в п.3.7. В этом же параграфе будет изложен метод, который основан на сохранении исходной структуры данных – точечных процессов. Основные конструкции метода были предложены в работе (Любушин, Писаренко, 1993). Представим последовательности сейсмических событий в m регионах в виде: { t (jα ) , M (jα ) },
j = 1,..., Nα ; α = 1,..., m
(2.6.1)
Здесь t (jα ) -моменты времени сейсмических событий, а M (jα ) -их магнитуда, про значения которой будем считать, что они удовлетворяют неравенству M (jα ) ≥ M 0 ,
M 0 -минимально допустимое к рассмотрению значение магнитуд, выбираемое из условия ее представительности на рассматриваемом интервале времени [0, T ] ; α -
142
номер региона или сейсмического каталога,
m -общее число совместно
анализируемых процессов; Nα - число событий в регионе α . Обозначим через λ (α ) (t ) интенсивность (число событий в единицу времени) процесса в регионе α . Рассмотрим следующую модель этой интенсивности: m
λ (α ) (t ) = μ (α ) + ∑ bβ(α ) ⋅ g ( β ) (t )
(2.6.2)
β =1
где μ (α ) ≥ 0, bβ(α ) ≥ 0 - параметры модели, g ( β ) (t ) - функция влияния процесса в регионе с номером β , которую выберем в виде:
g ( β ) (t ) =
∑ exp( r (M β
( ) j
t (j β ) < t
− M 0 )) ⋅ exp(−(t − t (j β ) ) / s )
(2.6.3)
Здесь r ≥ 0 и s > 0 - еще одни параметры модели. Таким образом, согласно модели (2.6.3), вес события с номером j становится ненулевым начиная с моментов времени t > t (j β ) , экспоненциально растет с ростом магнитуды M (j β ) и экспоненциально падает со временем, со скоростью, задаваемой временем затухания s . Сумма всех таких затухающих функций времени по всем событиям внутри региона, моменты которых строго меньше рассматриваемого момента времени t , формируют функцию влияния региона с номером β . Параметры bβ(α ) являются множителями, задающими силу влияния региона β на регион α :
β →α .
bα(α )
Величина
описывает влияние региона самого на себя
(самовозбуждающаяся компонента интенсивности). Что же касается параметра
μ (α ) , то он отражает вклад в функцию интенсивности чисто случайной, пуассоновской компоненты, для которой функция влияния постоянна и тождественно равна 1. Модель (2.6.2)-(2.6.3) являются модификацией и обобщением на многомерный случай линейной модели взаимного влияния 2-х точечных процессов, рассмотренной в (Ogata, Akaike, 1982). Временно зафиксируем параметры (r , s ) и рассмотрим задачу определения множителей
( μ (α ) , bβ(α ) )
из
принципа
максимума
правдоподобия.
Логарифмическая функция правдоподобия для точечного процесса региона α имеет вид (Cox, Lewis, 1966): Nα
T
j =1
0
ln( Lα ) = ∑ ln(λ (α ) (t (jα ) )) − ∫ λ (α ) (ξ )d ξ → max
(2.6.4)
143
где [0, T ] - интервал времени проведения наблюдений. Подставляя (2.6.2) в (2.6.4) и дифференцируя по параметрам ( μ (α ) , bβ(α ) ) , нетрудно получить, что:
μ (α )
T ∂ ln( Lα ) m (α ) ∂ ln( Lα ) + = − λ (α ) (ξ )dξ b N ∑ β α (α ) (α ) ∫ ∂μ ∂ bβ β =1 0
(2.6.5)
Поскольку μ (α ) ≥ 0, bβ(α ) ≥ 0 , то выражение в левой части формулы (2.6.5) равно нулю в точке максимума функции правдоподобия, так как, либо равны нулю частные производные – если μ (α ) > 0 или bβ(α ) > 0 , либо равны сами параметры μ (α ) или bβ(α ) – так как в этом случае максимум достигается на границе допустимой области. Следовательно, можно записать уравнение, вытекающее из необходимых условий максимума функции правдоподобия: T
∫λ
(α )
(ξ )dξ = Nα
(2.6.6)
0
Подставим (2.6.2) в (2.6.6) и разделим на длину интервала наблюдений. Тогда получим: m
μ (α ) + ∑ bβ(α ) ⋅ g ( β ) = μ0(α ) ≡ β =1
где
g
(β )
T
=
1 T
∫g
(β )
Nα T
(2.6.7)
(ξ )dξ - среднее значение функции влияния региона β .
0
Подставляя μ (α ) из (2.6.7) в (2.6.2), получим задачу на максимум, эквивалентную задаче на максимум (2.6.4): Nα
m
j =1
β =1
Φ (α ) (b1(α ) ,..., bm(α ) ) = ∑ ln( μ (0α ) + ∑ bβ(α ) ⋅ Δg ( β ) (t (jα ) )) → max
(2.6.8)
где Δg ( β ) (t ) = g ( β ) (t ) − g ( β ) , при условиях: m
b1(α ) ≥ 0,..., bm(α ) ≥ 0, ∑ bβ(α ) ⋅ g ( β ) ≤ μ0(α )
(2.6.9)
β =1
Нетрудно показать, что функция (2.6.8) является строго выпуклой, так как ее гессиан отрицательно определен и, следовательно, задача (2.6.8)-(2.6.9) имеет единственное решение. Пока мы рассматривали случай фиксированных параметров (r , s ) . Причиной этому является нерегулярность и большое число точек локального максимума в задачи на (2.6.4), если в список варьируемых параметров включить также и (r , s )
144
(Ogata et all, 1982). Для преодоления этих трудностей параметры (r , s ) перебирались на достаточно густой сетке значений: r = {rp , p = 0,..., Lr }, rp = rmin + Δr ⋅ p, Δr = (rmax − rmin ) / Lr
(2.6.10)
s = {sq , q = 0,..., Ls }, sq = smin + Δs ⋅ q, Δs = ( smax − smin ) / Ls
и для каждой пары значений (r , s ) из множества (2.6.10) решалась задача (2.6.8), (2.6.9). В качестве конечного варианта выбирались те пара (r , τ ) , для которой величина (2.6.8) была максимальна. Найдя решение задачи (2.6.8), (2.6.9) с «лучшей» парой параметров (r , τ ) для каждого
региона
мы
теперь
можем
ввести
т.н.
матрицу
влияния
{ κ β(α ) , α = 1,..., m; β = 0,1,..., m } имеющую компоненты: (α )
κ
(α ) 0
b ⋅g μ (α ) = (α ) ≥ 0, κ β(α ) = β (α ) μ0 μ0
(β )
≥0
(2.6.11)
Напомним, что μ (0α ) = Nα T - обычная «пуассоновская» интенсивность процесса в регионе α . Интерпретация элементов матрицы (2.6.11) довольно прозрачна: κ 0(α ) есть часть (доля) средней интенсивности
μ (0α ) , соответствующая чисто
стохастической компоненте случайного точечного процесса. Если κ 0(α ) = 1 , то процесс в регионе α чисто случаен и никак не связан с процессами в других рассматриваемых регионах. Величина κ β(α ) есть доля средней интенсивности процесса, обусловленная влиянием β → α . Из (2.6.6.) следует, что: m
κ 0(α ) + ∑ κ β(α ) = 1
(2.6.12)
β =1
Заметим, что матрица влияния κ β(α ) прямоугольная и состоит из m строк и (m + 1) столбцов. Первый столбец этой матрицы (имеющий индекс «0»: κ 0(α ) ) состоит из пуассоновских частей интенсивностей. Если его отбросить, то оставшаяся часть матрица будет уже квадратной размером m × m . По ее диагонали
стоят
значения
долей
интенсивности,
обусловленной
самовозбуждением процессов, а на диагоналях – ответственные за взаимные влияния. Эти недиагональные элементы матрицы влияния являются существенно несимметричными, то есть общей ситуацией является одностороннее влияние одной области на другую без обратного взаимного.
145
Если теперь оценивать элементы матрицы κ β(α ) в скользящем временном окне некоторой длины, то ее элементы становятся функциями от τ
− положения
правого конца скользящего окна: κ β(α ) = κ β(α ) (τ ) . Введем следующие три величины, являющиеся
интегральными
характеристиками
«большого»
региона,
составленного из m совместно анализируемых «малых» регионов:
P (τ ) =
m
1 m
∑ κ 0(α ) (τ ), S (τ ) = α =1
m
1 m
∑ κα(α ) (τ ), C (τ ) = α =1
m
1 m
m
κ βα (τ ) ∑ ∑ β α α β ( )
(2.6.13)
=1 =1, ≠
Таким образом, P(τ ) - это средняя по «малым» регионам пуассоновская часть полной интенсивности, S (τ ) - это часть интенсивности, ответственная за самовозбуждающиеся механизмы сейсмичности и, наконец, C (τ ) - часть интенсивности, отражающая процесса влияния сейсмичности в одних областях на сейсмичность в других. Очевидно, что P + S + C = 1 .
Рис.2.14. (а) – распределение эпицентров землетрясений в Калифорнии в течение 19632005 гг. с магнитудой M ≥ 4 и разбиение всей сейсмоактивной области на 8 регионов: Q1-Q8; (б) – графики интегральных статистик (2.6.14), описывающих эволюцию во времени стохастической (P), самовозбуждающейся (S) и отражающей взаимное влияние (C) регионов Q1-Q8 частей от общей средней интенсивности процесса. Оценка в скользящем окне длиной 5 лет со смещением 1 год, по временной оси – положение правого конца скользящего временного окна.
146
Для иллюстрации метода рассмотрим сейсмический режим Калифорнии, 1963-2005 гг. На рис.2.14(а) изображены эпицентры всех событий с магнитудой не менее 4 за период 1963-2005 гг., афтершоки не исключались (исходные данные могут
быть
свободно
получены
http://neic.usgs.gov/neis/epic/epic_global.html).
по
Сейсмичность
адресу:
Калифорнии
–
мелкофокусная, поэтому эпицентры всех событий лежат на глубине, не превышающей 100 км. Вся область разбита на 8 регионов Q1-Q8, границы которых показаны на рис.2.14(а) в виде замкнутых полигонов. Разбиение осуществлялось чисто визуально, по принципу оконтуривания кластеров сейсмичности. Матрицы влияния оценивались в скользящем временном окне длиной 5 лет со смещением 1 год. В формулах (2.6.10) брались значения: rmin = 0, rmax = 2, Lr = 21 , smin = 30, smax = 2000, Ls = 21 , значения s - в сутках. В таблице (2.6.1) представлена матрица влияния, соответствующая временному окну 1974-1978 гг. Колонка, помеченная “Poiss.”, соответствует значениям стохастических вкладов κ 0(α ) . Элементы матрицы, превышающие значение 0.2, выделены жирным шрифтом. В последней строке таблицы приведено число событий в областях Q1-Q8 в этом окне. Таблица 2.6.1. Матрица влияния для окна 1974-1978 гг. Poiss.
Q1
Q2
Q3
Q4
Q5
Q6
Q7
Q8
Q1
0.000
0.321
0.301
0.132
0.247
0.000
0.000
0.000
0.000
Q2
0.364
0.000
0.002
0.176
0.000
0.163
0.169
0.126
0.000
Q3
0.000
0.000
0.034
0.45
0.026
0.000
0.001
0.459
0.031
Q4
0.725
0.000
0.000
0.000
0.000
0.000
0.000
0.275
0.000
Q5
0.000
0.049
0.057
0.000
0.057
0.738
0.051
0.000
0.048
Q6
0.611
0.000
0.000
0.000
0.000
0.000
0.389
0.000
0.000
Q7
0.000
0.000
0.043
0.000
0.050
0.448
0.091
0.123
0.246
0.000 Число событий:
0.423
0.234
0.000
0.000
0.000
0.280
0.000
0.064
41
17
38
18
83
26
18
20
Q8
Из этой таблицы видно, что область Q1 в этом окне ведет себя пассивно и является «объектом агрессии» со стороны Q2 и Q4, Q7 – «агрессивна» и ее сейсмический режим влияет на Q3 и Q4, область Q5 является «интровертом» и ее
147
интенсивность
обусловлена
в
основном
процессами
самовозбуждения,
сейсмический режим в области Q4 большей частью стохастический, но есть значительное влияние области Q7. Среди эффектов влияния есть удаленные – это известный
факт
в
сейсмологии,
обусловленный
способностью
жестких
литосферных плит и волн порового давления быстро передавать изменение напряжений на большие расстояния (Bott, Dean, 1973; Соболев, 1993; Соболев, Пономарев, 2003). На рис.2.14(б) представлены графики изменений величин (2.6.14). Основная особенность этих зависимостей – сильная хаотизация сейсмического режима Калифорнии в середине 1990-х годов: значения S (τ ) и C (τ ) становятся близкими к
нулю.
Это
обнуление
явилось
результатом
длительного
тренда,
наблюдающегося с начала 1960-х годов. Современный же период находится на тренде подъема коллективной и самовозбуждающихся компонент сейсмичности. С этой точки зрения сейсмичность Калифорнии вернулась к состоянию режима второй половины 1970-х годов.
148
ГЛАВА 3. ПРИМЕРЫ АНАЛИЗА ИНФОРМАЦИИ СИСТЕМ МОНИТОРИНГА.
3.1. «Медленные события» в асейсмическом регионе. Одной из целей применения процедуры агрегирования сигналов является обнаружение с ее помощью аномалий, носящих характер перестройки структуры поведения одновременно всех регистрируемых процессов. Если наблюдения ведутся сетью мониторинга, охватывающей значительный участок земной коры, то такая перестройка может быть индикатором интенсификации процессов диссипации тектонической энергии в верхних слоях земной коры в виде усиления крипповых движений, оползневых процессов, миграции подземных вод. Подобного рода аномалии являются аналогами обычных землетрясений в сейсмоактивных регионах и могут быть названы “медленными событиями”. Современные модели диссипации энергии в верхних слоях земной коры существенно опираются на представления о самоподобии и автомодельности процессов в литосфере и, следовательно, об их принципиальной “одинаковости” как в сеймоактивных, так и в асейсмических регионах (Садовский, Писаренко, 1991). Различие должно состоять лишь в характерных частотах, на которых происходит диссипация энергии. Если для сейсмоактивных регионов с большим значением притока тектонической энергии характерна диссипация на высоких частотах, то в асейсмических регионах, где поток энергии гораздо ниже, разрядка носит более плавный характер и имеет вид не резкого возбуждения сейсмических волн, а увеличения “медленных” движений земной коры, происходящих вдоль сравнительно узких зон - линеаментов. Интенсификация подобного рода движений земной коры может приводить к усилению миграции подземных вод, обладающих способностью разупрочнять блоки земной коры, усиливать коррозионные процессы. В свою очередь, последнее приводит к увеличению вероятности оползней, растрескивания фундаментов больших зданий, прорыва подземных тоннелей, коррозии путей метрополитена. Кроме того, повышенная миграция
подземных
вод
может
привести
к
выносу
на
поверхность
149
радиоактивных веществ и временному повышению естественного радиоактивного и электромагнитного фона.
Рис.3.1. Графики синхронных временных рядов уровней подземных вод в скважинах пробуренных до горизонтов, лежащих на глубинах соответственно 120, 180, 400 и 1000 метров (левая колонка графиков) и их приращений (правая колонка графиков). Измерения выполнены с 02.02.1993 12:00 по 31.08.1997 03:00 и приведены к интервалу дискретизации 1 час, всего 40096 отсчетов. Вариации уровней компенсированы от влияния атмосферного давления путем оценки функций отклика по всей длине рядов. Измерения 120 и 180 выполнены в пос.Зеленый (Московская область), 400 и 1000 – в Москве, на территории ЦИТО.
Определение “медленных событий”, особенно в условиях мегаполиса, является
чрезвычайно
сложной
задачей,
поскольку
требует
применения
комплексных методов наблюдения и анализа информации. Как правило, один прибор
(деформометр, наклономер, гравиметр)
состоящий
в
основном
из
шумов
выдает ряд
техногенного
и
наблюдений,
метеорологического
происхождения. Полезная информация (или “сигнал”) может быть выделена 150
только в результате совместного статистического анализа показаний группы приборов, измеряющих различные геофизические поля и/или установленных в различных пунктах наблюдения. Отметим, что с расширением ареала техносферы на поверхности Земли все меньше остается регионов, свободных от шумов техногенного
происхождения.
Поэтому
разработка
методик
анализа
геофизической информации, которые бы максимально очищали результаты наблюдений от техногенных шумов является весьма актуальной задачей как для асейсмических, так и для сейсмоактивных регионов. Отличие техногенных шумов, от шумов метеорологического происхождения (вариаций атмосферного давления, температуры, влажности, осадков) состоит в том, что первые, в отличие от вторых, не могут быть измерены в их совокупности. Следовательно, единственный способ от них избавиться - это использование информации из разных пунктов наблюдения в предположении малой коррелированности шумов в каждом пункте. Для иллюстрации работы метода были взяты долговременные высокоточные наблюдения за вариациями уровней подземных вод в группе 4-х водоносных горизонтов в Московском регионе. Эти данные анализировались в работах (Любушин, Малугин, Казанцева, 1997(a), 1999; Любушин, 2001). На рис.3.1 представлены результаты синхронных измерений атмосферного давления, наружной температуры и вариаций уровней подземных вод в группе, состоящей из 4-х водовмещающих горизонтов, расположенных на глубинах 120, 180, 400 и 1000 метров. Для обработки взят интервал наблюдений с 12:00 02.02.1993 по 03:00 31.08.1997, (время местное, зимнее), что обеспечивает длину временных рядов, равной 40096 одночасовых отсчетов в каждом ряду. Измерения проводились В.А.Малугиным и О.С.Казанцевой (ОИФЗ РАН) в двух пунктах, находящихся в Москве (территория ЦИТО, рядом со станцией метро «Войковская») и в Московской области (пос. Зеленый Ногинского района) и разнесенных друг от друга на 40 км. В первом пункте измерялись вариации уровней в скважинах, пробуренных до горизонтов, лежащих на глубинах 400 и 1000 м, во втором – на глубинах 120 и 180
метров.
Для
простоты
обозначений
водоносных
горизонтов
и
соответствующих им временных рядов присвоим им обозначения 120, 180, 40» и 1000. Вариации уровней 120 и 180 характеризуются интенсивными техногенными помехами, связанными с откачкой для снабжения питьевой водой населенных
151
пунктов Московской области. Заметим, однако, что подобного рода техногенные помехи, индивидуальные для каждого из временных рядов, исключаются в процедуре агрегации, как уже было сказано выше. Рис.3.1 представляет как сами исходные
вариации
уровней,
предварительно
очищенные
от
влияния
атмосферного давления с использование частотной передаточной функции, оцененной по всей длине выборки (левая колонка графиков), так и их приращения (правая колонка). «Медленным событием» считался всплеск меры нестационарного поведения высокочастотной
составляющей
Фурье-агрегированного
сигнала.
Мера
нестационарности оценивалась в двойном скользящем временном окне и представляла, по сути, разницу коэффициентов авторегрессионной модели сигнала, оцененной слева и справа от центра окна, в метрике, задаваемой информационной
матрицей
Фишера
(матрицей
вторых
производных
от
логарифмической функции правдоподобия), деленной на длину окна – см. п.1.7, формула (1.7.3). На рис.3.2(а) представлен график приращений Фурье-агрегированного сигнала. Поскольку для выделения медленных событий необходим анализ высокочастотной составляющей, то приращения сигнала представляют более удобный объект, чем сам сигнал, в котором пришлось бы предварительно избавляться от доминирования низких частот. На рис.3.2(б) изображен график меры (1.7.3), оцененной в скользящем окне радиуса 672 отсчета (28 суток). Эта длина окна является наиболее обоснованной в исследованиях геофизических процессов, поскольку она равна лунному месяцу и периоду модуляции очень многих процессов в земной коре и гидросфере. Использовалась модель авторегрессии 2-го порядка, как модель минимального порядка, реагирующей на изменение положения частотной полосы, сосредотачивающей основную энергию колебаний в текущем временном окне. Видно, что на интервале наблюдений имеются ряд всплесков меры нестационарности поведения агрегированного сигнала, которые формируют 4 группы наиболее интенсивных – в начале наблюдений, около временных меток 10000 и 27000 часов и в конце. Как было показано в (Любушин и др., 1999) путем статистического моделирования поведения статистики (1.7.3) при ее применении к белому шуму, уровень 0.4 является статистически значимым порогом ее вариаций для используемых параметров.
152
Рис.3.2. (а) – приращения Фурье-агрегированного сигнала 4-х временных рядов уровней подземных вод (рис.3.1); (б) – мера нестационарности приращений Фурьеагрегированного сигнала (а) при оценке с использованием AR(2)-модели в скользящем временном окне радиуса 672 часа (28 суток); (в) – приращения робастного вейвлетагрегированного сигнала, вычисленного по всей выборке (неадаптивного) с использованием вейвлета Хаара, порог Lmin = 16 .; (г), черная линия – результат сжатия приращений агрегированного сигнала с использованием порога Донохо-Джонстона, α = 0.992 , удаления уровней детальности, начиная с 7-го и выше и взятия абсолютных значений; (г), серая толстая линия – результат сглаживания абсолютных значений сжатых приращений агрегированного сигнала (черной линии) в скользящем окне радиуса 336 часов.
153
Для того, чтобы получить независимое обоснование существования аномалий поведения коллективной составляющей вариаций уровней подземных вод, построим для этих же данных робастный вейвлет-агрегированный сигнал для параметров Lmin = 8 , вейвлет Хаара и при использовании всей длины выборки в качестве окна адаптации. Его приращения изображены на рис.3.2(в). Для выделения в приращениях агрегированного сигнала наиболее информативных вариаций подвергнем их процедуре вейвлет-сжатия с порогом Донохо-Джонстона и с использованием того же вейвлета Хаара. Уровень сжатия для этого сигнала оказался равным 0.992, то есть наиболее информативные вариации сосредоточены лишь в 0.8% вейвлет-коэффициентов, имеющих максимальные значения абсолютных величин. Далее из вейвлет-сжатых приращений агрегированного сигнала были удалены все уровни детальности, начиная с 7-го и выше, то есть для масштабов временных вариаций выше 128 часов и взяты абсолютные значения («амплитуды»
вариаций).
Результат
этой
последовательности
операций
изображен на рис.3.2(г) черной линией – это есть изменения амплитуды наиболее информативных и резких вариаций в коллективной компоненте сигналов. Сопоставление моментов времени группирования резких изменений сжатого вейвлет-агрегированного сигнала на рис.3.2(г) с пиками меры нестационарности на рис.3.2.(б) показывает, что они довольно хорошо коррелированны друг с другом. Для того, чтобы сделать эту корреляцию более наглядной, амплитуды резких изменений были сглажены в скользящем временном окне радиуса 336 часов и результат сглаживания представлен на рис.3.2(г) толстой серой линией. Из
сопоставления
этого
графика
с
рис.3.2(б)
видно,
что
пики
меры
нестационарности на рис.3.2(б) и пики сглаженного сигнала на рис.3.2(г) совпадают по времени друг с другом с точностью 300-500 часов, причем пики меры нестационарности на рис.3.2(б), как правило, отстают от максимумов последующих общих вариаций. Заметим, что это отставание представляет интерес с точки зрения изучения тонкой структуры фоновых процессов в земной коре: в большинстве случаев изменению спектрального состава общего сигнала предшествует увеличение его скачкообразной составляющей. Наличие скачкообразных составляющих, не связанных с дефектами систем измерения или систем регистрации, неоднократно отмечалось при наблюдениях за деформациями и вариациями уровней подземных вод. Можно строить различные гипотезы относительно происхождения скачкообразных сигналов,
154
например, процессы релаксации слабых напряжений в горных породах (своего рода микроземлетрясения) или выделение пузырьков газа из скважин при уровнемерных наблюдениях. В любом случае такие сигналы представляют интерес для геофизика и в особенности, если они наблюдаются синхронно в разных пунктах измерения. Именно синхронное возникновение скачкообразных составляющих
сигналов
призван
выделять
оценка
робастного
вейвлет-
агрегированного сигнала с последующим его сжатием
3.2. Формирование предвестника Тяншаньского землетрясения. Рассмотрим непосредственное применение метода агрегированных сигналов для поиска предвестников сильных землетрясений. На рис.3.3 представлены графики данных геофизического мониторинга в Северо-Восточном Китае. Данные для анализа были любезно представлены проф. Чанг Чаоченгом, Центр анализа и прогноза землетрясений (Prof. Zhang Zhaocheng, Center for Analysis and Prediction of Earthquakes, State Seismological Bureau, China). Набор исходных данных состоит из 10 временных рядов, представляющих собой результаты синхронной
регистрации
следующих
параметров:
геофизических
электросопротивление горных пород - 3 ряда, графики 1-3 на рис.3.3; наклоны - 3 ряда, графики 4-6 на рис.3.3; вариации уровней подземных вод в скважинах - 4 ряда, графики 7-10 на рис.3.3. Характерный
линейный
размер
наблюдательной
сети
=
200
км.
Обрабатываемый интервал наблюдений составляет 8 лет, с 01 января 1972 года по 31 декабря 1979 года. Интервал взятия отсчетов составляет 1 сутки, что обеспечивает длину рядов по 2922 отсчета в каждом. В течение обработанного интервала
наблюдений
произошло
катастрофическое
Тяньшаньское
землетрясений - M=7.8, 28 июля 1976 года. Момент этого землетрясения соответствует 1671 дню от начала 1972 года и он наиболее ярко отражен в постсейсмической реакции на графике 9 рис.3.3 вариаций подземных вод в пункте, находящейся непосредственно в эпицентральной зоне. Для построения вейвлет-агрегированного сигнала был использован вейвлет Хаара, длина временного окна адаптации 700 суток и порог представительности Lmin = 10 На графике 11 рис.3.3 представлено поведение агрегированного сигнала первых 1670 отсчетов (т.е. выборки, непосредственно примыкающей к моменту толчка) всех 10 временных рядов. Оно характеризуется амплитудной аномалией,
155
предшествующей землетрясению и начавшейся приблизительно за 100 суток до момента толчка. Кроме того, график 11 содержит другие всплески для моментов времени
менее
1000
дней,
которые,
по
всей
видимости,
являются
постсейсмическими реакциями или предвестниками других землетрясений.
Рис.3.3. Временные ряды мониторинга в Северо-Восточном Китае и их агрегированный сигнал. Графики 1-3 – электросопротивление горных пород; графики 4-6 – наклоны; графики 7-10 – вариации уровня подземных; 11 – вейвлетагрегированный сигнал, построенный по первым 1670 отсчетам (строго до момента Тяньшанского землетрясения, N = 1671 , M = 7.8 , 28.06.1976); вертикальные линии – момент землетрясения.
156
Рис.3.4 отражает изменение формы агрегированного сигнала на последнем участке, после 1000-го дня, по мере увеличения длины N обрабатываемой выборки (от 1500 до 1670 отсчетов) и ее приближения к моменту толчка. Видно, что наиболее контрастный предвестник сформировался за 5 суток до землетрясения. На
рис.3.5(a)
изображен
график
вейвлет-агрегированного
сигнала,
вычисленного с теми же параметрами уже для всей выборки, на котором видная аномалия,
предшествующая
Тяньшанскому
землетрясению.
Сам
момент
землетрясения выделен второй вертикальной линией. На рис.3.5(б) представлен график робастной модификации агрегированного сигнала, которая также надежно выделяет предвестник Тяньшанского землетрясения. Еще раз подчеркнем, что алгоритм агрегации временных рядов является лево-ориентированным. Последнее означает, что если обрабатывать не всю выборку, а лишь начальный кусок произвольной длины, то отбрасывание из обработки последней порции данных никак не скажется на результате анализа первой части данных и агрегированный сигнал на начальном интервале времени будет иметь тот же вид, что и при обработке всей информации. На первый взгляд рис.3.5(a) производит большее впечатление, поскольку те аномалии, которые на нем видны, больше выделяются над общим фоном статистических
флуктуаций.
Однако
известно,
что
перед
Тяньшанским
землетрясением в том же регионе Китая имело место Хайчэнгское (02.04.1975, M=7.4, 1188-й день от начала 1972 года), пожалуй, единственное в практике
прогноза, успешно предсказанное (по другим данным) (Касахара, 1985; Соболев, 1993). На рис.3.5 оно также отмечено вертикальной штриховой линией. Удручает то, что на рис.3.5(a) это событие не отмечено никаким статистически значимым эффектом синхронизации, ни до события, ни после него. В то же время на рис.3.5(б) заметен как предвестниковый, так и постсейсмический эффекты. Кроме того, все аномалии, заметные на рис.3ю5(a), также присутствуют и на рис.3.5(б), но в более контрастном виде. Таким образом, робастный вейвлет-агрегированный сигнал в данном частном случае оказался более чувствителен, чем его предыдущий вариант, хотя делать вывод, что для анализа временных рядов низкочастотного геофизического мониторинга
всегда
следует
использовать
робастную
агрегацию,
преждевременно. Здесь дело не только в том, что робастный вариант метода 157
требует времени счета, на порядок больше, чем старый вариант. Излишняя чувствительность метода может привести к тому, что он будет выделять не только сильные эффекты синхронизации, предшествующие сильным землетрясениям (а именно они и представляют интерес), но менее сильные общие вариации, которые, тем самым, увеличат амплитуду общего фона статистических флуктуаций.
Рис.3.4. Последовательное изменение формы агрегированного сигнала на последнем участке, после 1000-го дня, по мере увеличения длины N обрабатываемой выборки (от 1500 до 1670 отсчетов) и ее приближения к моменту толчка.
158
Рис.3.5. Графики вейвлет-агрегированных сигналов временных рядов, изображенных на рис.3.3 и оцененных для параметров: длина окна адаптации = 700, Lmin = 10 , использовались вейвлеты Хаара. (a) – неробастный вейвлет-агрегированный сигнал, (б) – его робастная модификация. Вертикальными линиями обозначены моменты землетрясений в Хайчэнге и Тяньшане.
Сравнение рис.3.5(a) и рис.3.5(б) подтверждают это предположение, хотя реакция робастного сигнала на Хайчэнгское землетрясение является, безусловно, сильным доводом в пользу применения робастной схемы агрегации временных рядов. Каждая из выделенных выше значимых аномалий, помимо заведомо связанной с Тяншанской катастрофой и рассмотренной выше, является индикатором увеличения коллективного поведения регистрируемых процессов. Здесь мы не будем пытаться каждую аномалию интерпретировать как предвестник того или иного сильного события в каталоге землетрясений СевероВосточного Китая. Ведь причиной увеличения коллективного поведения может быть и рой землетрясений слабой силы, и увеличение криповых движений типа т.н. “медленных событий”. Целью рассмотренного примера анализа данных была
159
именно
попытка
выделения
краткосрочных
предвестников
Тяншанского
землетрясения, и предложенная методика показала свою перспективность.
3.3. Многомерные геохимические и электротеллурические ряды на Камчатке. Анализ многомерных наблюдений на Камчатке разделен на 2 части: гидрогеохимических временных рядов и электротеллурических измерений.
Рис.3.6. Графики 16 временных рядов мониторинга гидрогеохимических показателей на системе скважин и источников на Камчатке. Первый отсчет – 03.01.1986, последний – 28.09.1992, интервал взятия отсчетов – 3 суток, общее число наблюдений в каждом ряду – 821. Группа (а1)-(а4) – концентрация Cl − , группа (б1)-(б5) – концентрация ионов угольной кислоты HCO3− , группа (в1)-(в4) – концентрация кремниевой кислоты
H 4 SiO4 в подземных водах. Вертикальной линией отмечен момент землетрясения M = 7.1 , 02.03.1992. 160
На
рис.3.6
представлены
графики
16
временных
рядов
различных
геохимических показателей, относящихся к составу подземных вод в скважинах и самоизливающихся источников Петропавловского геодинамического полигона Института вулканологии РАН, измерения проведены Ю.М. Хаткевичем в 19861992 гг. Общий набор временных рядов включает в себя также вариации уровня подземных вод, дебит скважин и температуру воды. В работе (Любушин и др., 1996, 1997(b); Любушин, 1995) анализировалось поведение максимальных собственных чисел спектральных матриц этих рядов в скользящих временных окнах и особенности полученных частотно-временных диаграмм сопоставлялись с сейсмичностью Камчатки.
Рис.3.7. Графики агрегированных сигналов 16 временных рядов мониторинга гидрогеохимических показателей (рис.3.6): (а) – Фурье-агрегированный сигнал; (б) – вейвлет-агрегированный сигнал всех 821 отсчета; (в) – вейвлет-агрегированный сигнал первых 750 отсчетов. Вертикальными линиями отмечены моменты наиболее сильных землетрясений.
161
Для анализа этих данных ниже будут использованы только 2 подхода – метод агрегированных сигналов и анализ максимальной канонической когерентности между 2-мя многомерными временными рядами. За время наблюдений в окрестности полигона (на расстоянии не более 130 км) произошли 2 сильных землетрясения: 06.10.1987, M=6.6 и 02.03.1992, M=7.1. Последнее событие является своего рода вехой в сейсмическом процессе на Камчатки, так как именно с него началась сильная активизация сейсмичности. К сожалению, измерения, сформировавшие эти ряды, производились вручную с интервалом 1 раз в 3 суток. Поэтому, несмотря на большую календарную длительность наблюдений их фактический объем невелик – всего 821 отсчет в каждом сигнале.
Рис.3.8. Частотно-временные диаграмма квадрата максимальной канонической когерентности между 5-мерным временным рядом концентрации ионов угольной кислоты HCO3− , группа (б1)-(б5) на рис.3.6 и 4-мерным временным рядом концентрации кремниевой кислоты H 4 SiO4 в подземных водах, группа (а1)-(а4) на рис.3.6. Оценка в скользящем временном окне длиной 100 отсчетов (300 суток), векторная AR(3)-модель.
На рис.3.7 представлены графики Фурье-агрегированного сигнала (3.7(а)) и вейвлет-агрегированного сигнала, полученного при длине временного окна адаптации 128 отсчетов, использовании вейвлета Хаара и для Lmin = 10 . Для того, чтобы проиллюстрировать, что метод оценки вейвлет-агрегированного сигнала является лево-ориентированным, то есть его значения зависят только от поведения обрабатываемых рядов слева от рассматриваемого момента времени,
162
на рис.3.7 представлены графики вейвлет-агрегированных сигналов, вычисленных по всей выборке (рис.3.7(б)) и только по первым 750 отсчетам (рис.3.7(в)), то есть строго до момента землетрясения 02.03.1992 – видно, что они полностью совпадают на интервале времени, где они определены одновременно. Рис.3.7(а) подчеркивает
наличие
общих
низкочастотных
составляющих
в
данных,
формирующих классические бухтообразные аномалии перед событиями. Что же касается вейвлет-агрегированного сигнала, то его поведение говорит о том, что активизация сейсмичности Камчатки начала готовится примерно за 800-900 суток до
его
начала
02.03.1992
–
об
этом
свидетельствует
резкое
начало
высокочастотных флуктуаций большой амплитуды. На рис.3.8 представлена частотно-временная диаграмма эволюции квадрата модуля максимальной канонической когерентности между 5-мерным временным рядом концентрации отрицательных ионов угольной кислоты (группа (б1)-(б5) на рис.3.6) и 4-мерным временным рядом концентрации кремниевой кислоты (группа (в1)-(в4) на рис.3.6) в подземных водах. Оценка строилась в скользящем временном окне длиной 100 отсчетов (300 суток) с помощью векторной модели авторегрессии 3-го порядка с предварительным устранением линейных трендов и переходом к приращениям в каждом окне. Видна отчетливая синхронизация этих многомерных сигналов примерно за 500 суток до события 02.03.1992 (с учетом длины окна) на периодах от 20 до 50 суток. Примечательно, что если обрабатывать отдельно обе группы многомерных сигналов, то ни та, ни другая не дают никаких предвестников – только лишь очевидную постсейсмическую синхронизацию. Этот пример ярко иллюстрирует важность комплексного анализа разнородных данных для поиска скрытых сигналов коллективного поведения, предваряющих сильные землетрясения. На рис.3.9 изображена схема расположения пункта электротеллурических наблюдений Верхняя Паратунка (ВП), а также эпицентры землетрясений с магнитудой не менее 4.5 внутри квадрата: от 51 до 55 град. СШ и от 159 до 163 град. ВД. Цифрами обозначены сильные землетрясения: 1 – 05.12.1997, М= 7.9; 2 – 01.06.1998, М= 6.3; 3 - 08.03.1999, М = 6.9; 4 - 08.10.2001, М= 6.6. На рис.3.10 представлены графики временных рядов наблюдений, интервал дискретизации приведен к 1 часу. Число отсчетов в каждом ряду N=41447.
163
Рис.3.9. (а) – схема расположения пункта электротеллурических наблюдений Верхняя Паратунка (ВП), эпицентров сильных землетрясений и их афтершоков (1 – 05.12.1997 г., M = 7.9; 2 – 01.06.1998 г., M = 6.3; 3 - 08.03.1999 г., M = 6.9; 4 - 08.10.2002 г., M = 6.6); КК – Курило-Камчатский глубоководный желоб, А – Алеутский глубоководный желоб; (б) – последовательность событий с магнитудой не менее 4.5 в квадрате от 51 до 55 град. СШ и от 159 до 163 град. для интервала времени 01.10.1996-23.10.2001. Цифрами 1-4 отмечены сильные события, эпицентры которых показаны на (а). Вертикальной штриховой линией отмечен момент окончания наблюдений.
Далее представлены результаты совместного анализа трех временных рядов наблюдений за вариациями электротеллурических потенциалов на Камчатке, пункт
наблюдений
Верхняя
Паратунка,
за
период
01.10.1996-23.06.2001
(Любушин, Копылова, 2004). Пункт наблюдений представляет систему из трех измерительных линий длиной 70-100 м, ориентированных в меридиональном
164
(север-юг – линия 1, сигнал 1p), широтном (запад-восток – линия 3, сигнал 3p) и диагональном (юго-запад-северо-восток – линия 4, сигнал 4p) направлениях. Частота регистрации разности теллурических потенциалов составляет 1 мин., точность – 0.5 мВ. Общая продолжительность наблюдений составляет 4 года 8 месяцев (с 01.10.1996 по 23.06.2001).
Рис.3.10. Графики исходных данных после усреднения и прореживания в 24 раза (перехода к однодневному интервалу дискретизации): (а) – линия 1; (б) – линия 3, (в) – линия 4. По осям ординат – мВ/100 м.
В течение нескольких десятилетий в различных сейсмоактивных регионах, в том числе на Камчатке, проводится регистрация электротеллурического поля (ЭТП) с целью обнаружения предвестников землетрясений (Соболев, 1993; Соболев, Пономарев, 2003). Но, несмотря на многочисленные сообщения о регистрации разнообразных вариаций ЭТП в связи с землетрясениями, до
165
настоящего времени не имеется ясных представлений о механизме образования таких сигналов. Это связано, в первую очередь, с трудностью интерпретации временных рядов ЭТП из-за разнообразного и комплексного влияния различных внешних и внутренних факторов. В результате ионосферных, метеорологических, техногенных и др. воздействий перед любым землетрясением могут проявляться разнообразные вариации ЭТП, которые усложняют выделение сигналов, связанных с развитием современных геодинамических процессов и подготовкой сильных землетрясений. В работах, посвященных результатам электротеллурических наблюдений на Камчатке и в других регионах, отмечался широкий набор аномальных сигналов перед землетрясениями с амплитудами от первых мВ/100 м до десятков и сотен мВ/100м. Их продолжительности составляли от минут до десятков суток. По форме выделялись плавные «бухтообразные» вариации и импульсные сигналы (Соболев, 1993; Мороз и др., 1995). Вместе с тем, в (Копылова и др., 2001) отмечается, что, большая часть разнообразных вариации ЭТП на Камчатке имеют, в основном, естественное и закономерное происхождение вследствие влияния внешних
ионосферных
источников
и
сезонных,
преимущественно
гидрологических и гидрометеорологических факторов. Низкочастотные вариации ЭТП включают годовые сезонные изменения с амплитудами до нескольких десятков – первых сотен мВ/100м, а также изменения в форме несимметричных «бухт» с амплитудами от единиц до первых десятков мВ/100 м в результате выпадения осадков в летнее время и зимних оттепелей (их продолжительность от первых суток до десяти и более суток). Наиболее амплитудные изменения ЭТП происходят в апреле–июне во время таяния снега и в октябре–ноябре во время выпадения эффективных осенних осадков. Выбор
интервала
дискретизации
1
сутки
позволяет
избавиться
от
присутствующего в данных сильного высокочастотного шума, обусловленного, в основном, внешними факторами. Кроме того, переход к однодневному шагу дискретизации позволяет более подробно изучить низкочастотную область спектра ЭТП, для которой предполагается линейная связь компонент поля, вызванных механоэлектрическими преобразованиями, с порождающими эти поля механическими деформациями. Следует также подчеркнуть сильно негауссовый и нестационарный характер исходных данных, что сразу же ставит под сомнение возможность их содержательного анализа с помощью Фурье-разложений. Именно
166
для данных такого типа вейвлеты являются наиболее подходящим инструментом анализа. Землетрясение 05.12.1997 г., М=7.9 (№ 1 на рис.3.9(б)), произошло на расстоянии 350 км от пункта ВП и сопровождалось многочисленными афтершоками, которые заполнили обширную область размером 200×100 км в районе Камчатского и Кроноцкого заливов. Это землетрясение является сильнейшим на Камчатке с 1971 года. Перед этим землетрясением проявились слабые аномалии в изменениях ЭТП на п. ВП, которые были обнаружены в результате применения комплекса алгоритмов обработки многомерных рядов данных
электротеллурических
наблюдений.
Выявленные
статистические
аномалии отражали увеличение уровня несинхронных шумовых компонентов в изменениях теллурических потенциалов на отдельных линиях (Копылова и др., 2001). В 1998–2001 гг. в районе Авачинского залива на расстоянии 140-150 км от пункта ВП произошли три серии землетрясений с магнитудами 6.3–6.9: 27.0501.06.1998 г., М=6.3 (№ 2); 08.03.1999 г., М=6.9 (№ 3); 08.10.2001 г., М=6.6 (№ 4). Все три землетрясения сопровождались многочисленными афтершоками. Для анализа был выбран метод робастного вейвлет-агрегированного сигнала с окном адаптации длиной 365 отсчетов, то есть 1 год, как наиболее естественное в области
низких
частот
ЭТП.
Использовался
вейвлет
Хаара,
порог
представительности Lmin = 10 . На рис.3.11. представлены результаты анализа – сам агрегированный сигнал и ассоциированные с ним меры (2.5.4) κ ( A) (τ , β ) . Заметим, что в этом случае поведение агрегированного сигнала не дало никаких примечательных особенностей, в отличие от сопряженных с ним мер когерентности κ ( A) (τ , β ) . Именно на анализе величин (2.5.4) в дальнейшем будет сделан основной акцент. В изменениях κ ( A) (τ , β ) на рис.3.11 обращает внимание последовательный переход всплесков меры коллективности с низкочастотных уровней детальности на все более и более высокочастотные. Отметим, что в литературе по исследованию критических явлений такая закономерность (рост частоты коллективных вариаций) известна давно и уже использовалась для анализа как геофизических, так и финансовых данных (Sornette et al., 1996), правда, вне рамок многомерного анализа данных. Отчетливый максимум κ ( A) (τ , β ) в конце 1997 – 1998 гг. может быть проявлением предыдущего цикла миграции или может быть
167
не связан с таким процессом, если проявления миграции ограничены в области относительно малых периодов вариаций ЭТП.
Рис.3.11. Робастный вейвлет-агрегированный сигнал – (А) и эволюция произведения робастных оценок покомпонентных канонических корреляций κ ( A) (τ , β ) (формула (2.5.4)) на первых 5 уровнях детальности. Вейвлет Хаара, длина окна = 365 отсчетов, Lmin = 10 . Наклонной серой линией со стрелкой указано направление миграции всплесков когерентности от крупномасштабных уровней к мелкомасштабным.
Наиболее выраженный цикл миграции, отмеченный на рис.3.11 наклонной стрелкой, мог быть связан с возникновением сильнейшего Кроноцкого землетрясения и предшествовать сильному землетрясению 08.10.2001 г., произошедшему после 2.5 летнего относительного затишья, и может быть связан с процессами его подготовки. 168
Выявленные
особенности
структур
вариаций
κ ( A) (τ , β )
(как
меры
коллективности вариаций ЭТП во временной и частотной областях), отражают, по-видимому, эволюцию некоторого процесса, обеспечивающего временную изменчивость
чувствительности
ЭТП
к
сейсмотектоническим
процессам.
Развитие сравнительно медленных сейсмотектонических и вулканотектонических процессов, сопровождающихся
деформированием разнородной среды, может
сопровождаться механоэлектрическими преобразованиями при ведущей роли электрокинетических и ионно-диффузионных процессов (Светов и др., 1997).
3.4. Микросейсмический фон перед сильным землетрясением. Рассматриваются непрерывные синхронные записи микросейсмического фона на 6 широкополосных станциях IRIS, расположенных в обширном регионе, простирающимся от центра Европейской части России (Обнинск) до Дальнего Востока (Камчатка, Сахалин), в течение месяца перед Кроноцким землетрясением на Камчатке (M=7.8, 05.12.1997). Путем усреднения и прореживания исходных записей осуществлялся переход к интервалу дискретизации 30 сек. и исследовался микросейсмический фон в диапазоне периодов от 1 минуты до 2.4 часа после удаления масштабно-зависимых трендов, обусловленных влиянием приливов и температурных колебаний. Флуктуации микросейсм анализировались с помощью оценок эволюции их мультифрактальных спектров сингулярности (п.1.8) в скользящем
временном
окне
длиной
12
часов.
В
качестве
признака,
характеризующего свойства фона в текущем временном окне, брались значения
α*
- обобщенного показателя Херста, реализующего максимум спектра
сингулярности. Таким образом, осуществлялся переход от анализа исходных высокочастотных сейсмических записей к совместному анализу низкочастотных временных рядов α * -вариаций на нескольких станциях. Путем оценки эволюции спектральной
меры
когерентного
поведения
α * -вариаций в скользящем
временном окне длиной 5 суток для различных комбинаций совместно анализируемых станций выделены скрытые эффекты Рассматриваются любезно предоставленные Геофизической службой РАН сейсмические записи вертикальной компоненты с частотой дискретизации 20 Гц на 6 широкополосных станциях IRIS в Петропавловске-Камчатском (Pet), ЮжноСахалинске (Yss), Магадане (Mag), Якутске (Yak), Арти (Art) на Урале и Обнинске (Obn) в течение месяца, от 05.11.1997 до 05.12.1997 строго перед 169
Кроноцким землетрясением на Камчатке (M=7.8, 05.12.1997). В скобках указаны 3-буквенные идентификаторы сейсмических станций, на которые всюду далее будут делаться ссылки. Для перехода в минутный диапазон периодов исходные записи усреднялись и прореживались в 600 раз, в результате чего получались временные ряды с интервалом дискретизации 30 сек. Эти записи содержали выбросы большой амплитуды, обусловленные вступлениями либо от удаленных сильных землетрясений, либо местных событий, в том числе и промышленных взрывов. Для устранения побочных эффектов, обусловленных такими выбросами, после перехода к 30-секундным отсчетам данные подвергались итеративной процедуре винзоризации. На рис.3.12 изображены графики данных после усреднения, прореживания и винзоризации. Отчетливо видны приливные колебания и прочие низкочастотные тренды, предположительно связанные с вариациями температуры и атмосферного давления. Заметим, что запись Yak содержит пропуск данных для временных меток 20160-21598 минут, который заметен на рис.3.12 как плато постоянных значений. Кроме того, на записи Art присутствует низкочастотная аномалия (возможно калибровочный импульс) для временных меток 32200-32960 минут, после которой запись претерпевает значительные скачки вверх и вниз с последующим плавным восстановлением среднего уровня. Эти 2 дефекта данных надо иметь в виду при интерпретации результатов анализа. Заметим, что участок данных на записи Art с сильным возрастающим трендом после низкочастотного импульса является вполне кондиционным для анализа, так как используемый метод оценки спектра сингулярности как раз предназначен для исключения влияния трендов. Для того, чтобы используемый метод оценки спектра сингулярности в скользящем временном окне мог пройти непрерывно по всей длительности записей Yak и Art через сбойные участки с постоянными значениями без остановки из-за численной неустойчивости, плато постоянных значений были возмущены малым гауссовским белым шумом с дисперсией 10−3.
170
Рис.3.12. Графики исходных данных микросейсмических колебаний для 6 станций с 05.11.1997 по 05.12.1997 строго перед Кроноцким землетрясением на Камчатке ( M =7.8, 05.12.1997) (краткие обозначения станций приведены на графиках) после перехода к 30-секундным интервалам дискретизации и операции винзоризации, т.е. итеративной срезки больших выбросов в данных, обусловленных вступлениями от землетрясений.
171
Рис.3.13. Графики значений α * - обобщенного показателя Херста, реализующего максимум спектра сингулярности записей микросейсмического фона на всех станциях (рис.3.12) при оценке в скользящем временном окне длиной 12 часов, взятых со смещением 1 час. По временной оси отложена координата правого конца скользящего временного окна.
Целью анализа является обнаружение эффектов когерентного (синхронного) поведения микросейсмических колебаний в минутном диапазоне периодов после перехода от исходных данных к их спектрам сингулярности, оцененным в скользящем временном окне. Ниже в качестве такой характеристики спектров сингулярности были выбраны значения α * аргумента, на котором спектр достигает своего максимума. Значения α * характеризуют наиболее типичную
172
сингулярность, которая встречается чаще всего в пределах текущего окна, при условии самоподобного поведения шумовой составляющей микросейсм. Для получения временных рядов эволюции значений α * было выбрано скользящее окно длиной 1440 30-секундных отсчетов, то есть 12 часов, взаимное смещение соседних окон равнялось 120 отсчетам или 1 часу. Для устранения масштабно-зависимых трендов брались полиномы 4-го порядка. Функция h(q) в зависимости Z ( m ) (q, s ) ∼ s h ( q ) в формуле (1.8.7) оценивалась в каждом окне для масштабов s , изменяющихся от минимального значения 20 отсчетов до максимального, равного одной пятой длины окна. При длине 1440 отсчетов, таким образом, максимальный масштаб равен 288 30-секундных отсчетов или 144 минуты = 2.4 часа. На рис.3.13 представлены графики эволюции значений α * для всех 6 станций в зависимости от правого конца скользящего временного окна. Дальнейший план анализа состоит в выделении когерентных вариаций значений α * . Даже невооруженным глазом заметна сильная коррелированность
α * -вариаций для станций Yak и Mag начиная с временной метки 38000 минут. Для выделения более скрытых когерентных элементов поведения, которые могут иметь фазовый сдвиг и наблюдаться сразу для нескольких станций, был применен метод, использующий оценку канонических когерентностей в скользящем временном окне – см. формулу (2.3.2). Серия диаграмм на рис.3.14(а1)-(а4) предназначена для выделения всплеска когерентности путем оценок для различных комбинаций из 3-х станций. Отметим, что на рис.3.14(а1)-(а4) допустимо сравнение максимальных значений меры когерентности, поскольку число одновременно анализируемых временных рядов одно и то же. Наибольший всплеск когерентности (0.65), наблюдается для станций Mag, Pet, Yak, расстояние от эпицентра Кроноцкого землетрясения для которых составляет 900, 350 и 2050 км; наименьший (0.32) – для станций Obn, Art, Yak, наиболее удаленных от очага землетрясения, на 6800, 5900 и 2050 км. Во всех вариантах на рис.3.14(а1)-(а4) мера когерентности претерпевает всплеск в окрестности метки 40000 минут, которая соответствует интервалу наблюдений 29.11-03.12.1997, то есть за 3-7 суток до толчка.
173
Рис.3.14. (а1)-(а4) – частотно-временные диаграммы эволюции спектральной меры когерентности временных рядов α * -вариаций при оценке в скользящем временном окне длиной 109 значений (5 суток) для различных комбинаций 3-х одновременно анализируемых станций. (б1)-(б4) – частотно-временные диаграммы эволюции спектральной меры когерентности временных рядов α * -вариаций для последовательно увеличиваемого числа одновременно анализируемых станций. На каждой диаграмме рядом с идентификаторами анализируемых станций проставлены максимальные значения меры когерентности.
Рис.3.14(б1)-(б4) представляет образ развития «пятна когерентности» на плоскости время-частота перед Кроноцким землетрясением по мере включения 174
все большего числа станций в совместную обработку (сверху вниз): он начинается с 3-х Pet, Yak, Mag, наиболее близко расположенных к очагу (3.14(б1)) и завершается всеми 6 станциями на рис.3.14(б4). Основной всплеск когерентности на рис.3.14(б1) сосредоточен в окрестности временных меток 40000-42000 минут и находится в самой низкочастотной части спектра, для периодов от 500 до 6000 минут. С учетом того, что метки на диаграммах соответствуют правому концу временного окна длиной 7200 минут (5 суток), этот всплеск соответствует интервалам времени 32800-42000 на рис.1 и 2 или 28.11-03.12.1997. Интересно отметить, что по мере приближения скользящего временного окна к моменту землетрясения уровень когерентности α * -вариаций падает, хотя и остается выше фоновых статистических флуктуаций. Остальные диаграммы на рис.3.14(б1)-(б4) дают
увеличение
временной
длительности
низкочастотного
«пятна
когерентности» по мере увеличения числа станций. Заметим, что на рис.3.14(б4), где в обработку включена станция Art, наиболее длительный всплеск когерентности прерывается для временных меток 33000-34000 минут, что объясняется наличием низкочастотного калибровочного импульса на записи Art для меток 32000-32960, о котором уже говорилось выше. Заметим кроме того, что интенсивный синхронный всплеск шума для временных меток 4920-6000 минут на рис.3.12, обусловленный вступлением от удаленного мощного землетрясения 08.11.1997, 10:02 GTM, M=7.9, широта = 35.08 град. СШ, долгота = 87.32 град. ВД, дал увеличение меры когерентности
α * -вариаций лишь на рис.3.14(а4) и 3.14(б4), причем для «высоких частот» с периодом около 160 минут. На рис.3.12 можно заметить еще несколько подобных же синхронных всплесков, которые также дали несущественное увеличение меры
κ (τ , ω ) . Конец интервала наблюдений, непосредственно примыкающий к вступлению от Кроноцкого землетрясения содержит весьма незначительные синхронные вариации на рис.3.12, которые включают в себя также 2 форшока. Как было подробно исследовано в (Соболев и др., 2005) с помощью вейвлетразложений, конец записей на станциях Obn, Yak, Pet, Yss, Mag содержит общие импульсы существенно низкочастотного характера, с периодами 10-60 минут, которые не являются результатом вступлений от близких или удаленных событий. Отметим, что 03.12.1997 началась мощная серия форшоковой активизации перед Кроноцким землетрясением. Как указано в работе (Соболев и др., 2005),
175
перед Кроноцким землетрясением
не было зарегистрировано аномальных
метеорологических эффектов. Корреляция записей низкочастотных микросейсм на станциях, удаленных друг от друга на тысячи километров, а по долготе на десятки градусов, говорит об общем источнике регионального характера. С учетом наибольшей корреляции для станций, расположенных в северо-восточной части Дальнего востока и Сибири, он предположительно располагался в этом районе. Вопрос об его природе остается открытым. Таким образом, в результате анализа эволюции спектральной меры когерентности вариаций значений обобщенного показателя Херста, реализующего максимум мультифрактальных спектров сингулярности поля
микросейсмических
колебаний,
выделен
эффект
синхронизации
микросейсмических шумов на севере Евразии за 3-7 суток до мощного Кроноцкого землетрясения на Камчатке 05.12.1997.
3.5. Выделение общих сигналов в сети наблюдений на берегах Каспийского моря. В этом параграфе рассматриваются временные ряды вариаций уровня Каспийского моря по синхронным измерениям на 15 береговых станциях за период наблюдений с начала 1977 года по конец 1991 года с интервалом опроса 6 часов. Ставится задача выделить в этом 15-мерном временном ряду коллективные (общие) компоненты, как стационарного, так и нестационарного характера. Целью исследования является анализ динамики Каспийского моря как сложной нелинейной системы путем статистического анализа изменения во времени различных масштабно-зависимых мер когерентного поведения результатов наблюдений в различных точках акватории. В данном случае используются временные ряды наблюдений за уровнем моря по 15 береговым станциям. Для анализа данных применялись оценки канонических когерентностей в скользящем временном окне, а также анализ агрегированных сигналов. Результаты
анализа
заключаются
в
обнаружении
общих
гармонических
составляющих, образующих полусуточные и суточные группы приливных гармоник,
сезонные
вариации,
частотную
полосу
вариаций
с
сильной
когерентностью в диапазоне периодов от 4 до 8 суток. Кроме того, удалось выделить низкочастотную общую гармонику с периодом 12.85 лет, которая предположительно связана с влиянием на вариации уровня Каспийского моря
176
циклических изменений глобального характера. Помимо этих результатов, в результате оценки робастной вейвлетной меры когерентности в скользящем окне, обнаружен общий сезонный эффект с тенденцией к понижению когерентности к концу интервала наблюдений и всплеск когерентного поведения длительность около года для вариаций, имеющих масштаб от 12 до 24 часов, который совпадает по времени с серией афтершоков сильного землетрясения 06 марта 1986 года в центральной части Каспия. Подчеркнем отличие подходов, используемых ниже, от других методов анализа многомерных наблюдений, широко практикуемых в метеорологии, гидрологии
и
атмосферной
физике,
например,
метода
эмпирических
ортогональных функций (МЭОФ) (Багров и др., 1985). Под МЭОФ понимается оценка собственных векторов ковариационной матрицы многомерного вектора наблюдений в нескольких пунктах путем усреднения по временным реализациям различной длительности и последующее построение пространственных карт путем интерполяции (тем или иным методом геостатистики) значений компонент собственных векторов (упорядоченных по убыванию собственных чисел), привязанных
к
координатам
пунктов
измерений,
в
узлы
регулярной
пространственной сетки точек. Настоящий подход акцентирует внимание на зависимости эффектов синхронного поведения исследуемых сигналов от периодов (в спектральном подходе) или от временных масштабов временных вариаций (в вейвлет-анализе), тогда как МЭОФ предназначен для выделения форм распределения геофизических полей по пространству и анализу изменения этих пространственных форм во времени. То есть, в нашем подходе рассматриваются эффекты синхронизации процессов в зависимости от их временных периодов, что выходит за рамки МЭОФ. Задачи, поставленные в этом параграфе, принципиально отличаются от тех, которые обычно решаются МЭОФ. В нашем подходе пространственные координаты пунктов измерения явно не участвуют, но принимаются во внимание косвенно, путем объединения анализируемых процессов в группы по принципу географической близости их пунктов
измерения.
Именно
так
и
делается
далее,
когда
отдельно
рассматриваются вся совокупность наблюдений, наблюдения в северной части Каспийского моря и в центральной ее части. Другим возможным подходом к анализу данных многомерных наблюдений является применение классических методов главных и канонических компонент
177
или факторного анализа (п.2.1). Фактически МЭОФ является методом главных компонент. Если исследовать не пространственное распределение значений компонент собственных векторов ковариационной матрицы, а вычислять проекции вектора наблюдений на собственные вектора в каждый момент времени, то
получится
совокупность
временных
рядов
–
главных
компонент,
упорядоченных по величине собственных чисел. Основным недостатком такого прямого применения классического многомерного анализа к временным рядам является отсутствие предварительного разложения исследуемых сигналов по их спектральному составу. Основной целью наших исследований является получение количественной меры когерентного поведения в зависимости от периода вариаций, причем эта мера должна оцениваться
не по всей выборке, а в
скользящем временном окне, чтобы имелась возможность оценки изменчивости синхронности
поведения
во времени. В качестве
такой меры берется
произведение модулей канонических корреляций (2.3.2) каждого из исследуемых сигналов с многомерным рядом наблюдений всех остальных сигналов. В случае использования ортогональных вейвлетов в качестве базисных функций мера когерентного поведения становится зависимой от т.н. масштабов временных вариаций, диапазонов
которые
можно
периодов,
грубо
ассоциировать
образующих
равномерную
с
последовательностью сетку
значений
в
логарифмической шкале. В качестве динамических колебаний уровня Каспийского моря обычно рассматриваются ветровые нагоны и сгоны, сейшевые и приливные колебания. Анализ сейшевых колебаний, выполненный в работе (Герман, 1970) на основании спектрального анализа рядов наблюдений различной продолжительности, позволил выделить периоды одноузловой (8.66 ч.) и двух узловой (4.39 ч.) сейши. В Среднем и Южном Каспии выделяются сейши с периодом 2 и 6 суток. Анализ приливных
колебаний,
выполненный
рядом
авторов
путем
обработки
мареографных записей, показал, что на Каспии преобладает полусуточный прилив с периодом, близким к 12.4 часа, и незначительный по величине. Непериодические
сгонно-нагонные
колебания
определяются,
в
основном,
характеристиками ветра и формой профиля дна прибрежной части моря.
178
Рис.3.15. (а) – целые числа соответствуют номерам и местоположениям 15 пунктов наблюдения за уровнем Каспийского моря, крестики – эпицентры землетрясений с магнитудой M ≥ 5.0 и глубиной эпицентра ≤100 км за интервал времени 1977-1991 гг., кружки – эпицентры землетрясений с магнитудой ≥ 6.0, штриховой линией выделена прямоугольная область повышенной сейсмичности; (б) – последовательность землетрясений с магнитудой ≥ 3.0 в выделенной области повышенной сейсмичности.
Перечисленные выше различные колебания уровня моря в прикладных задачах, как правило, учитываются раздельно, что обусловило применение различных моделей в разных частотных диапазонах. Тем не менее, задача
179
построения общей стохастической модели колебаний уровня Каспийского моря остается открытой, в связи с чем представлены результаты многомерного спектрального анализа данных уровнемерных наблюдений за период подъема уровня моря. На рис.3.15(а) схематически представлено расположение 15 береговых станций, результаты наблюдений которых были использованы для решения поставленной задачи. Номера станций даны в кодах, причем, для упрощения, отброшена стандартная комбинация «970» цифр начала кодов, например, станция с номером «48» реально имеет код 97048 и т.д. Кроме того, на этом же рисунке проставлены положения эпицентров землетрясений с магнитудами свыше 5 и 6, произошедших в Каспийском море и его прибрежных районах за период наблюдений, и прямоугольником выделен район с повышенной сейсмичностью на дне
моря
(использовался
глобальный
каталог
NEIC,
http://wwwneic.cr.usgs.gov/neis/). Рис. 3.15(б) представляет последовательность сейсмических событий в этом районе. Исходные временные ряды представляют собой последовательности синхронных измерений с шагом по времени 6 часов, начинающиеся 01 января 1977 года в 09:00 и заканчивающиеся в конце 1991 года. Общая длительность каждого анализируемого ряда равна 21908 отсчетов. Общее число станций равно 35, но для анализа было отобрано всего 15, так как только они не содержали пропусков в наблюдениях, превосходящих по длительности 2-х суток и, кроме того, общее число таких пропусков в каждом из рядов не превышало 10. Пропущенные данные перед анализом были восполнены по поведению на участках наблюдений, равных по длительности длине пропуска слева и справа от интервала пропуска с сохранением общего локального линейного тренда. Осцилляции отклонений от линейного тренда внутри интервала пропуска брались равными половине суммы таких же отклонений слева и справа от пропуска. Перед анализом производилась отбраковка выбросов в графическом редакторе.
180
Рис.3.16. Графики исходных временных рядов (интервал опроса 6 часов, номера пунктов наблюдений проставлены рядом) и их Фурье-агрегированного сигнала. Поверх графика агрегированного сигнала нанесена кривая циклического тренда с минимальной дисперсией остатка, период которого оказался равным 4691 суток (12.85 года).
Верхние 15 кривых на рис.3.16 представляют собой графики исходных данных, построенных в одинаковом масштабе (шкала по оси ординат приведена), метки справа связывают каждую кривую с пунктом наблюдений. Прежде всего, бросаются в глаза наличие общих сезонных (годовых) вариаций уровней и общего линейного тренда, отражающего повышение уровня Каспийского моря. Кроме того, следует отметить наличие большого шума в данных на пунктах 30 и 48, что 181
обусловлено их расположением в северной, мелководной части Каспийского моря и, как следствие этого, сильным влиянием ветровых нагонов на наблюдения. Последняя внизу кривая на рис.3.16 представляет собой график Фурьеагрегированного сигнала. Помимо сезонных вариаций видна низкочастотная составляющая большой амплитуды. Она была аппроксимирована циклическим трендом с неизвестным периодом, который определялся из условия минимума дисперсии остатка. Таким образом, была получена величина периода тренда, равная 4691 суток, что приблизительно составляет 12.85 года.
Рис.3.17. Произведение покомпонентных канонических когерентностей 15-мерного временного ряда синхронных измерений вариаций уровня Каспийского моря на различных береговых станциях. Оценка в скользящем временном окне, векторная ARмодель 5-го порядка. Рис.3.17(a) – для временных рядов с интервалом опроса 6 часов, длина временного окна 730 отсчетов (0.5 года), смещение окна 112 отсчетов (28 суток, т.е. лунный месяц). Рис.3.17(b) – для временных рядов после приведения к интервалу опроса 1 сутки, длина временного окна 730 отсчетов (2 года), смещение временного окна равно 28 отсчетов (также лунный месяц).
Как показано в работе (Любушин и др., 2004(b)), спектр мощности агрегированного
сигнала
(который
подчеркивает
общие
спектральные
182
составляющие и подавляет индивидуальные) содержит суточные и полусуточные группы пиков с периодами 21.74; 22.48; 23.94; 24.00; 24.07; 24.13 и 25.74 часов и 12.00; 12.03; 12.42; 12.66 часов, которые связаны с лунно-солнечными приливами и пологий, но статистически значимый максимум в области периодов от 4 до 8 суток. На
рис.3.17
отражены
результаты
исследования
нестационарности
коллективных эффектов вариаций уровней. На рис.3.17(a) представлена частотновременная диаграмма эволюции спектральной меры когерентности (2.3.2) при оценке в скользящем временном окне 730 6-часовых отсчетов (полгода). Смещение соседних окон бралось равным 112 отсчетам, что составляет 28 суток. Последнее значение было выбрано из соображений равенства смещения лунному месяцу, что позволяет каждое временное окно помещать в приблизительно одни и те же условия изменения гравитационного потенциала. На диаграмме 3.17(a) видны регулярные всплески меры когерентного поведения, приходящиеся на середину зимы и весну почти каждого года в частотной полосе с периодами от 2-х до 4-х суток. Отметим, что на спектре агрегированного сигнала эта полоса никак не
проявилась
коллективного
–
именно
поведения.
вследствие Что
же
резко
касается
нестационарного окрестности
эффекта
суточного
и
полусуточного периодов, то там видны всплески нестационарной меры коллективного
поведения,
незначительность
которых
вытекает
из
монохроматичности (сильной узкополосности) общих сигналов приливного происхождения и близости их субгармоник, которые трудно разрешить по частоте из-за относительно малой длины скользящего временного окна. На рис.3.17(b) представлена аналогичная диаграмма эволюции спектральной меры когерентного поведения (2.3.2), но оцененная для временных рядов после устранения линейных трендов и приведения длины интервала дискретизации к 1 суткам. По-прежнему длина временного окна бралась равной 730 отсчетам, которая теперь уже составляет 2 года. Что же касается смещения, то оно бралось прежним в абсолютном выражении – 28 суток, что равно 28 отсчетам. Наиболее примечательным
результатом
на
этой
диаграмме
мы
считаем
сильную
когерентность и стационарность эффекта когерентности вариаций в полосе частот с периодами от 4 до 8 суток. Этот факт находится в согласии с формой спектра агрегированного сигнала в этом диапазоне периодов. Что же касается возможного физического механизма возникновения такой сильной когерентности, то наиболее
183
вероятной
причиной
следует
считать
образование
ветровых
сейшей,
охватывающих сразу весь бассейн Каспийского моря. Отметим различие диаграмм 3.17(a) и 3.17(b) в общих частотных полосах, в частности, ярко выраженную сезонность на 3.17(a), которая отсутствует на 3.17(b). Для объяснения этого напомним, что длина временного окна в первом случае равна 0.5 года, а во втором – 2 года. Следовательно, при 2-годовом окне сезонный эффект усредняется и выдает в общей частотной полосе лишь равномерное по времени увеличение меры когерентности до средних значений 0.10-0.12.
Рис.3.18. Эволюция робастной вейвлетной меры когерентного поведения при использовании вейвлетов Хаара для временных рядов в приращениях наблюдений за уровнем Каспийского моря, длина скользящего временного окна – 360 6-часовых отсчетов, то есть 90 суток, параметр Lmin =16. Вариант (а) – все 15 рядов наблюдений, вариант (б) – наблюдения для 9 пунктов с номерами 7, 12, 17, 21, 65, 66, 73, 74 и 80 в центре Каспийского моря, вариант (в) – для 6 пунктов с номерами 27, 30, 49, 59, 60 и 61 на севере Каспия. Первые 4 уровня детальности, номеру уровня соответствует цифра после буквенного обозначения варианта. Первому уровню детальности соответствуют масштабы от 12 до 24 часов, 2-му уровню – масштабы от 24 до 48 часов, 3-му – масштабы от 2 до 4 суток, 4-му – от 4 до 8 суток. По осям абсцисс отложены значения времени – правого конца скользящего временного окна в сутках от начала 1977 года.
184
Следующим шагом является анализ тех же данных, но с помощью робастной вейвлетной меры (2.4.20). Параметры метода для оценки были выбраны следующими: N =360, Lmin =16, откуда следует, что β max =4. Выбранная длина скользящего временного окна при интервале опроса 6 часов равна 90 суткам, то есть примерно равна длине климатического сезона – 3 месяца. Такой выбор параметров способен уловить изменения меры когерентности, обусловленные как установившимися зимним и летним режимами (например, сильными ветрами во время осенне-зимних штормов, охватывающими всю акваторию моря), так и переходными осенними и весенними режимами выпадения осадков и испарения с поверхности моря. Кроме того, естественно ожидать появления сезонных изменений меры когерентности с годовым периодом. Для выбранных значений параметров были рассмотрены три варианта совместно анализируемых временных рядов: вариант (а) – совокупность всех данных, q =15; вариант (б) – данные с 9 станций 7, 12, 17, 21, 65, 66, 73, 74 и 80 из центра Каспия, q =9; вариант (в) – ряды с 6 станций 27, 30, 49, 59, 60 и 61 на севере Каспийского моря, q =6. Результаты полученных оценок приведены на рис.3.18. Прежде всего, обращает на себя внимание наличие сезонных всплесков меры когерентности на 2-4 уровнях детальности. Отметим, что пиковые значения чаще всего приходятся на конец года: на октябрь-декабрь месяцы (с учетом того, что временная метка относится к правому концу скользящего окна длиной 90 суток). Эти увеличения когерентного поведения могут быть объяснены высокой интенсивностью штормов в это время года, которые воздействуют на большую часть акватории. Однако
амплитуда
нестационарна.
сезонных
всплесков
меры
когерентности
весьма
В частности, имеет место резкое изменение ритма сезонных
всплесков меры когерентности на втором уровне детальности на рис.3.18(а2): они почти полностью исчезли после прошествия примерно 3600-3700 суток для метки правого конца временного окна от начала 1977 года, что соответствует августу 1986 г. – февралю 1987 г. Таким образом, конец 1986 г. – начало 1987 г. является интервалом времени, когда произошла смена режима пульсаций мер когерентности для временных масштабов от 24 до 48 часов. Поскольку вариант (а) на рис.3.18 относится к совместному анализу всех данных, то такая смена свидетельствует об уменьшении связи мелкомасштабных временных вариаций уровня моря в 185
различных точках акватории в последней трети интервала наблюдения. Отметим, что на рис.3.18(а3) и 3.18(а4) исчезновению сезонных ритмов на втором уровне детальности предшествуют значительные всплески когерентности на 3-ем и 4-ом уровнях для временных окон, покрывающих конец октября 1985 г. – конец января 1986 г. Кроме того, трудно объяснимым является резкий всплеск когерентности на самом мелкомасштабном, первом уровне детальности для варианта 3.18(а), который длится почти 1.5 года (рис.3.18(а1)). Всплеск соответствует меткам 35104000 дней для правого конца скользящего окна, что выделяет интервал времени от середины мая 1986 г. по середину декабря 1987 г. То, что этот всплеск не имеет сезонной составляющей и то, что он возникает на самом высокочастотном уровне детальности, позволяет высказать предположение, что его происхождение может быть связано с сейсмическими явлениями на дне Каспийского моря. На рис.3.15 представлена информация о сейсмическом процессе в течение интервала наблюдений в Каспийском море и ее окрестности. Мы видим, что центральную часть Каспия занимает область повышенной сейсмичности, выделенная на рис. 3.15(а) прямоугольником. Согласно (Доценко и др., 2004) эта область ответственна за возникновение волн цунами в Каспийском море. На рис.3.15(б) мы видим, что в области повышенной сейсмичности 06.03.1986 (3352 суток от начала 1977 г.) произошло сильное землетрясение с магнитудой 6.6, которое сопровождалось
длительной
серией
афтершоков
(повторных
толчков).
Примечательно, что 16.09.1989 и 17.09.1989 в этой области также произошли сильные землетрясения с магнитудами 6.6 и 6.1, но они не сопровождались длительными сериями афтершоками (рис.3.15(б)). Наше предположение о природе всплеска когерентности на рис.3.18(а1) заключается в том, что он обусловлен движениями земной коры на дне Каспия в течение серии повторных толчков после землетрясения 06.03.1986. Чтобы подтвердить это предположение, полный набор временных рядов был разбит на 2 части – вариант (б) соответствует 9 рядам наблюдений в центре Каспия, а вариант (в) – 6 рядам наблюдений из северной части. Результаты оценки статистики κ (τ , β ) для этих вариантов также представлены на рис.3.18. Из сравнения рис.3.18(а1), 3.18(б1) и 3.18(в1) мы видим, что природа всплеска значений κ (τ , β ) действительно локализована в центральной части Каспия – для 6 рядов из северной части этот всплеск практически отсутствует. Это означает, что
186
коллективная составляющая вариаций уровня моря, обусловленная причиной, генерирующей всплеск на рис.3.18(а1) и 3.18(б1) слишком мала для варианта (в) и она не способна пробиться сквозь сильные локальные шумы в результате многомерной обработки. Северная, значительно более мелководная, часть Каспия, по всей видимости, характеризуется своими, более интенсивными, общими сигналами, связанными с изменением режима стока воды Волги, наличием ледового покрова зимой и особенностями морфологии и динамики морского участка дельты Волги. Эти причины коллективных сигналов присутствуют в центральной части Каспия, но там они, в свою очередь, ослаблены фоном местных общих сигналов. Этим объясняется различия в поведении величины κ (τ , β ) на уровнях детальности 1-3 для вариантов (б) и (в) на рис.3.18. Что касается 4-го, наиболее низкочастотного уровня детальности, то на нем статистика когерентного поведения ведет себя значительно более однородно для всех вариантов, несмотря на присутствие индивидуальных особенностей. Это вполне естественно, так как низкочастотные вариации
должны
характеризоваться
большим
пространственным
«дальнодействием». Интересной особенностью рис.3.18(в1) является то, что он подобен рис.3.18(а2) – и тут и там мы наблюдаем одну и ту же точку смены режима пульсаций меры когерентности, приходящуюся на конец 1986 г. Этому факту может быть дана следующая интерпретация: наблюденная точка разладки поведения статистики κ (τ , β ) имеет причину, локализованную в северной части Каспия (возможно изменение стока Волги) – поэтому для варианта (в) мы ее наблюдаем как на 1-ом, так и на 2-ом уровнях детальности. При анализе всей совокупности временных рядов (вариант (а)) проявления этой причины исчезают на 1-ом уровне детальности, поскольку он характеризует высокочастотные вариации,
имеющих
наименьший
пространственный
радиус
корреляции.
Получается так, что движения земной коры, предположительно генерирующие всплеск когерентности на рис.2(а1) и 2(б1), для первого уровня детальности имеют больший радиус пространственной корреляции, нежели изменения стока Волги (также предположительно), ответственные за смену поведения статистики
κ (τ , β ) в конце 1986 г. Таким образом, в результате применения метода многомерного вейвлетанализа к обработке временных рядов наблюдений за уровнем Каспийского моря
187
в 1977-1991 гг. выделены 2 аномалии поведения статистики когерентного поведения. Первая аномалия заключается во всплеске когерентного поведения, покрывающего интервал времени май 1986 г. – декабрь 1987 г. для временных масштабов вариаций 12-24 часа. Причина, порождающая эту аномалию, локализована в центральной части Каспия и, предположительно, связана с движениями земной коры на дне моря в течение длительной серии повторных толчков после землетрясения 06.03.1986. Вторая аномалия заключается в изменении режима сезонных всплесков меры когерентного поведения в конце 1986 г. и причина, порождающая эту аномалию, локализована в северной мелководной части Каспия. Предположительно она связана с изменением гидрологического режима мелководной северной части моря и морской части дельты Волги при резком подъеме уровня воды в Каспии. Еще одной причиной, приводящей к среднему уменьшению когерентности наблюдений к концу интервала 1977-1991 гг. может служить региональные изменения атмосферной циркуляции, вследствие чего сильные ветровые потоки, формирующие сезонные всплески когерентности вариаций уровня, охватывают не всю акваторию Каспийского моря, а лишь ее части. В связи с эти отметим, что на частотно-временных диаграммах на рис.3.16 к концу интервала наблюдений когерентность также падает во всех частотных полосах, где ее значение существенно превосходит фон.
3.6. Коллективные компоненты стока рек и их климатическое происхождение. Одной из важнейших задач гидрологии является объяснение механизма долгопериодных
колебаний
речного
стока,
подбор
подходящего
класса
математических моделей и верификация конкретной модели с использованием имеющейся, как правило ограниченной, информации по стоку рек. Интерес к этим проблемам
определяется
как
их
очевидной
практической
важностью
(многочисленные аспекты задачи управления водными ресурсами) так и явной связью с глобальными климатическими процессами в атмосфере и гидросфере в целом. Традиционно
соответствующие
временные
ряды
являются
объектом
применения различных статистических методов анализа данных. (Привальский и др., 1992, Kashyap, Rao, 1976). Здесь следует отметить, что попытки
188
детерминистического описания многолетних колебаний стока пока не привели к каким-либо успешным результатам, хотя, конечно, на понятийном уровне очевидна связь стока с глобальными климатическими изменениями самых различных масштабов (от геологических до погодных). По-видимому, модель взаимодействия природных процессов в системе океан-атмосфера-суша пока практически приемлемо описывается лишь на уровне стохастических моделей взаимодействия отдельных компонент. Ниже рассматриваются временные ряды среднемесячных расходов воды в ряде рек Европы и Европейской части бывшего СССР. Целью анализа является исследование эффектов коллективного поведения вариаций среднемесячного речного стока, возникающих одновременно во всех анализируемых временных рядах. Эффекты коллективного взаимодействия элементов в больших системах привлекли за последнее время большое внимание в связи с изучением свойств нелинейных динамических систем и детерминированного хаоса. Систему рек, охватывающую
большие
площади,
вместе
с
атмосферной
циркуляцией,
воздействующей на режим речных стоков, также можно рассматривать как большую, распределенную, нелинейную динамическую систему. Поэтому исследование возможных эффектов взаимодействия в этой системе представляет известный интерес (Любушин и др., 2003). Эффекты коллективного поведения (когерентности) выделялись двумя способами: оценкой эволюции постоянной Херста для различных рек и путем оценки изменения спектральной меры (2.3.2) коллективности вариаций в заданной частотной полосе. Оценки всех характеристик вычислялись в скользящем временном окне длиной 12-30 лет. Выбор таких длин временного окна диктуется методическими соображениями, поскольку они составляют от одной четвертой до одной трети длин имеющихся временных рядов (соответствует минимуму, позволяющему проследить изменчивость статистических свойств) и, кроме того, достаточно велика, чтобы усреднить влияние известных климатических факторов, например, 11-12-летней периодичности солнечной активности. Конечно, с точки зрения статистической устойчивости полученных результатов, длины окон 12-30 лет являются
весьма
критическими.
Но,
к
сожалению,
имеющиеся
длины
инструментальных записей расхода воды в реках не позволяют увеличить эту длину.
189
Рис.3.19. Графики временных рядов среднемесячных стоков некоторых рек длительностью 100-150 лет, масштаб по осям времени одинаков. Возможно ли их использование для выделения долгопериодных (с периодами порядка нескольких десятков лет) климатических сигналов?
Следует также подчеркнуть, что, хотя длины анализируемых временных рядов сравнительно невелики (около 100 лет) по сравнению с периодами (40-50 лет) тех эффектов, которые желательно выделить, использованная методика, по своей сути, основана на оценке коллективных модулирующих свойств рядов на основном «несущем» периоде 1 год. Вариации на годичном периоде являются статистически значимыми при использованном длинах окон. Поэтому оценки изменчивости эффектов когерентного поведения в окрестности периода 1 год
190
являются статистически обоснованными имеющимися длинами выборок, в отличие, например, от прямой оценки спектров мощности на периодах 40-50 лет. На рис.3.19 представлены графики временных рядов среднемесячных стоков на территории бывшего СССР, в Европейской части России, Белоруссии и Украине.
Этот
набор
данных
включает
в
себя
реки,
находящиеся
в
различающихся климатических условиях (зоны как дождевого так и снегового питания),
а
пункты
измерений
характеризуются
сравнительно
хорошей
представительностью информации об ее водном режиме (большая длительность времени инструментальных записей и отсутствие крупных гидротехнических сооружений). Все рассматриваемые реки находятся в области действия атлантических циклонов и, в этом смысле, находятся в одной глобальной климатической зоне. Момент начала наблюдений для различных временных рядов существенно различается. В тех случаях, когда метод анализа требовал совместной обработки всех рядов (спектральная мера когерентности), то начальный момент выбирался общим и равным сентябрю 1901 года. Выбор пунктов наблюдений за расходом рек осуществлялся с учетом следующих условий: число пропусков минимально (максимальная длительность – не более 2-х лет), расход воды в реках не определяется работой гидротехнических сооружений
(т.е.
максимально
незарегулирован).
Небольшие
интервалы
пропусков восполнялись, исходя из поведения временных рядов по обе стороны пропущенного интервала такой же длины: в каждый месяц с пропущенным данным бралось среднее значение расходов воды по тому же месяцу слева и справа от концов интервала. Такое простое восполнение пропущенных данных в этом случае сохраняло спектральную структуру временного ряда. Поскольку длина
интервалов
пропущенных
данных
была
невелика
(не
более
24
среднемесячных значений), а анализ проводился в скользящем временном окне длиной 30 лет (360 значений), влияние пропусков на конечный результат было незначительно.
Последнее
утверждение
проверялось
путем
внесения
искусственных пропусков заданной длины, их восполнением по вышеописанному правилу и сравнением результатов обработки исходных данных и искусственно искаженных. Используемый
метод
восполнения
пропусков,
возможно,
далек
от
оптимального, но его качество оказалось вполне удовлетворительным. Кроме того, отбор пунктов наблюдения по критерию минимального числа пропусков
191
является решающим фактором, снижающих их влияние. Другие, более изощренные
методы
восполнения
пропусков,
например
использующие
информацию о расходе воды в близких реках, сходных по водному режиму, где пропуски регистрации отсутствовали, зачастую невозможно было применять по причине, что чаще всего отсутствие регистрации наблюдалось одновременно по обширным регионам, и связано было с ведением военных действий периода Великой Отечественной и Гражданской войн.
Рис.3.20. Графики изменений оценок постоянных Херста в скользящем временном окне длиной 30 лет для временных рядов речных стоков на рис.3.19.
192
На рис.3.20 представлены графики изменений оценок постоянных Херста (согласно формулам (1.8.10)-(1.8.12)) в скользящем временном окне длиной 30 лет для временных рядов, представленных на рис.3.19. В левой колонке графиков обращает на себя внимание наличие общего элемента на всех кривых, за исключением Северной Двины: увеличения постоянной Херста для скользящих окон с центрами в 1920-1940 гг. Эта особенность имеет видимый период около 40-50 лет и присутствует во всех временных рядах с различной степенью выраженности, несмотря на различие в географическом положении. Таким образом, налицо свидетельство о наличии некоторой общей компоненты во временных рядах речных стоков. Рис.3.20 также содержит оценки эволюции постоянной Херста для рек второй группы,
в
правой
колонке
графиков,
для
которых
также
выделяется
«квазипериодичность» с видимым периодом 40-50 лет, однако, в отличие от рек первой группы, эта квазипериодичность не во всех рядах синхронна. Тем не менее и для них кривые эволюции постоянной Херста содержат очевидные общие черты поведения. Причем, максимум кривых приходится примерно на тот же период, что и для 1-ой группы – на середину 1930-х годов. При сравнении вариаций постоянных Херста мы ограничились чисто визуальным анализом и не привлекали каких-либо количественных критериев, например, вычисления коэффициентов корреляции, по следующей причине. Кривые имеют чрезвычайно низкочастотный характер на тех временных интервалах, на которых они оценены. Известно, что в этом случае оценки коэффициентов корреляции являются сильно смещенными и могут быть произвольно изменены за счет очень небольшого сдвига по фазе для низких частот. Поэтому чисто качественный визуальный анализ в такой ситуации является более объективным инструментом. Разумеется, мы вынуждены отказаться от количественного сопоставления кривых вариаций постоянных Херста лишь по причине критического недостатка данных. В работе (Любушин и др., 2003) для выделения частотно-зависимых когерентных эффектов во временных рядах стока использовалась спектральная мера когерентности (2.3.2). Однако, ввиду сильно негауссова характера исследуемых сигналов, в частности, большого числа выбросов (рис.3.19), представляется, что вейвлет-анализ в данном случае будет более уместным. Даже беглый взгляд на графики вариаций речных стоков приводит к мысли о том, что
193
эти сигналы мало похожи на стационарные гармонические колебания, для которых спектральные методы, основанные на использовании Фурье-разложений, являются наилучшим выбором.
Рис.3.21. (a1)-(a3) – робастная вейвлетная мера когерентного поведения на первых 3-х уровнях детальности для среднемесячных стоков 7 рек: Гломма, Луара, Дунай, Эльба, Висла, Ока, Сев. Двина. Сентябрь 1901 г. – декабрь 1979 г. Длина окна 12 лет, вейвлет Хаара, Lmin = 16 , без перехода к приращениям. На 3-м уровне детальности (годовые вариации) когерентность модулируется колебанием с периодом 46 лет. (б1)-(б3) – то же самое для 5 рек: Дунай, Эльба, Висла, Ока, Сев. Двина. Сентябрь 1901 г. – декабрь 1984 г. Когерентность на 3-м уровне детальности модулируется колебанием с периодом 51 год.
На рис.3.21(а1)-(а3) представлены графики эволюции робастной меры когерентности (2.4.20) для 7 рек. Оценка производилась в окне длиной 144 отсчета (12 лет). Такой выбор обусловлен максимальным округленным значением известного периода солнечной активности. Длина окна и выбранное значение порога представительности Lmin =16 определяет номера уровней детальности, возможных для анализа – их три. Третий уровень детальности охватывает 194
временные масштабы от 8 до 16 месяцев и, следовательно, включает в себя период годовых вариаций сток (12 месяцев). Как и следовало ожидать, уровень когерентности на 3-м уровне максимален, причем заметна циклическая модуляция когерентности, гораздо более выраженная, чем при спектральном подходе в (Любушин и др., 2003). Период циклического тренда был оценен путем подгонки тренда с неизвестным периодом, который выбирался из условия минимума дисперсии остатка после вычитания тренда. Этот период оказался равным 552 месяцам или 46 годам. Учитывая малую длительность наблюдений, это значение можно считать
вполне
соответствующим
ранее
найденным
климатическим
периодичностям. Однако можно рассмотреть вопрос об устойчивости значения этого найденного периода по отношению к составу совместно анализируемых временных рядов речных стоков. С этой целью удалим 2 временных ряда – Гломму (поскольку там явно присутствует антропогенное изменение стока в самом конце ряда) и Луару (временной ряд для которой заканчивается раньше всех). На
рис.3.21(б1)-(б3)
представлены
оценки
меры
когерентности
для
оставшихся 5 временных рядов. На рис.3.21(б3) мы видим, что когерентность на 3-м уровне детальности сохранила циклическое поведение и ее период увеличился – он стал 609 месяцев или примерно 51 год. Таким образом, многомерный
анализ
позволяет
выделить
скрытые
периодичности
климатического происхождения в вариациях стока рек.
3.7. Многомерный вейвлет-анализ сейсмического процесса. Как уже отмечалось в п.2.6, непосредственное применение мер когерентного поведения разработанных для временных рядов, к многомерным потокам событий, встречает ряд принципиальных трудностей, связанных с том, что временные ряды, образуемые из точечных процессов, являются сильно негауссовыми, характеризуются большими выбросами или скачкообразными изменениями
и
длительными
интервалами
постоянных
значений,
соответствующих временным интервалам отсутствия событий (затишьям). Вейвлет-разложение таких сигналов, тем не менее, может быть инструментом, позволяющим применять к точечным процессам метода для временных рядов – в
195
силу временной локализации влияния выбросов и скачков из-за финитности базисных функций. Ниже будет рассмотрен пример применения робастной вейвлетной меры когерентности к анализу всплесков синхронного поведения сейсмического процесса. На рис.3.22 изображено распределение эпицентров землетрясений с магнитудами M≥4.5, глубинами ≤ 100 км за период 1963 – 2005 г. в регионе Японии, Курильских островов и Камчатки и разбиение региона на 7 областей: J1J5,
KN
и
KS.
Использовался
глобальный
каталог
NEIC
(http://wwwneic.cr.usgs.gov/neis/), для которого используемый нижний порог магнитуд является представительным на рассматриваемом промежутке времени. Разбиение было произведено чисто визуально, из соображений оконтуривания больших кластеров сейсмичности, мнемоника для названий областей довольно прозрачна: “J” – Япония, “K” – Камчатка и Курилы, соответственно северная и южная половины. На рис.3.23 изображены ряды приращений кривых Беньоффа (накопленных значений корней квадратных из выделившихся энергий землетрясений) в соответствующих областях с шагом по времени 5 суток после проведения определенных операций масштабирования в окне адаптации длиной 5 лет. Видно, что
анализируемые
временные
ряды
имеют
существенно
негауссов
и
нестационарный характер, что делает фактически невозможным их анализ с помощью Фурье-методов. Таким образом, задача состоит в том, чтобы выделить интервалы
времени,
когда
эти
временные
ряды
имеют
коллективную
составляющую. Очевидно также, что наиболее подходящим вейвлетом для анализа таких данных является вейвлет Хаара. На рис.3.24 изображены графики изменения вейвлетной меры когерентного поведения κ ( A) (τ , β ) , сопряженной с вычислением агрегированного сигнала (формула (2.5.4)), для 7-мерного временного ряда, изображенного на рис.3.23. Как отмечалось в п.2.5, меры (2.5.4) более предпочтительны для анализа сигналов с сильными выбросами, чем чисто оконные статистики (2.4.20)..
196
Рис.3.22. Эпицентры землетрясений с магнитудой ≥ 4.5, глубина ≤ 100 км, 1963 - 2005 гг. в регионе (Япония, Курилы, Камчатка) и его разделение на 7 частей.
Оценка была сделана в скользящем временном окне длиной 5 лет. При такой длине окна эффекты синхронизации могут быть исследованы на первых 5 уровнях детальности, соответственно для вариаций, имеющих масштабы 10-20, 20-40, 4080, 80-160 и 160-320 суток (рис.3.24(б1)-3.24(б5)). На графике 3.24(а) представлено число сильнейших землетрясений региона (с магнитудами от 6 и выше) при их оценке в скользящем окне длиной 10 лет. Видно, что конец интервала
наблюдений
характеризуется
очень
сильным
увеличением
сейсмичности
197
Рис.3.23. Нормированные приращения кривых Беньоффа для сейсмических областей на рис.3.21 с равномерным шагом по времени 5 суток.
198
Рис.3.24. Сценарий синхронизации сейсмического режима региона (Японии, Курилы, Камчатка), 1963 – 2005 гг. (а) – число землетрясений с магнитудой ≥ 6.0, глубина ≤ 100 км, в последовательных временных окнах длиной 10 лет. Рис.(б1)-(б5) – всплески робастной вейвлетной меры когерентности временных рядов приращений кривых Беньоффа с шагом по времени 5 суток (рис.3.22) в скользящем окне 5 лет. Пунктирная линия – сценарий синхронизации миграции всплесков меры когерентности от больших временных масштабов к малым.
Рис.3.24(б1)-3.24(б5) дают довольно сложную картину эволюции всплесков синхронного поведения. В частности, можно выделить сценарий, состоящий из последовательной миграции всплесков от крупномасштабных (низкочастотных) уровней детальности ко все более и более мелкомасштабным (высокочастотным). На рис.3.24 этот сценарий отмечен пунктирной линией. Отметим, что в 199
литературе по исследованию критических явлений такая закономерность (рост частоты вариаций), предшествующая катастрофическим изменениям, уже давно исследовалась для анализа как геофизических, так и финансовых данных (Sornette et al., 1996), но вне рамок многомерного анализа данных, что резко суживает применимость область применения сценария. Отметим, что выход на 2-й уровень детальности (рис.3.24(б2)) как раз предшествует активизации сейсмичности региона (рис. 3.24(а)). Имеющийся опыт выделения интервалов времени и частотных полос (или временных масштабов) увеличения коллективного поведения геофизических полей показывает, что проявления разнообразных эффектов их синхронизации часто предшествует сильным землетрясениям (Любушин, 2003). Однако единичное событие увеличения коллективности поведения не дает полной картины взаимодействия геофизических полей в процессе подготовки сильного землетрясения. Значительно более информативная картина создается в результате выделения определенных сценариев синхронизации – последовательностей всплесков меры коллективного поведения, наблюдаемой на различных временных масштабах. В частности, одним из перспективных сценариев синхронизации является миграция всплесков меры коллективного поведения в высокочастотную область по мере приближения к катастрофе. Отметим, что в работе (Любушин, 2000(b)) кривые Беньоффа анализировались без перехода к приращениям, что имело своей целью именно уменьшение влияния катастрофических выбросов, возникающих в случае рассмотрения величин сброса упругих напряжений за малый равномерный промежуток времени (шаг дискретизации временного ряда). Неробастный анализ временных рядов, имеющих такие выбросы, априорно представлялся
проблематичным
(хотя
и
формально
возможным).
При
использовании робастных схем агрегации этот довод исчезает, поэтому возможно рассмотрение временных рядов приращений кривых Беньоффа за один и тот же промежуток времени, что является безусловно более предпочтительным, чем анализ кумулятивных кривых, с точки зрения избавления от доминирующего влияния низких частот.
200
3.8. Выделение вступлений сейсмических волн при мониторинге гидроразрывов. Этот, заключительный параграф последней главы, является наиболее «техническим», поскольку он посвящен изложению метода определения вступлений сейсмических волн в задачах межскважинной сейсморазведки в условиях больших шумов (Любушин, 2006). Однако методы, разработанные для автоматической отбраковки сбойных сейсмических трасс, фактически, являются ничем иным, как формализацией понятий «зашумленного временного ряда» и могут быть использованы для решения других задач мониторинга. В равной степени это же относится и к введенным понятиям много-уровненных мер нестационарности. Задача определения моментов вступлений P и S-волн и их годографов является одной из самых рутинных и важных в практике анализа сейсмических данных и мониторинга слабых сейсмических событий в литосфере, в частности, для задач локализации источников сейсмической эмиссии (Seismic signals analysis…, 1982; Hatton et al., 1986; Pisarenko et al., 1987; Гамбурцев, 1992; Гашин, Кушнир, 1998; Кушнир, Хайкин, 2000). Большой объем сейсмических данных, особенно
в
задачах
сейсмического
мониторинга
слабых
событий
и
сейсморазведки, при наличии высокого уровня шума и большого числа сбойных трасс, делает весьма актуальной проблему автоматизации детектирования вступлений. Ниже рассматривается новый метод для решения этой задачи, основанный на использовании компактных ортогональных базисных функций (вейвлетов) для разложения исходных сигналов и адаптивного анализа главных компонент
для
подавления
шума.
Преимущества
вейвлет-анализа
перед
классическим разложением Фурье хорошо известны и вытекают из компактности базисных функций. Применение вейвлет-анализа к обработке сейсмических данных позволяет создавать новые методы для идентификации и классификации сигналов. Одним из недостатков использования ортогональных вейвлетов является слабая разрешающая способность по частоте, что является оборотной стороной
хорошей
разрешающей
способности
по
времени.
Увеличение
частотного разрешения вейвлет-анализа в методе достигается использованием вейвлет-пакетов. Следует заметить, что рассматриваемый метод может быть реализован с использованием обычной полосовой Фурье-фильтрации, но результат при этом будет гораздо менее точным и устойчивым.
201
Метод будет изложен в виде последовательности пунктов с параллельной иллюстрацией каждой операции на примере обработки реальных данных. Данные представляют собой сейсмограммы из базы данных по натурному эксперименту Cotton Valley, East Texas, по идентификации событий (гидроразрывов – раскрытия трещин под воздействием гидравлического давления), инициированных закачкой воды под давлением в газовый коллектор (Maxwell et al., 1998, Zino et al., 1998; Maxwell et al., 2000). События регистрировались после завершения переходных процессов после закачки воды системой 3-компонентных (3C) геофонов, погруженных в скважину и расположенных на расстоянии 50 метров друг от друга. Частота опроса равна 1000 Гц, общее число геофонов – 45, число отсчетов в каждой скалярной (1С) трассе равно 400. Исходные данные представлены на рис.3.25 отдельно для X, Y и Z-компонент. Каждой 3C записи присвоен номер, увеличивающийся от 1 до 45 по мере углубления в скважину. Данные были предоставлены для тестирования метода доктором Дэвидом Лесли (David Leslie) из
Исследовательского
центра
Шлюмберже
в
Кембридже
(Schlumberger
Cambridge Research). Этот пример данных является типичным для эксперимента. Как нетрудно заметить, данные содержат большое число сбойных 1C трасс. В то же время, много таких 3C записей, в которых не все компоненты являются плохими. Таким образом, необходимо создать метод автоматической отбраковки плохих 1C трасс. Качественно 3C записи можно классифицировать на «полностью плохие» (все 3 скалярные трассы являются сбойными), «частично хорошие» (когда 1 или 2 скалярные трассы пригодны для последующего анализа) и «полностью хорошие». В дальнейшем для 1C трасс будут использования обозначения типа “X-21”, “Z02”, “Y-14” с очевидной мнемоникой – первая буква означает компоненту, а последующая цифра – номер 3C трассы на рис.1. Метод не должен отказываться от всей информации, содержащейся в 3C записи в том случае, если одна или даже 2 скалярные компоненты являются плохими – любая кондиционная 1C трасса должна быть использована. В случае, если 3C трасса является «полностью хорошей» или содержит 2 хорошие 1C трассы, возможно применение метода главных компонент для дополнительного подавления шума. Для 3C сейсмических записей метод главных компонент есть ничто иное, как поляризационный анализ (Kanasewich, 1981)
202
203
Рис.3.25. Исходные данные сейсмического мониторинга гидроразрывов, соответственно X, Y и Z-компоненты. По оси абсцисс – номера временных отсчетов (частота опроса 1000 Гц), по оси ординат – номера трасс, соответствующие 3-компонентным сейсмическим датчикам, расположенным в скважине с шагом 50 метров в глубину. Одиночным восклицательным знаком помечены скалярные трассы, выделенные как сбойные на 1-ой стадии автоматического контроля качества, двойными восклицательными знаками – выделенные как сбойные на 2-ой стадии контроля. На каждом из графиков изображены линии гиперболических годографов моментов вступления – по времени сначала для P-волн, затем для S-волн.
Метод представляет собой следующую последовательность операций: 1. Вейвлет-пакетное разложение всех 1C трасс. 2. Оценка вариаций много-уровненной меры нестационарности для всех 1C трасс. 3. Контроль качества 1C трасс с использованием много-уровненной меры из п.2, нормализованной энтропии распределения квадратов вейвлет-коэффициентов и критерия отношения энергии «высоких частот» к энергии «низких частот» – для автоматической маркировки плохих 1C трасс. 4. Вычисление адаптивных главных компонент для всех полностью или частично хороших 3C трасс в перекрывающихся вейвлет-пакетных частотных полосах и в масштабно-зависимых скользящих временных окнах. 5. Оценка вариаций много-уровненной меры нестационарности для всех масштабно-зависимых главных компонент. 6. Определение начальных оценок моментов времени вступления S-волн, используя максимальные значения мер нестационарности, вычисленных в п.5. 7. Корректировка начальных оценок моментов времени вступления S-волн и идентификация гиперболического годографа S-волн с помощью итеративной робастной процедуры подгонки его параметров. 8. Определение начальных оценок моментов времени вступления P-волн, используя максимальные значения мер нестационарности, вычисленных в п.5 для моментов времени строго до моментов вступления S-волн, определенных в п.7. 9. Корректировка начальных оценок моментов времени вступления P-волн и идентификация гиперболического годографа P-волн с помощью итеративной робастной процедуры подгонки его параметров. Ниже каждый пункт этой последовательности будет описан детально. На рис.3.25 помимо исходных данных изображены также конечные оценки годографов P и Sволн. 1. Вейвлет-пакетное разложение. Ортогональное вейвлет-пакетное разложение сигнала
x(t ) , аналогично
формуле (1.6.14), запишем в виде суммы:
mq
q
x(t ) = const + ∑∑ x ( β ,γ ) (t ) + β =1 γ =1
m
∑ β
x ( β ) (t )
(3.8.1)
= mq +1
204
где q = 2r , r = 1, 2,3,... задает число подуровней, на которое расщепляется обычный уровень детальности. Компоненты x ( β ,γ ) (t ) частотно-упорядочены и локализованы в полосе, заданной формулой (1.6.15). Отметим, что специфика формулы для вейвлет-разложения (поскольку такую же или подобную ей формулу можно записать и при использовании многополосной Фурье-фильтрации), состоит именно в использовании полного ортогонального
базиса
финитных
функций.
В
этом
случае
влияние
короткоживущих всплесков (как шумов, так и полезных сигналов) неминуемо ограничено по времени, тогда как использование базиса синусов-косинусов, в силу неограниченности их носителя, приводит к возникновению побочных эффектов фильтрации (особенно для сигналов с небольшим числом отсчетов), состоящих
в
«глобализации»
влияния
локальных
всплесков
на
весь
обрабатываемый временной интервал. В конечном итоге эти побочные эффекты приводят к расплыванию фронтов сейсмических волн после фильтрации и уменьшению точности определения моментов вступлений. В дальнейшем будем использовать только значение q = 8 . В этом случае компоненту x ( β ,γ ) (t ) назовем γ -ой октавой уровня детальности с номером β . Для вейвлет-пакетного разложения будет использоваться базисную функцию Добеши 8-го порядка, обнуляющую 4 первых момента, для которой фильтр дискретного времени содержит 8 ненулевых коэффициентов. Этот выбор является результатом большого числа экспериментов с вейвлетами других порядков, а также с автоматическим выбором вейвлета из критериев типа минимума энтропии. Значение 8 для порядка вейвлета оказалось наилучшим для анализа сейсмических данных: его базисная функция одновременно является и достаточно компактной (с ростом порядка его носитель расширяется) и достаточно гладкой (с уменьшением порядка в финитной базисной функции появляются точки разрыва производных).
205
Таблица 3.8.1. Значения минимальных и максимальных периодов первых 17 перекрывающихся вейвлет-пакетных частотных полос длиной 6 октав. Номер
α полосы
Период
Период
(α ) Tmin
(α ) Tmax
Номер
α полосы
Период
Период
(α ) Tmin
(α ) Tmax
1
2.000
3.200
10
4.267
7.111
2
2.133
3.556
11
4.571
8.000
3
2.286
4.000
12
4.923
8.533
4
2.462
4.267
13
5.333
9.143
5
2.667
4.571
14
5.818
9.846
6
2.909
4.923
15
6.400
10.667
7
3.200
5.333
16
7.111
11.636
8
3.556
5.818
17
8.000
12.800
9
4.000
6.400
Вейвлет-пакетное разложение позволяет выделить составляющие сигнала в пересекающихся частотных полосах, состоящих из заданного числа
p
примыкающих друг к другу октав, которые, в то же время, могут принадлежать разным уровням детальности. Эти вейвлет-пакетные частотные полосы смещены друг относительно друга на одну октаву и дают детальное частотно-временное разложение сигнала. Зададим число p примыкающих друг к другу октав. Тогда можно
определить
целочисленный
индекс
α = 1,..., α max ,
нумерующий
последовательно пересекающиеся вейвлет-пакетные частотные полосы длиной по (α ) p октав с постепенно увеличивающимися границами максимальных Tmax и
(α ) периодов. Значения ( p, α max ) являются параметрами метода и минимальных Tmin
определяют частотное разрешение (параметр p ) и частотный диапазон (параметр
α max ) вейвлет-пакетного анализа. Для обработки примера данных были выбраны значения
p = 6, α max = 17 . В Таблице 3.8.1 приведены соответствия между
минимальными и максимальными периодами частотных полос для выбранных значений параметров ( p, α max ) , измеренных в единицах длины интервала дискретизации Δt .
206
Обозначим через z j , k (t ), j = 1,..., N t r ; k = 1, 2,3; t = 1,..., L
(3.8.2)
совокупность всех 1C сейсмических трасс. Здесь N t r – полное число 3C записей (45 в нашем случае), L – число отсчетов в каждой 1C трассе (400 в нашем случае), индекс k = 1, 2,3 соответствует X, Y и Z-компонентам. Таким образом, первая операция метода состоит в вычислении матрицы: z (jα, k) (t ), α = 1,..., α max
(3.8.3)
соответствующей системе перекрывающихся частотных полос. 2. Много-уровненная мера нестационарного поведения. Пусть z (jα, k) (t ) – какаянибудь компонента частотной полосы с номером α скалярной сейсмической (α ) ) трассы z j , k (t ) . Возьмем скользящее временное окно радиуса M (α ) = int(Tmax
отсчетов с центральной точкой τ и вычислим дисперсию составляющей полосы
α на левой и на правой половинах скользящего окна:
(σ (jα, k) (τ | L)) 2 =
τ −1
∑
t =τ − M
(σ
(α ) j, k
(τ | R)) = 2
(α )
τ + M (α )
∑
t =τ +1
(z (jα, k) (t )) 2 / M (α ) ,
(z
(3.8.4) (α ) j, k
2
(t )) / M
(α )
Вычислим разницу между дисперсиями, после чего просуммируем эти разности по всем полосам:
μ (jα, k) (τ ) = ((σ (jα, k) (τ | L)) 2 − (σ (jα, k) (τ | R)) 2 ) 2 , α max
μ j , k (τ ) = ∑ μ (jα, k) (τ )
(3.8.5)
α =1
Если для какого-то значения τ статистика (3.8.5) имеет локальный минимум, это означает, что существует значительная разница между поведением сигнала слева и справа от точки τ . Суммирование в формуле (3.8.5) обеспечивает
207
подавление сильных шумовых составляющих, которые некоррелированны между собой в различных частотных полосах и при суммировании происходит их взаимное гашение. В то же время сигнал вступления имеет коррелированные составляющие в большей части полос и суммирование лишь усиливает всплески статистики (3.8.5), относящиеся к моментам вступлений. Следует заметить, что вариации этих мер для «хороших» сейсмических трасс обычно имеют форму 2-х близко расположенных пиков – это вполне естественно, так как 1-й пик отмечает начало вступления волны, а 2-ой – ее завершение. 3. Контроль качества 1C трасс. Процедура автоматического контроля качества 1C трасс использует 3 критерия. Первый критерий основан на вычислении величин:
κ j, k =
medianτ { μ j , k (τ ) }
(3.8.6)
maxτ { μ j , k (τ ) }
Для «хороших» скалярных трасс значение медианы статистики (3.8.5) определяется малыми фоновыми значениями, тогда как ее максимальные значения соответствуют вступлениям волн и значительно превосходят фон. Поэтому для «хороших» трасс значение (3.8.6) должно быть достаточно мало, тогда как для сбойных трасс с хаотическим или периодическим поведением сигнала это значение будет большим. Таким образом, если:
κ j , k ≥ κ max
(3.8.7)
то 1C трасса маркируется как плохая. Значение порога κ max является параметром метода и для нашего примера использовалось значение κ max = 0.04 . Второй критерий качества основан на вычислении нормализованной энтропии распределения значений квадратов обычных вейвлет-коэффициентов сигнала на 1-ом и 2-ом уровнях детальности. Нормализованная энтропия конечного n
дискретного распределения вероятностей pi ≥ 0, i = 1,..., n, ∑ pi = 1 определяется i =1
формулой:
208
n
En = (−∑ pi ⋅ ln( pi )) / ln(n)
(3.8.8)
i =1
Таким образом, значения En лежат между 0 и 1. Если в качестве pi подставить значения квадратов вейвлет-коэффициентов для уровней детальности 1-2, деленные на сумму всех этих значений, а в качестве n взять общее число вейвлет-коэффициентов на первых 2-х уровнях детальности (при N = 2n это число будет равно n = 3 N / 4 ), то значение (3.8.8) будет представлять 2-ой критерий En j , k для энтропии 1C трасы z j , k (t ) . Если трасса обладает хаотическим высокочастотным поведением («дребезг»), то значение En j , k будет большим. Иными словами, если выполняется неравенство En j , k ≥ Enmax
(3.8.9)
то 1C трасса маркируется как «плохая». Для анализа данных эксперимента ниже используется порог Enmax = 0.25 . Третий тип «плохих» 1C трасс можно назвать «дутыми», например X-03, X39, X-42 – они характеризуются слишком большой интенсивностью низких частот. Для их выделения используется критерий отношения энергии «низких» частот к энергии «высоких» частот. Пусть E (j ,Lk) есть сумма квадратов вейвлеткоэффициентов всех уровней детальности с номерами β > 3 , а E (j ,Hk ) - сумма квадратов коэффициентов для уровней детальности 1-3 обычного (не пакетного) вейвлет-разложения 1C трассы z j , k (t ) . Рассмотрим отношение:
λ j ,k = E (j ,Lk) / E (j ,Hk )
(3.8.10)
Для 3-го типа плохих трасс отношение (3.8.10) должно быть велико. Таким образом, если выполняется неравенство
λ j ,k ≥ λmax
(3.8.11)
209
то 1C трасса считается плохой. Ниже использовалось значение порога λmax = 2.75 . Если по крайней мере одно из неравенств (3.8.7), (3.8.9) или (3.8.11) выполняется, то 1C трасса маркируется как «плохая» и исключается из последующего анализа. Скалярные трассы на рис.1, помеченные одиночным восклицательным знаком “!” идентифицированы как плохие на стадии предварительного контроля качества. 4. Масштабно-зависимые главные компоненты. Те 3C трассы, все скалярные компоненты которых являются плохими, исключаются из анализа. Те 3C трасс, в которых только одна скалярная компонента прошла предварительный тест качества, включаются в анализ данных, но только эта единственная 1C трасса и анализируется. Если же 3C трасса содержит 2 или 3 хороших компоненты, то возможно
последующее
(поляризационного
анализа).
применение Главные
метода
компоненты
главных для
компонент
таких
3C
трасс
вычисляются для каждой из вейвлет-пакетных частотных полос. Для каждой вейвлет-пакетной частотной полосы с номером α главная компонента вычисляется в скользящем временном окне, радиус которого равен (α ) mPTmax , где mP является параметром алгоритма (в расчетах бралось значение
(α ) mP =10), а Tmax есть максимальный период вейвлет-пакетной полосы (в единицах
интервала дискретизации – см. таблицу 3.8.1). Для каждого положения скользящего временного окна вычисляется выборочная оценка ковариационной матрицы размером 2×2 или 3×3 (в зависимости от того, сколько скалярных компонент
прошло
тест
качества),
находится
собственный
вектор,
соответствующий максимальному собственному числу и вычисляется проекция 2х или 3-мерного вектора сейсмических колебаний на этот собственный вектор. Результат этого проектирования, главная компонента 1C трассы, запоминается лишь для центральной точки скользящего временного окна. Для первого окна, примыкающего к началу записи, главная компонента запоминается для моментов времени из первой половины окна (включая центральную точку), а для последнего окна, примыкающего к концу записи – для второй половины окна. На рис.3.26 представлена «полностью хорошая» 3C трасса № 21 и ее главные компоненты во всех вейвлет-пакетных частотных полосах.
210
Рис.3.26. X, Y и Z-компоненты трассы № 21; далее – ее главные компоненты в 17 перекрывающихся вейвлет-пакетных частотных полосах с шириной 6 октав.
5. Много-уровненные меры нестационарности для главных компонент. Меры нестационарного поведения скалярной трассы, введенные выше формулами (3.8.4) и (3.8.5), могут быть вычислены аналогично для масштабно-зависимых главных компонент каждой 3C трассы. Обозначим их через μ (αj ) (τ ) и μ j (τ ) – в данном случае индекс k , в формулах (3.8.4), для различения X, Y или Zкомпонент является излишним и опускается. Если 3C трасса имеет единственную «хорошую» 1C компоненту, то для нее используется мера, уже вычисленная ранее в формулах (3.8.4) и (3.8.5). На рис.3.27 представлены графики зависимостей
μ (αj ) (τ ) и μ j (τ ) .
211
Рис.3.27. (а) – графики поведения мер нестационарности в каждой из частотных полос, нижний график (помеченный как sum) является суммой мер нестационарности по всем частотным полосам и демонстрирует наличие сигналов вступлений, S-волна доминирует; (б) – те же графики, что и на рис.(а), но построенные для моментов времени строго до вступления S-волн минус значение δ tS , нижний график (помеченный как sum) является суммой мер нестационарности по всем частотным полосам, которая используется для обнаружения вступления P-волны.
6. Начальные оценки моментов времени вступления S-волн. Метод сначала определяет моменты вступления S-волн, как в среднем более интенсивных и, следовательно, более просто обнаруживаемых. Пусть j - номер полностью или
212
частично «хорошей» 3C трассы, то есть, имеется возможность анализировать статистику
μ j (τ ) . Далее, пусть
ξ
- центр временного окна радиуса
(α max ) отсчетов для анализа вариаций статистики μ (αj ) (τ ) . Подчеркнем, M b = 1.5 ⋅ Tmax
что в формуле для M b берется значение максимального периода для последней, самой низкочастотной вейвлет-пакетной полосы с номером α max . Пусть μ j среднее значение μ j (τ ) , вычисленное по всем τ , а ν j (ξ ) - среднее значение от
μ j (τ ) , вычисленное в скользящем временном окне с центром в точке ξ . Метод определения начальных оценок вступлений S-волн основан на выделении таких моментов времени, для которых ν j (ξ )
превзойдет порог
произведению общего среднего значения μ j
ρμ j , равный
на некоторый коэффициент ρ .
Значения множителя ρ заключены в пределах от 2 до 3 и берутся с достаточно малым равномерным шагом. Следует отметить, что некоторых трасс P-волна может иметь энергию, сравнимую или даже превосходящую энергию S-волны. Для того, чтобы избежать ошибочной идентификации для этих случаев вступления P-волны как S-волны, применяется метод анализа пиковых значений статистики μ j (τ ) в обратном направлении времени, от конца записи к ее началу. Таким образом, скользящее временное окно движется от конца временного интервала к его началу и ищется первое положение ξ j* центра ξ , когда
ν j (ξ ) > ρ ⋅ μ j . Затем метод ищет первый момент времени τ j* ∈ [ξ j* − M b , ξ j* ] принадлежащий первой половине скользящего окна, когда значение μ j (τ ) превзойдет 85% квантиль распределения значений μ j (τ ) внутри интервала
τ ∈ [ξ j* − M b , ξ j* + M b ] . Следует подчеркнуть, что τ j* зависит еще от значения коэффициента ρ , используемого для определения порога для скользящих средних ν j (ξ ) . Поэтому запишем τ j* = τ j* ( ρ ) . Оптимальное значение параметра
ρ находится из условия минимума вариативности значений τ j* ( ρ ) между соседними трассами:
∑|τ j
* j
( ρ ) − τ j*−1 ( ρ ) | → min, ρ ∈ [2,3] ρ
(3.8.12)
213
Значения τ j* ( ρ ) , где ρ находится из решения задачи (3.8.12), берутся в качестве начальных оценок моментов времен вступления S-волны на трассах с номерами j . 7. Оценка годографа S-волны. Для уточнения начальных оценок моментов времени вступления S-волн используется итеративная самоорганизующаяся процедура подгонки гиперболических годографов. Определим модельный гиперболический годограф формулой (Hatton et al., 1986):
Tj * =
T 02 + ( s ⋅ ( j − j 0 )) 2
(3.8.13)
где T j * – модельное значение момента вступления, j - номер трассы, ( T0 , s, j0 ) параметры модели, в которой s является медленностью волны. Найдем значения параметров из решения задачи:
∑ | (τ
* 2 j
) − (T j * ) 2 | → min
j
T0 , s , j0
(3.8.14)
Те начальные оценки τ j* , которые находятся в пределах ±3 медианы распределения величин | τ j* − T j * |
в окрестности модельного годографа с
параметрами, определенными из (3.8.14), не нуждаются в коррекции. Те же значения τ j* , которые выходят за эти пределы, подвергаются процедуре коррекции: они заменяются на значения τ , соответствующие максимальным значениям статистики μ j (τ ) для аргументов τ , лежащих в вышеуказанных пределах. После этой коррекции процедура подгонки (3.8.14) повторяется до тех пор, пока не исчезает необходимость корректировки для всех значений τ j* . Если начальные оценки τ j* представляют собой выброс от модельного годографа на величину, превосходящую ±4 медианы, то такие трассы маркируются как плохие и исключаются из анализа – это составляет 2-й, заключительный этап автоматического контроля качества. На рис.1 трассы, отбракованные на 2-ом этапе, помечены двойным восклицательным знаком “!!”.
214
Если годограф после подгонки (3.8.14) своих параметров имеет минимум внутри профиля, то есть 1 < j0 < N tr , то окрестность трассы
j0 является
неблагоприятной для применения метода главных компонент, поскольку там присутствуют сильно коррелированные помехи от близкого вступления P-волны. В этой ситуации использование вариаций мер μ j , k (τ ) для индивидуальных скалярных компонент может дать более точное определение вступления S-волны, чем использование меры μ j (τ ) для главной компоненты. Таким образом, для полностью или частично хороших 3C трасс с номером j при условии выполнения | j − j0 |< 5 итеративный метод корректировки и подгонки гиперболического годографа включает в себя анализ пиковых значений статистик μ j , k (τ ) для хороших скалярных компонент k наряду с пиковыми значениями статистики
μ j (τ ) для главной компоненты. При сравнении этих статистик предпочтение отдается той, для которой 85% квантиль вариаций мер реализует минимальное расстояние от модельного годографа после подгонки его параметров – именно это значение берется для корректировки (если в этом возникает необходимость). 8. Начальные оценки моментов времени вступления P-волны. Моменты вступления P-волн ищутся после определения годографа S-волны. Метод совершенно аналогичен определению S-годографа, за исключением того, что начальные оценки моментов вступления P-волн ищутся по вариациям статистик
μ j (τ ) не для всех значений τ , а лишь удовлетворяющих неравенству (α τ < t ( j ) − 2 ⋅ Tmax
max )
S
≡ t S( j ) − δ tS
(3.8.15)
где t S( j ) - момент времени S-годографа на трассе с номером j . На рис.3.27(б) изображены графики мер μ (αj ) (τ ) и μ j (τ ) , для моментов времени τ ≤ t S( j ) − δ tS , которые используются для определения начальных оценок вступления P-волн. Отметим, что графики на рис. 3.27(б) соответствуют тем же вариациям, что и на рис.3.27(а), но они не видны на фоне значительно более сильных изменений, связанных с вступлениями S-волны. Когда же при построении графиков ограничились временами τ ≤ t S( j ) − δ tS , то предшествующие вариации стали различимыми.
215
9. Оценка годографов P-волны. Для нахождения P-годографа используется тот же метод итераций с подгонкой модели гиперболического годографа, что и для Sволны, но медленность P-волны ищется не превосходящей по своему значению ранее найденной медленности S-волны, деленной на
2 . На рис.3.28
представлены графики обоих годографов вместе с их ошибками, составляющими 3 медианы отклонения начальных оценок от итоговых S и P-годографов.
Рис.3.28. Полученные годографы вступлений S-волн (S) и P-волн (P) с горизонтальными штрихами ошибок определения. На рис.(S) изображены вариации много-уровненной статистики для всех трасс, которые не были классифицированы как «целиком плохие» на 1-ой стадии автоматического контроля качества: (P) – те же самые меры нестационарности, но построенные для моментов времени строго до вступления S-волн минус значение δ tS для всех трасс, которые не были классифицированы как «целиком плохие» на 2-ой стадии контроля.
Итак, полный список параметров метода: 1. p – число октав в вейвлет-пакетных перекрывающихся частотных полосах; 2. α max – максимальное число вейвлет-пакетных полос; 3. κ max – порог для применения критерия (3.8.6) автоматического контроля качества;
216
4. Enmax – порог для применения критерия энтропии (3.8.9); 5. λmax – порог для применения энергетического критерия (3.8.11); 6. mP – параметр, определяющий радиус масштабно-зависимого скользящего временного окна для вычисления главных компонент. Таким образом, разработанный и апробированный метод автоматической идентификации моментов времени вступления продольных и поперечных волн для задач пассивного сейсмического мониторинга в задачах скважинной сейсморазведки для ситуаций низкого отношения «сигнал/шум» и при наличии большого числа сбойных однокомпонентных трасс может найти применение в задачах мониторинга слабых сейсмических событий. Метод основан на комбинации идей вейвлет-пакетного разложения сейсмических записей и поляризационного анализа. Разработанные идеи автоматической маркировки сбойных трасс и накопления полезной информации путем вычисления суммы вариаций много-уровненных мер нестационарности могут быть использованы для мониторинга объектов, характеризуемых большим числом измеряемых сигналов.
217
ЗАКЛЮЧЕНИЕ.
Развитие
современных
систем
мониторинга
природных
объектов,
заключающееся в совершенствовании систем цифровой регистрации, телеметрии и средств быстрого доступа к данным, в том числе и через интернет, приводит к катастрофическому увеличению объема информации, доступного исследователю. Уходят в прошлое времена «штучного» анализа отдельных временных рядов. В этих быстро изменяющихся условиях интерпретатор часто захлебывается в потоке информации и срабатывает «защитная реакция организма» - данные остаются невостребованными не потому, что они не нужны, а потому, что с ними очень трудно иметь дело из-за их большого объема, высокой размерности и физической разнородности сигналов мониторинга. Настоящая монография подводит итог работ автора по созданию методов и их алгоритмической реализации, целью которых является создание инструментов обработки данных, позволяющих анализировать большие объемы разнородной информации и находить в них общие сигналы (в различном понимании) и отсеивать малосущественные детали «индивидуального» поведения, несмотря на то, что их проявления могут быть на порядки более интенсивными по своим амплитудам, чем скрытый «полезный сигнал». Надеюсь, что изложенные методы и опыт анализа данных, представленный в многочисленных примерах из самых различных сфер мониторинга земной коры, гидросферы и воздушной оболочки Земли, поможет исследователям в их попытках разобраться «с самой сутью» данных и избавиться от шумов.
218
ЛИТЕРАТУРА.
Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. (1989) Прикладная статистика. Классификация и снижение размерности. М., Финансы и статистика. 607с. Арнольд В.И. (1981) Теория катастроф. М.: Знание. 1981. 77с. Багров Н.А., Кондратович К.В., Педь Д.А., Угрюмов А.И. (1985) Долгосрочные метеорологические прогнозы. Л., Гидрометеоиздат. 248с. Бородкин Л.И., В.В.Мотль (1976) Алгоритм обнаружения моментов изменения параметров уравнения случайного процесса. – Автоматика и телемеханика. N6. С.23-32. Вапник В.Н., Червоненкис А.Я. (1974) Теория распознавания образов. М., Наука, 416с. Гамбурцев А.Г. (1992) Сейсмический мониторинг литосферы. М., Наука. 1992. 200с. Гашин А.Н., А.Ф.Кушнир (1998) Изучение аномалий распространения региональных сейсмических фаз по данным малоапертурной группы Алибек. – Вопросы геодинамики и сейсмологии: Сб. науч. тр. – М., 1998, 355с, (Вычислительная сейсмология, вып.30), с.316-335. Герман В.Х. (1970) Спектральный анализ колебаний уровня Азовского, Черного и Каспийского морей в диапазоне частот от одного цикла за несколько часов до одного цикла за несколько суток. – Тр. Государственного океанографического института (ГОИН), 1970, вып.103, с.52-73. Гусев Г.А., А.А.Любушин, В.А.Малугин, А.Б.Манукин, В.И.Осика, Е.И.Попов, В.И.Ребров. (1994) Исследования низкочастотных фоновых процессов в земной коре. – В книге: Динамические процессы в геофизической среде. М.: Наука. 1994, 255с. С.227-243. Доценко С.Ф., Кузин И.П., Левин Б.В., Соловьев О.Н. Расчет интенсивности цунами в Каспийском море с учетом протяженных очагов подводных землетрясений // Физика Земли. 2004. N7. С.57-64. Капица С.П., Курдюмов С.П., Малинецкий Г.Г. (1997) Синергетика и прогнозы будущего. М., Наука, 285с. Копылова Г.Н., Любушин А.А., Малугин В.А., Смирнов А.А., Таранова Л.Н. Гидродинамические наблюдения на Камчатке. – Вулканология и сейсмология. 2000, N4. С.69-79. Копылова Г.Н., Любушин А.А., Таранова Л.Н. Применение многомерного статистического анализа для обработки данных электротеллурических наблюдений на Камчатке // Проблемы геодинамики и прогноза землетрясений / Под ред. Ф.Г.Корчагина. Хабаровск: ИТиГ ДВО РАН. 2001. С. 225-245. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. (1985) Справочник по теории вероятностей и математической статистике. М., Наука, 640с. Кушнир А.Ф., Л.М.Хайкин (2000) Обработка данных в автоматизированной системе для сейсмического мониторинга с помощью малоапертурной группы. – Проблемы динамики и сейсмичности Земли: Сб. науч. тр. – М., 2000, 324с, (Вычислительная сейсмология, вып.31), с.273-289. Любушин А.А., В.И.Осика, В.А.Пчелинцев, Л.С.Петухова. (1992) Анализ отклика деформаций земной коры на вариации атмосферного давления. – Физика Земли. N2. С.81-89.
219
Любушин А.А. (1993) Многомерный анализ временных рядов систем геофизического мониторинга. – Физика Земли. N3. С.103-108. Любушин А.А., Л.А.Латынина. (1993) Компенсация метеорологических помех в деформометрических наблюдениях. – Физика Земли. N3. С.98-102. Любушин А.А., В.А.Малугин. (1993) Статистический анализ отклика уровня подземных вод на вариации атмосферного давления. – Физика Земли. N12. С.74-80. Любушин А.А., В.Ф.Писаренко. (1993) Исследование сейсмического режима с помощью линейной модели интенсивности взаимодействующих точечных процессов. – Физика Земли. N12. С.81-87. Любушин А.А. (1994) Классификация состояний низкочастотных систем геофизического мониторинга. – Физика Земли. N7. С.135-141. Любушин А.А., М.Ю.Лежнев. (1995) Анализ изменчивости функции отклика уровня подземных вод на баровариации на Южных Курилах (о.Шикотан). – Физика Земли. N8. С.79-84. Любушин А.А., Г.Н.Копылова, Ю.М.Хаткевич. (1996) Применение многомерного анализа для обработки данных гидрогеологических наблюдений на Петропавловском полигоне, Камчатка, с целью поиска предвестников землетрясений. – Вулканология и сейсмология. N1. С.79-97. Любушин А.А., В.А.Малугин, О.С.Казанцева. (1997(a)) Мониторинг приливных вариаций уровня подземных вод в группе водоносных горизонтов. – Физика Земли. N4. С.52-64. Любушин А.А., Г.Н.Копылова, Ю.М.Хаткевич. (1997(b)) Анализ спектральных матриц данных гидрогеологических наблюдений на Петропавловском геодинамическом полигоне, Камчатка, в сопоставлении с сейсмическим режимом. – Физика Земли. N6. С.79-89. Любушин А.А., В.Ф.Писаренко, В.В.Ружич, В.Ю.Буддо. (1998) Выделение периодичностей в сейсмическом режиме. – Вулканология и сейсмология. N1. С.62-76. Любушин А.А. (1998(a)) Анализ канонических когерентностей в задачах геофизического мониторинга. – Физика Земли. N1. С.59-66. Любушин А.А. (1998(b)) Агрегированный сигнал систем низкочастотного геофизического мониторинга. – Физика Земли. N3. С.69-74. Любушин А.А., Малугин В.А., Казанцева О.С. (1999) Выделение “медленных событий” в асейсмическом регионе. – Физика Земли. N3. С.35-44. Любушин А.А.. (2000(a)) Вейвлет-агрегированный сигнал и синхронные всплески в задачах геофизического мониторинга и прогноза землетрясений. – Физика Земли. N3. С.20-30. Любушин А.А. (2000(b)) Многомерный вейвлет-анализ сейсмичности – Физика Земли. N8. С.74-85. Любушин А.А. (2002(c)) Периодичности и ритмы глобальной сейсмичности в XX веке – Совместное заседание сессии научного семинара ОГГГГН РАН «Теоретические проблемы геологии» и X научного семинара «Система Планета Земля» по теме: «Ритмичность и цикличность в геологии как отражение общих законов развития», 07-08.02.2002. Тезисы докладов семинара ОГГГГН РАН, М., 2002, с.66-67. Любушин А.А. (2001) Многомерный вейвлет-анализ временных рядов систем геофизического мониторинга. - Физика Земли. 2001, N6. С.41-51. Любушин А.А. (2002) Робастный вейвлет-агрегированный сигнал для задач геофизического мониторинга - Физика Земли. 2002, N9. С.37-48. Любушин А.А. , Кузнецов И.В., Писаренко В.Ф., Удалова С.В. (2002) Многомерный вейвлет-анализ временных рядов скорой помощи в Москве, 1995-1998 гг. – В книге: Атлас временных вариаций природных, антропогенных и социальных
220
процессов. Том 3. Природные и социальные сферы как части окружающей среды и как объекты воздействий. М.:, Янус-К. 2002, 672с. С.533-546. Любушин А.А., В.Ф.Писаренко, М.В.Болгов, Т.А.Рукавишникова (2003) Исследование общих эффектов вариаций стока рек - Метеорология и гидрология, 2003, N7. С.76-88. Любушин А.А. (2003) Всплески и сценарии синхронизации в геофизических наблюдениях. – В выпуске: Очерки геофизических исследований. К 75-летию Объединенного Института физики Земли им. О.Ю. Шмидта. – М., ОИФЗ РАН, 2003, 474с., с. 130-134. Любушин А.А. , Копылова Г.Н. (2004) Многомерный вейвлет-анализ временных рядов электротеллурических наблюдений на Камчатке - Физика Земли, 2004, N2, с.8296. Любушин А.А. , З.Калаб, Н.Частова (2004(a)) Использование вейвлет-анализа для автоматической классификации трехкомпонентных сейсмических записей. Физика Земли, 2004, N7, с.50-56. Любушин А.А., В.Ф.Писаренко, М.В.Болгов, М.В.Родкин, Т.А.Рукавишникова (2004(b)) Синхронные вариации уровня Каспийского моря по береговым наблюдениям,1977-1991 гг. – Известия РАН. Физика атмосферы и океана, 2004, N6, том 40, с.821-831. Любушин А.А. (2006) Вейвлет-пакетный поляризационный метод для автоматического детектирования вступлений P и S-волн – Физика Земли, 2006, N4, с.30-39. Мороз Ю.Ф., Бахтиаров В.Ф., Воропаев В.Ф., Гаврилов В.А., Левин В.Е., Попруженко С.В. О мониторинге электротеллурического поля для прогноза сильных землетрясений на Камчатке // Вулканология и сейсмология. 1995. № 4-5. С. 139– 149. Монин А.С., Сонечкин Д.М. (2005) Колебания климата. – М.: Наука, 2005, 191 с. Никифоров. И.В. (1983) Последовательное обнаружение изменения свойств временных рядов. М.,Наука. 199с. Обнаружение изменения свойств сигналов и динамических систем, (1989) Пер. с англ. /М.Бассвиль, А.Вилски, А.Банвенист и др. – Под ред. М.Бассвиль, А.Банвениста. М.,Мир. 278с. Печерский Д.М., В.С.Захаров, А.А. Любушин (2005) Бушвельд (Южная Африка): запись тонкой структуры геомагнитного поля в керне скважины WP-16. – Физика Земли, 2005, N5, с.3-17. Писаренко В.Ф., Любушин А.А., Болгов М.В., Рукавишникова Т.А., Каню С., Каневский М.Ф., Савельева Е.А., Демьянов В.В., Заляпин И.В (2005) Статистические методы прогноза речного стока. – Водные ресурсы и режим водных объектов, 2005, № 2. С.133-145. Привальский В.Е., Панченко В.А., Асарина Е.Ю. Модели временных рядов с приложениями в гидрометеорологии. – СПб, Гидрометеоиздат, 1992, 226с. Раткович Д.Я., Болгов М.В. (1997) Стохастические модели колебаний составляющих водного баланса речного бассейна. – М., Институт водных проблем РАН, 1997, 262с. Рытов, С.М. Введение в статистическую радиофизику. Ч.1. Случайные процессы — М., Наука, 1976, 496с. Светов Б.С., Каринский С.Д., Кукса С.Д., Одинцов В.И. Магнитотеллурический мониторинг геодинамических процессов // Физика Земли. 1997. № 5. С. 36-46. Смирнов В.Б., Пономарев А.В., Qian Jiadong, А.С.Черепанов (2005) Ритмы и детерминированный хаос в геофизических временных рядах. – Физика Земли, 2005, N6, с.6-28.
221
Садовский М.А., В.Ф.Писаренко. (1991) Сейсмический процесс в блоковой среде. М., Наука. 96с. Соболев Г.А. (1993) Основы прогноза землетрясений. М., Наука, 313с. Соболев Г.А, Пономарев А.В. (2003) Физика землетрясений и предвестники. М., Наука, 270с. Соболев Г.А. (2003) Эволюция периодических колебаний сейсмической интенсивности перед сильными землетрясениями. – Физика Земли, 2003, №11, с.3-15. Соболев Г.А. (2004) Вариации микросейсм перед сильными землетрясениями. – Физика Земли, 2004, №6, с.3-13. Соболев Г.А., Любушин А.А., Закржевская Н.А. (2005) Синхронизация микросейсмических колебаний в минутном диапазоне периодов – Физика Земли, 2005, N8, с.3-27. Шор Н.З. (1979) Методы минимизации недифференцируемых функций и их приложения. Киев, «Наукова думка», 1979, 200с. Akaike H. (1974) A new look at the statistical model identification. – IEEE Trans. Automatic Control, AC-19, 716-723. Anderson, T.W., H.Rubin (1956) Statistical inference in factor analysis, Proc. 3rd Berkley Symp. on Math. Statistics and Probability, vol.5, pp.111-150. Anderson T.W. (1971) The statistical analysis of time series. John Wiley & Sons, Inc., New York, London, Sydney, Toronto (Русский перевод: Андерсон Т. (1976) Статистический анализ временных рядов. М., Мир, 755с.). Bacry, E., J. F. Muzy, and A. Arnéodo (1993) Singularity Spectrum of Fractal Signals: Exact Results, Journal of Statistical Physics, 70 - 3/4, 635-674. Bak P., C.Tang. (1989) Earthquakes as a self-organized critical phenomenon – J.Geoph.Res., vol.94, pp.15635-15637. Berger J., R. Coifman, and M., Goldberg. (1994) Removing noise from music using local trigonometric bases and wavelet packets. J. Audio Eng. Soci., Vol. 42, No. 10, pp. 808818. Bott M.H., Dean D.S. (1973) Stress diffusion from plate boundaries. – Nature. Vol.243, pp.339-341. Box G.E.P., G.M.Jenkins (1970) Time series analysis. Forecasting and control. Holden-Day. San Francisco, Cambridge, London, Amsterdam. (Русский перевод: Бокс Дж., Дженкинс Г. (1974) Анализ временных рядов. Прогноз и управление. М., Мир, в 2-х выпусках, 406с. и 197с.). Brillinger D.R. (1975) Time series. Data analysis and theory. Holt, Rinehart and Winston, Inc., N.Y., Chicago, San Francisco (Русский перевод: Бриллинджер Д. (1980) Временные ряды. Обработка данных и теория. М., Мир. 536с.) Chui, C.K. (1992) An Introduction to Wavelets, Academic Press, San Diego, CA (Русский перевод: Чуи Ч. Введение в вэйвлеты. М., Мир, 2001, 412с.). Clarke E. (1975) Generalized gradients and applications //Trans. Amer. Math. Soc. 1975. Vol.205, No.2, pp. 247-262. Cox D.R., Lewis P.A.W. (1966) The statistical analysis of series of events. London, Methuen (Русский перевод: Кокс Д., П.Льюис (1969) Статистический анализ последовательностей событий. М., Мир. 312с.) Currenti G., C. del Negro, V. Lapenna, and L. Telesca (2005) Multifractality in local geomagnetic field at Etna volcano, Sicily (southern Italy) – Natural Hazards and Earth System Sciences, 5, 555–559, 2005. Dansgaard, W., Johnsen, S. J., Reeh, N., Gundestrup, N., Clausen, H. B., Hammer, C. U. (1975) Climatic changes, Norsemen and modern man. Nature 255: 24-28.
222
Daubechies I. (1992) Ten Lectures on Wavelets. No.61 in CBMS-NSF Series in Applied Mathematics, SIAM, Philadelphia (Русский перевод: Добеши И. Десять лекций по вейвлетам. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001, 464с.). Donoho D., I. Johnstone (1994) Ideal spatial adaptation via wavelet shrinkage. Biometrika, vol. 81, pp. 425-455. Duda R.O., P.E.Hart (1973) Pattern classification and scene analysis, John Wiley & Sons, N.Y., London, Sydney, Toronto (Русский перевод: Дуда Р., Харт П. (1976) Распознавание образов и анализ сцен. М., Мир. 511с.) Efron B., R.Tibshirani (1986) Bootstrap methods for standard errors, confidence intervals and other measures of statistical accuracy. – Statistical Sciences, vol.1, pp.54-77 (Русский перевод: Эфрон Б., Тибширани Р. (1988) Бутстреп-методы для стандартных ошибок, доверительных интервалов и других мер статистической точности. – в сборнике: Эфрон Б. (1988) Нетрадиционные методы многомерного статистического анализа, М., Финансы и статистика, 262с., с.214-248). Feder J. (1988) Fractals. Plenum Press, New York, London (Русский перевод: Федер Е. (1991) Фракталы. М., Мир. 254с.) Gilmore R. (1981) Catastrophe theory for scientists and engineers. John Wiley and Sons, Inc., New York (Русский перевод: Гилмор Р. (1984) Прикладная теория катастроф: в 2-х книгах. М., Мир. 350с. и 285с.). Haken H. (1982) Synergetics. 2nd ed. Springer, Berlin, Heidelberg, N.Y., Tokyo (Русский перевод 1-го издания: Хакен Г. Синергетика, М., Мир, 1980). Hannan E.J. (1970) Multiple time series. John Wiley and Sons, Inc., N.Y., London, Sydney, Toronto (Русский перевод: Хеннан Э. (1974) Многомерные временные ряды. М., Мир, 575с.) Hardle W. (1989) Applied nonparametric regression. Cambridge University Press, Cambridge, New York, New Rochell, Melbourne, Sydney (Русский перевод: Хардле В. Прикладная непараметрическая регрессия. М., Мир, 1993, 349с.) Harman, H.H. (1967). Modern factor analysis. Chicago: University of Chicago Press (Русский перевод: Харман Г. (1972) Современный факторный анализ. М., Финансы и статистика. 420 с.). Hatton L., Worthington M.H., Makin J. (1986). Seismic Data Processing. Theory and Practice. Blackwell Scientific Publications, Oxford, London (Русский перевод: Л.Хаттон, М.Уэрдингтон, Дж.Мейкин, Обработка сейсмических данных. Теория и практика. М.: «Мир», 1989, 215с.). Hotelling H. (1936). Relations between two sets of variates. – Biometrika. Vol.28, pp.321377. Huber P.J. (1981) Robust statistics. John Wiley and Sons. New York, Chichester, Brisbane, Toronto (Русский перевод: Хьюбер П. (1984) Робастность в статистике. М., Мир, 303с.). Hurst H.E. (1951) Long-term storage capacity of reservoirs. – Trans. Amer. Soc. Civ. Eng. Vol.116, pp.770-808. Hummel B., R. Moniot. (1989) Reconstruction from zero-crossings in scale-space. IEEE Trans. Acoust., Speech, and Signal Proc., 37(12), December 1989. Jenkins G., Watts D.G. (1968) Spectrum Analysis and its Applications. Holden Day. San Francisco. (Русский перевод: Дженкинс Г., Ваттс Д., Спектральный анализ и его приложения, М., Мир, в 2-х выпусках, 316с. и 286с., 1972.). Kanasewich E.R. (1981), Time Series Analysis in Geophysics. The University of Alberta Press, Edmonton (Русский перевод: Канасевич Э.Р., Анализ временных последовательностей в геофизике. М.: «Недра», 1985, 400с.).
223
Kantelhardt J. W., Zschiegner S. A., Konscienly-Bunde E., Havlin S., Bunde A., and Stanley H. E. (2002) Multifractal detrended fluctuation analysis of nonstationary time series, Physica A, 316, 87–114, 2002. Kantelhardt, J. W., Rybski, D., Zschiegner, S.A., Braun, P., Koscielny-Bunde, E., Livina, V., Havlin, S., Bunde, A., 2003. Multifractality of river runoff and precipitation: Comparison of fluctuation analysis and wavelet methods. Physica A, 330, 240-245. Kasahara K. (1981) Earthquake mechanics. Cambridge University Press (Русский перевод: Касахара К. (1985) Механика землетрясений. М., Мир. 264с.) Kashyap R.L., A.R.Rao. (1976) Dynamic stochastic models from empirical data. Academic Press. N.Y., San Francisco, London (Русский перевод: Кашьяп Р.Л., А.Р.Рао. (1983) Построение динамических стохастических моделей по экспериментальным данным. М., Наука, 384с.) Klyashtorin L.B. and A.A. Lyubushin, (2003) On the coherence between dynamics of the world fuel consumption and global temperature anomaly. – Energy & Environment, vol.14, No.6, 773-782 (December 2003). Lawley, D.N., Maxwell, A.E. (1971). Factor analysis as a statistical method. New York: American Elsevier (Русский перевод 1-го издания: Лоули Д., Максвелл А. (1967) Факторный анализ как статистический метод. М., Мир.). Lawrimor J., M.Halpert, J.Bell, M.Menne, B.Lyon,R.Schnell, K.Gleason, Easterling, W.Thiaw, W.Wright, R.Heim Jr., D.Robinson, L.Alexander (2001) Climate Assessment. Bull. of the American Meteorological Society: Vol.82, No.6:1304-1380. Lyubushin A.A. (1999(a)) Wavelet-Aggregated Signal in Earthquake Prediction. – Earthquake Research in China (English Edition). Vol.13. No.1, pp.33-43. Mallat S. (1998) A wavelet tour of signal processing. Academic Press. San Diego, London, Boston, N.Y., Sydney, Tokyo, Toronto. 577 p. (Русский перевод: Малла С. Вэйвлеты в обработке сигналов. - М.: Мир, 2005, 671c.). Mandelbrot B.B., Van Ness J.W. (1968) Fractional Brownian motions, fractional noises and applications. – SIAM Review. Vol.10, No.4, pp .422-437 Mandelbrot B.B., Wallis J.R. (1969) Some long-term properties of geophysical records. – Water Resources Res. Vol.5, pp.321-340. Mandelbrot, B. B. (1982), The Fractal Geometry of Nature. W. H. Freeman. Maxwell, S.C., Bossu, R., Young, R.P. and Dangerfield, J. (1998) Processing of induced microseismicity recorded in the Ekofisk Reservoir: Annual Meeting Abstracts, Society of Exploration Geophysicists, New Orleans, 904-907. Maxwell, S.C., Urbancic, T.I., Falls, S.D. and Zinno, R. (2000) Real-Time Microseismic Mapping of Hydraulic Fractures in Carthage, Texas: Expanded Abstracts, Society of Exploration Geophysicists, New Orleans, Session: RC2.9. Mogi K. (1985) Earthquake prediction. Academic Press, Tokyo, Orlando, San Diego, New York, london, Toronto, Montreal, Sydney (Русский перевод: Моги К. (1988) Предсказание землетрясений. М., Мир, 382с.). Marple S.L.(Jr.) (1987) Digital spectral analysis with applications. Prentice-Hall, Inc., Englewood Cliffs, New Jersey (Русский перевод: Марпл С.Л. (1990) Цифровой спектральный анализ и его приложения. М., Мир. 584с.). Muzy, J. F., Bacry, E. & Arneodo, A. (1994) The multifractal formalism revisited with wavelets. Int. J. Bifurc. Chaos. 4, 245-302. Nicolis G., I.Prigogine. (1989) Exploring complexity, an introduction. W.H. Freedman and Co., New York (Русский перевод: Николис Г., И.Пригожин. (1990) Познание сложного. М., Мир. 344с.). Ogata Y., H.Akaike. (1982) On linear intensity models for mixed doubly stochastic Poisson and self-exciting point processes. – Journal of the Royal Statistical Society. Series B (Methodological), V.44, No.1, pp.102-107.
224
Ogata Y., H.Akaike, K.Katsura. (1982) The application of linear intensity models to the investigation of causal relations between a point process and another stochastic process. – Annals of the Institute of Statistical Mathematics, V.34, No.2, Pt.B, pp.373-387. Pechersky D.M., V.S. Zakharov and A.A. Lyubushin (2004) Continuous record of geomagnetic field variations during cooling of the Monchegorsk, Kivakka and Bushveld Early Proterozoic layered intrusions. – Russian Journal of Earth Sciences, 2004, Vol.6, No.6, p.391-456, http://elpub.wdcb.ru/journals/rjes/v06/tje04158/tje04158.htm Pisarenko V.F., A.F.Kushnir, I.V.Savin. (1987) Statistical adaptive algorithms for estimation of onset moments of seismic phases. – Phys. Earth Planet. Interiors. Vol.47, pp.4-10. Press W.H., Flannery B.P., Teukolsky S.A. and Vettering W.T. (1996) Numerical Recipes, 2nd edition, Chapter 13, Wavelet Transforms, Cambridge Univ. Press, Cambridge. Ramírez-Rojas A., A. Muñoz-Diosdado, C. G. Pavía-Miller, and F. Angulo-Brown (2004) Spectral and multifractal study of electroseismic time series associated to the Mw=6.5 earthquake of 24 October 1993 in Mexico - Natural Hazards and Earth System Sciences (2004) 4: 703–709. Rao C.R. (1965) Linear statistical inference and its applications. John Wiley & Sons, Inc. N.Y., London, Sydney (Русский перевод: Рао С.Р. (1968) Линейные статистические методы и их применение. М., Наука. 548 с.). Samson J.C., Olson J.V. (1980) Some comments on the description of the polarization states of waves – Geophysical Journal, vol.61, 115-129. Schlesinger, M.E., Ramankutty N. (1994) An oscillation in the global climate system of period 65-70 years // Nature, vol.376, p.723-726. Seismic signal analysis and discrimination. Methods in Geochemistry and Geophysics, 17 (1982) – Edited by C.H. Chen, reprinted from Geoexploration, vol.20, No.1/2 – Elsevier Scientific, Amsterdam, Oxford, N.Y. (Русский перевод: Анализ и выделение сейсмических сигналов: Пер. с англ./ Под ред. Ч.Чженя. – М., Мир, 1986, 240с.). Sornette D., A.Johansen, J.-Ph.Bouchaud (1996) Stock market crashes, precursors and replicas. – Journ. Phys. I. France, Vol.6, pp.167-175. Telesca L., G. Colangelo, and V. Lapenna (2005) Multifractal variability in geoelectrical signals and correlations with seismicity: a study case in southern Italy - Natural Hazards and Earth System Sciences, 5, 673–677, 2005 Turcotte, D.L. (1997) Fractals and Chaos in Geology and Geophysics, 2-nd edition, Cambridge Univ. Press, New York. Vogel M.A., Wong A.K.C. (1978) PFS Clustering Method. – IEEE Trans. Pattern Analysis. Mach. Intell., PAMI-1, pp.237-245. Zinno, R.J., Gibson, J., Walker Jr., R.N. and Withers, R.J. (1998) Overview: Cotton Valley Hydraulic Fracture Imaging Project: Annual Meeting Abstracts, Society of Exploration Geophysicists, New Orleans, 926-929.
225
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ.
Глава 1.
МЕТОДЫ АНАЛИЗА СКАЛЯРНЫХ ВРЕМЕННЫХ РЯДОВ. 1.1. Циклические тренды. 1.2. Гауссовские и локально-полиномиальные тренды. 1.3. Спектры и спектрально-временные диаграммы. 1.4. Непрерывные вейвлет-диаграммы 1.5. Cкелеты максимумов модулей непрерывных вейвлет-преобразований. 1.6. Ортогональные вейвлет-разложения. 1.7. Мера нестационарности. 1.8. Мультифрактальный анализ, спектр сингулярности и постоянная Херста. 1.9. Скрытые периодичности в потоке событий.
Глава 2.
МЕТОДЫ АНАЛИЗА МНОГОМЕРНЫХ ВРЕМЕННЫХ РЯДОВ. 2.1. Главные компоненты, канонические корреляции, факторный и кластерный анализ. 2.2. Спектры когерентности и частотные функции отклика, компенсация помех. 2.3. Канонические когерентности и спектральные меры синхронного поведения. 2.4. Вейвлетные меры когерентности. 2.5. Агрегированные сигналы. 2.6. Анализ взаимодействия нескольких потоков сейсмических событий
Глава 3.
ПРИМЕРЫ АНАЛИЗА ИНФОРМАЦИИ СИСТЕМ МОНИТОРИНГА 3.1. «Медленные события» в асейсмическом регионе. 3.2. Формирование предвестника Таншаньского землетрясения. 3.3. Многомерные геохимические и электротеллурические ряды на Камчатке. 226
3.4. Микросейсмический фон перед сильным землетрясением. 3.5. Выделение общих сигналов в сети наблюдений на берегах Каспийского моря. 3.6. Коллективные компоненты стока река и их климатическое происхождение. 3.7. Многомерный вейвлет-анализ сейсмического процесса. 3.8. Выделение вступлений сейсмических волн при мониторинге гидроразрывов.
ЗАКЛЮЧЕНИЕ. ЛИТЕРАТУРА.
227
Научное издание
Любушин Алексей Александрович
АНАЛИЗА ДАННЫХ СИСТЕМ ГЕОФИЗИЧЕСКОГО И ЭКОЛОГИЧЕСКОГО МОНИТОРИНГА Утверждено к печати Ученым советом Института физики Земли им. О.Ю. Шмидта Зав. редакцией М.В. Грачева Редактор Л.С. Аюпова Художник Е.А. Шевейко Художественный редактор Ю.И. Духовская Технический редактор З.Б. Павлюк Корректоры З.Д. Алексеева, Е.А. Желнова, Т.А. Печко.