ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО «ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
А. А. Аргучинцева
МЕТОДЫ СТАТИСТИ...
141 downloads
191 Views
798KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОУ ВПО «ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
А. А. Аргучинцева
МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ И АНАЛИЗА ГИДРОМЕТЕОРОЛОГИЧЕСКИХ НАБЛЮДЕНИЙ Учебное пособие
Иркутск 2007
1
УДК 551.46+551.501 ББК 26.23 А 79 Печатается по решению редакционно-издательского совета Иркутского государственного университета
Рецензенты: П. Г. Ковадло, ст. науч. сотр. института солнечно-земной физики, д-р физ.-мат. наук; А. А. Кречетов, доц. кафедры метеорологии и охраны атмосферы Иркутского госунивер ситета, канд. геогр. наук
А 79
Аргучинцева А. В. Методы статистической обработки и анализа гидрометеорологических наблюдений : учеб. пособие / А. В. Аргучинцева. – Иркутск : Иркут. гос. ун-т, 2007. – 105 с.
Излагаются основные теоретические знания методов обработки и анализа гидрометеорологической информации, базирующиеся на положениях теории вероятностей, математической статистики и теории случайных процессов. Приводятся примеры конкретных расчетов, проводимых с помощью методов полиномиальной и оптимальной интерполяции, четырехмерного численного анализа и методов контроля исходной информации. Пособие предназначено для студентов очного и заочного отделений специальностей «Гидрология» и «Метеорология», а также направления «Гидрометеорология». Библиогр. 43 назв. Ил. 2. Табл. 1. ISBN 978-5-9624-0165-2 Пособие подготовлено при поддержке ведомственной целевой программы «Развитие научного потенциала высшей школы (2006–2008) проект РНП. 2.2.1.1.7334 «Научно-образовательный центр Байкал».
УДК 551.46+551.501 ББК 26.23 ISBN 978-5-9624-0165-2
© Аргучинцева А. В., 2007 © ГОУ ВПО «Иркутский государственный университет», 2007
2
ОГЛАВЛЕНИЕ ВВЕДЕНИЕ
5
1. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 1.1. Основные понятия 1.2. Введение в теорию ошибок 1.2.1. Особенности обработки ограниченного числа наблюдений. Оценки для неизвестных параметров закона распределения 1.2.2. Оценки для неизвестных параметров генеральной совокупности: математического ожидания и дисперсии 1.3 Множественное линейное уравнение регрессии. Множественный коэффициент корреляции 1.4 Метод наименьших квадратов 1.4.1. Линейная связь между двумя случайными величинами 1.4.2 Построение нелинейных уравнений множественной регрессии 2. СЛУЧАЙНЫЕ ФУНКЦИИ 2.1. Основные понятия 2.2. Основные характеристики случайной функции 2.3. Система случайных функций 2.4. Суммирование случайных функций 2.5. Стационарные случайные функции 2.5.1. Система стационарных случайных функций 2.6. Положительно определенные функции 2.7. Свойство эргодичности случайных процессов
3
6 6 18
21 23 27 33 33 35 38 38 41 46 49 51 54 57 57
2.8. Структурная функция 60 2.9. Случайные поля 63 2.9.1. Основные понятия 63 2.9.2. Однородные и изотропные случайные поля и их характеристики 66 2.10. Экстраполяция, интерполяция и сглаживание случайных функций 69 2.11. Влияние ошибок измерения на статистические характеристики корреляционного анализа 72 3. ЧИСЛЕННЫЙ АНАЛИЗ ГИДРОМЕТЕОРОЛОГИЧЕСКОЙ ИНФОРМАЦИИ 3.1. Метод полиномиальной интерполяции 3.2. Метод оптимальной интерполяции 3.3. Четырехмерный численный анализ 3.4. Метод контроля исходной информации
4
73 75 80 93 95
ВВЕДЕНИЕ В настоящее время остро ощущается недостаток учебной литературы, в которой методически и в разумных пределах строгости были бы освещены необходимые разделы для освоения грамотной статистической обработки и анализа гидрометеорологических наблюдений. Дисциплина относится к основополагающим курсам в системе подготовки высококвалифицированных специалистов, независимо от их специализации в области гидрометеорологии. Цель пособия – освоение теоретических и практических основ прикладного статистического анализа. Пособие рассчитано на знание основ математического анализа, теории вероятностей и математической статистики в рамках программного курса для студентов, обучающихся по специальностям гидрология, метеорология или по направлению гидрометеорология. Материал, изложенный в пособии, может оказать существенную помощь и при изучении таких дисциплин, как «Гидрологические прогнозы», «Численные методы анализа и прогноза погоды», «Синоптическая метеорология», «Речной сток и гидрологические расчеты», «Водохозяйственные расчеты», «Моделирование в задачах охраны окружающей среды». Учебное пособие состоит из введения, трех глав, списка основной и дополнительной литературы в алфавитном порядке. Формулы имеют тройную нумерацию: первая цифра – номер главы, вторая – номер параграфа в соответствующей главе, третья – номер формулы в рассматриваемом параграфе. Количество рисунков ограничено, а потому их нумерация сквозная.
5
1. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
1.1. Основные понятия Теория вероятностей и математическая статистика изучают закономерности в массовых случайных явлениях. Случайное явление – это такое явление, которое при неоднократном воспроизведении одного и того же опыта протекает каждый раз несколько по-иному. Совершенно очевидно, что в природе нет ни одного физического явления, в котором не присутствовали бы в той или иной мере элементы случайности. Как бы точно и подробно ни были фиксированы условия опыта, невозможно достигнуть того, чтобы при повторении опыта результаты полностью и в точности совпадали. Случайные отклонения неизбежно сопутствуют любому закономерному явлению. Тем не менее, в ряде практических задач этими случайными элементами можно пренебречь, рассматривая вместо реального явления его упрощенную схему, «модель», и предполагая, что в данных условиях опыта явление протекает вполне определенным образом. При этом из бесчисленного множества факторов, влияющих на данное явление, выделяются самые главные, основные, решающие; влиянием остальных, второстепенных, факторов просто пренебрегают. Однако для решения ряда вопросов описанная схема так называемых «точных наук» оказывается плохо приспособленной. Существуют такие задачи, где интересующий нас исход опыта за-
6
висит от столь большого числа факторов, что практически невозможно зарегистрировать и учесть все эти факторы. Это – задачи, в которых многочисленные второстепенные, тесно переплетающиеся между собой случайные факторы играют заметную роль, а вместе с тем число их так велико и влияние столь сложно, что применение методов исследования «точных наук» себя не оправдывает. Очевидно, должна существовать принципиальная разница в методах учета основных, решающих факторов, определяющих в главных чертах течение явления, и вторичных, второстепенных факторов, влияющих на течение явления в качестве «погрешностей» или «возмущений». Элемент неопределенности, сложности, многопричинности, присущий случайным явлениям, потребовал создания специальных методов для изучения этих явлений. Именно такие методы разработаны в теории вероятностей, математической статистике, теории случайных процессов. Практика показывает, что, наблюдая в совокупности массы однородных случайных явлений, обычно обнаруживаются определенные закономерности, своего рода устойчивости, свойственные именно массовым случайным явлениям. Подобные специфические, так называемые «статистические», закономерности наблюдаются всегда, когда мы имеем дело с массой однородных случайных явлений. Закономерности, проявляющиеся в этой массе, оказываются практически независимыми от индивидуальных особенностей отдельных случайных явлений, входящих в массу. Эти отдельные особенности в массе как бы взаимно погашаются, нивелируются, и средний результат массы случайных явлений оказывается уже практически не случайным. Именно эта многократно подтвержденная опытом устойчивость массовых случайных явлений и служит базой применения вероятностных (статистических) методов исследования. Обычно случайные величины обозначают большими (прописными) буквами латинского алфавита, а их возможные значения – соответствующими малыми (строчными) буквами с цело7
численными индексами. Например, случайная величина X с возможными значениями x1 , x 2 ,..., x n . Рассматривают случайные величины двух типов: дискретные и непрерывные. Возможные значения дискретных величин можно перечислить (количество гидрометеорологических станций и постов в городе, количество телефонных звонков, поступающих абоненту в сутки, количество студентов в группе и пр.). Возможные значения непрерывных величин заполняют некоторый промежуток, который иногда имеет резко выраженные границы, а чаще – границы неопределенные, расплывчатые. Примеры непрерывных величин – давление, модуль скорости ветра, температура среды, рост человека и пр. Необходимо вспомнить, что в теории вероятностей и математической статистике давались определения m классической вероятности – P = , n где n – общее число исходов, m – число исходов, благоприятствующих появлению интересуемого события. Иначе классическую вероятность можно назвать теоретической вероятностью, или вероятностью генеральной совокупности, или вероятностью до опыта (apriori). Определить такую вероятность можно при условии, что для случайных событий выполнима схема случаев, т. е. выполняются три условия: события образуют полную группу, несовместны и равновозможны. Если хотя бы одно из трех условий не выполняется, то определить классическую (теоретическую) вероятность нельзя. В этом случае необходимо проделать серию опытов и определить так называемую m статистическую вероятность – P * = , n где n – общее число опытов, m – число опытов, в которых появилось (наблюдалось) интересуемое событие. Иначе статистическую вероятность можно назвать эмпирической, или вероятностью выборочной совокупности, или вероятностью после опыта (a posteriori). 8
Между статистической и классической вероятностью существует связь, определяемая законом больших чисел в виде теоремы Бернулли (студенту предлагается вспомнить). Случайная величина полностью определяется законом распределения (для дискретных величин – это ряд распределения или функция распределения, для непрерывных величин – это функция распределения или функция плотности вероятности). Ряд (таблица) распределения – это задание возможных значений случайной величины с соответствующими вероятностями. Например, Х Р Здесь
х1 p1
х2 p2
… …
хn pn
n
∑ pi = 1 , n – либо общее число исходов, либо число
i =1
опытов. Рассматривая каждую пару значений (x i , p i ) как точку на плоскости, можно ряд распределения представить геометрически как многоугольник распределения. Функция распределения F(x ) – это универсальный (интегральный) закон распределения, справедливый и для дискретных, и для непрерывных случайных величин. Ее аналитическая запись: F(x ) = P(X < x ) = P(− ∞ < X < x ) – вероятность того, что случайная величина X окажется левее какого-либо возможного своего значения. Очевидно, что функция распределения безразмерна. Ее свойства: если x 2 > x 1 , то F(x 2 ) ≥ F(x 1 ) – неубывающая функция сво-
его аргумента,
lim F(x ) = 0,
lim F(x ) = 1.
x → −∞
x → +∞
Дополнение функции распределения F(x ) до 1, т. е. 1 − F(x ) называют в гидрологии функцией обеспеченности (в биологии – функцией выживаемости, экономике – функцией риска). Если обозначить функцию обеспеченности через P(x ) , то P(x ) = 1 − F(x ) = P(X ≥ x ) , 9
т. е. функция обеспеченности показывает вероятность превышения некоторого заданного значения x и обладает свойствами: при
x 2 > x1
P (x 2 ) ≤ P (x 1 ) ; lim P(x ) = 1, lim P(x ) = 0 ; x → −∞
x → +∞
F(x ) = P(x ) = 0,5. Функция плотности распределения (вероятности) f (x ) – это дифференциальный закон распределения непрерывных случайных величин: f (x ) = F′(x ) (при условии, что F(x ) дифференцируема для всех значений случайной величины). Вспомнив определение производной, можно утверждать, что функция плотности распределения имеет размерность, обратную размерности случайной величины. Функция плотности распределения, являясь производной неубывающей функции распределения F(x ) , будет неотрицательной, т. е. f (x ) ≥ 0 и
+∞
∫ f (x ) dx = 1, где f (x )dx есть элемент ве-
−∞
роятности (безразмерный). Благодаря функции плотности вероятности можно оценить вероятность попадания случайной величины в любую область из множества ее значений. Например, P(X < x ) = P(− ∞ < X < x ) =
x
b
−∞
a
∫ f (x )dx , P(a < X < b ) = ∫ f (x )dx ,
где x , a и b принадлежат области определения случайной величины X . Существует очень большое количество различных теоретических законов распределения (равномерный, Бернулли, Коши, Пуассона, нормальный, логнормальный, Гумбеля, Крицкого– Менкеля, Джонсона, 13 кривых распределения Пирсона и др.). Наиболее употребительным является нормальный закон распределения. В гидрометеорологической практике, как правило, рассматривают законы распределения, зависящие от небольшого числа параметров (обычно два–три). 10
Однако найти конкретный закон распределения для случайной величины не всегда возможно, а иногда и не нужно. Поэтому часто достаточно охарактеризовать поведение случайной величины числовыми характеристиками, из которых студенту надо вспомнить обыкновенные (степенные) начальные, центральные и смешанные моменты. Чтобы четко понимать различие и сходство моментов теоретических и статистических, условимся в левой половине листа записывать моменты теоретические, а в правой – статистические, разделяя их вертикальной чертой.
Теоретические моменты (моменты генеральной совокупности)
Статистические моменты (моменты выборочной совокупности)
Начальные моменты к-порядка n
α k = ∑ x ik p i – для дискретi =1
n
αk =
∑ x ik n i i =1
– начальный моn ной величины, где при n → ∞ должно выполняться условие мент, взвешенный по частотам. Здесь n – общее количество сходимости ряда. опытов, n i – количество опытов,
в которых появилось интересуемое событие. n
αk =
∑ x ik i =1
– простой начальный n момент. В дальнейшем все формулы будут записаны в двойном виде (моменты, взвешенные по частотам и простые).
11
+∞
αk = ∫ xk f (x)dx – для непре−∞
рывной величины при условии, что несобственный интеграл сходится. Из начальных моментов самостоятельное значение имеет только 1-й, который получил специальное название – математическое ожидание m x , или M(X ) (теоретическое среднее, среднее генеральной совокупности), размерность которого совпадает с размерностью самой случайной величины. Для выборки 1-й начальный момент – это среднее арифметическое. n
n
α1 = ∑ x i p i = m x i =1
+∞
α1 = ∫ xf ( x )dx = m x −∞
α1 =
∑x n i
i
= x – среднее арифn метическое, взвешенное по частотам (среднее выборки). i =1
n
α1 =
∑x
i
= x – простое среднее n арифметическое i =1
Студенту предлагается вспомнить связь между математическим ожиданием и средней арифметической (теорема Чебышева из закона больших чисел). Среднее многолетнее значение величин (многолетний период такой продолжительности, при увеличении которой полученное среднее существенно не меняется) называют нормой, например, норма годового стока, норма сроков вскрытия и замерзания водных объектов, норма дат начала и окончания весеннего половодья, норма высоты снежного покрова, климатическая норма и пр. 12
Начальные моменты выше первого порядка самостоятельного значения не имеют и используются как вспомогательные для более быстрого вычисления центральных моментов. Центральные моменты к-порядка n
μ k = ∑ (x i − m x )k pi
для дис-
i =1
кретной величины
∑ (x − x ) n n
μk =
i =1
k
i
n
∑ (x − x ) n
+∞
μ k = ∫ ( x − m x ) k f ( x )dx −∞
μk =
i
i =1
k
i
n
для непрерывной величины Центральные моменты μ 0 = 1, μ 1 = 0 самостоятельного значения не имеют. μ 2 имеет самостоятельное значение и его называют дисперсией (D). n
n
μ 2 = D = ∑ ( x i − m x ) 2 p i для i =1
дискретной величины
∑ (x i − x )
μ 2 = D в = i =1
+∞
для непрерывной величины
ni
n
n
∑ (x i − x )
μ 2 = D = ∫ ( x − m x ) 2 f ( x )dx −∞
2
2
μ 2 = D в = i =1
,
n
n
μ 2 = Dв =
,
∑ (x i − x ) i =1
2
n −1
для n < 30
Дисперсия имеет размерность, равную размерности квадрата случайной величины. Поэтому, чтобы получить характеристику разброса той же размерности, что и случайная величина, из дисперсии извлекают квадратный корень. Положительный корень из дисперсии: + D = σ – среднее квадратическое отклонение (по английской терминологии – стандарт), который характеризует разброс случайной величины вокруг своего среднего. 13
На практике измерить все значения случайной величины не всегда возможно. В этих случаях поступают следующим образом: в расчет включают дополнительную характеристику, которая позволяет по среднему значению, полученному на основании ограниченного числаn n наблюдений, судить об общей (истинной) величине средней всей совокупности. Такого рода характеристиками являются средние случайные ошибки. Так, средняя ошибка n
средней арифметической δ x =
∑ xi − X i =1
n n
, а средняя ошибка средn
∑ (x i − X )
него квадратического отклонения δ σ = ношение
2
i =1
=
n
σ n
. От-
δσ должно находиться в пределах 1,25 ÷ 1,30 , согласно δx
которым случайные ошибки подчиняются закону нормального распределения. Центральные моменты μ 3 и μ 4 используют для расчетов соответственно асимметрии (А) и эксцесса ( Ex ). n
A=
μ3 3
=
n
∑ (x i − m x ) 3 p i
i =1
Aв =
3
σ σ для дискретной величины
μ3 σ
3
=
+∞
μ A = 33 = σ
i =1
nσ 3 n
3 ∫ ( x − m x ) f ( x )dx
−∞
σ
∑ (x i − x) 3 n i
Aв =
3
для непрерывной величины
μ3 σ
3
=
∑ (x i − x) 3 i =1
nσ 3
А = 0 – распределение случайной величины симметрично, А < 0 и А > 0 – распределение асимметрично – соответственно левая и правая асимметрия. Коэффициент асимметрии безразмерен. На
14
практике принято асимметрию при значении A ≤ 0,25 считать
малой, 0,25 < A ≤ 0,5 – умеренной, A > 0,5 – большой, A > 1,5 – исключительно большой. n
n
∑ (x i − m x ) pi μ E x = 44 − 3 = i =1 −3 σ σ4 для дискретной величины
(x i − x)4 n i ∑ μ4 E x = 4 − 3 = i=1 −3 nσ 4 σ
4
+∞
n
∫ ( x − m ) f ( x )dx 4
μ4 − 3 = −∞ −3 4 σ σ4 для непрерывной величины Ex =
x
Ex =
μ4 −3= σ4
∑ (x − x) i =1
i
nσ 4
4
−3
Именно число 3 вычитается потому, что для весьма распростраμ4 ненного нормального закона распределения отношение = 3. σ4 Следовательно, для нормального распределения E x = 0 ; для более островершинного распределения по сравнению с нормальным E x > 0 ; для более плосковершинного распределения по сравнению с нормальным E x < 0 . Отклонение от нормального распределения может приобретать не только асимметричную форму. Имеются распределения, у которых в силу воздействия тех или иных факторов сохраняется симметричность ряда и его кривой распределения, но наблюдается нехарактерное для нормального распределения скопление частот в центре ранжированного ряда. Это скопление образует высокую пикообразную кривую, ветви которой круто опускаются по осям ординат к оси абсцисс и затем резко переходят в «шлейфы» по обеим сторонам. Такой тип кривой называют эксцессивным ( E x > 0 ). Для кривых с существенно положительным эксцессом характерно, что крайние значения x min и x max не доходят до границ X ± 3σ . При E < 0 кривая распределения может иметь x
15
провал, что соответствует генетической неоднородности ряда случайных величин. Оценки эксцесса колеблются в [− 2, ∞[ . Если E x = −2 – кривая распределения распадается на две отдельные, − 0,5 < E x < 3 считают, что распределение приближается к
при
нормальному. Центральные моменты выше четвертого порядка на практике используются очень редко из-за быстрого накопления ошибок округления при расчетах. Коэффициент корреляции между двумя случайными величинами Х и У характеризует степень тесноты линейной зависимости. n
n
∑ ∑ (x i − m x )(y j − m y )pij
rxy =
для
n n
∑ ∑ (x i − x )(y j − y )n ij
i =1 j=1
σx σy
rxy =
дискретной величины +∞ +∞
rxy =
∫ ∫ (x − m x )(y − m y )f ( x, y)dxdy
−∞ −∞
σx σ y
для непрерывной
величины
i =1 j=1
nσ x σ y n
n
∑ ∑ (x i − x )(y j − y )
rxy =
i =1 j=1
nσ x σ y n
∑ (x i − x )(yi − y )
rxy = i =1
nσ x σ y
при i=j.
pij – вероятность совместной реализации значений x i и y j , f ( x, y) – двумерная функция плотности вероятности.
rxy – безразмерная величина,
− 1 ≤ rxy ≤ +1.
Если rxy = 0 , то между случайными величинами нет линейной связи; связь нелинейная может иметь место, и ее надо находить другими методами (в этом случае говорят, что величины некоррелируемы, но могут быть зависимыми). Если rxy > 0 , то говорят о положительной корреляции, т. е. с увеличением одной случайной величины другая имеет тенденцию возрастать. 16
Если rxy < 0 , то говорят об отрицательной корреляции, т. е. с увеличением одной случайной величины другая имеет тенденцию убывать. Среди часто используемых характеристик случайной величины следует также дополнительно отметить: из характеристик положения: моду (Мо) – наиболее вероятное значение случайной величины, медиану (Ме) – значение случайной величины, приходящееся на середину упорядоченного ряда, q-квантиль q = P(X < x q ) = F(x q ) = q . Очевидно, что медиана является частным случаем 50 % квантили, так как P(X < x 0,5 ) = P(X < x 50% ) = F(x 0,5 ) = 0,5 = 50% или P(X < Me ) = P(X > Me ) = 0,5 . Если значения среднего значения случайной величины, ее моды и медианы совпадают, то говорят, что распределение этой величины симметрично. При левой асимметрии X < Me < Mo , при правой – X > Me > Mo . Естественно, что все характеристики положения имеют размерность самой случайной величины. Из характеристик разброса: размах R = x max − x min , n
среднее абсолютное отклонение d = коэффициент вариации
ν=
∑X−X
i −1
n
,
σx 100% , или mx
ν=
σx 100 % , исX
пользуемый для оценки однородности (неритмичности) рядов. На практике при коэффициенте вариации более 33 % необходимо тщательно проанализировать рассматриваемый ряд случайных величин, чтобы выяснить причину его неоднородности. Такие при-
17
чины могут быть обусловлены грубыми ошибками наблюдателя или оператора, антропогенным вмешательством человека, климатическими изменениями и пр. Ошибки необходимо устранить, либо разбить ряд на однородные части.
1.2. Введение в теорию ошибок Теория ошибок – изучение и оценка погрешностей в измерениях. Опыт показывает, что ни одно измерение, как бы тщательно оно ни проводилось, не может быть совершенно свободно от ошибок. Поскольку в основе любой науки и ее применений заложены измерения, исключительно важно рассчитывать эти ошибки и сводить их к минимуму. В науке слово «ошибка» не имеет обычного бытового значения чего-то неправильного. «Ошибка» в научном измерении означает неизбежную погрешность, которая сопутствует всем измерениям. Ошибки, как таковые, часто нельзя отнести к промахам экспериментатора, он не сможет их избежать, стараясь быть очень внимательным. Лучшее, на что можно рассчитывать, – это свести ошибки к возможному минимуму и надежно рассчитать их величины. Часто слово «ошибка» заменяют словом «погрешность». Экспериментальные погрешности, которые можно обнаружить с помощью многократных измерений, называются случайными ошибками, а те, которые нельзя обнаружить таким способом, называются систематическими ошибками. Чтобы проиллюстрировать различия между этими видами ошибок, рассмотрим несколько примеров. Предположим, что мы измеряем время оборота равномерно вращающегося диска. Одним из источников ошибок будет время нашей собственной реакции при запуске и остановке секундомера. Если бы это время реакции было всегда точно одним и тем же, то два запаздывания, обусловленные реакцией экспериментатора, компенсировали бы фактически друг друга. Однако время нашей реакции изменяется: мы мо18
жем больше промедлить при запуске и недооценить время оборота, или больше задержаться при остановке секундомера и переоценить время. Так как обе возможности равновероятны, то знак эффекта случаен. При многократном повторении измерения мы иногда будем переоценивать время полного оборота диска, а иногда – недооценивать. Таким образом, переменное время нашей реакции проявится в различии полученных результатов. Анализируя разброс в результатах методами статистики, мы можем получить очень достоверную оценку ошибки этого (случайного) типа. С другой стороны, если наш секундомер постоянно отстает, то все измеренные значения времени будут недооценены и никакое количество повторений измерений (с тем же секундомером) не обнаружит этого источника ошибок. Ошибка такого типа называется систематической, поскольку она всегда систематически смещает наш результат в одну и ту же сторону. Систематические ошибки нельзя обнаружить статистическими методами. В качестве второго примера проявления случайных и систематических ошибок рассмотрим измерение точно определенной длины с помощью рулетки. Один из источников погрешности – это необходимость в интерполяции между делениями шкалы, и эта погрешность, очевидно, случайна (при интерполяции мы с равной вероятностью как переоцениваем, так и недооцениваем результат). Но имеется также вероятность того, что наша рулетка дефектна, а это уже будет приводить к систематической ошибке. Подобно этим двум примерам почти все измерения подвержены как случайным, так и систематическим погрешностям. Необходимо обратить внимание на то, что типичные источники случайных погрешностей – это небольшие ошибки наблюдателей (как например, в случае с интерполяцией); небольшие помехи, воздействующие на аппаратуру (подобные механическим вибрациям) и др. Наиболее очевидная причина систематических ошибок – это раскалибровка измерительных приборов (отстающий секундомер,
19
вытянутая линейка, неустановленная точно на нуле стрелка прибора и др.). Различия между случайными и систематическими ошибками не всегда можно ясно определить. Например, при изменении положения головы наблюдателя по отношению к типичному стрелочному прибору результаты считывания могут изменяться. Этот эффект называется параллаксом, и он приводит к тому, что правильное считывание со шкалы возможно только в случае, когда взгляд наблюдателя направлен точно по перпендикуляру к стрелке. Однако даже очень аккуратному наблюдателю не всегда удается правильно направить свой взгляд на стрелку, а потому измерения будут содержать малые погрешности, связанные с параллаксом, и эти погрешности будут, вероятно, случайными. С другой стороны, неосторожный экспериментатор, который поставит стрелочный прибор сбоку от себя и забудет о влиянии параллакса, внесет систематическую ошибку во все свои измерения. Таким образом, один и тот же эффект параллакса может привести и к случайным, и к систематическим погрешностям. Учет случайных ошибок совершенно отличен от учета систематических. Статистические методы дают достоверную оценку случайных погрешностей и, как мы увидим ниже, указывают на точно определенный способ их уменьшения. Систематические ошибки бывает трудно оценить и даже обнаружить. Опытный наблюдатель должен уметь предвидеть возможные источники систематических ошибок и позаботиться о том, чтобы все систематические ошибки были меньше требуемой точности наблюдения. Для этого потребуется, например, проверка используемых приборов по принятым стандартам, или даже, если необходимо, приобретение более совершенных приборов. Если мы производим n измерений некоторой величины X (используя одну и ту же аппаратуру и метод измерения) и получаем n значений: x1 , x 2 ,..., x n , то наилучшей оценкой величины X будет ее среднее значение: 20
n
∑ xi i =1
X наил = X =
. n Если принять, что X – это наилучшая оценка величины X , то естественно рассмотреть разность x i − X = d i . Эта разность, называемая отклонением (или остатком) x i от X , показывает, насколько результат i-го измерения отличается от своего среднего значения. Если все d i малы, то наши измерения сделаны сравнительно точно, в противном случае – результаты грубы. Часто вместо d i находят среднее квадратическое отклонение: n
σ=
∑ (x i − X )
2
i =1
n
.
1.2.1. Особенности обработки ограниченного числа наблюдений. Оценки для неизвестных параметров закона распределения
На практике часто приходится иметь дело со статистическим материалом весьма ограниченного объема, на основе которого необходимо (хотя бы ориентировочно) определить важнейшие числовые характеристики случайной величины. Если вид закона распределения случайной величины известен заранее, то требуется оценить только некоторые параметры, от которых он зависит (например, для нормального закона распределения – это математическое ожидание и среднее квадратическое отклонение, для закона Пуассона – только математическое ожидание). Наконец, в некоторых задачах вид закона распределения вообще несущественен, а требуется знание только числовых характеристик. Рассмотрим ряд задач об определении неизвестных параметров, от которых зависит закон распределения случайной величины, по ограниченному числу опытов. 21
Прежде всего, надо отметить, что любое значение искомого параметра, вычисленное на основе ограниченного числа опытов, всегда будет содержать элемент случайности. Такое приближенное случайное значение мы будем называть оценкой параметра. Например, оценкой для математического ожидания может служить среднее арифметическое наблюдаемых значений случайной величины в n независимых опытах. При очень большом числе опытов среднее арифметическое будет с большой вероятностью весьма близко к математическому ожиданию. Если же число опытов n невелико, то замена математического ожидания средним арифметическим приводит к какой-то ошибке. Эта ошибка в среднем тем больше, чем меньше число опытов. Также будет обстоять дело и с оценками других неизвестных параметров генеральной совокупности. Любая из таких оценок случайна; при пользовании ею неизбежны ошибки. Желательно выбрать такую оценку, чтобы эти ошибки были по возможности минимальны. Рассмотрим следующую общую задачу. Имеется случайная величина X , закон распределения которой содержит неизвестный параметр а. Требуется найти подходящую оценку для параметра а по результатам n независимых опытов, в каждом из которых величина X приняла определенные значения: x 1 , x 2 ,..., x n . Обозначим через ~ a оценку параметра а, которая естественно есть функция x i i = 1,2,...,n
~ a=~ a (x1 , x 2 ,..., x n )
и, следовательно, сама является случайной величиной. Закон распределения ~a зависит, во-первых, от закона распределения величины X (в частности, от самого неизвестного параметра а) и, вовторых, от числа опытов n . Предъявим к оценке ~ a ряд требований, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественной» оценкой. Естественно потребовать от оценки ~a , чтобы при увеличении числа опытов N она приближалась (сходилась по вероятности) к
22
параметру а. Оценка, обладающая таким свойством, называется состоятельной. Желательно, чтобы, пользуясь величиной ~a , мы, по крайней мере, не делали систематической ошибки в сторону завышения или занижения, т. е. чтобы выполнялось условие: M(~ a)= a . Оценка, удовлетворяющая такому условию, называется несмещенной. Наконец, желательно, чтобы выбранная несмещенная оценка обладала (по сравнению с другими) наименьшей дисперсией, т. е. D(~ a ) = min . Оценка, обладающая таким свойством, называется эффективной. На практике не всегда удается удовлетворить всем этим трем требованиям. Например, может оказаться, что даже если эффективная оценка существует, формулы для ее вычисления оказываются слишком сложными и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда применяются, в интересах простоты расчетов, незначительно смещенные оценки. Однако выбору оценки всегда должен предшествовать ее критическое рассмотрение со всех перечисленных выше точек зрения. 1.2.2. Оценки для неизвестных параметров генеральной совокупности: математического ожидания и дисперсии
Пусть в результате наблюдений случайная величина Х приняла какие-то значения x1 , x 2 ,..., x n . Математическое ожидание и дисперсия генеральной совокупности этой случайной величины неизвестны. Требуется найти для них «доброкачественную оценку». В качестве оценки для математического ожидания естественно принять среднее арифметическое выборки: 23
n
~ =X= m x
∑ xi
i =1
. n Согласно Закону больших чисел эта оценка является состоя~ сходится тельной, так как при увеличении опытов n величина m по вероятности к m . ~ является и несмещенной, так как Оценка m x
⎛ n ⎞ ⎜ ∑ xi ⎟ n n ~ ) = M (X ) = M⎜ i=1 ⎟ = 1 M⎛⎜ x ⎞⎟ = 1 M (X ) = 1 nm = m . M (m ∑ ∑ x x x ⎜ n ⎟ n ⎝ i=1 i ⎠ n i=1 n ⎜ ⎟ ⎝ ⎠ Здесь и в дальнейшем используется условие, что операции суммирования и математического ожидания перестановочны.
⎛ n ⎞ ⎜ ∑ xi ⎟ ~ ) = D⎜ i =1 ⎟ = 1 nD = D x Дисперсия оценки D(m . x x ⎜ n ⎟ n2 n ⎜ ⎟ ⎝ ⎠ Эффективность или неэффективность оценки зависит от вида закона распределения случайной величины Х. Можно доказать, что если Х распределена по нормальному закону, то дисперсия бу~ является эффективдет минимально возможной, т. е. оценка m x ной. Для других законов распределения это может быть и не так. Перейдем теперь к оценке для неизвестной дисперсии D x генеральной совокупности. Наиболее естественной оценкой представляется дисперсия выборки D в . n
~ D x = Dв =
∑ (x i − X )
2
i =1
. n Проверим, является ли эта оценка состоятельной. Для этого ~ (где цевыразим оценку через начальные оценочные моменты α k лочисленный индекс к определяет порядок момента): 24
~ ~ −α ~2. D = Dв = α 2 1
Из Закона больших чисел при n → ∞ оценочные моменты выборки сходятся по вероятности к соответствующим начальным моментам генеральной совокупности, т. е. с вероятностью P → 1 ~ ~ →α , α ~ → α , а потому D α 1 1 2 2 x → D x , и мы можем утверждать, что оценка состоятельна.
( )
~ ~ Проверим, является ли оценка D несмещенной: M D = D .
Найдем сначала 2
n
~ ~ ~2 D=α 2 − α1 =
∑
i =1
x i2
n
n n n ⎛ n ⎞ 2 2 xix j ∑ x x x ⎜∑ i ⎟ ∑ i ∑ i < i j = − ⎜ i=1 ⎟ = i=1 − i=1 2 − 2 2 ⎜ n ⎟ n n n ⎟ ⎜ ⎠ ⎝
n
∑ xix j n −1 n 2 i< j = 2 ∑ xi − 2 . n i=1 n2 Теперь найдем
( )
⎞ n −1 n 2 n ~ n −1 ⎛ n ⎞ 2 ⎛n M D = 2 M⎜ ∑ x i2 ⎟ − 2 M⎜⎜ ∑ x i x j ⎟⎟ = 2 ∑ M x i2 − 2 ∑ M (x i x j ). n n i< j ⎝ i=1 ⎠ n ⎝ i< j ⎠ n i=1
( )
Так как дисперсия не зависит от выбора начала координат, то ~ . Так как опыты независимы, то выберем его в точке X = m x
⎛ 0 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ M (x i x j ) = M⎜ X i ⎟M⎜ X j ⎟ = K ij = 0 , где M⎜ X i ⎟ и M⎜ X j ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ – математические ожидания центрированных величин, K ij – второй центральный смешанный корреляционный момент. n −1 ~ n −1 Dx . Поэтому M (D ) = 2 nD x = n n Из последнего выражения видим, что оценка по выборке не является несмещенной для дисперсии генеральной совокупности, ~ т. е., пользуясь оценкой D = D в , мы будем совершать некоторую систематическую ошибку в меньшую сторону. Чтобы ликвидиро25
вать это смещение, достаточно ввести поправку, умножив величи~ n . Получим ну D на n −1
n n −1 ⎛ n ~⎞ M⎜ D⎟ = D x = D x несмещенную оценку. ⎝ n −1 ⎠ n −1 n
Итак, n
n
2 2 ∑ (x i − X ) ∑ (x i − X )
n ~ n n i =1 D= Dв = n −1 n −1 n −1
=
n
i =1
n −1
.
Такую исправленную статистическую дисперсию мы и выберем в качестве оценки для неизвестной дисперсии D генеральной совокупности. n → 1 при n → ∞ , а это означаЗаметим, что множитель n −1 ет, что при достаточно большой выборке обе оценки – смещенная и несмещенная будут различаться очень мало и введение поправочного множителя теряет смысл. На практике рекомендуют вводить поправочный коэффициент при выборке, содержащей менее 30 наблюдений. ~ Оценка D для дисперсии генеральной совокупности не является эффективной. Однако в случае нормального закона распределения случайной величины она является асимптотически эффективной, т. е. при увеличении числа опытов N отношение ее дисперсии к минимально возможной по вероятности неограниченно стремится к 1. Итак, при обработке ограниченного числа наблюдений для оценки математического ожидания и дисперсии генеральной совокупности рекомендуется пользоваться приближенными оценками: n
~= m
n
~) (x i − m ∑ ~ . D − i=1
∑ xi i −1
n
и
2
n −1
26
1.3. Множественное линейное уравнение регрессии. Множественный коэффициент корреляции Общий случай Имеем n опытов, в каждом из которых наблюдаются величины Y, X1, X2,..., Xm, где X1, X2, ..., Xm – факторы, или предикторы, от которых может зависеть Y-предиктант. В процессе наблюдений Y изменяется: Y1, Y2, Y3,..., Yn , X1 – X11, X12, X13, ..., X1n, X2 – X21, X22, X23, ..., X2n, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., Xm – Xm1, Xm2, Xm3, ..., Xmn,
т. е. факторы Xhj , где h = 1, 2, 3, 4, ..., m;
j = 1, 2, 3, 4, ..., n.
Парные коэффициенты корреляции между Y и каждым из факторов в общем виде можно записать в следующем виде: n
rhy =
∑ (y i =1
i
− y )(x hi − x h ) nσ y σ h
,
(1.3.1)
где h = 1, 2, …, m. Парный коэффициент корреляции между факторами: n
rhj =
∑ (x i =1
hi
− x h )(x ji − x j ) nσ h σ j
,
(1.3.2)
где h, j = 1, 2, …, m. Уравнение линии связи (линейной): y − y = ∑ a j (x j − x j ), m
(1.3.3)
j=1
Коэффициенты линейной связи наилучшим образом можно найти методом наименьших квадратов: Ф = ∑ [ y i − y − ∑ a j (x ji − x j )] 2 = min . n
m
i =1
j=1
27
Дифференцируя последнее уравнение по каждому неизвестному a j , получаем систему m уравнений: n ⎡ m ⎤ ∂Ф = 2 ∑ ⎢ y i − y − ∑ a j (x ji − x j )⎥[− (x hi − x h )] = 0 . ∂a j ⎥⎦ i =1 ⎢ j =1 ⎣
Или
∑ ∑ a j (x ji − x j )(x hi − x h ) = ∑ (y i − y )(x hi − x h ) . n m
n
i =1 j=1
i =1
Учитывая уравнения (1.3.1) и (1.3.2), имеем: m
∑ a jrhjnσ h σ j =r hy nσ y σ h . j =1
Деля обе части последнего уравнения на nσ h , получаем: m
∑ a jrhjσ j = r hy σ y . j=1
Разделим обе части последнего выражения на σ y : σj
m
∑a r j=1
j hj
σy
= r hy .
(1.3.4)
Обозначим: aj a j = βj
σy σj
σj σ
= β j , откуда y
, j = 1, 2, 3, …, m
Система уравнений (1.3.4) примет вид: m
∑ β j rhj =r hy , т. е. j=1
⎧ β1r11 + β 2 r12 + β3r13 + β4 r14 + ... + β m r1m = r1y , ⎪ β r + β r + β r + β r + ... + β r = r ⎪ 1 21 2 22 3 23 4 24 m 2m 2 y, ⎨ ⎪ ........................................................................, ⎪⎩β1rm1 + β 2 rm 2 + β3rm 3 + β4 rm 4 + ... + β m rmm = rmy .
28
(1.3.5)
В последней системе r11 = r22 = r33 = r44 = ... = rmm = 1 , неизвестные β1 , β2 , β3 ,...., β m . Определитель системы имеет вид: 1 r12 r 1 D = 21 ... ... rm1 rm 2
... r1m ... r2 m . ... ... ... 1
Если D ≠ 0 , то находим определители D1 , D 2 , D3 ,..., D m путем последовательной замены соответствующих столбцов определителя столбцом свободных членов. Неизвестные коэффициенты определяем: D D1 D D , β 2 = 2 , β 3 = 3 , ..., β m = m . D D D D Подставляя найденные β j в (1.3.5), определим все a j в так β1 =
называемом сигмальном масштабе. Подставив a j в (1.3.3), найдем уравнение линейной связи: y = a 0 + a1x1 + a 2 x 2 + ... + a m x m ,
где
a 0 = y − a1x1 − a 2 x 2 − ... − a m x m .
Множественный коэффициент линейной корреляции имеет вид:
R = β1 r1y + β 2 r2 y + β 3 r3 y + ... + β m rmy . Во всех системах уравнений коэффициенты β j выражены через σ j и σ y . Поэтому говорят, что уравнения записаны в сигмальном масштабе. Применение σ -масштаба позволяет выявить наиболее влияющие факторы на прогнозируемую величину. Согласно свойству сигмального масштаба коэффициенты β1 , β 2 , β 3 ,..., β m показывают весомость, степень влияния каждого фактора. Так напри-
29
мер, если отношение
β1 > 1 , то можно утверждать во сколько раз β2
фактор X1 влияет на изменение величины Y больше (сильнее), чем фактор X 2 . Кроме того, знак перед коэффициентом β j показывает направленность действия соответствующего j-го фактора: знак «+» – с увеличением фактора имеет тенденцию в среднем возрастать Y-предиктант; знак «-» указывает на обратное влияние, т. е. с увеличением фактора X j предиктант Y имеет тенденцию в среднем убывать. Необходимо отметить, что с увеличением учета числа факторов коэффициенты β j могут по абсолютной величине уменьшаться, т. е. дополнительный фактор уточняет влияние других величин. Например, мы рассмотрели влияние на Y двух величин X1 и X 2 и нашли коэффициенты β1 и β 2 . Если при включении нового фактора X 3 , величины β1 и β 2 почти не изменились по абсолютной величине, то влияние фактора X 3 несущественно и его нецелесообразно включать в рассмотрение. Если β1 и β 2 изменились, то влияние X 3 желательно учитывать. Множественный коэффициент корреляции иногда называют совокупным коэффициентом корреляции. Квадрат множественного коэффициента корреляции принято называть коэффициентом детерминации. Заметим, что формула расчета множественного коэффициента корреляции записана в сигмальном масштабе в самом общем виде, т. е. для любого количества факторов. Свойства множественного коэффициента корреляции: 1) 0 ≤ R ≤ 1 , в отличие от парного коэффициента корреляции множественный не показывает направленность действия факторов, так как он только положительный (направленность факторов характеризуют коэффициенты β j ).
30
2) R = 1 – связь между рассматриваемыми величинами функциональная. 3) R = 0 – Y не может быть линейно связан с X j . Нелинейная связь может иметь место. Частные случаи 1) Z зависит от двух факторов X и Y , причем каждая переменная измеряется N раз. Тогда формулы (1.3.1) и (1.3.2) принимают вид: n
∑ (z i − z )(x i − x )
rzx = i =1
nσ z σ x n
rxy =
∑ (x i =1
i
n
∑ (z i − z )(y i − y )
rzy = i =1
− x )(yi − y ) nσ x σ y
nσ z σ y
,
.
Уравнение связи: z − z = a1 (x − x ) + a 2 (y − y ) . n
Ф = ∑ [(z i − z ) − a1 (x i − x ) − a 2 (y i − y )]2 = min . i =1
Далее, n ∂Ф = −2 ∑ [(z i − z ) − a1 (x i − x ) − a 2 (y i − y )](x i − x ) = 0 , ∂a1 i =1 n ∂Ф = −2 ∑ [(z i − z ) − a1 (x i − x ) − a 2 (y i − y )](y i − y ) = 0 . ∂a 2 i =1
Или n n ⎧ n 2 ⎪⎪a1 ∑ (x i − x ) + a 2 ∑ (y i − y )(x i − x ) = ∑ (z i − z )(x i − x ), i =1 i =1 ⎨ i =n1 n n ⎪ a1 ∑ (x i − x )(y i − y ) + a 2 ∑ (y i − y )2 = ∑ (z i − z )(y i − y ). ⎪⎩ i =1 i =1 i =1
Используя (1.3.6), имеем: 31
(1.3.6)
⎧⎪a 1 rxx nσ 2x +a 2 ryx nσ y σ x = rzx nσ z σ x , ⎨ 2 ⎪⎩ a 1 rxy nσ x σ y + a 2 ryy nσ y = rzy nσ z σ y . Учитывая, что rxx = ryy = 1 , и деля обе части первого уравне-
ния на nσ x , а второго – на nσ y , получим:
⎧ a 1σ x + a 2 ryx σ y = rzx σ z , ⎨ ⎩ a 1rxy σ x + a 2 σ y = rzy σ z .
a1 =
rzx σz
ryx σ y
rzy σz σx
σy , ryx σ y
rxy σ x
σx rxy σ x σx
a2 =
σy
rzx σz rzy σz , ryx σ y
rxy σ x β1 = a1
R = β1rxz + β 2 ryz ,
σx , σz
σy
β2 = a 2
σy σz
.
Уравнение линейной связи: z = a 0 + a1x + a 2 y , где a 0 = z − a1x − a 2 y . 2) Y зависит только от Х. Уравнение связи: y − y = a (x − x ) или
y = y + ax − ax , или
y = a 0 + ax , где a 0 = y − ax n
rxy =
∑ (x i − x )(y i − y )
i =1
nσ x σ y
,
n
Ф = ∑ [(y i − y ) − a (x i − x )]2 = min . i =1
n ∂Ф = −2∑ [(y i − y ) − a (x i − x )](x i − x ) = 0 , ∂a i =1
n
∑ a (x i − x )
i =1
2
n
= ∑ (y i − y )(x i − x ) , i =1
anrxx σ 2x = rxy nσ x σ y , или arxx σ x = rxy σ y ,
32
a = rxy
σy σx
,
так как
Уравнение связи: σ y − y = rxy y (x − x ) , или σx y = a 0 + rxy
σy σx
x,
где
rxx = 1.
y = rxy
σy σx
(x − x ) + y ,
a 0 = y − rxy
σy σx
или
x.
1.4. Метод наименьших квадратов Установление вида теоретической связи между случайными величинами представляет одну из основных задач при их изучении. В предыдущем параграфе рассмотрено уравнение линейной регрессии в самом общем виде и его частные случаи. К сожалению, возможности метода ограничены только случаем линейной зависимости. Однако случайные величины могут быть зависимы, но некоррелированы (значение коэффициента корреляции близко к 0) и приходится искать другой (нелинейный) тип связи. На практике исследователь из каких-то соображений гипотезирует вид теоретической зависимости, коэффициенты которой находятся методом наименьших квадратов. Суть метода – найти коэффициенты гипотезируемой зависимости таким образом, чтобы сумма квадратов отклонений эмпирических точек предиктанта от их теоретически рассчитанных была наименьшей. Рассмотрим применение метода наименьших квадратов для различных видов связи. 1.4.1. Линейная связь между двумя случайными величинами
Имеем n наблюдений за двумя величинами X : x1 , x 2 ,..., x n и
Y : y1 , y 2 ,..., y n . Пусть расположение точек (x i .y i ) , где i = 1 ÷ n
33
наводит исследователя на мысль о линейной зависимости между случайными величинами: y = ax + b .
(1.4.1)
Коэффициенты a , b в этой зависимости – неизвестны. Найдем их согласно требованиям метода наименьших квадратов: n
(
Φ = ∑ y i теор − y i эмп i =1
ческие,
2
)
yi теор – рассчитанные теорети-
= min , где
yi эмп – эмпирические (наблюдаемые) значения величины
Y. Иначе последнее равенство можно записать: 2
n
Φ = ∑ (ax i + b − y i ) = min .
(1.4.2.)
i =1
Выполняя условие экстремума (минимума), продифференцируем (1.4.2) по неизвестным a и b . Получим нормальную систему уравнений: n ⎧ ∂Φ = 2 ∑ (ax i + b − y i )x i = 0 ⎪⎪ ∂a i =1 ⎨ n ∂ Φ ⎪ = 2∑ (ax i + b − y i ) = 0 ⎪⎩ ∂b i =1 n n ⎧ n 2 + = a x b x ∑ i ∑ x i yi ⎪⎪ ∑ i i =1 i =1 ⎨ i =1 n n ⎪ a ∑ x i + bn = ∑ y i ⎪⎩ i =1 i =1
или
(1.4.3)
Решая (1.4.3), найдем: D1 D , b = 2 , где D – определитель системы; D1 и D 2 – опреD D делители, полученные из определителя D путем замены соответa=
ственно первого и второго столбца столбцом свободных членов системы (1.4.1). Для обеспечения единственности решения должен определитель системы D ≠ 0 . Подставив найденные коэффициенты a и b в уравнение (1.4.1), найдем теоретическое уравнение связи. 34
Естественно, что результаты, полученные в предыдущем параграфе с использованием сигмального масштаба, должны полностью совпадать с результатами, полученными методом наименьших квадратов. С помощью среднего квадратического отклонения можно оценить погрешность полученных расчетных значений:
∑ (y i теор − y i эмп ) n
δ=
2
i =1
n
.
Совершенно очевидно, что по аналогии можно найти коэффициенты множественного линейного уравнения регрессии. 1.4.2. Построение нелинейных уравнений множественной регрессии
В процессе n наблюдений Y изменяется: Y1, Y2, Y3,..., Yn , X11, X12, X13, ..., X1n, X1 – X21, X22, X23, ..., X2n, X2 – . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., Xm1, Xm2, Xm3, ..., Xmn . Xm – Пусть зависимость имеет степенной вид: y = a 0 x 1a 1 x a2 2 ...x amm .
(1.4.4)
Прологарифмируем (основание логарифма значения не имеет, пусть это – 10). lg y = lg a 0 + a 1 lg x 1 + a 2 lg x 2 + ... + a m lg a m .
Параметры уравнения определим методом наименьших квадратов при условии: 2
n
Φ = ∑ (lga 0 + a1 lg x1i + a 2 lg x 2i + ... + a m lg x mi − lg y i ) = min . i =1
35
Продифференцировав по всем a j ( j = 0 ÷ m ) и сделав преобразования, получим нормальную систему m + 1 уравнений с неизвестными a 0 , a 1 , a 2 ,..., a m :
m +1
n n n n ⎧ + + + + = n lg a a lg x a lg x ... a lg x 0 1∑ 1i 2∑ 2i m∑ mi ∑lg yi , ⎪ i=1 i=1 i=1 i=1 ⎪ n n n n n ⎪ 2 ⎪lga0 ∑lgx1i + a1∑(lgx1i ) + a 2 ∑(lgx2i lgx1i ) + ...+ a m ∑(lgxmi lgx1i ) = ∑(lgyi lgx1i ), ⎨ i=1 i=1 i=1 i=1 i=1 ⎪........................................................................................................................................................., ⎪ n n n n n ⎪ 2 2 ⎪lga0 ∑lgxmi + a1∑(lgx1i lgxmi ) + a 2 ∑(lgx2i lgxmi ) + ...+ a m ∑(lgxmi ) = ∑(lg yi lgxmi ), ⎩ i=1 i=1 i=1 i=1 i=1
Если определитель системы D ≠ 0 , то lg a 0 =
D1 D , lg a1 = 2 , D D
a 0 = 10 D1
D
,
lg a 2 =
a1 = 10 D 21
D
D3 D ,..., lg a m = m +1 , откуда D D
, …,
a m = 10 D m +1
D
.
Замечание. Для удобства и краткости теоретических выкладок решения уравнений записаны в виде определителей, хотя известно, что на практике решать с помощью формул Крамера удобно только системы не выше 3-го порядка. Если системы содержат более трех уравнений, то надо воспользоваться одним из методов исключения неизвестных (например, метод Гаусса с выбором или без выбора главного элемента, метод Жордана–Гаусса и др.).
Найденные коэффициенты подставим в (1.4.4). Совершенно аналогично можно рассмотреть тип регрессии показательный, логарифмический, тригонометрический и пр. Наименьшая ошибка (невязка) позволяет предпочесть ту или иную зависимость. Аналитическое решение задачи определения коэффициентов корреляционных уравнений не представляет большой трудности. 36
Однако на практике способ наименьших квадратов иногда бывает неудобен, так как, приступая к вычислениям, мы часто не имеем сведений относительно порядка корреляционного уравнения, которое давало бы достаточно точное приближение эмпирических точек к графику теоретического вида связи. Поэтому приходится постепенно повышать порядок корреляционного уравнения, а это приводит к тому, что необходимо записывать новую нормальную систему уравнений и проводить вновь всю вычислительную работу. Для устранения этих неудобств П. Л. Чебышев предложил особый способ решения задачи подбора полиномов того или иного порядка. По способу Чебышева члены уравнения более высокого порядка прибавляются последовательно к уравнению порядка на единицу ниже, полученному в предыдущих расчетах. Погрешность нового уравнения оценивается при условии сохранения погрешности предыдущего уравнения. Если погрешность (невязка) нового уравнения с требуемой точностью не превосходит предыдущей невязки, то исследователь останавливает свой уже обоснованный выбор на предыдущем уравнении. Замечание. На практике корреляционную связь выше 3-го порядка используют редко вследствие быстрого накопления ошибок округления при работе с большими выборками.
37
2. СЛУЧАЙНЫЕ ФУНКЦИИ
2.1. Основные понятия Классическая теория вероятностей оперирует со случайными величинами, значения которых не зависят от времени или какоголибо другого параметра и при неоднократном воспроизведении одного и того же опыта меняются случайным образом. Предположим, что результатом опыта является теперь не число, а некоторая функция одного или нескольких аргументов, причем эта функция при повторении (реализации) опытов в одинаковых условиях может каждый раз случайным образом менять свой вид. Такую функцию будем называть случайной, а результат каждого отдельного опыта – возможной реализацией случайной функции. Таким образом, случайную функцию можно определить как множество или ансамбль всех ее реализаций. Условимся обозначать случайные функции прописными буквами с указанием в скобках аргумента, например U(t), V(t), H(t), а их возможные реализации соответствующими строчными буквами с индексами, указывающими номер опыта, при котором данная реализация получена, например u1(t), u2(t), u3(t), … , uN(t). В качестве примера можно рассмотреть данные срочных наблюдений на гидрометеорологической станции за температурой воздуха какого-либо определенного дня выбранного месяца (например, 15 мая) в течение нескольких лет (например, пяти). Представим эти наблюдения в виде графика (рис. 1). Наблюдения за отдельный год – это реализации: u1(t), u2(t), u3(t), u4(t), u5(t). 38
о
U(t), С 20
U5 (t) U4 (t) U3 (t) U1 (t)U2 (t)
15 10 5 0
3
6
9
12
15
18
21
[t,ч
Рис. 1. График изменения температуры воздуха в течение одного дня 15 мая за несколько лет
Если зафиксировать аргумент случайной функции t = ti и провести прямую, перпендикулярную оси абсцисс, то эта прямая пересечет каждую реализацию только в одной точке. Совокупность таких точек пересечения называют сечением случайной функции и обозначают U(ti). Очевидно, каждое сечение случайной функции представляет собой случайную величину, возможные значения которой – это значения функции в точках пересечения при t = ti . Поэтому случайную величину можно рассматривать как частный случай случайной функции при фиксированном значении аргумента. На рис. 1 сечение случайной функции показано при t = 6 ч. Оно представляет собой случайную величину с возможными значениями температуры, характерными для выбранного дня в заданное время суток. Используя понятие сечения, можно случайную функцию определить как совокупность или множество всех ее сечений. Однако можно поступить и наоборот, определив случайную функцию как
39
функцию, значение которой при любом фиксированном значении аргумента является случайной величиной U(ti). Аргумент t может принимать либо любые вещественные значения в заданном интервале, либо только определенные дискретные значения. В первом случае случайную функцию называют процессом, во втором – случайной последовательностью. Все гидрометеорологические процессы развертываются во времени непрерывно, однако ряды наблюдений мы, как правило, имеем в дискретном виде. Обычно для простоты такого разделения не делают и часто используют термин «случайный процесс» безотносительно к физической природе аргумента. Надо отметить, что аргументом случайной функции может быть не только время. Понятие случайной функции хорошо отражает сущность всех гидрометеорологических явлений. Так, например, уровень воды в реке (или водохранилище) меняется во времени случайным образом в зависимости от количества осадков, таяния снега, интенсивности оросительных мероприятий, солнечной радиации и пр.; дождевые осадки и сток изменяются во времени и по площади водосбора; аналогично меняются скорость инфильтрации и инфильтрационная способность почвы, распределение консервативных и неконсервативных загрязняющих ингредиентов в атмосфере, водотоках, водоемах, почве. Турбулентный характер атмосферных процессов влечет крайнюю изменчивость метеорологических величин во времени и в пространстве. При этом интенсивные турбулентные пульсации имеют место как для крупномасштабных процессов, так и для движений самого малого масштаба. Наличие турбулентности приводит к тому, что начальные условия не определяют полностью течение процесса и, следовательно, опыты, проведенные при одинаковых внешних условиях, будут приводить к различным результатам.
40
2.2. Основные характеристики случайной функции В классической теории вероятностей случайная величина Х считается полностью определенной с вероятностной точки зрения, если известна ее функция распределения
F(x ) = P(X < x ) , где Р – вероятность. Известно, что случайный процесс U(t ) можно рассматривать как совокупность всех его сечений, каждое из которых представляет собой случайную величину. Поэтому, если мы имеем n сечений случайного процесса: U(t 1 ), U(t 2 ), U(t 3 ),..., U(t n ), то этот случайный процесс мы можем приближенно охарактеризовать функцией распределения полученной системы случайных величин
F(u 1 , u 2 , u 3 ,..., u n ) = P(U 1 < u 1 , U 2 < u 2 , U 3 < u 3 ,..., U n < u n ).
Очевидно, что эта функция распределения тем точнее будет характеризовать случайный процесс, чем ближе друг к другу будут расположены сечения и чем больше число n их взято. Исходя из этого, случайный процесс U (t ) считают заданным, если для каждого значения аргумента t определена функция распределения случайной величины: F1 (U; t ) = P[U (t ) < u ], а также для каждой пары сечений t1 и t 2 аргумента
t опреде-
лена функция распределения системы двух случайных величин U i = U (t i ) и U j = U (t j ) : F2 (U i , U j ; t i , t j ) = P(U i < u i, U j < u j ) ; i, j = 1,2,..., n ,
и вообще для любых n значений t 1 , t 2 ,..., t n аргумента t определена n -мерная функция распределения Fn (U1 , U 2 ,..., U n ; t1, t 2 ,..., t n ) = P(U1 < u1, U 2 < u 2 ,..., U n < un )
41
случайных величин U1 = U(t 1 ), U 2 = U(t 2 ), ..., U n = U(t n ) . Если существуют смешанные частные производные от многомерной функции распределения, то можно записать многомерный дифференциальный закон распределения (многомерную функцию плотности вероятности): ∂ n Fn (U1 , U 2 ,..., U n ; t1, t 2 ,..., t n ) . ∂u1∂u 2 ...∂u n Случайный процесс будет полностью охарактеризован только в том случае, если заданы все многомерные функции распределения. Очевидно, что теоретически можно неограниченно увеличивать число сечений и получать при этом все более полную характеристику случайного процесса. Однако установить вид многомерных функций распределения и оперировать столь громоздкими характеристиками, зависящими от многих аргументов, крайне неудобно, и в этом далеко не всегда есть необходимость. Поэтому на практике более чем двумерные законы распределения применяются крайне редко. Часто для изучения случайных функций (также как и случайных величин в теории вероятностей) оказывается достаточным знание лишь некоторых основных характеристик, описываемых начальными и центральными моментами распределения. Начальным моментом порядка q1 + q 2 + ... + q n случайной функции U(t) называется математическое ожидание произведения соответствующих степеней ее различных сечений:
{
}
α q1 , q 2 ,..., q n (t1 , t 2 ,..., t n ) = M [U(t1 )]q1 [U(t 2 )]q 2 ...[U(t n )]q n . В
частности, начальный момент первого порядка: q1 + q 2 + ... + q n = 1 – это математическое ожидание случайной функции при фиксированном значении аргумента (т. е. по заданному ансамблю)
42
α1 (t ) = M[U (t )] = m u (t ) , причем ⎧+ ∞ ⎪ ∫ uf1 (u; t )dx при непрерывном t, ⎪ α1 (t ) = ⎨− ∞N ⎪ ∑ u p (u; t ) при дискретном t. ⎪⎩ k =1 k k
Здесь и далее предполагается, что интеграл абсолютно сходится; k = 1, 2, … , N – число реализаций; f1 (u; t ) – одномерная функция плотности распределения; p k (u; t ) – вероятность возмож-
ного значения случайной функции в заданном сечении. Очевидно, что математическое ожидание имеет размерность, равную размерности рассматриваемой величины, и обладает теми же свойствами, которые рассматриваются в классической теории вероятностей. Математическое ожидание (теоретическое среднее) является уже неслучайной функцией и дает представление о центре, вокруг которого при заданном t группируются значения различных реализаций случайной функции. Например, в качестве случайной функции мы будем рассматривать среднегодовые температуры как функции глубины в заданном районе океана. При этом каждая реализация из ансамбля будет представлять собой график изменения среднегодовой температуры по глубине за определенный год, а математическое ожидание сечения – многолетнюю среднегодовую температуру на определенной глубине. Обычно при изучении гидрометеорологических процессов математические ожидания, полученные осреднением по всем реализациям, представляют собой климатическую норму. Из всех начальных моментов случайной функции самостоятельное значение имеет только первый, остальные моменты, более высоких порядков, используются как вспомогательные для вычисления центральных моментов или их частных случаев, когда мате43
матическое ожидание случайной функции равно нулю. Записать начальный момент любого порядка не представляет трудности. Так, начальные моменты второго порядка q1 + q 2 + ... + q n = 2 могут быть двух типов: • для одного и того же сечения случайной функции
{
α2 (t ) = M [U (t )]2
}
–
и
• смешанный момент второго порядка для двух различных сечений – α1,1 = M[U (t i )U (t j )]. Центральным моментом порядка
q1 + q 2 + ... + q n случайной
функции U(t) называется математическое ожидание произведения соответствующих степеней ее центрированных сечений: q q ⎧⎪⎡ o ⎤ q1 ⎡ o ⎤ 2 ⎡ o ⎤ n ⎫⎪ μ q1 ,q 2 ,...,q n (t 1 , t 2 ,..., t n ) = M ⎨⎢ U(t 1 )⎥ ⎢ U(t 2 )⎥ ...⎢ U(t n )⎥ ⎬ , ⎦ ⎣ ⎦ ⎣ ⎦ ⎪⎭ ⎪⎩⎣ o
o
где U(t 1 ) = U(t 1 ) − m u (t 1 ), ... , U(t n ) = U(t n ) − m u (t n ) – центрированные сечения. Центральные моменты нулевого и первого порядков не представляют самостоятельного интереса, так как всегда равны постоянным величинам, соответственно единице и нулю. Центральные моменты второго порядка можно представить, во-первых, для одного и того же сечения случайной функции: ⎧⎪ ⎡ o ⎤ 2 ⎫⎪ μ 2,0 (t ) == M ⎨ ⎢ U (t )⎥ ⎬ = M[U (t ) − m u (t )]2 ⎦ ⎪⎭ ⎪⎩ ⎣
и, во-вторых, для двух различных сечений случайной функции:
[
]
o ⎡o ⎤ μ1,1 (t1 , t 2 ) = M ⎢ U (t i ) U (t j )⎥ = M{[U (t i ) − m u (t i )] U (t j ) − m u (t j ) }. ⎣ ⎦
44
Момент μ 2,0 (t ) является функцией одного аргумента t
(t = t i = t j ) и при каждом фиксированном его значении представляет собой дисперсию соответствующего сечения случайной функции: μ 2 , 0 ( t ) = D U (t ) . Дисперсия – это уже неслучайная величина, имеющая размерность квадрата размерности рассматриваемой случайной функции, и обладает теми же свойствами, которые рассматриваются в классической теории вероятностей. Положительный квадратный корень из дисперсии называют средним квадратическим отклонением в данном сечении случайной функции: σ U (t ) = D U (t ) , которое имеет уже размерность, совпадающую с размерностью самой случайной функции, и характеризует разброс случайных значений рассматриваемого сечения около своего центра рассеяния (математического ожидания). В гидрометеорологических исследованиях этот разброс от нормы часто называют аномалиями, изучение которых представляет самостоятельный интерес. Момент μ1,1 (t i t j ) для каждой пары t i и t j есть момент связи или корреляционный момент между соответствующими сечениями случайной функции. Его обычно обозначают μ1,1 (t i t j ) = K ij (t i , t j ) и называют корреляционной (автокорреляционной), или ковариационной функцией случайного процесса, которая обладает всеми свойствами, рассматриваемыми в классической теории вероятностей для корреляционных моментов. Очевидно, что при t i = t j = t корреляционная функция превращается в дисперсию. Из определения корреляционной функции следует ее симметричность относительно аргументов, т. е. K u (t i , t j ) = K u (t j , t i ) . (2.2.1) На практике часто вместо корреляционной функции рассматривают безразмерную нормированную корреляционную (автокорреляционную) функцию 45
R u (t i , t j ) =
K u (t i , t j )
σ u (t i )σ u (t j )
,
которая для каждой фиксированной пары значений t i и t j представляет коэффициент корреляции, характеризующий степень тесноты линейной зависимости между соответствующими сечениями случайной функции. В общем виде нормированная корреляционная функция для n сечений случайного процесса представима в виде матрицы парных коэффициентов корреляции между соответствующими сечениями, в которой все диагональные элементы равны единице, а элементы, симметричные главной диагонали (в силу свойства симметричности корреляционных функций) равны между собой:
R ij (t i , t j ) =
1
R12
R 21 ...
1 ...
R n1
...
R1n
... R 2 n , ... ...
R n 2 ...
1
i, j = 1,2,3,..., n; R u (t i , t j ) = R ij ; R 11 = R 22 = R 33 = ... = R nn = 1.
При решении многих прикладных задач часто бывает достаточно знать только первый начальный и второй центральный моменты. Причем для нормально распределенных случайных процессов эти характеристики являются исчерпывающими. Следует указать, что раздел теории случайных функций, оперирующий только с математическим ожиданием и корреляционными функциями, называют корреляционной теорией случайных функций.
2.3. Система случайных функций На практике приходится иметь дело одновременно с несколькими случайными функциями. Так, например, при изучении таких случайных процессов, как испарение приходится совместно 46
рассматривать ряд случайных процессов: температуру, ветер, давление атмосферы, солнечную радиацию и др.; при изучении потерь стока рассматривают перехват, испарение, задержание в бессточных депрессиях, инфильтрацию. Поэтому, кроме рассмотренных выше характеристик для каждой случайной функции, существенным является еще установление связи между различными функциями. Начальные моменты первого порядка совпадают с математическими ожиданиями соответствующих случайных функций. Центральные моменты второго порядка могут быть двух видов: вопервых, можно рассматривать второй центральный момент для двух сечений одной и той же случайной функции (это мы делали в предыдущем параграфе); во-вторых – для двух сечений, принадлежащих разным случайным функциям. При этом полученный корреляционный момент называют корреляционной функцией связи, или взаимной корреляционной функцией между двумя случайными функциями. Рассмотрим, например, систему двух случайных процессов: U(t ) и V(t ) . В корреляционной теории ее характеристиками будут:
m u (t ), m v (t ), K u (t i , t j ), K v (t i , t j ), а также корреляционная функция
связи:
[
]
K uv (t i , t j ) = M{[U (t i ) − m u (t i )] V (t j ) − m v (t j ) },
которая характеризует степень линейной зависимости между сечениями U(t i ) и V(t j ). В частном случае, при t i = t j корреляционная функция будет характеризовать степень линейной зависимости сечений случайных процессов U(t ) и V(t ) , соответствующих одному и тому же значению аргумента.
Корреляционная функция связи K uv (t i , t j ) не является сим-
метричной относительно своих аргументов: K uv (t i , t j ) ≠ K uv (t j , t i ) , но обладает тем свойством, что при одновременной перестановке аргументов и индексов выполняется равенство: 47
K uv (t i , t j ) = K vu (t j , t i ).
(2.3.1)
Легко показать, что и автокорреляционная функция, и корреляционная функция связи не изменяется при добавлении к каждой из них неслучайных слагаемых (студентам предлагается выполнить доказательство самостоятельно). Используя этот факт, часто вместо самого случайного процесса рассматривают центрированный случайный процесс (с математическим ожиданием, равным нулю). Безразмерную величину
R uv (t i , t j ) =
K uv (t i , t j )
σ u (t i )σ v (t j )
называют нормированной корреляционной функцией связи, которая для любой пары фиксированных аргументов t i и t j представляет собой коэффициент корреляции случайных величин U(t i )
( )
и V t j . Если R uv (t i , t j ) = 0 , то случайные процессы называются
несвязными. Также как и для случайных величин, условие несвязности является необходимым, но недостаточным для независимости случайных процессов (оно характеризует только отсутствие линейной зависимости). Для характеристики N случайных процессов U1 (t ), U 2 (t ), ... , U N (t ) для фиксированных сечений в корреляцион-
ной теории достаточно задать N математических ожиданий, N корреляционных функций и N (N–1) корреляционных функций связи. Корреляционные функции и корреляционные функции связи удобно записывать в виде корреляционной матрицы
48
( (
) )
(
)
K11 t i , t j K 21 t i , t j K sg t i , t j = ... K N1 t i , t j
(
)
( (
) )
(
)
K12 t i , t j K 22 t i , t j ... K N2 ti , t j
(
( ) ( )
... K1N t i , t j ... K 2 N t i , t j , ... ... ... K NN t i , t j
(
)
(
)
)
в которой для краткости записи K u s u g t i , t j = K sg t i , t j , и при s = g (по главной диагонали) записаны корреляционные функции, а при s ≠ g – корреляционные функции связи между сечениями различных случайных процессов (s, g = 1, 2, …, N).
2.4. Суммирование случайных функций Пусть случайная функция W(t) представляет собой сумму двух случайных функций W(t) =U(t)+V(t). (2.4.1) При каждом фиксированном t ее математическое ожидание, согласно свойству математического ожидания суммы случайных величин, равно m w (t ) = m u (t ) + m v ( t ) .
(2.4.2)
Найдем корреляционную функцию: o ⎡o ⎤ K w t i , t j = M ⎢ W (t i ) W t j ⎥ = M [W (t i ) − m w (t i )] W t j − m w t j . ⎣ ⎦ Подставим в последнее равенство (2.4.1) и (2.4.2), получим:
(
)
( )
[ ( )
{
[
( )]}
][
]
K w (t i , t j ) = M{ U(t i ) + V(t i ) − m u (t i ) − m v (t j ) U(t j ) + V(t j ) − m u (t j ) − m v (t j ) }.
Сделаем преобразования, сгруппировав члены так, чтобы получить соответствующие центрированные случайные функции.
49
Тогда o o ⎧⎡ o ⎤⎡ o ⎤⎫ K w t i , t j = M ⎨⎢ U(t i ) + V(t i )⎥ ⎢ U t j + V t j ⎥ ⎬. ⎦⎣ ⎦⎭ ⎩⎣ Перемножим двучлены под знаком математического ожидания. Получим:
(
)
( ) ( )
o o o o o o o ⎡o ⎤ K w t i , t j = M ⎢ U ( t i ) U t j + V ( t i ) V t j + U (t i ) V t j + V ( t i ) U t j ⎥ . ⎣ ⎦ Используя свойство математического ожидания (математическое ожидание алгебраической суммы случайных величин равно той же сумме математических ожиданий этих величин), окончательно имеем
(
)
( )
( )
( )
( )
o o o o ⎡o ⎤ ⎡o ⎤ ⎡o ⎤ ⎡o ⎤ Kw t i , t j = M⎢U(t i ) U t j ⎥ + M⎢V(t i ) V t j ⎥ + M⎢U(t i ) V t j ⎥ + M⎢V(t i ) U t j ⎥ = ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
(
)
( )
( )
( )
= K u (t i , t j ) + K v (t i , t j ) + K uv (t i , t j ) + K vu (t i , t j ).
( )
(2.4.3)
Таким образом, мы видим, что для определения корреляционной функции суммарного случайного процесса необходимо знать корреляционные функции каждого слагаемого процесса и корреляционные функции связи этих процессов. В частном случае, когда процессы U (t ) и V(t ) не связны, то K w (t i , t j ) = K u (t i , t j ) + K v (t i , t j ) ,
(2.4.4)
так как K uv (t i , t j ) = K vu (t i , t j ) = 0. Если случайная функция состоит из N слагаемых N
W (t ) = ∑ U g (t ) , g =1
то формулы (2.4.2), (2.4.3) и (2.4.4) можно соответственно обобщить следующим образом: N
m w (t ) = ∑ m u g ( t ) , g =1
50
K w (t i , t j ) = ∑ K u g (t i , t j ) + ∑ K u g u s (t i , t j ) , N
N
g =1
g <s
K w (t i , t j ) = ∑ K u g (t i , t j ) . N
g =1
2.5. Стационарные случайные функции Наиболее простым для изучения является особый класс случайных процессов – стационарные случайные процессы, статистические свойства которых практически не изменяются с изменением аргумента. Случайный процесс U(t ) называется строго стационарным (или стационарным в узком смысле), если все его конечномерные законы распределения f n (u1 , u 2 ,..., u n ; t1 , t 2 ,..., t n ) произвольного порядка n не изменяются при любом сдвиге всей группы точек t1 , t 2 ,..., t n вдоль оси t, т. е. при любом n и t 0 справедливо равенство:
f n (u1, u 2 ,...,u n ; t1, t 2 ,..., t n ) = f n (u1, u 2 ,...,u n ; t1-t0, t 2 − t 0 ,..., t n − t 0 ) . (2.5.1) Следовательно, плотность распределения инварианта относительно сдвига начала отсчета аргумента t. Заметим, что термин «стационарность» возник при изучении случайных функций времени и характеризует постоянство их свойств во времени. Для случайных процессов, аргументом которых является другая переменная, например расстояние, вводится термин «однородность». Обычно термин «однородность» применяют к случайным полям, характеризуя их однородность в пространстве, а под стационарностью поля понимают постоянство его статистических свойств во времени, хотя иногда вместо стационарности говорят об однородности по времени.
51
Полагая в (2.5.1) t 0 = t1 , получим
f n (u1,u 2,...,u n ; t 1,t 2,...,t n ) = f n (u1,u 2,...,u n ; 0, t 2 − t1,...,t n − t1 ) . Мы видим, что n-мерные плотности распределения вероятностей зависят не от абсолютного положения значений t 1,t 2 ,...,t n на оси t, а от их относительного расположения, а именно от разностей t 2 − t1 ,..., t n − t1 . Это значит, что всякое перемещение начала отсчета по оси времени преобразует совокупность реализаций случайной функции в саму себя таким образом, что ее статистические характеристики не изменяются. Данное определение стационарности налагает слишком много ограничительных условий на случайные процессы, и на практике их невозможно даже проверить. Из равенства (2.5.1) следует, что для стационарного случайного процесса n-мерная плотность распределения вероятностей зависит не от n, а от n-1 значений аргумента, так как одно из значений аргумента всегда можно принять за начало отсчета (например, положить t 1 = 0 ). Отсюда ясно, что одномерная плотность распределения вероятностей f1 (u; t ) − f1 (u; t - t 0 ) = f1 (u; 0) − f1 (u )
не зависит от t и является одной и той же для всех сечений случайного процесса. Двумерная плотность распределения вероятностей f 2 (u1, u 2 ; t1, t 2 ) = f 2 (u1, u 2 ; t1 - t 0 , t 2 − t 0 ) = f 2 (u1, u 2 ; 0, t 2 − t1 ) = = f 2 (u1 , u 2 ; t 2 − t1 ) = f 2 (u1 , u 2 ; τ ) ,
где τ = t 2 − t1 зависит только от одного аргумента τ – сдвига сечений по координатной оси t. Для двух произвольных сечений стационарной функции двумерную плотность распределения вероятностей в общем виде можно записать
52
f 2 (u i , u j ; t i , t j ) = f 2 (u i , u j ; t i - t 0 , t j − t 0 ) = f 2 (u i , u j ; 0, t j − t i ) = = f 2 (u i , u j ; 0, t j − t i ) = f 2 (u i , u j ; τ ).
Тогда основные характеристики стационарного случайного процесса имеют вид: m u (t ) =
K u (t i .t j ) =
+∞
+∞
−∞
−∞
∫ uf1 (u; t )du = ∫ uf1 (u )du = m u = const .
+∞ +∞
∫ ∫ (u i − m u )(u j − m u )f 2 (u i , u j ;
−∞ −∞
Очевидно, что при τ = 0
(2.5.2)
τ )du i du j = K u (τ ) . (2.5.3)
K ij (τ ) = K u (0) = D u = const . Следо-
вательно, математическое ожидание и дисперсия являются постоянными величинами для всех сечений стационарного процесса. Эти условия равносильны, например, утверждению о постоянстве климата и физико-географических условий формирования стока, т. е. отрицанию возможности изменения их во времени. Корреляционная функция стационарного случайного процесса является функцией только одного аргумента, т. е. коэффициент корреляции между сечениями U (t i ) и U (t j ) для любых t i и t j не меняется при сдвиге на время τ , иначе говоря, такой же коэффициент корреляции будет между сечениями U (t i + τ ) и U (t j + τ ). Условия (2.5.2) и (2.5.3) являются необходимыми, но недостаточными условиями стационарности. Это означает, что если процесс стационарен, то эти условия выполняются всегда. Обратное утверждение не гарантирует стационарность при n ≥ 3 . Однако при решении большинства практических задач гидрометеорологии многомерные плотности распределения ( n > 2) применяются очень редко, а из гипотезы стационарности используют лишь условия (2.5.2) и (2.5.3), что значительно упрощает описание случайных процессов. В связи с этим в корреляционной теории выделяют 53
класс случайных процессов, для которых выполняются условия (2.5.2) и (2.5.3). Такие процессы называют стационарными в широком смысле. В общем случае стационарность в широком смысле не тождественна стационарности в узком смысле. Случайные функции, стационарные в узком смысле, будут стационарны и в широком смысле, но не наоборот. Но имеется целый класс стационарных процессов, для которых понятие стационарности в узком и широком смысле совпадают. Это – нормальные стационарные процессы, для которых функция плотности вероятностей полностью определена математическим ожиданием и корреляционной функцией. В дальнейшем, когда речь будет идти о стационарности, мы будем иметь в виду именно стационарность в широком смысле. Из симметричности корреляционной функции (см. свойство (2.2.1)) следует и четность корреляционной функции стационарного случайного процесса: K u (τ ) = K u (− τ ) . На практике условия стационарности можно непосредственно проверить, вычислив средние значения, дисперсии и корреляционные функции для разных моментов времени. Если значения средних и дисперсий постоянны для всех сечений, а коэффициенты корреляции между любыми двумя сечениями не зависят от постоянного сдвига, то процесс стационарен. 2.5.1. Система стационарных случайных функций
Пусть имеем систему случайных процессов U1 , U 2 ,..., U N . Эта система называется стационарной в широком смысле, или стационарно связной, если в этом смысле стационарен каждый из процессов, входящих в систему, а корреляционные функции связи являются функциями только одного аргумента τ K sg (t i , t j ) = K sg (τ) ,
s, g = 1,2,..., N .
54
Здесь, как и в п. 2.2, обозначено K sg (t i , t j ) = K u s u g (t i , t j ). Опираясь на свойство корреляционных функций (2.3.1), можно записать K sg (τ) = K gs (− τ) , т. е. корреляционную функцию связи двух стационарных процессов можно описать одной корреляционной функцией связи, заданной как при положительных, так и отрицательных значениях аргумента, при этом функция K sg (τ) в общем случае не является четной. Из изложенного ясно, что принятие гипотезы стационарности случайных функций приводит к значительному упрощению описания их статистических свойств, что позволило, в свою очередь, разработать эффективные математические методы, используемые при прогнозировании. Для нестационарных функций решение этих вопросов связано с большими трудностями. Поэтому всякую случайную функцию, с которой имеют дело на практике, прежде всего, пытаются рассматривать с точки зрения возможности считать ее стационарной. Для процессов, имеющих место в атмосфере и гидросфере, гипотеза об их стационарности хорошо оправдывается для сравнительно небольших интервалов времени или расстояний. С увеличением интервалов изменения аргумента наблюдается и нарушение стационарности. Так, для гидрологических рядов гипотеза о стационарности считалась достаточно естественной в течение длительного времени. Однако все возрастающая хозяйственная деятельность человека на водосборе, а также возможные антропогенные изменения климата требуют в настоящее время обоснование этой гипотезы для каждого конкретного водосбора. Антропогенные изменения стока приводят к тому, что стационарные распределения приходится строить либо по очень коротким рядам, либо по неоднородным гидрологическим рядам, что создает огромные проблемы в обеспечении устойчивости статистических параметров. Аналогичные замечания можно сделать и для других гидрометеорологических характеристик. Несмотря на то, что нарушение 55
стационарности приводит к изменению математического ожидания рассматриваемой гидрометеорологической величины, тем не менее, стационарность в смысле независимости корреляционной функции от начала отсчета сохраняется с достаточно допустимым на практике приближением. Исходя из этого, часто на практике вместо самого случайного процесса целесообразно рассматривать центрированный случайный процесс, так как этот процесс можно уже считать стационарным с постоянным математическим ожиданием, равным нулю, а корреляционные функции центрированного и исходного процессов совпадают. Поэтому для многих процессов атмосферы и гидросферы на основе большого статистического материала различными авторами предложены разнообразные корреляционные функции, общими свойствами которых являются: 1) стремление их к нулю при возрастании аргумента, и 2) максимальные значения этих функций, равные дисперсиям случайных процессов, достигаются при нулевом значении аргумента. Если мы рассматриваем стационарный процесс с корреляционной функцией K u (τ ) , то ее максимум будет при τ = 0 , в то время как корреляционная функция связи K uv (τ ) максимума при τ = 0 может не дости-
гать. Действительно, влияние одного процесса на другой может происходить с некоторым запаздыванием, например нагревание воды за счет солнечного излучения происходит лишь спустя некоторое время τ . В этом случае значение корреляционной функции связи между сечениями этих процессов при интервале τ , отличном от нуля, будет больше, чем между одновременными сечениями этих процессов. Наличие такого запаздывания может служить причиной несимметричности корреляционной функции связи относительно аргумента τ , т. е. K uv (τ ) ≠ K uv (− τ ) . С некоторыми видами корреляционных функций мы познакомимся ниже.
56
2.6. Положительно определенные функции Для убедительности доказательств последующих утверждений введем понятие положительно определенной функции. Функция f(t), удовлетворяющая неравенству
∑ ∑ αi α jf (t i − t j ) ≥ 0 для любых наборов t1, t 2 ,..., t n и любых n веn n
i =1 j=1
щественных α1 , α2 ,..., α n называется положительно определенной. Рассмотрим сумму такого вида для стационарной корреляционной функции K u (τ ) 2
o o ⎡o ⎤ ⎡n ⎤ ( ) ( ) ( ) ( ) α α − = α α = α K t t M U t U t M U t ∑∑ i j u i j ∑∑ ⎢ i ∑ j ⎥ i j 1 i ⎢ ⎥ ≥ 0. i =1 j=1 i =1 j=1 ⎣ ⎦ ⎣i =1 ⎦ n n
n n
Для стационарного случайного процесса начало отсчета можем принять при t i = t j . Последняя сумма не может быть отрицательной, так как рассматривается математическое ожидание величины, возведенной в квадрат. Таким образом, корреляционная функция стационарного случайного процесса представляет собою положительно определенную функцию. Справедливым является и обратное утверждение: всякая положительно определенная функция является корреляционной функцией некоторого стационарного случайного процесса.
2.7. Свойство эргодичности случайных процессов Стационарные случайные процессы могут обладать замечательным свойством, получившим название свойства эргодичности. Рассмотрим подробнее смысл этого свойства. До сих пор мы определяли основные характеристики случайного процесса путем осреднения по множеству реализаций. Но возможен и другой способ 57
осреднения, если мы располагаем одной реализацией достаточной продолжительности. При этом если связь между сечениями случайного процесса убывает быстро, то отдельные части реализации мы имеем право рассматривать как независимые между собой. Поэтому совокупность таких отдельных n частей одной реализации мы можем принимать за совокупность n самостоятельных реализаций. Для стационарных процессов нам известно, что математическое ожидание и дисперсия не зависят от аргумента, поэтому можно, не разделяя реализацию на отдельные части, определить эти характеристики по всей данной реализации: 2
1 Δt 1 Δt ( ) mu = u t dt ; D = ∫ ∫ [u (t ) − m u ] dt; u Δt 0 Δt 0
1 Δt K u (t ) = ∫ [u (t ) − m u ][u (t + τ) − m u ]dt , Δt 0 где Δt – длина интервала, на котором задана реализация. Возникает закономерный вопрос: будут ли характеристики случайного процесса, полученные путем осреднения по совокупности реализаций, совпадать с соответствующими характеристиками, найденными путем осреднения только по одной реализации. Оказывается, что это выполняется не для всех стационарных функций. Говорят, что стационарные функции обладают свойством эргодичности, если статистические характеристики, полученные путем осреднения по множеству реализаций в данный момент времени, с вероятностью, сколь угодно близкой к единице, равны статистическим характеристикам, полученным путем осреднения по достаточно длительному интервалу времени одной единственной реализации.
58
Здесь использовано известное из теории вероятностей понятие сходимости по вероятности, которое, например, для среднего значения по реализации может быть записано в виде: lim P( U t − m u < ε ) = 1 ,
Δt → ∞
(2.7.1)
где U t – средняя по реализации за интервал времени Δt , m u – средняя по множеству реализаций в данный момент времени, ε – бесконечно малая величина. Равенство (2.7.1) дает достаточные основания для того, чтобы на практике можно было вместо m u использовать значение U t , где Δt сравнительно велико. Поэтому остается выяснить, при каких условиях для Δt на практике выполнимо условие (2.7.1), так как при наличии наблюдений на малом интервале изменения аргумента можно получить искомые характеристики с недопустимо большими ошибками. Опуская подробные доказательства, которые можно найти, например, в двухтомнике Монина А. С., Яглома А. М., заметим, что Тейлором было доказано: для дисперсии разностей между истинным значением, полученным осреднением по одной реализации при достаточно большом Δt , справедлива асимптотическая формула: τ D ≈ 2 0 K u (0 ) , где Δt – интервал осреднения, τ0 – величина, назыΔt 1 ∞ ваемая временем корреляции, причем τ0 = ∫ K u (τ)dτ . K u (0 ) 0 Отсюда видно, что для надежного определения искомых характеристик по одной единственной реализации необходимо брать интервал осреднения Δt во много раз больше, чем время корреляции τ0 , которое иногда называют «временным масштабом корреляции». Физический смысл этого условия состоит в том, что при τ > τ0 величины могут считаться независимыми.
59
Надо отметить, что отдельные реализации случайного процесса могут иметь свои специфические особенности, например, колебания вокруг различных средних. В этом случае среднее значение, полученное по одной реализации, может значительно отличаться от среднего по ансамблю реализаций. По отношению к корреляционной функции свойства эргодичности формулируются гораздо сложнее, а потому проверку их на практике осуществить в основном не удается. В связи с этим выводы об эргодичности делают, как правило, на основе соображений о физической сущности случайного процесса. Выполнение свойства эргодичности имеет большое значение, так как для определения статистических характеристик достаточно располагать одной реализацией, что мы обычно и имеем на практике. Например, в гидрометеорологии далеко не всегда удается осуществить многократное повторение эксперимента в одинаковых условиях, и потому все ряды наблюдений на гидрометеорологических станциях и постах практически представляют собою единственную реализацию. Если же мы все-таки располагаем несколькими реализациями, полученными в одинаковых условиях, то, пользуясь свойством эргодичности, можно получить статистические характеристики осреднением по каждой реализации, а затем взять в качестве искомых среднее арифметическое из них с учетом веса каждой реализации.
2.8. Структурная функция Из стационарных процессов наиболее важны процессы со стационарными приращениями ΔU = U(t + τ) − U(t ) . Математическое ожидание квадрата приращений (разности сечений, соответствующих двум значениям аргумента) называется структурной функцией B u (τ ) : 60
[
] {
}
B u (τ ) = M (ΔU )2 = M [U(t + τ) − U(t )]2 .
(2.8.1)
Впервые структурная функция была введена А. Н. Колмогоровым для описания статистической теории турбулентного движения. Из определения структурной функции видно, что она неотрицательна, т. е. Bu (τ ) ≥ 0 . Выразим структурную функцию через корреляционную. В формуле (2.8.1) сделаем тождественные преобразования путем добавления и вычитания одной и той же величины m u :
{
} {
}
Bu (τ) = M [U(t + τ) − U(t ) − mu + mu ]2 = M [U(t + τ) − mu ] − [U(t ) − mu ]2 =
{
} {
}
= M [U(t + τ ) − m u ]2 + M [U(t ) − m u ]2 − 2M{[U(t + τ) − m u ][U(t ) − m u ]} = = K u (0 ) + K u (0 ) − 2K u (τ = 2[K u (0) − K u (τ )]) .
(2.8.2)
Из последнего равенства видно, что структурная функция четна, т. е. Bu (τ ) = Bu (− τ ) , так как K u (τ ) = K u (− τ ) . Заметим, что четность структурной функции следует и из ее определения (3.5.1). При τ = 0 равенство (2.8.2) принимает вид: Bu (τ ) = 2[K u (0 ) − K u (0 )] = 0 . Этот же результат можно было получить из определения (2.8.1). Если для случайного процесса выполняется условие lim K u (τ) = 0 , то τ→0
lim Bu (τ ) = 2K u (0 ) = 2σ2u .
(2.8.3)
τ→0
Обозначим
lim Bu (τ) = Bu (∞ ) . τ→0
61
(2.8.4)
Тогда равенство (2.8.2) с условиями (2.8.3) и (2.8.4) примет вид: Bu (τ ) = Bu (∞ ) − 2K u (τ ) , или
K u (τ ) =
Bu (τ) − Bu (∞ ) . 2
Естественно, что на практике мы не имеем реализации на бесконечном интервале, т. е. не можем знать структурную функцию, соответствующую бесконечному аргументу. Однако в большинстве случаев структурная функция довольно быстро достигает некоторого предельного значения, начиная с которого при дальнейшем увеличении аргумента она фактически не меняется или меняется незначительно. Поэтому B u (∞ ) часто называют насыщающим значением структурной функции. Для стационарного случайного процесса, обладающего эргодическим свойством, структурную функцию, как и корреляционную, можно найти по одной единственной реализации по формуле: 2
1 Δt Bu (τ ) = ∫ [u (t + τ) − u (t )] dt . Δt 0
Во многих случаях использование структурной функции бывает предпочтительнее, чем корреляционной. Поясним это утверждение. Гидрометеорологические процессы, вообще говоря, нельзя считать стационарными. В качестве примеров, подтверждающих нестационарность, можно привести известный факт потепления Арктики в последние годы, изменение климата и речных стоков под влиянием хозяйственной деятельности человека (строительство гидроэлектростанций на больших реках) и пр. В этом случае средние значения гидрометеорологических величин, а также и другие статистические характеристики, определенные за различные периоды времени, ведут себя неустойчиво. На структурную функцию, исходя из ее определения (2.8.1), нестационарность длинноволновых возмущений не оказывает существенного влияния при малых значениях аргумента τ . Кроме
62
того, систематические ошибки, содержащиеся в данных различных сечений, при вычислении структурных функций взаимопогашаются. Таким образом, использование структурных функций в ряде случаев позволяет уменьшить нестационарность (неоднородность) случайного процесса и нивелировать систематические ошибки. Однако преимущества структурных функций существенны только при малых значениях τ . При вычислении же корреляционных функций через структурные точность корреляционных функций не повышается из-за ошибок вычисления насыщающего значения структурной функции.
2.9. Случайные поля 2.9.1. Основные понятия
Мы рассмотрели случайные функции одного аргумента, в качестве которого в частном случае могло быть время. Однако в гидрометеорологии приходится в основном иметь дело со случайными функциями, зависящими не только от времени, но и от пространственных координат. Такое пространственно-временное распределение получило название поля физической величины, или случайного поля. Например, такие гидрометеорологические процессы, как выпадение атмосферных осадков, испарение с подстилающей поверхности и т. д. образуют трехмерные поля, компонентами которых являются две географические координаты и время. Поля скорости, температуры в пограничном слое атмосферы – это функции уже четырех аргументов (трех пространственных координат и времени). С точки зрения математики можно рассматривать координаты некоторого трехмерного или четырехмерного (а в общем случае – n-мерного) пространства как вектор с соответствующими этому пространству компонентами, например λ(x , y, z, t ) , а потому сокращенно обозначать случайное поле U(λ ) . Далее, по аналогии со
63
случайными процессами, случайное поле можно рассматривать как множество всех его реализаций или множество всех его сечений, понимая под сечением случайного поля случайную величину, полученную при фиксированных значениях всех его аргументов (иначе, при фиксированном λ ). Следовательно, простой заменой t на λ все формулы, полученные для случайных процессов, будут иметь место и для случайных полей. Поэтому для случайного поля по аналогии можем записать n-мерную функцию распределения: Fn (U1 , U 2 ,..., U n ; λ1, λ 2 ,..., λ n ) = P(U1 < u1 , U 2 < u 2 ,..., U n < u n ) ,
n-мерную плотность распределения ∂ n Fn (U1 , U 2 ,..., U n ; λ1, λ 2 ,..., λ n ) = f n (u1 , u 2 ,..., u n ; λ1, λ 2 ,..., λ n ) , ∂u1∂u 2 ...∂u n
первый начальный момент (математическое ожидание), называемый иногда одноточечным начальным моментом первого порядка, α1 (λ ) = M[U(λ )] = m u (λ ) ,
второй центральный момент (дисперсия), называемый иногда одноточечным центральным моментом второго порядка, ⎧⎪⎡ o ⎤ 2 ⎫⎪ μ 2,0 (λ ) = M ⎨⎢ U(λ )⎥ ⎬ = M [U(λ ) − m u (λ )]2 = D u (λ ) , ⎦ ⎪⎭ ⎪⎩⎣ второй центральный смешанный момент (корреляционная функция), называемый иногда двухточечным центральным моментом (является функцией координат двух точек пространственновременной области),
{
}
[
]
o ⎤ ⎡o μ1,1 (λ i , λ j ) = M ⎢ U(λi ) U (λ j )⎥ = M{[U(λ i ) − m u (λ i )] U (λ j ) − m u (λ j ) }, ⎦ ⎣
64
нормированную корреляционную функцию K u (λ i , λ j ) R u (λ i , λ j ) = , σu (λ i )σu (λ j ) которая для каждой фиксированной пары точек λ i и λ j представляет коэффициент корреляции между двумя сечениями случайного поля. Записанные пространственно-временные моменты могут характеризовать связь, во-первых, между значениями случайного поля в одной и той же точке пространства за два различных момента времени (временная связь, или временные моменты); во-вторых, между двумя различными точками пространства в один и тот же момент времени (пространственная связь, или пространственные моменты); в-третьих, между двумя различными точками пространства в два различных момента времени (пространственновременная связь). В первом случае фиксируются координаты пространства и имеют дело со случайными временными процессами, которые мы подробно рассматривали выше. Во втором случае фиксируется время и изучается случайное поле, которое является функцией только пространственных координат (в гидрометеорологии такими координатами являются широта, долгота и высота или глубина). Третий случай является более общим, когда случайное поле является функцией пространственных координат и времени. Так, в гидрологии большое внимание уделяется анализу изменений стока и стокообразующих факторов во времени и в пространстве. Назначение этого анализа – выявить основные свойства исследуемых процессов: изменчивость, цикличность, характеристики периодических и непериодических колебаний, преемственности в развитии и пр. и предсказать их поведение в будущем. Поля метеорологических величин вследствие турбулентности атмосферы крайне изменчивы как в пространстве, так и во времени. В частных случаях, фиксируя момент времени, мы мо-
65
жем рассматривать процессы синоптического характера; фиксируя пространственные координаты, мы можем рассматривать эволюцию процесса в интересуемом месте. Основное отличие пространственных рядов от временных состоит в том, что их значения по пространственному аргументу распределены неравномерно, так как точки наблюдений в пространстве в основном расположены на неравных расстояниях. Временные процессы мы рассмотрели подробно, теперь остановимся на описании пространственных случайных полей. 2.9.2. Однородные и изотропные случайные поля и их характеристики
Существенным в описании временных случайных процессов, как мы видели, является условие их стационарности. Аналогичными упрощающими условиями для описания пространственных случайных полей являются условия их однородности и изотропности. Если все n-мерные законы распределения не изменяются при любом сдвиге (параллельном переносе) системы точек λ1 , λ 2 ,..., λ n на один и тот же вектор λ 0 , т. е. функции распределения (плотности распределения) не изменяются при замене сечений, соответствующих точкам λ1 , λ 2 ,..., λ n , сечениями λ 1 − λ 0 , λ 2 − λ 0 ,..., λ n − λ 0
f n (u1, u 2 ,..., u n ; λ1, λ 2 ,..., λ n ) = f n (u1, u 2 ,..., u n ; λ1 − λ 0 , λ 2 − λ0 ,..., λ n − λ0 ) , то такое случайное поле называется однородным. Если при этом конечномерные плотности вероятности не изменяются при всевозможных вращениях системы точек λ1 , λ 2 ,..., λ n вокруг осей, проходящих через начало координат, и при зеркальных отражениях этой системы точек относительно плоскостей, проходящих через начало координат, то такое случайное поле называется однородным и изотропным.
66
По аналогии с п. 2.5, f1 (u; λ ) = f1 (u; λ - λ 0 ) = f1 (u; 0) = f1 (u ) , f 2 (u1 , u 2 ; λ1 , λ 2 ) = f 2 (u1 , u 2 ; λ1 - λ 0 , λ 2 - λ 0 ) = f 2 (u1 , u 2 ; 0, λ 2 - λ1 ) =
= f 2 (u1,u 2; λ 2 -λ1 ) = f 2 (u1,u 2; r ) ,
где r = λ 2 − λ1 зависит только от одного аргумента r – сдвига сечений в пространстве. Для двух произвольных сечений однородного изотропного случайного поля двумерную плотность распределения вероятностей в общем виде можно записать f 2 (u i , u j ; λi , λ j ) = f 2 (u i , u j ; λ i - λ 0 , λ j - λ0 ) = f 2 (u i , u j ; 0, λ j - λi ) = = f 2 (u i , u j ; λ j - λi ) = f 2 (u i , u j ; r ).
Соответствующие моменты примут вид: +∞
+∞
−∞
−∞
m u (λ ) = ∫ uf1 (u; λ ) du = ∫ uf1 (u ) du = m u = const , (2.9.1)
K u (λi , λ j ) =
+∞ +∞
∫ ∫ (ui − mu )(u j − mu )f2 (ui , u j; r )duidu j = Ku (r ). (2.9.2)
−∞ −∞
Очевидно, что при r = 0
K u (r ) = K u (0 ) = D u = const .
Если случайные поля однородны и изотропны, то условия (2.9.1) и (2.9.2) всегда выполняются. Обратное утверждение не всегда верно. Однако в практике гидрометеорологических исследований выполнение названных условий ведет к значительному упрощению обработки статистического материала. Поэтому, если условия (2.9.1) и (2.9.2) выполняются, то, по аналогии с временными процессами, случайное поле называют однородным в широком смысле. Обычно, говоря об однородности и изотропности, в
67
практике гидрометеорологии понимают однородность в широком смысле. Естественно, что для полей гидрометеорологических характеристик турбулентного потока предположение об однородности даже в широком смысле всегда является некоторой идеализацией, так как точно оно никогда не выполняется. Действительно, говоря об однородности, необходимо потребовать, чтобы поток заполнял все неограниченное пространство, а уже одно это предположение является идеализацией в применении к реальным потокам. Далее, необходимо, чтобы все средние характеристики потока (скорость, давление, температура, влажность, соленость и пр.) были постоянными во всем пространстве, и чтобы статистический режим пульсаций не менялся при переходе от одной части пространства к другой. Разумеется, что эти требования могут выполняться лишь с удовлетворительной точностью в пределах некоторых ограниченных областей пространства, малых по сравнению с масштабами макроскопических неоднородностей и достаточно удаленных от всех ограничивающих поток твердых стенок. Таким образом, на практике можно говорить об однородности гидродинамических полей лишь в некоторой определенной области. По аналогии с временными процессами можно говорить и об осреднении пространственных полей по одной реализации в том случае, если выполняется условие эргодичности, а именно: однородное поле обладает свойством эргодичности, если все случайные характеристики, полученные осреднением по одной реализации, при безграничном увеличении диаметра области сходятся по вероятности к соответствующим характеристикам, полученным осреднением по всему множеству реализаций случайного поля. Структурная функция однородного случайного поля имеет вид:
{
B u (r ) = M [U(λ + r ) − U(λ )]
2
и по аналогии вывода в п. 2.8 имеем: 68
}
Bu (r ) − Bu (∞ ) . 2 Для характеристики случайного поля, однородность которого является лишь приближенной, использование структурных функций по сравнению с корреляционными иногда бывают предпочтительнее. В частности, это, например, имеет место при исследованиях пространственной мезо- и макроструктуры гидрометеорологических полей, когда широтные различия в притоке солнечной энергии, различный характер воздушных течений над океанами и материками и др. вызывают нарушения однородности пространственных полей. Однако надо помнить, что по экспериментальным данным часто бывает трудно получить значение структурной функции Bu (r ) , которое для достаточно больших расстояний можно было K u (r ) =
бы принять за насыщающее значение Bu (∞ ) .
2.10. Экстраполяция, интерполяция и сглаживание случайных функций Рассмотрим несколько задач, наиболее часто встречающихся в гидрометеорологии. u (t ) случайного процесса U(t ) на проПусть реализация межутке [0, Δt ] изменения аргумента t определена в результате опыта с некоторой ошибкой v(t ) , представляющей в свою очередь реализацию какого-то случайного процесса V(t ) . Так, что в результате опыта получена реализация: w ( t ) = u (t ) + v (t ) , где u (t ) – истинное значение реализации, v(t ) – ошибка измерения. Требуется определить истинное значение реализации u (t ) для некоторого аргумента t , т. е. отделить его от ошибки измере-
69
ния. Такую задачу называют задачей сглаживания, или фильтрации случайного процесса. В гидрометеорологии эта задача возникает при обработке экспериментальных данных как задача сглаживания ошибок, неизбежно сопутствующих всем измерениям из-за точности используемых методов, точности измерительных приборов и т. д. Если по имеющейся реализации требуется дать прогноз истинной реализации u (t ) для значений аргумента t = Δt + T , где Т > 0, то такую задачу называют задачей об экстраполяции со сглаживанием, при этом величину Т часто называют упреждением. Например, имеется ряд N наблюдений за годовым объемом стока. Требуется предсказать объем стока за последующий (N+1)-й год. При Т<0 эту задачу называют задачей об интерполяции со сглаживанием. Например, 1) во временном ряду наблюдений за годовым объемом стока есть пропущенные данные, которые требуется восстановить; 2) по имеющимся в распоряжении картам снята батиметрия водоема или рельеф местности с некоторым шагом (например, 1 км). Для каких-то целей требуются данные с шагом 500 м. Заметим, что в качестве аргумента t может выступать не только время, но и любая другая переменная, предположим расстояние. На практике мы почти всегда получаем реализацию интересующего нас случайного процесса, включающую ошибки измерения. Если измерения проведены с требуемой точностью, то говорят в этом случае соответственно о «чистой» экстраполяции и «чистой» интерполяции. Задачи об экстраполяции, интерполяции и сглаживании можно рассматривать как единую задачу определения истинного значения реализации u (t ) при некотором значении аргумента t 0 . Математическая формулировка такой задачи заключается в следующем. Известна реализация w (t ) = u (t ) + v(t ) на некотором промежутке [0, Δt ] изменения параметра t . Требуется оп-
70
ределить значение u (t 0 ) реализации u (t ) в момент t 0 ∈ [Δt , T ]: при Т > 0 речь идет об экстраполяции; при Т < 0 – об интерполяции; при Т = 0 – о сглаживании. Поскольку мы имеем дело со случайными функциями, то нас интересует нахождение такого способа решения задачи, который бы давал наилучший в некотором смысле результат по всему множеству реализаций, т. е. нахождение такого оператора L, который в применении к множеству реализаций W (t ) давал бы наилучшие в некотором смысле значения реализации U (t 0 ): U(t 0 ) = L[W (t )], или U(t 0 ) = L[U(t ) + V(t )] .
Естественно, возникает вопрос, что понимать под критерием качества решения поставленной задачи. В рамках случайных процессов качество оператора можно оценить лишь статистически, т. е. в среднем по всему выбранному множеству реализаций случайной функции. Можно назвать наилучшим тот оператор L , который обращает в минимум разность δ = U (t 0 ) − L[W (t )] . Однако с математической точки зрения наиболее удобным критерием качества является обращение в минимум математического ожидания квадрата разности
( )
{
}
M δ 2 = M [U(t 0 ) − L[W (t )]]2 . При выполнении этого условия оператор L называется оптимальным и обеспечивает оптимальную экстраполяцию, интерполяцию или сглаживание. Способ решения поставленной задачи существенно зависит от того, является ли интервал, на котором известна реализация, конечным или бесконечным. Для конечного интервала будем считать, что реализация задана при конечном числе дискретных значений параметра t , что наиболее часто имеет место в практике гидрометеорологических измерений.
71
2.11. Влияние ошибок измерения на статистические характеристики корреляционного анализа Пусть каждая реализация случайного процесса получена в результате опыта с некоторой ошибкой, так что w i (t ) = u i (t ) + v i (t ) , i − 1,2,..., N . Тогда оценка для математического ожидания случайного процесса согласно (2.4.2) имеет вид m w (t ) = m u (t ) + m v (t ) , т. е. математическое ожидание истинного случайного процесса завышено на математическое ожидание случайных ошибок измерения. Дадим оценку корреляционной функции. Согласно (2.4.3) имеем K w (t i , t j ) = K u (t i , t j ) + K v (t i , t j ) + K uv (t i , t j ) + K vu (t i , t j ) .
В гидрометеорологической практике обычно считают, что ошибки измерений не коррелируют как с истинными значениями измеряемой величины при любых значениях аргументов, так и между собой только при различных значениях аргументов, т. е. K uv (t i , t j ) = 0 ;
(
)
⎧ 0 при i ≠ j, . ( ) D t при i = j ⎩ v j
K vu (t i , t j ) = 0 ; K v t i , t j = ⎨
Итак, ошибки гидрометеорологических измерений завышают оценку корреляционной функции на величину дисперсии ошибки только при значениях t i = t j .
72
3. ЧИСЛЕННЫЙ АНАЛИЗ ГИДРОМЕТЕОРОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
Гидрометеорологические станции и посты расположены крайне неравномерно. Большая часть этих станций расположена на хорошо обжитой территории. На акватории океанов, в труднодоступных районах их почти нет. Кроме того, число метеорологических станций, на которых проводятся аэрологические наблюдения, явно недостаточно. Съемки крупно- и мезомасштабных полей океана на больших акваториях обычно осуществляются только в периоды проведения исследований по международным программам несколькими судами одновременно. Систематизация подобных наблюдений заключается в представлении всей полученной информации в форме карт основных полей водного и воздушного океанов, отражающих их состояния на большой территории. Такие карты необходимы также для получения начальных данных о значениях гидрометеорологических величин в узлах регулярной сетки с целью осуществления численного прогноза этих величин. На первом этапе развития численных методов прогноза значения гидрометеорологических величин в узлах регулярной сетки находились следующим образом. На карту с проведенными на ней изолиниями накладывалась прозрачная палетка с нанесенными на ней узлами сетки. Далее путем визуальной интерполяции определялись значения гидрометеорологических величин в узлах регулярной сетки. Такой способ занимает много времени и приводит к искусственному нарушению автоматизации процесса при прохож73
дении информации через технические устройства. За последние десятилетия было уделено значительное внимание автоматизации указанного процесса. В первую очередь была решена задача получения значений гидрометеорологических величин в узлах регулярной сетки по их значениям на станциях. Эта задача получила название численного или объективного анализа. Впервые метод численного анализа был предложен Х. А. Пановским в 1949 г. Метод сводился к представлению какой-либо метеорологической величины в виде некоторого полинома. Этот метод стал называться методом полиномиальной интерполяции. Различные варианты этого метода были позднее предложены Г. П. Курбаткиным, Я. М. Хейфецем, П. Н. Беловым и другими. Другой подход к численному анализу был предложен Л. С. Гандиным. Существенным моментом этого метода, который получил название метода оптимальной интерполяции, было использование статистической структуры метеорологических полей. Различные реализации этого метода были осуществлены С. Л. Белоусовым и другими. Позднее этот метод стал активно использоваться для восстановления полей океана в узлах расчетной сетки (работы В. И. Беляева, И. Е. Тимченко и др.). Следует отметить, что с точки зрения требований, предъявляемых к оператору L, оба метода: метод полиномиальной интерполяции и метод оптимальной интерполяции являются оптимальными с той лишь разницей, что первый из них не учитывает вероятностную структуру случайных полей. Однако, следуя установившейся традиции, будем использовать предложенную терминологию. В дальнейшем распространение получили различные методы анализа, основанные на комбинировании линейной интерполяции и статистической структуры гидрометеорологических полей. Это – метод последовательных приближений (метод коррекции), метод сплайн-полиномов.
74
В настоящее время сплайны успешно применяют при решении широкого круга гидрометеорологических задач, требующих аппроксимации одномерных или многомерных полей сложной структуры, заданных своими значениями в отдельных точках, и, возможно, последующего интегрирования (осреднения) аппроксиманта по заданным областям с целью получения обобщенных пространственных характеристик этих полей. Последняя задача часто усложняется нерегулярным расположением точек, в которых известны значения поля, неправильной формой области и т. д. Развитие новых средств наблюдений, таких как спутниковые системы, трансозондовые и др. привело к тому, что гидрометеорологические наблюдения стали несинхронными. Это обстоятельство потребовало разработки нового подхода к проблеме численного анализа и привело к созданию четырехмерного численного анализа, который правильнее было бы назвать пространственновременным численным анализом. Рассмотрим подробнее некоторые из наиболее употребительных методов численного анализа.
3.1. Метод полиномиальной интерполяции Метод основан на описании участка поля какой-либо гидрометеорологической величины в окрестности точки регулярной сетки полиномом (многочленом). Эти полиномы могут быть алгебраическими различного порядка, тригонометрическими, сферическими и т. д. и могут иметь разные порядки. Например, в случае плоскости (один уровень) алгебраические полиномы первого, второго и третьего порядка имеют соответственно вид:
X1 (x , y ) = a 0 + a1x + a 2 y , X 2 (x , y ) = X1 (x , y ) + a 3 xy + a 4 x 2 + a 5 y 2 , X 3 (x , y ) = X 2 (x , y ) + a 6 x 2 y + a 7 xy 2 + a 8 x 3 + a 9 y 3 , 75
где x , y – координаты, a i
(i = 1, 2, …, 9) – коэффициенты. Ука-
занные полиномы можно записать в более компактном виде: X (x , y ) =
i + j≤ 3
∑ a ijx i y j .
i , j= 0
Основы метода рассмотрим на примере поля геопотенциала одного уровня при использовании полинома первого порядка:
H (x , y ) = a 0 + a 1 x + a 2 y Определяем коэффициенты
(3.1.1)
a 0 , a1 , a 2 методом наименьших
квадратов по значениям Hi в нескольких пунктах (станциях), расположенных в окрестности узла (влияющие точки). n
2
2
n
Ф(x, y) = ∑[H(xi , yi ) − Hi ] = ∑[a 0 + a1xi + a 2 yi − Hi ] = min. (3.1.2) i −1
i −1
Число пунктов n может быть невелико, однако в любом случае оно должно быть равно или превышать число членов взятого полинома. Дифференцируя последнее выражение последовательно по a 0 , a 1 , a 2 , имеем систему алгебраических уравнений: n ⎧ ∂Ф(x , y ) = 2 ∑ [a 0 + a1x i + a 2 y i − H i ] = 0, ⎪ ∂a i =1 0 ⎪ n ⎪ ∂Ф(x , y ) = 2∑ [a 0 + a1x i + a 2 y i − H i ]x i = 0, ⎨ ∂ a i =1 1 ⎪ n ⎪ ∂Ф(x , y ) = 2∑ [a o + a1x i + a 2 y i − H i ]y i = 0. ⎪ ∂a i =1 ⎩ 2
Или после тождественных преобразований имеем: n n n ⎧ na 0 + a1 ∑ x i + a 2 ∑ y i = ∑ H i , ⎪ i =1 i =1 i =1 ⎪ n n n n ⎪ 2 + + = a x a x a x y ∑ Hi x i , ⎨ 0∑ i 1∑ i 2∑ i i i 1 i 1 i 1 i = = = =1 ⎪ n n n n ⎪ 2 + + = a y a x y a y ∑ H i yi . 1∑ i i 2∑ i ⎪ 0∑ i i =1 i =1 i =1 ⎩ i =1
76
Решив полученную систему уравнений, найдем искомые коэффициенты a 0 , a1 , a 2 в (3.1.1). Если мы поместим начало координат в рассматриваемый узел сетки или интересуемую точку, то x = y = 0 и H(0,0 ) = a 0 . Это значение можно принять в качестве искомого значения геопотенциала в узле или точке сетки. Проделав такую операцию для всех точек регулярной сетки или интересующих каких-то точек (влияющие станции для каждой точки будут разными), мы получим в них значения геопотенциала, которые далее можно использовать для численного прогноза либо автоматического расчерчивания диагностических полей. Изложенная схема интерполяции дает хорошие результаты в случае одинаковой достоверности данных во всех учитываемых пунктах. Реальная же гидрометеорологическая информация имеет различную достоверность в разных пунктах, что может быть связано с использованием приборов различных конструкций, ошибками измерений, различными расстояниями станций влияния и пр. В этом случае интерполяция по приведенной схеме может дать неудовлетворительные результаты. Поэтому необходимо будет учитывать различия в достоверности данных путем введения в систему (3.1.2) дополнительных весов pi : n
2
n
2
Ф(x , y ) = ∑ p i [H(x i , y i ) − H i ] = ∑ p i [a 0 + a1x i + a 2 y i − H i ] = min . i −1
i −1
Существенно заметить, что какой-либо универсальной методики для выбора весов не существует, поэтому подбор их осуществляется, как правило, на основе эмпирических данных и численных экспериментов (например, пропорционально средней квадратической ошибке данных, пропорционально расстоянию влияющих станций и пр.). Надо отметить, что аналогичным образом может быть получена система для других видов интерполяционных полиномов. Как частный случай полиномиальную интерполяцию можно использовать для определения некоторых гидрометеорологических 77
характеристик методом аналогий, когда данные наблюдений по интересующему нас объекту отсутствуют. Например, необходимо определить норму стока реки В, для которой в качестве аналога взята река А. Для реки А имеются регулярные многолетние наблюдения, на основе которых найдена норма стока q A = 2,1 л/(с км2). Для реки В проведены только за шесть лет наблюдения, параллельные с наблюдениями за рекой А. Результаты этих наблюдений отражены в таблице. Таблица Модуль стока q л/(с км2) рек А и В Реки А В
1989 г. 1,10 1,38
1990 г. 1,18 0,99
1991 г. 2,09 2,28
1992 г. 1,65 2,08
1993 г. 2,58 3,30
1994 г. 0,78 0,65
Пусть график связи между значениями модулей стока рек А и В наводит на мысль о их линейной зависимости, т. е.
q B = a 0 + a1q A
(3.1.3)
qB, л/(с км2) 4
3
2
1
0 -2
-1
0
1
2
3
qA, л/(с км2)
-1
-2
Рис. 2. Связь годового стока рек А и В
78
Коэффициенты a 0 и
a1 определяем методом наименьших
квадратов из условий требования наилучшей линейной связи так, чтобы 2
∑ (a 0 + a1q A i − q Bi ) = min . 6
i =1
После частного дифференцирования последнего выражения система нормальных уравнений принимает вид: 6 6 ⎧ na 0 + a1 ∑ q A i = ∑ q B i , ⎪⎪ i =1 i =1 . ⎨ 6 6 6 2 ⎪a 0 ∑ q A + a1 ∑ q A = ∑ q A q B i i i ⎪⎩ i = i i i =1 i =1
( )
(
(3.1.4)
)
Используя данные таблицы, находим: 6
∑qA
i =1
i
6
∑qB
= 9,38;
i =1
∑ (q A q B 6
i =1
i
= 10,68;
i
i
∑ (q A
2
6
i =1
i
)
= 16,96;
) = 19,90.
Подставив найденные значения в (3.1.4), получим систему уравнений: ⎧ 6a 0 + 9,38a1 = 10,68, , ⎨ 9 , 38 a + 16 , 96 a = 19 , 90 0 1 ⎩
которая имеет следующее решение: a 0 = −0,41;
a1 = 1,40. Тогда
уравнение (3.1.3) примет вид: q B = −0,41 + 1,4q A , откуда q B = −0,41 + 1,4q A = −0,41 + 1,40 × 2,1 = 2,53 л/(с км2).
79
3.2. Метод оптимальной интерполяции Рассмотрим метод линейной оптимальной интерполяции случайной функции W(t), заданной дискретно для t 1 , t 2 ,..., t n на конечном интервале, причем t1 < t 2 < ... < t n . Считая, что эти значения являются результатами измерений и содержат ошибки, можно записать i = 1,2 = ..., n, W (t i ) = U (t i ) + V (t i ) , (3.2.1) где U(t i ) – истинное значение реализации в момент t i , а V(t i ) – ошибка измерения. Случайные процессы U(t) и V(t) будем считать стационарными и стационарно связными, а их характеристики – математическое ожидание, корреляционные функции и корреляционные функции связи – известными. Без нарушения общности выводов будем считать, что математическое ожидание равно нулю, т. е. мы рассматриваем соответствующие центрированные случайные функции. В противном случае (если математическое ожидание не равно нулю), нам необходимо случайные функции центрировать. Искомое значение U(t 0 ) , являющееся результатом применения линейного оператора L ко всем значениям W (t i ) , можно записать в виде линейной комбинации n
U (t 0 ) = ∑ a i W (t i ) ,
(3.2.2)
i =1
где a i – постоянные коэффициенты, которые надо определить. Задача сводится, таким образом, к отысканию таких значений коэффициентов α1 , α 2 ,..., α n , при которых величина 2 n ⎧⎪⎡ ⎤ ⎫⎪ M δ = (a1 , a 2 ,..., a n ) = M ⎨⎢ U(t 0 ) − ∑ a i W (t i )⎥ ⎬ ⎦ ⎪⎭ i =1 ⎪⎩⎣ обращается в минимум.
( ) 2
σ 2n
80
(3.2.3)
Заметим, что в настоящее время практически приемлемое решение поставленной задачи получено при предположениях о линейности и стационарности оператора L, а также и стационарной связности случайных процессов U(t) и V(t). Известно, что необходимым условием минимума функции n переменных является равенство нулю всех ее частных производных по каждой переменной, т. е. a1 , a 2 ,..., a n должны быть решениями системы уравнений: ∂σ 2n (a1,a 2,...,a n ) = 0, ∂a i
i = 1,2,...,n.
Преобразуем выражение (3.2.3).
σ 2n
2 ⎧⎪ n ⎡n ⎤ ⎫⎪ 2 (a1 , a 2 ,..., a n ) = M ⎨U (t 0 ) − 2 U(t 0 )∑ a i W(t i ) + ⎢ ∑ a i W(t i )⎥ ⎬ . i =1 ⎣i =1 ⎦ ⎪⎭ ⎪⎩
В последнее выражение подставим (3.2.1) σ2n
2 n ⎧⎪ 2 ⎡n ⎤ ⎫⎪ (a1,a2,...,an ) = M⎨U (t 0 ) − 2U(t 0 )∑ai [U(ti ) + V(ti )] +⎢∑ai [U(ti ) + V(ti )]⎥ ⎬. ⎣i =1 ⎦ ⎪⎭ i =1 ⎪⎩
Воспользовавшись свойствами математического ожидания, преобразуем полученное выражение, особо обратив внимание на правильность операции возведения в степень последнего слагаемого.
[
]
n
σ 2n (a1 , a 2 ,..., a n ) = M U 2 (t 0 ) − 2 ∑ a i {M[U (t 0 )U (t i )] + M[U (t 0 )V(t i )]}+ i =1
+ ∑ ∑ a i a j {M [U (t i )U (t j )] + M [U (t i )V (t j )] + M [V (t i )U (t j )] + M [V (t i )V (t j )]}= n
n
i =1 j =1
81
n
= K u (0 ) − 2 ∑ a i [K u (t 0 − t i ) + K uv (t 0 − t i )] + i =1
n n
[
]
+ ∑∑ a ia j K u (t j − t i ) + K uv (t j − t i ) + K vu (t j − t i ) + K v (t j − t i ) . (3.2.4) i =1 j=1
Продифференцируем по всем a i : ∂σ 2n (a1 , a 2 ,..., a n ) = −2[K u (t 0 − t i ) + K uv (t 0 − t i )] + ∂a i
[
]
+ ∑ a j K u (t j − t i ) + K uv (t j − t i ) + K vu (t j − t i ) + K v (t j − t i ) , i = 1, 2, …, n. n
j=1
Воспользовавшись необходимым условием минимума функции n переменных, приравняем производные нулю. Получим
[
]
Ku (t 0 − ti ) + Kuv(t0 − ti ) = ∑a j Ku (t j − ti ) + Kuv(t j − ti ) + Kvu(t j − ti ) + Kv (t j − ti ) . (3.2.5) n
j=1
Решив полученную систему линейных алгебраических уравнений относительно a 1 , a 2 ,..., a n , можно убедиться непосредственно, что выполнено и достаточное условие, т. е. выражение (3.2.3) обращается в минимум (вспомним одно из правил, известных из математического анализа, например, смена знака первой производной в окрестности искомой точки). Коэффициенты a 1 , a 2 ,..., a n называют интерполяционными «весами», с которыми учитываются значения
W (t i )
в сумме
(3.2.2), причем n
∑ a i = 1.
i =1
Заметим, что на практике последнее равенство выполняется приближенно из-за ошибок округления, неизбежно возникающих при расчетах.
82
Как нам уже известно, с принципиальной точки зрения вывод формул для оптимальной экстраполяции и оптимального сглаживания не отличается от вывода формулы оптимальной интерполяции. Рассмотрим частные случаи (3.2.5). 1. Ошибки измерения отсутствуют, т. е. имеем случай чистой интерполяции или экстраполяции. В этом случае в формуле (3.2.1) V(t i ) = 0 , а W (t i ) = U(t i ) . Следовательно, K v (τ ) = 0 , K vu (τ ) = 0 . Тогда формула (3.2.5) принимает вид:
K uv (τ ) = 0,
K u (t 0 − t i ) = ∑ a jK u (t j − t i ) n
i = 1, 2, …, n .
(3.2.6)
j=1
Так как корреляционная функция положительно определена, то определитель линейной системы (3.2.6) отличен от нуля и, следовательно, система имеет единственное решение. При этом коэффициенты a 1 , a 2 ,..., a n зависят от степени связанности сечений U(t i ) как между собой, так и с аппроксимируемым сечением U (t 0 ) .
Если сечения U(t i ) не связаны между собой, но связаны с
аппроксимируемым U(t 0 ) , то все
K u (t j − t i ) = 0
при i ≠ j . По-
этому имеем: K u (t 0 − t i ) = a i K u (0 )
или a1 =
K u (t 0 − t i ) = R u (t 0 − t i ) , K u (0)
т. е. коэффициенты a i определяются через коэффициенты корреляции между сечениями случайной функции i = 1, 2, …, n. Если сечение U(t 0 )
U (t 0 ) и
U (t i ) ,
практически не связано с сечениями
U(t i ) , что будет иметь место при экстраполяции, когда величина
83
упреждения Т будет выбрана очень большой, то в равенстве (3.2.6) K u (t 0 − t i ) = 0 и
∑ a jK u (t j − t i ) = 0 , n
i = 1, 2, …, n.
j=1
Определитель этой системы алгебраических уравнений не равен нулю (корреляционная функция положительно определена), а потому выполнение последнего равенства возможно только тогда, когда все коэффициенты a1 = a 2 = ... = a n = 0 . Согласно равенству (3.2.2) в этом случае метод оптимальной экстраполяции дает аппроксимируемое значение, равное математическому ожиданию случайной функции. 2. Ошибки измерений существуют, но они не коррелируют между собой в различных сечениях и не коррелируют с истинными значениями случайной функции, т. е. K v (τ ) = 0 при τ = 0 и K uv (τ ) = 0,
K vu (τ ) = 0.
(3.2.7)
Тогда формула (3.2.5) принимает вид:
[
]
K u (t 0 − t i ) = ∑ a j K u (t j − t i ) + K v (t j − t i ) . n
j =1
Так как K v (t j − t i ) ≠ 0 только при j = i , то K u (t 0 − t i ) = ∑ a jK u (t j − t i ) + a i K v (0) , n
(3.2.8)
j =1
где i=1,2,…, n. Оценим ошибку оптимальной интерполяции со сглаживанием. В нашем случае равенство (3.2.4) с учетом (3.2.7) принимает вид: n
n n
n
i =1
i =1 j=1
i =1
σ2n (a1, a 2 ,...,a n ) = Ku (0) − 2∑ai Ku (t 0 − t i ) + ∑∑aia jKu (t j − t i ) + ∑ai2Kv (0) . (3.2.9)
84
Умножив каждое из n равенств (3.2.8) на соответствующее a i и сложив результаты, получим:
∑ a i K u (t 0 − t i ) = ∑ ∑ a i a jK u (t j − t i ) + K v (0)∑ a i2 . n
n n
n
i =1
i =1 j =1
i =1
Подставим полученное выражение в (3.2.9).
σ2n (a1 , a 2 ,..., a n ) = K u (0) − ∑ a i K u (t 0 − t i ) + ∑∑ a i a jK u (t j − t i ) − n
n n
i=1
i=1 j=1
− K v (0 )∑ a i2 + ∑ ∑ a i a jK u (t j − t i ) + ∑ a i2 K v (0 ) . n
n
i =1
n
n
i =1 j =1
i =1
Приводя подобные члены, имеем:
σ2n
n
(a1, a 2 ,..., a n ) = K u (0) − ∑ a i K u (t 0 − t i ). i =1
В этом выражении последняя сумма неотрицательна (корреляционная функция положительно определена) и K u (0 ) = D u = D . Поэтому ошибка оптимальной интерполяции (экстраполяции) не превосходит дисперсии случайной функции:
σ 2n (a1 , a 2 ,..., a n ) ≤ D , или
σ 2n = δ ≤ 1, D
т. е. относительная ошибка не превосходит единицы. Окончательно имеем: n
δ = 1 − ∑ a i R u (t 0 − t i ) , i =1
где
K (t − t ) R u (t 0 − t i ) = u 0 i , D
85
σ2n = δ. D
(3.2.10)
Вернемся к равенству (3.2.8), обе части которого разделим на дисперсию случайной функции (напомним, что в силу стационарности дисперсия для всех сечений случайного процесса постоянна). K u (t 0 − t i ) n K u (t j − t i ) K v (0) , i = 1, 2, …, n. = ∑a j + D D D j=1
где
(3.2.11)
K v (0) – дисперсия ошибки, D – дисперсия истинной реали-
зации,
K v (0) – относительная ошибка измерения. D
Через нормированные корреляционные функции равенство (3.2.11) запишется: R u (t 0 − t i ) = ∑ a jR u (t j − t i ) + a i δ , n
i = 1, 2, …, n.
j =1
Для краткости дальнейших записей обозначим: R u (t 0 − t i ) = R 0 i ,
Ru (t j − t i ) = R ij .
Итак, окончательно система уравнений оптимальной интерполяции (экстраполяции) со сглаживанием имеет вид: n
R 0i = ∑ a jR ij + a i δ ,
i = 1, 2, …, n.
j=1
Запишем эту систему в развернутом виде. a 2 R12 + a 3R13 + ⎧a1 (R11 + δ ) + ⎪ aR + a 2 (R 22 + δ ) + a 3R 23 + ⎪⎪ 1 21 a 2 R 32 + a 3 (R 33 + δ ) + ⎨ a1R 31 + ⎪ ... ... ... ⎪ ⎪⎩ a1R n1 + a 2R n2 + a 3R n 3 +
86
... +
a n R1n
= R 01 ,
... + ... +
a n R 2n a n R 3n
= R 02 , = R 03 ,
...
...
...
... + a n (R nn + δ ) = R 0 n .
Систему линейных алгебраических уравнений можно переписать и для случая измерений без ошибок, когда δ = 0 . Найденные значения a i (i = 1, 2, …, n) подставим в формулу (3.2.2), записанную для центрированных величин (напомним, что, не нарушая общности рассуждений, мы положили математическое ожидание равным нулю). Переходя к нецентрированным величинам, получим истинное значение случайной функции при заданном значении аргумента. Очевидно, что методика, изложенная применительно к стационарным процессам одной переменной t, полностью применима и для пространственной интерполяции (экстраполяции) изотропных и однородных полей. Соответствующие формулы легко получаются заменой скалярного аргумента t векторным аргументом λ. Метод оптимальной интерполяции, основанный на вероятностной модели согласования гидрометеорологических наблюдений, как показал опыт, обеспечивает по сравнению с другими методами картирования максимальную точность восстановления полей в узлах регулярной сетки. В случае расчета карты одного крупномасштабного поля (по измерениям этого же поля) для оптимальной интерполяции, как мы уже убедились, необходима предварительная оценка корреляционной функции поля. Эта функция служит естественной характеристикой его пространственной изменчивости. Однако при практической оценке корреляционной функции приходится накладывать статистические ограничения на изменчивость поля, вводя предположения об однородности и изотропности его по отношению к корреляционной функции и о постоянстве его среднего значения. В этом случае корреляционная функция зависит не от координат точек, а только от скалярного расстояния между этими точками. При океанографических съемках (в виду их высокой стоимости) целесообразно выполнять комплексные измерения многих 87
компонентов полей океана на каждой станции. Большинство из измеряемых полей оказываются связанными между собой уравнениями динамики океана, которые отражают реально существующие в океане физические связи между параметрами состояния водных масс. Физические связи между полями создают существенные ограничения на их пространственную изменчивость, которые отражаются на форме взаимных корреляционных функций этих полей. Картирование крупномасштабной изменчивости океана является задачей комплексного использования всей доступной информации о каждом поле, содержащейся в измерениях различных полей. Так, в работе Неуймин Г. Г. и др. (см. список дополнительной литературы) методом оптимальной интерполяции в узлах регулярной сетки с шагом 2 o построены карты оптических характеристик вод тропической зоны Атлантического океана по данным ряда экспедиций судов Морского гидрофизического института. Дальнейшая проверка полученных расчетов хорошо подтвердила тот факт, что показатель ослабления оптических свойств в основном определяется содержанием планктона и продуктов его жизнедеятельности: в районах с повышенным содержанием биогенов величина показателя ослабления увеличивается, а в зонах конвергенции показатель ослабления уменьшается; в прибрежных водах прозрачность понижается не только за счет высокой продуктивности, но и за счет содержания терригенных веществ. В метеорологии для крупномасштабной структуры, характеризующейся горизонтальными расстояниями порядка сотен километров, можно говорить об однородности и изотропности только в горизонтальном направлении или вдоль изобарической поверхности. С этой точки зрения при анализе крупномасштабной структуры целесообразно рассматривать значения какой-либо одной метеорологической величины на двух уровнях (или на двух изобарических поверхностях) как бы в качестве двух различных метеорологических переменных.
88
Свойства изотропности и однородности выполняются приближенно, и при расстояниях, сравнимых с радиусом Земли, они, по-видимому, нарушаются. Практически, как показывают многочисленные расчеты, корреляционные функции высот изобарических поверхностей можно считать функциями только расстояния до тех пор, пока это расстояние не превышает примерно 3 000 км. Хотя гипотезы однородности и изотропности не являются столь уж принципиальными для ряда применений корреляционных функций, в том числе и для оптимальной интерполяции, однако принятие этих гипотез позволяет значительно облегчить использование корреляционных функций. Определение макромасштабных корреляционных функций производится путем обработки массового материала обычных аэрологических наблюдений. При выборе исходного материала необходимо соблюдать ряд требований, направленных на обеспечение однородности и репрезентативности данных: данные следует брать в пределах одного сезона или его части; не следует использовать данные за соседние сроки наблюдений из-за их связности (достаточно брать данные, отстоящие друг от друга на двое-трое суток); в качестве норм следует принимать средние значения по тому же материалу, который используется для определения корреляционных функций (то же относится и к дисперсиям). С помощью статистического анализа были исследованы корреляционные крупномасштабные функции различных метеорологических величин. Эти корреляционные функции в метеорологических рекомендациях для различных метеовеличин даны или в форме таблиц, или аналитических зависимостей. Так, например, для высоты поверхности 500 гПа (АТ 500 ) нормированная корреляционная функция аппроксимируется выражением
R (r ) = (1 + 0,98r ) exp(− 0,98r ) – формула М. И. Юдина,
89
R (r ) =
sin (1,51r ) exp(− 0,25r ) – формула Т. И. Олевской. 1,51r
Пространственная корреляционная функция ветра на поверхности 500 гПа: r R (r ) = 1 − при r ≤ 1,5 ; 1,4
скорости
временная нормированная корреляционная функция приземного давления имеет вид: t ⎞ ⎛ t ⎞ ⎛ R (t ) = ⎜1 + ⎟ exp⎜ − ⎟ . ⎝ 30 ⎠ ⎝ 30 ⎠ Здесь r – расстояние в тысячах километров, t – время в ча-
сах. Следует заметить, что приведенные формулы надо рассматривать как рабочие. Пример. На метеорологических станциях в какой-то стандартный срок проведены наблюдения за полем высот изобарической поверхности 500 гПа. Относительная ошибка измерения δ = 0,02. Эти измерения представлены в виде отклонений от соответствующих значений стандартной атмосферы. Используя для каждой точки регулярной сетки данные наблюдений по четырем ближайшим метеостанциям, рассчитать методом оптимальной интерполяции высоту данной изобарической поверхности в каждом узле регулярной сетки, если в качестве нормы принята средняя арифметическая (100 гп.м), рассчитанная по всему полю. Нормированную корреляционную функцию аппроксимировать формулой М. И. Юдина. Решение поставленной задачи продемонстрируем для одного из узлов регулярной сетки, в окрестности которого находятся метеорологические станции, имеющие следующие значения высот для рас-
90
сматриваемой изобарической поверхности: первая станция – H1=150 гп.м, вторая – H2=150 гп.м, третья – H3=187 гп.м, четвертая – H4=187 гп.м. Истинное значение высоты изобарической поверхности в данном узле обозначим через H0. Расположение станций дано на схеме. Расстояние между точками (0)-(1) составляет 600 км, (0)-(2) ………….. 600 км, (0)-(3) ………….. 300 км, (0)-(4) ………….. 300 км.
2
1
0
3
4
Решение: Так как норма отлична от нуля, то формула оптимальной интерполяции (3.2.2) будет в данных обозначениях иметь вид: H 0 − H = ∑ a j (H j − H ) , где H – норма. 4
j=1
Для расчета коэффициентов a j нам надо решить следующую систему линейных алгебраических уравнений: + a 3R13 + a 4 R14 ⎧a1 (R11 + δ ) + a 2 R12 ⎪a R + a 2 (R 22 + δ ) + a 3R 23 + a 4 R 24 ⎪ 1 21 ⎨ + a 2 R 32 + a 3 (R 33 + δ ) + a 4 R 34 ⎪a1R 31 ⎪⎩a1R 41 + a 2 R 42 + a 3R 43 + a 4 (R 44 + δ )
= R 01 , = R 02 , = R 03 , = R 04 .
Для расчета нормированных корреляционных функций, зависящих только от расстояния, предварительно найдем расстояния между пунктами в тыс. км: r11 = r22 = r33 = r44 = 0 ;
r13 = r31 = r24 = r42 = 0,900 ; r23 = r32 = r14 = r41 = 0,671 ;
91
r01 = r02 = 0,600 ; r12 = r21 = 0,848 ; r34 = r43 = 0,424 ; r03 = r04 = 0,300 .
Здесь индексы означают номера соответствующих пунктов. Найдем нормированные корреляционные функции по формуле М. И. Юдина, подставляя в нее соответствующие найденные расстояния. В результате получим: R 11 = R 22 = R 33 = R 44 = 1; R 13 = R 31 = R 24 = R 42 = 0,779; R 23 = R 32 = R 14 = R 41 = 0,859; R 01 = R 02 = 0,882; R 12 = R 21 = 0,797; R 34 = R 43 = 0,934; R 03 = R 04 = 0,964;
Система линейных алгебраических уравнений примет вид: ⎧1,020a1 + 0,797a 2 + 0,779a 3 + 0,859a 4 ⎪0,797a + 1,020a + 0,859a + 0,779a ⎪ 1 2 3 4 ⎨ ⎪0,779a1 + 0,859a 2 + 1,020a 3 + 0,934a 4 ⎪⎩0,859a1 + 0,779a 2 + 0,934a 3 + 1,020a 4
= 0,882, = 0882, = 0,964, = 0,964.
Решая полученную систему, например методом Гаусса, найдем
a1 = a 2 = 0,166;
a 3 = a 4 = 0,354 .
Тогда
H 0 − H = a1 (H1 − H ) + a 21 (H 2 − H ) + a 3 (H 3 − H ) + a 4 (H 41 − H ).
92
Или Н0 = 100+0,166(150-100)+0,166(150-100)+0,354(187-100)+ + 0,354(187-100) = 178,196 (гп.м). Оценим (3.2.10),
ошибку
интерполяции,
использовав
формулу
4
δ = 1 − ∑ a i R 0i = 1 − 2(0.166 × 0,882 + 0,354 × 0,964) = 0,025 . i =1
3.3. Четырехмерный численный анализ Мы рассмотрели методы объективного анализа (в частности, полиномиальную и оптимальную интерполяции) гидрометеорологических полей на плоскости и в пространстве по данным синхронных наблюдений, т. е. наблюдений, проводимых в единый момент времени (синоптические наблюдения), который соответствует различному местному времени в разных пунктах земного шара. Между тем для новейших наблюдательных гидрометеорологических систем (например, спутниковых) характерны асиноптические, т. е. несинхронные наблюдения. Для усвоения спутниковых наблюдений, а также несинхронных экспедиционных данных в процессе численного анализа необходимо, чтобы анализ допускал возможность использования данных, относящихся не только к различным точкам пространства, но и к различным моментам времени, иначе говоря, перейти к пространственно-временному анализу гидрометеорологических полей. Такой пространственно-временной анализ, как мы уже говорили, называется четырехмерным анализом гидрометеорологических полей или четырехмерным усвоением (ассимиляцией) гидрометеорологической информации. Существует две принципиально различные схемы четырехмерного анализа: 1. Дискретная, предусматривающая построение 93
диагностических полей лишь для синоптических сроков наблюдений. В этом отношении она не отличается от существующих методик объективного анализа. Различие же состоит в том, что при построении каждого диагностического поля, наряду с данными наблюдений, относящихся к рассматриваемому сроку, используется также асиноптическая информация, относящаяся к другим, более ранним моментам времени. 2. Наиболее логичной является другая непрерывная схема четырехмерного анализа, в рамках которой каждое наблюдаемое значение (синоптическое или асиноптическое) усваивается соответственно тому времени, к которому это наблюдение относится. Это усвоение заключается в изменении результатов численного прогноза для момента времени, соответствующего поступившему наблюдению. Иначе говоря, каждый результат наблюдения вводится в численную прогностическую модель, которая действует непрерывно. Рассмотрим, например, один из подходов решения задачи четырехмерного анализа – полиномиальный. Метод полиномиальной интерполяции обобщается следующим образом. При представлении поля скалярного аргумента, например температуры, геопотенциала, давления и пр., в виде какого-либо полинома время t рассматривается в качестве одной из независимых переменных. Так, при использовании полинома второго порядка на плоскости принимается, что
Φ(x i , yi , t s ) = Φ is = a 0 + a1x i + a 2 yi + a 3x i yi + a 4 x i2 + a 5yi2 + + a 6 t s + a 7 x i t s + a 8 yi t s + a 9 t s2 . Коэффициенты a j
( j = 0,1,2,...,9 ), как и ранее, находятся из
условия минимума:
∑∑[Φis − ( n m
i =1 s =1
a 0 + a1x i + a 2 yi + a 3x i yi + a 4 x i2
+ a 5yi2
94
+ a 6 t s + a 7 x i ts + a8yi t s + a 9 t s2
2
)] pis ,
где индекс i показывает положение точки на плоскости, а индекс s – момент времени, т. е. суммирование распространяется на все точки на плоскости и на все моменты времени. Значение весовой функции pis может быть выбрано из каких-либо дополнительных соображений (в простейшем случае pis = 1 ). Далее, согласно методу наименьших квадратов, составляется нормальная система уравнений для определения коэффициентов a j (j = 0, 1, 2, …, 9). Аналогично можно рассматривать и метод оптимальной интерполяции.
3.4. Метод контроля исходной информации Наряду с небольшими ошибками в данных наблюдений, которые неизбежны и можно считать случайными, встречаются также и значительные (грубые) по величине ошибки, причины появления которых могут быть вызваны неисправностью аппаратуры, просчетами при первичной обработке данных на станциях, искажениями при кодировании во время передачи или приема данных. Такие ошибки необходимо уметь выявлять, исправлять или отбрасывать. Все эти действия, естественно, должны выполняться автоматически по некоторому алгоритму контроля данных. Практика показала, что ни один из методов контроля не является универсальным для полного исправления или отбраковки грубо ошибочных данных. Однако наилучшие результаты достигаются в том случае, если различные методы контроля взаимосвязаны. Применяемые в настоящее время методы контроля можно условно разбить на три группы: 1) вертикальный контроль; 2) горизонтальный контроль; 3) контроль при согласовании. Каждая из названных групп, в свою очередь, подразделяется на подгруппы, в основе разделения которых заложены различные методы. Так, на-
95
пример, в различных схемах численного анализа и прогнозах гидрометеорологических полей, используемых в нашей стране, применяется один из следующих трех методов вертикального контроля: статистический контроль производных по высоте, разработанный С. Л. Белоусовым; статистический контроль при использовании автокорреляционных матриц, предложенный М. Ю. Юдиным; статический (гидростатический) контроль высот изобарических поверхностей и температуры. Рассмотрим для примера наиболее часто встречающийся статический контроль высот изобарических поверхностей и температуры. Этот контроль заключается в проверке выполнимости уравнения статики для политропной среды в слоях между каждыми соседними главными изобарическими поверхностями. Уравнение статики атмосферы и гидросферы имеет вид: dp = − gρ , dz
где p – давление, g – ускорение свободного падения, ρ – плотность, ось z направлена вертикально вверх. Заменим высоту z геопотенциальной высотой Н. Известно, что геопотенциальная высота Н представляет собой отношение геопотенциала G к нормальному (стандартному) ускорению свободного падения g 0 : H=
G 1 z g = ∫ gdz ≈ z, g0 g0 0 g0
(g0 = 9,8 м/с2).
На практике часто бывает наиболее удобно представлять геопотенциальную высоту Н следующим образом: H=
g g z = z. 10g 0 98
Полученная рабочая формула дает размерность геопотенциальной высоты Н в гп. дам (геопотенциальный декаметр). 96
Из последнего выражения найдем z = 98 H/g и подставим его в уравнение гидростатики, предварительно записав его в виде: dz 1 =− ; dp ρg
98dH 1 =− ; gdp ρg
или
98dH 1 = . dp ρ
В последнем дифференциальном уравнении разделим переменные, предварительно выразив плотность ρ из уравнения состояния идеального газа p = ρRT : dH = −
RT dp , 98 p
где Т – температура по шкале Кельвина, R – универсальная газовая постоянная. Проинтегрируем это уравнение в слое между главными изобарическими поверхностями pi и H i +1
∫
Hi
H i +1 − H i = −
dH = −
p i +1
∫
pi
p i +1 :
RT dp , 98 p
или
R (ln pi +1 − ln pi )Tm = R ln pi Tm , 98 98 pi +1
(3.4.1)
где Tm – средняя абсолютная температура слоя. Заменяя ее приближенно полусуммой температур Ti и Ti +1 на границах слоя и переходя к температуре t 0 C , получим: H i +1 − H i =
=
p (t + 273) + (t i +1 + 273) R = ln i i 2 98 pi +1
p p R 273R ln i (t i + t i +1 ) . ln i + pi +1 196 pi +1 98
97
Обозначим в последнем равенстве первое слагаемое в правой части через Ai , а выражение перед скобкой во втором слагаемом – через Bi . Тогда
H i +1 − H i = A i + Bi (t i + t i +1 ) .
Невязкой статического контроля называется разность между левой и правой частями последнего уравнения: δi = H i +1 − H i − A i − Bi (t i + t i +1 ) .
Эта невязка может быть обусловлена отклонением профиля температуры от линейного относительно ln p, а также случайными ошибками измерения и округления. Максимальное по модулю значение δi , обусловленное указанными причинами, обозначим Δ i . Если Δ i превышает допустимое значение, то весьма вероятна
грубая ошибка, по крайней мере, в одной из четырех величин: H i , H i +1 , t i , t i +1 . Анализ соотношений в различных слоях часто позволяет выяснить, какая из величин ошибочна, оценить величину этой ошибки и внести соответствующие исправления. Пример. Основываясь на уравнении статики и считая, что значения температуры даны без ошибок, произвести контроль распределения высот изобарических поверхностей по следующим данным:
р, гПа … 1000
850
700
500
Т ………. 287,4 278,7
268,5
251,9 228,5
216,7 216,7 216,7
Н, гп. дам 11
402
558
1280 1620 2060
146
300
918
Провести исправление грубых ошибок.
98
200
100
50
Указание. Одно из двух значений высот соседних изобарических поверхностей считать ошибочным, если средняя температура слоя, расположенного между двумя уровнями, определенная как средняя арифметическая из измерений и по уравнению статики, отличается более чем на 4 o . Решение: Находим среднюю температуру слоя, расположенного между двумя уровнями: 1) как среднюю арифметическую
Ti + Ti +1 и 2 2) из уравнения статики (3.4.1) 98 (H i +1 − H i ) , Tm = R ln (pi pi +1 ) Tариф. =
где R = 287 Дж (кг ⋅ K ) , К – кельвин.
В результате получим следующие значения для температуры Слой Tариф. Tариф − Tm Tm между уровнями, гПа 1000–850 850–700 700–500 500–300 300–200 200–100 100–50
283,1 273,6 260,2 240,2 222,6 216,7 216,7
283,6 450,2 158,3 240,6 304,9 167,5 216,8
0,5 176,6 101,9 0,4 82,3 49,2 0,1
Согласно условию задачи значения температуры даны без ошибок, поэтому отклонения в рассчитанных средних температурах по данным формулам возникают только за счет ошибок в задании высот изобарических поверхностей. Анализируя результаты 99
сделанных расчетов, видим, что недопустимые ошибки имеются в данных о высотах изобарических поверхностей 700 и 200 гПа. Исправим эти данные, используя уравнение (3.4.1). Результаты исправлений могут зависеть от того, какой индекс мы придали расчетной высоте i или i+1 (эти различия обусловлены не точным линейным изменением температуры с высотой, а также ошибками округления при расчетах). Пусть H 700 = H i . Тогда из формулы (3.4.1): H i = H 700 = H i +1 −
= H 500 −
R p T + Ti +1 ln i i = 98 pi +1 2
R p 700 T700 + T500 ln = 98 p500 2
287 700 ln 260,2 = 301,6 (гп. дам). 98 500 Видим, что исправленная высота изобарической поверхности H 700 =301,6 гп. дам значительно отличается от заданной H 700 =402 = 558 −
гп. дам. Пусть теперь H 700 = H i +1 . Тогда из формулы (3.4.1) имеем: H i +1 = H 700 = H i +
= H 850 −
= 146 −
R p T + Ti +1 ln i i = 98 pi +1 2
R p850 T850 + T700 ln = 98 p 700 2
287 850 ln 273,6 = 301,6 (гп. дам). 98 700
Аналогично исправляем высоту изобарической поверхности 200 гПа. 100
Полагаем H 200 = H i . Тогда H i = H 200 = H i +1 −
H 200 = 1620 −
R p T + Ti +1 ln i i = 98 pi +1 2
287 200 ln 216,7 = 1180,1 (гп. дам). 98 100
Если принять H 200 = H i +1 , то H i +1 = H 200 = H i +
= 918 +
R p T + Ti +1 ln i i = 98 pi +1 2
287R 300 ln 222,6 = 1182,3 (гп. дам). 98 200
Замечание. Все расчеты температуры и исправленных высот изобарических поверхностей можно было округлить до целых, так как ошибка в температуре дана с точностью до целого знака.
101
БИБЛИОГРАФИЧЕСКИЙ СПИСОК Основная литература
1. 2.
3.
4.
5. 6. 7.
8.
9.
10.
Белов П. Н. Численные методы прогноза погоды / П. Н. Белов. – Л. : Гидрометеоиздат, 1975. – 392 с. Белов П. Н. Сборник упражнений по численным методам прогноза погоды / П. Н. Белов. – Л. : Гидрометеоиздат, 1980. – 136 с. Белоусов С. Л. Обработка оперативной метеорологической информации с помощью электронных вычислительных машин / С. Л. Белоусов, Л. С. Гандин, С. А. Машкович. – Л.: Гидрометеоиздат, 1968. – 193 с. Вагер Б. Г. Сплайны при решении прикладных задач метеорологии и гидрологии / Б. Г. Вагер, Н. К. Серков. – Л. : Гидрометеоиздат, 1987. – 160 с. Гандин Л. С. Объективный анализ метеорологических полей / Л. С. Гандин. – Л. : Гидрометеоиздат, 1963. – 289 с. Гандин Л. С. Четырехмерный анализ метеорологических полей / Л. С. Гандин. – Л. : Гидрометеоиздат, 1963. – 289 с. Гандин Л. С. Практикум по численным методам прогноза погоды / Л. С. Гандин, А. М. Данович, Ю. М. Либерман, Р. П. Репинская. – Л. : Гидрометеоиздат, 1978. – 216 с. Гандин Л. С. Статистические методы интерпретации метеорологических данных / Л. С. Гандин, Р. Л. Каган. – Л. : Гидрометеоиздат, 1976. – 359 с. Гордин В. А. Математические задачи гидродинамического прогноза погоды / В. А. Гордин. – Л. : Гидрометеоиздат, 1963. – 289 с. Дружинин В. С. Методы статистической обработки гидрометеорологической информации / В. С. Дружинин, А. В. Сикан. – СПб. : Изд. РГГМУ, 2001. – 168 с.
102
11.
12. 13.
14.
15. 16. 17.
18. 19.
Казакевич Д. И. Основы теории случайных функций в задачах гидрометеорологии / Д. И. Казакевич. – Л. : Гидрометеоиздат, 1989. – 230 с. Картвелишвили Н. А. Стохастическая гидрология / Н. А. Картвелишвили. – Л. : Гидрометеоиздат, 1981. – 167 с. Картвелишвили Н. А. Теория вероятностных процессов в гидрологии и регулировании стока / Н. А. Картвелишвили. – Л. : Гидрометеоиздат, 1985. – 192 с. Тимченко И. Е. Динамико-статистические модели состояния океана / И. Е. Тимченко. – Киев : Наукова думка, 1981. – 191 с. Христофоров А. В. Теория случайных процессов в гидрологии / А. В. Христофоров. – М. : МГУ, 1994. – 141 с. Лекции по численным методам краткосрочного прогноза погоды. – Л. : Гидрометеоиздат, 1969. – 734 с. Шелутко В. А. Статистические модели и методы исследования многолетних колебаний стока / В. А. Шелутко. – Л. : Гидрометеоиздат, 1984. – 159 с. Шелутко В. А. Численные методы в гидрологии / В. А. Шелутко. – Л. : Гидрометеоиздат, 1991. – 238 с. Юдин М. И. Новые методы и проблемы краткосрочного прогноза погоды / М. И. Юдин. – Л. : Гидрометеоиздат, 1963. – 404 с. Дополнительная литература
1.
2. 3.
Беляев В. И. О применении объективного и четырехмерного анализа в океанографии / В. И. Беляев, И. Е. Тимченко // Мор. гидрофиз. исследования. – 1972. – № 2 – С. 80–92. Бендат Дж. Прикладной анализ случайных данных / Дж. Бендат, А. Пирсол. – М. : Мир, 1989. – 540 с. Бендат Дж. Прикладной анализ случайных данных / Дж. Бендат, А. Пирсол. – М. : Мир, 1983. – 312 с. 103
4.
5.
6. 7. 8. 9.
10.
11.
12.
13.
14. 15. 16.
Вентцель Е. С. Теория случайных процессов и ее инженерные приложения / Е. С. Вентцель, Л. А. Овчаров. – М. : Наука, 1991. – 383 с. Верещагин М. А. Статистические методы в метеорологии / М. А. Верещагин, Э. П. Наумов, К. М. Шанталинский. – Казань: Изд-во Казан. ун-та, 1990. – 109 с. Доценко С. В. Случайные процессы в гидрофизических измерениях / С. В. Доценко. – Л. : Гидрометеоиздат, 1983. – 239 с. Исаев А. А. Статистика в метеорологии и климатологии / А. А. Исаев. – М. : МГУ, 1988. – 245 с. Каган Р. Л. Осреднение метеорологических полей / Р. Л. Каган. – Л. : Гидрометеоиздат, 1979. – 213 с. Карасев И. Ф. Стохастические методы речной гидравлики и гидрометрии / И. Ф. Карасев, В. В. Коваленко. – СПб. : Гидрометеоиздат, 1992. – 208 с. Коваленко В. В. Гидрометрическое оценивание речного стока с элементами стохастического подхода / В. В. Коваленко. – Л. : ЛПИ, 1986. – 60 с. Коваленко В. В. Измерение и расчет характеристик неустановившихся речных потоков / В. В. Коваленко. – Л. : Гидрометеоиздат, 1984. – 160 с. Кочергин В. П. Мониторинг гидрофизических полей океана / В. П. Кочергин, И. Е. Тимченко. – Л. : Гидрометеоиздат, 1987. – 279 с. Кучмент Л. С. Динамико-стохастические модели формирования речного стока / Л. С. Кучмент, А. Н. Гельфан. – М. : Наука, 1993. – 103 с. Монин А. С. Статистическая гидромеханика / А. С. Монин, А. М. Яглом. – СПб. : Гидрометеоиздат, 1992. – Т. 1. – 694 с. Монин А. С. Статистическая гидромеханика / А. С. Монин, А. М. Яглом. – М. : Наука, 1967. – Ч 2. – 720 с. Неуймин Г. Г. Построение поля показателя ослабления излучения в Тропической Атлантике методом объективного ана104
17.
18.
19.
20.
21.
22.
23. 24.
лиза / Г. Г. Неуймин, Н. А. Сорокина, И. Е. Тимченко // Океанология. – 1979, 19. – Вып. 4. – С. 600–607. Музылев С. В. Статистические модели инженерной гидрологии / С. В. Музылев, В. Е. Привальский, Д. Я. Раткович. – М. : Наука, 1982. – 184 с. Пановский Г. А. Статистические методы в метеорологии / Г. А. Пановский, Г. В. Брайер. – Л. : Гидрометеоиздат, 1972. – 200 с. Рождественский А. В. Статистические методы в гидрологии / А. В. Рождественский, А. И. Чеботарев. – Л. : Гидрометеоиздат, 1974. – 424 с. Рожков В. А. Вероятностные модели океанологических процессов / В. А. Рожков, Ю. А. Трапезников. – Л. : Гидрометеоиздат, 1990. – 272 с. Смирнов Н. П. Методы многомерного статистического анализа в гидрологических исследованиях / Н. П. Смирнов. – Л. : ЛГУ, 1986. – 190 с. Рожков В. А. Вероятностные модели океанологических процессов / В. А. Рожков, Ю. А. Трапезников. – Л. : Гидрометеоиздат, 1990. – 272 с. Статистические методы в гидрологии / пер. с англ. М. И. Русинова. – Л. : Гидрометеоиздат, 1970. – 271 с. Гордин В. А. Математические задачи гидродинамического прогноза погоды. Вычислительные аспекты / В. А. Гордин – Л. : Гидрометеоиздат, 1987. – 264 с.
105
Учебное издание
Аргучинцева Алла Вячеславовна
МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ И АНАЛИЗА ГИДРОМЕТЕОРОЛОГИЧЕСКИХ НАБЛЮДЕНИЙ
ISBN 978-5-9624-0165-2
Подготовлено к печати М. А. Айзиман Дизайн обложки: М. Г. Яскин
Темплан 2007 г. Поз. 42. Подписано в печать 17.05.07. Формат 60х84 1/16. Печать трафаретная. Усл. печ. л. 4,8. Уч.-изд. л. 3,1. Тираж 100 экз. Зак. 52. РЕДАКЦИОННО-ИЗДАТЕЛЬСКИЙ ОТДЕЛ Иркутского государственного университета 664003, г. Иркутск, бульвар Гагарина, 36
106