Электронный учебно-методический комплекс
ЦИФРОВАЯ ОБРАБОТКА АЭРОКОСМИЧЕСКИХ ИЗОБРАЖЕНИЙ Учебная программа дисциплины Уч...
107 downloads
415 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Электронный учебно-методический комплекс
ЦИФРОВАЯ ОБРАБОТКА АЭРОКОСМИЧЕСКИХ ИЗОБРАЖЕНИЙ Учебная программа дисциплины Учебное пособие Конспект лекций Методические указания по лабораторным работам Методические указания по самостоятельной работе Банк тестовых заданий в системе UniTest
Красноярск ИПК СФУ 2008
УДК 621.51:504(07) ББК 32.811.3 К31 Электронный учебно-методический комплекс по дисциплине «Цифровая обработка аэрокосмических изображений» подготовлен в рамках инновационной образовательной программы «Структурная перестройка научно-образовательного центра «Радиоэлектроника»», реализованной в ФГОУ ВПО СФУ в 2007 г. Рецензенты: Красноярский краевой фонд науки; Экспертная комиссия СФУ по подготовке учебно-методических комплексов дисциплин
К31
Кашкин, В. Б. Цифровая обработка аэрокосмических изображений. Версия 1.0 [Электронный ресурс] : конспект лекций / В. Б. Кашкин, А. И. Сухинин. – Электрон. дан. (3 Мб). – Красноярск : ИПК СФУ, 2008. – (Цифровая обработка аэрокосмических изображений : УМКД № 54-2007 / рук. творч. коллектива В. Б. Кашкин). – 1 электрон. опт. диск (DVD). – Систем. требования : Intel Pentium (или аналогичный процессор других производителей) 1 ГГц ; 512 Мб оперативной памяти ; 3 Мб свободного дискового пространства ; привод DVD ; операционная система Microsoft Windows 2000 SP 4 / XP SP 2 / Vista (32 бит) ; Adobe Reader 7.0 (или аналогичный продукт для чтения файлов формата pdf). ISBN 978-5-7638-1054-7 (комплекса) ISBN 978-5-7638-1395-1 (конспекта лекций) Номер гос. регистрации в ФГУП НТЦ «Информрегистр» 0320802728 от 23.12.2008 г. (комплекса) Настоящее издание является частью электронного учебно-методического комплекса по дисциплине «Цифровая обработка аэрокосмических изображений», включающего учебную программу, учебное пособие, методические указания по лабораторным работам, методические указания к самостоятельной работе, контрольно-измерительные материалы «Цифровая обработка аэрокосмических изображений. Банк тестовых заданий», наглядное пособие «Цифровая обработка аэрокосмических изображений. Презентационные материалы». Рассмотрены физические основы, принципы и технологии космического дистанционного зондирования Земли в оптическом и радиодиапазоне. Приводятся сведения о космических аппаратах для дистанционного зондирования и их орбитах, об особенностях приема данных дистанционного зондирования. Значительное внимание уделено методам цифровой обработки изображений: восстановлению (реставрации) изображений, изменению яркости и контраста, фильтрации изображений, кластерному анализу и распознаванию объектов на изображении. Предназначен для студентов направления подготовки магистров 210300.68 «Радиотехника» укрупненной группы 210000 «Электроника, радиотехника и связь», для студентов направления подготовки магистров 230200.68 «Информационные системы» укрупненной группы 230000 «Вычислительная техника и информационные технологии» и студентов направления подготовки специалистов 120201.65 «Исследование природные ресурсов аэрокосмическими средствами» укрупненной группы 120000 «Геодезия и землеустройство». Кроме того, может быть использован студентами, обучающимися по специальности 010703 «Физика Земли и планет».
© Сибирский федеральный университет, 2008 Рекомендовано к изданию Инновационно-методическим управлением СФУ Редактор И. Н. Байкина Разработка и оформление электронного образовательного ресурса: Центр технологий электронного обучения информационно-аналитического департамента СФУ; лаборатория по разработке мультимедийных электронных образовательных ресурсов при КрЦНИТ Содержимое ресурса охраняется законом об авторском праве. Несанкционированное копирование и использование данного продукта запрещается. Встречающиеся названия программного обеспечения, изделий, устройств или систем могут являться зарегистрированными товарными знаками тех или иных фирм.
Подп. к использованию 12.12.2008 Объем 3 Мб Красноярск: СФУ, 660041, Красноярск, пр. Свободный, 79
Оглавление ВВЕДЕНИЕ ...............................................................................4 I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ .................................5 Лекция 1 Физические основы дистанционного зондирования ........................... 5 Лекция 2 Методы исследования в оптическом диапазоне................................... 10 Лекция 3 Методы изучения земли из космоса ........................................................ 18 Лекция 4 Орбиты космических аппаратов ............................................................... 25 Лекция 5 Космические аппараты для дистанционного зондирования ............. 31 Лекция 6 Прием данных дистанционного зондирования ..................................... 38 Лекция 7 Восстановление спутниковых изображений.......................................... 45 II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ ...................52 Лекция 8 Технические средства обработки изображений .................................... 52 Лекция 9 Форматы графических файлов................................................................. 60 Лекция 10 Модели изображений. Преобразования яркости и контраста........... 66 Лекция 11 Линейная пространственно-инвариантная фильтрация ................. 75 Лекция 12 Фильтрация в пространственной области ........................................... 81 Лекция 13 Сегментация изображений ....................................................................... 89 Лекция 14 Распознавание изображений ................................................................... 95 Лекция 15 Параметрические методы классификации ......................................... 101 Лекция 16 Непараметрические методы классификации ..................................... 106 Лекция 17 Дополнительные средства обработки изображений ....................... 112 БИБЛИОГРАФИЧЕСКИЙ СПИСОК ......................................120
Цифровая обработка аэрокосмических изображений. Конспект лекций
-3-
ВВЕДЕНИЕ Центральной проблемой современного экологического мониторинга является получение объективной информации об окружающей среде. Перспективным методом исследования поверхности нашей планеты и ее атмосферы является применение искусственных спутников Земли. Особенно это важно для бескрайних просторов Сибири, где расположены основные запасы полезных ископаемых, основные лесные ресурсы, крупные промышленные и гидротехнические комплексы, но низка плотность населения. Интерес к космическим методам мониторинга возрос в последние годы в связи со свертыванием наземных и авиационных средств контроля окружающей среды, с одной стороны, и ростом доступности космической информации, с другой. Космическая радиолокация является всепогодным средством наблюдения поверхности Земли. За счет применения бокового обзора и синтеза апертуры при космической радиолокации достигается такое же пространственное разрешение, как в оптическом диапазоне. В конспекте лекций рассмотрены физические основы дистанционных методов исследования Земли из космоса в оптическом диапазоне – отражение и рассеяние излучения земной поверхностью, особенности наблюдения растительного и снегового покрова, влияние атмосферы при дистанционном зондировании. Обсуждается конструкция и основные параметры бортовой оптической аппаратуры для наблюдения Земли с космических аппаратов дистанционного зондирования. В СФУ установлены две станции приема данных дистанционного зондирования, рассчитанные на работу с различными аппаратами дистанционного зондирования. В конспекте лекций приводятся характеристики спутников, информацию с которых способны принимать эти станции. В конспекте лекций обсуждаются задачи, решаемые средствами космического дистанционного зондирования, и дается их краткая характеристика. Содержится постановка задач цифровой обработки изображений: восстановления (реставрации) и улучшения изображений. Приводится теория линейного пространственно-инвариантного преобразования изображений в пространственной и частотной области, даны примеры использования линейной и нелинейной фильтрации. Рассмотрены различные методы распознавания изображений, основанные на детерминированном и статистическом подходах. Приводится статистическая теория распознавания изображений и алгоритмы, основанные на ее применении. Обсуждается принцип работы нейрокомпьютеров, основные особенности и применение их при распознавании изображений. При составлении конспекта использован опыт многолетней научной и педагогической деятельности авторов, связанной с космическим дистанционным зондированием Земли.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-4-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 1 Физические основы дистанционного зондирования План лекции 1. Особенности технологии дистанционного зондирования. 2. Применение дистанционного зондирования. 3. Физические основы дистанционного зондирования в оптическом диапазоне. При наблюдении Земли из космоса используют дистанционные методы: исследователь получает возможность на расстоянии (дистанционно) получать информацию об изучаемом объекте. Дистанционные методы, как правило, являются косвенными, т. е. измеряются не интересующие параметры объектов, а некоторые связанные с ними величины. Например, нас может интересовать состояние сельхозпосевов. Но аппаратура спутника регистрирует лишь интенсивность светового потока от этих объектов в нескольких участках оптического диапазона. Для того, чтобы «расшифровать» такие данные, требуются предварительные исследования, включающие в себя различные подспутниковые эксперименты: по изучению состояния растений контактными методами; по изучению отражательной способности листьев в различных участках спектра и при различном взаимном расположении источника света (Солнца), листьев и измерительного прибора. Далее необходимо определить, как выглядят те же объекты с самолета и лишь после этого судить о состоянии посевов по спутниковым данным. Необходимо прокалибровать спутниковую аппаратуру перед запуском и в космосе, сравнивать спутниковые данные с наземными. Подспутниковые исследования трудоемки, но проводятся на небольшой площади. В то же время они дают возможность интерпретировать данные, относящиеся к огромным пространствам и даже ко всему земному шару. Широта охвата является характерной чертой спутниковых методов исследования Земли. К тому же эти методы, как правило, позволяют получить результат за сравнительно короткий интервал времени. Для Сибири с её просторами спутниковые методы в настоящее время являются единственно приемлемыми. Основные области применения спутниковых данных дистанционного зондирования – получение объективной оперативной информации о состояния окружающей среды и о природопользовании, мониторинг природных и техногенных опасных ситуаций и катастроф. Для Красноярского края наиболее актуальна спутниковая информация: • для лесопожарного мониторинга и обнаружения поражения леса вредителями; • контроля лесных угодий и вырубок;
Цифровая обработка аэрокосмических изображений. Конспект лекций
-5-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 1. Физические основы дистанционного зондирования • оперативного обнаружения и мониторинга нефтяных загрязнений в районах добычи и транспортировки нефти и нефтепродуктов; • мониторинга состояния гидротехнических сооружений; • мониторинга береговой линии в водохранилищах; • контроля снегового и ледового покрова, кромки ледостава, заторнозажорных явлений, прогноза стоков рек и мониторинга мест разливов рек; • обновления топографических карт; • ведения земельного кадастра и контроля застройки городов и поселков; • контроля за соблюдением лицензионных соглашений в местах добычи полезных ископаемых; • для мониторинга состояния сельскохозяйственных угодий, в том числе целевого использования земель, оперативной оценка состояния и степени деградации земель, прогноза урожайности. К числу особенностей дистанционных методов относится влияние среды (атмосферы), через которую спутник наблюдает Землю. Самый простой пример такого влияния – наличие облачности, делающей невозможным наблюдения в оптическом диапазоне. Однако и при отсутствии облачности атмосфера ослабляет восходящее излучение от объекта, особенно в полосах поглощения составляющих её газов. Поэтому приходится работать в так называемых окнах прозрачности, учитывая, что и в них есть поглощение и рассеяние излучения газами и аэрозолем. В радиодиапазоне возможно наблюдение Земли сквозь облачность. Информация о Земле поступает со спутников, как правило, в виде цифровых изображений. Это также характерная черта дистанционных методов. Наземная обработка изображений проводится на ЭВМ; в настоящее время цифровая обработка изображений относится к числу наиболее динамично развивающихся информационных технологий и находит применение в робототехнике, полиграфии, медицине, физическом материаловедении и т. д. Современные спутниковые методы позволяют получать не только изображение Земли. Используя приборы, чувствительные к полосам поглощения атмосферных газов, удается измерять концентрацию, в том числе для газов, вызывающих парниковый эффект, вредных газов природного и антропогенного происхождения, несмотря на их относительно малое количество. Спутник «Метеор-3» с установленным на нем прибором TOMS позволял за сутки оценить состояние всего озонового слоя Земли. Спутник NOAA кроме получения изображений поверхности, дает возможность исследовать озоновый слой и даже изучать вертикальные профили атмосферы (давление, температура, влажность на разных высотах в сотнях точек в полосе обзора). Дистанционные методы делят на активные и пассивные. При использовании активных методов на спутник устанавливают собственный источник энергии, которая посылается на Землю (лазер, радиолокационный передатчик); аппаратура спутника регистрирует отраженный сигнал. Радиолокация позволяет «видеть» Землю сквозь облака. Чаще используются пассивные методы, когда регистрируется отраженная поверхностью энергия Солнца либо тепловое излучение Земли.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-6-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 1. Физические основы дистанционного зондирования
При дистанционном зондировании Земли из космоса используется оптический диапазон электромагнитных волн и микроволновый участок радиодиапазона. На рис. 1.1 представлен оптический диапазон, включающий в себя ультрафиолетовый (УФ) участок спектра, видимый участок – синяя полоса (B), зеленая (G), красная (R); инфракрасный участок (ИК) − ближний ИК (БИК), средний ИК и тепловой ИК.
Рис. 1.1. Оптический диапазон электромагнитных волн
В пассивных методах зондирования в оптическом диапазоне источниками электромагнитной энергии являются разогретые до достаточно высокой температуры твердые, жидкие, газообразные тела. При термодинамическом равновесии с окружающей средой все тела с одинаковой температурой Т излучают одинаково (первый закон Кирхгофа). В состоянии термодинамического равновесия поглощаемая в секунду участком поверхности энергия равна энергии, излучаемой в тот же промежуток времени той же поверхностью (второй закон Кирхгофа). Интенсивность излучения I в заданном направлении, характеризуемом углом α от нормали к излучающей поверхности абсолютно черного тела, определяется законом Ламберта: I = I0 cos α, где I0 − интенсивность излучения при α = 0, которая максимальна; при α = 90°, т.е. по касательной к поверхности, интенсивность излучения равна нулю. По формуле Планка, плотность потока мощности, излучаемой в состоянии термодинамического равновесия единицей поверхности абсолютно черного тела с температурой T в интервале длин волн λ, λ + dλ в телесный угол 2π стерадиан (ср), B (λ , T ) =
c1 ⋅ λ5
⎛ ex p ⎜ ⎝
1 . c2 ⎞ ⎟ −1 λT ⎠
(1.1)
Здесь с1 = 1,1911⋅108 Вт⋅мкм4/м2⋅ср; c2 = 14 388 мкм⋅К. Максимум излучения приходится на λ = 2 898/T мкм. Полная энергия во всем интервале длин волн описывается формулой Стефана-Больцмана: ∞
∫ B (λ, T ) d λ = a ⋅ T
4
, a = 5,67·10−8 Вт⋅м–2⋅К–4.
0
Цифровая обработка аэрокосмических изображений. Конспект лекций
-7-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 1. Физические основы дистанционного зондирования
При увеличении длины волны (1.1) переходит в формулу Релея-Джинса B(λ,T) = с3Т / λ4, с3 = с1/с2. При наблюдении Земли из космоса на длине волны короче 2−3 мкм регистрируется энергия Солнца, отраженная и рассеянная поверхностью суши, воды и облаков. Температура поверхности (фотосферы) Солнца равна 5 785 К, максимум излучения приходится на 0,5 мкм. На рис. 1.2 приведено распределение энергии в спектре Солнца согласно формуле Планка, без учета поглощения в атмосфере Солнца.
Рис. 1.2. Спектр Солнца, вычисленный по формуле Планка
Глаз человека видит предметы в интервале длин волн от 0,38 до 0,76 мкм, максимум чувствительности приходится на λ = 0,5 мкм. Озон, содержащийся в атмосфере в небольшом количестве, сильно поглощает ультрафиолетовое излучение с длиной волны короче 0,3 мкм, так что при наблюдении Солнца с поверхности Земли отсутствует коротковолновый скат кривой B(λ,T) (заштрихован на рис. 1.2). Озон защищает животный и растительный мир от опасного воздействия ультрафиолетового излучения. На длинах волн более 4 мкм собственное тепловое излучение Земли превосходит излучение Солнца. Регистрируя интенсивность теплового излучения Земли из космоса, можно достаточно точно оценивать температуру суши и водной поверхности, которая является важнейшей экологической характеристикой. Измерив температуру верхней границы облачности (ВГО), можно определить её высоту, если учесть, что в тропосфере с высотой температура уменьшается в среднем на 6,5°/км. ВГО представляет большой интерес для метеорологии и авиации. Для регистрации теплового излучения со спутников используется интервал длин волн 10–14 мкм, в котором поглощение невелико. При температуре земной поверхности (облаков) минус 50°С, максимум излучения согласно (1.1) приходится на 12 мкм, при 50° С − на 9 мкм. Цифровая обработка аэрокосмических изображений. Конспект лекций
-8-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 1. Физические основы дистанционного зондирования
Если с помощью датчика, установленного на спутнике, измерено значение плотности потока мощности B = B(λ,Т) от некоторого объекта, то из (1.1) получаем: T = λ/c2 ln (c1/λ5B + 1). Определенная по интенсивности В теплового излучения (радиации) температура Т носит название радиационной, в отличие от термодинамической температуры, характеризующей интенсивность теплового движения молекул вещества и измеряемой контактным термометром. Для абсолютно черного тела обе температуры совпадают, для реальных тел − нет, так как для них величина В составляет некоторую долю ε от плотности потока мощности, излучаемой абсолютно черным телом при той же температуре; ε носит название коэффициента теплового излучения. Ближе всего к 1 коэффициент теплового излучения в тепловом ИК диапазоне у воды и облаков (0,98–0,99). Сложнее дело обстоит с поверхностью суши. Здесь влияет характер поверхности (гладкая или нет), увлажненность и т. д. Для свежего снега ε = 0,986, для густой травы − 0,970, глинистой почвы − 0,980, хвойного леса − 0,97. Для достаточно точного, с погрешностью не более 0,2−0,5 К, определения температуры поверхности из космоса, необходимо учитывать и коэффициент теплового излучения, и поглощение в атмосфере. Контрольные вопросы
1. Что понимают под низким, средним и высоким пространственным разрешением при дистанционном зондировании? 2. Для каких целей применяются спутники дистанционного зондирования с низким, средним и высоким пространственным разрешением? 3. На какую длину волны приходится максимум теплового излучения от лесного пожара, если горящий лес имеет температуру 600° С? 4. Что такое пассивные и активные методы дистанционного зондирования? 5. В чем отличие радиационной температуры от термодинамической? 6. Какова экологическая роль озона?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-9-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 2 Методы исследования в оптическом диапазоне План лекции
1. Отражательная способность поверхности. 2. Наблюдение растительного и снегового покрова. 3. Сведения о составе атмосферы. 4. Ослабление и рассеяние восходящего излучения в атмосфере. Установленная на спутнике аппаратура в видимом и ближнем ИК диапазоне регистрирует солнечную энергию, отраженную и рассеянную поверхностью Земли. Отражательная способность А − это отношение количества (плотности потока) отраженной и рассеянной вверх радиации I0 к плотности потока падающей прямой радиации Солнца Ic: A = I0/Ic. Обычно говорят об общей отражательной способности для широкой области видимого и ближнего инфракрасного спектра и выражают А в %. Можно определять А и для отдельных участков спектра. Величина А для различных типов поверхности и различных участков спектра − это ключ к распознаванию деталей на спутниковых изображениях Земли. Для идеально матовой поверхности зависимость интенсивности радиации, рассеянной под углом α к нормали к поверхности, в точности подчиняется закону Ламберта. Такую поверхность имеют, например, облака. Для других типов поверхности закон Ламберта выполняется приближенно. Значение А зависит от свойств (в том числе от влажности) отражающей поверхности (трава, лес, почва и т. п.), от спектра падающей радиации − прямой и рассеянной, от угла её падения α, рельефа и т. п. Так, зеленая растительность, образующая хорошо поглощающий слой, имеет низкое А − около 5 % в видимой части спектра и большее А в ближней ИК области. У оголенных почв отражательная способность различна: у подзола − всего 7 %, у сухого песка в красной части спектра − до 37 %, заметно меньше у влажного песка. И у растений, и у почвы А обычно растет с увеличением угла α (при низком Солнце). В зимнем хвойном лесу снег, лежащий между деревьями, увеличивает A при малом α и не влияет на А при косых солнечных лучах. Свежий снег имеет в видимых лучах высокое А − до 98 %. У старого зернистого и влажного снега и морского льда А невелико, до 43–45 %. В ИК лучах при λ = 1,55−1,65 мкм снег почти черный (А ~ 0), что позволяет отличать при спутниковых наблюдениях заснеженные участки от облаков, имеющих значительное А на этих длинах волн. Поверхность водоемов имеет низкое А в видимой области (4–6 %) при малых α и еще меньшее в ИК-спектре с λ = 0,8–1,5 мкм, но оно возрастает до 30 % и более при большом угле падения лучей, при зеркальном их отражении (α > 60°), когда, например, со спутника видна светлая дорожка сол-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-10-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
нечных бликов на воде. Волнение увеличивает А до 13 % при малых α и уменьшает при больших. Часть отражательной способности (1–4 %) обусловлена светом, рассеянным в верхнем тонком слое воды. Средняя величина А поверхности Земли меньше 20 % в широком поясе между 55° с.ш. и 60° ю.ш., в особенности в океанических областях. Весь год оно выше 80 % в Антарктике. В северной околополярной области и в области снежного покрова, которая зимой местами распространяется к югу до 40° с.ш. оно меняется с сезоном, но также велико (65–75 %). Отражательная способность облаков, наблюдаемых сверху, тем больше, чем мощнее их слой. Она мала при их оптической толщине τ ~ 1 и значительно больше у слоев с τ = 1−10. Так, например, слой слоистых облаков толщиной в 300 м имеет А = 59−63 %. Особый интерес представляет отражательная способность растительного покрова, которая определяется пигментами листа, в особенности, хлорофиллом (рис. 2.1). В синей и красной области видимого диапазона отражательная способность листа низкая из-за наличия полос поглощения с центрами при λ1 = 0,45 и λ2 = 0,65 мкм. Поглощение на длине волны λ2 заметно даже из космоса.
Рис. 2.1. Отражательная способность зеленого листа
Поглощение между полосами (в зеленой области) незначительное, минимум поглощения, т. е. максимум отражательной способности лежит приблизительно при 0,54 мкм. Из-за этого нормальная, здоровая листва воспринимается глазом как зеленая. Когда растение находится в состоянии стресса и образование хлорофилла уменьшается, происходит уменьшение поглощения энергии в полосах λ1 и λ2, отражательная способность повышается, это заметно глазом в красной области. Растение кажется желтоватым. В ближнем ИК диапазоне при λ > 0,75 > 1,3 мкм поглощательная способность зеленого листа незначительна (~5 %), отражательная способность достаточно велика (А до 45–50 %), значительное количество энергии проходит сквозь лист (45–50 %). Несколько слоев листьев могут иметь более высокую, чем один лист, отражательную способность (А до 85 %). В среднем ИК диапазоне вода Цифровая обработка аэрокосмических изображений. Конспект лекций
-11-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
имеет несколько полос поглощения (при λ = 1,4, λ = 1,9 и λ = 2,7 мкм). Эти полосы ослабляют спектральный отклик зеленых листьев. У хвойного леса для всего видимого диапазона А = 6-16%, у лиственного леса летом А = 7−18 %, у травы А = 7−25 %, у поля близких к зрелости злаков А = 13−23 %. Установленная на спутнике аппаратура дистанционного зондирования регистрирует восходящее излучение от земной поверхности в красном (0,58−0,68 мкм), ближнем инфракрасном (0,75−0,9 мкм) и некоторых других областях спектра. Сравнивая между собой яркости f1 и f2 изображения растительности в красном и ближнем ИК участках, можно судить о состоянии растений в данном районе. Для этого используют так называемый дифференциальный вегетационный индекс DVI = f2 – f1. Однако DVI очень чувствителен к взаимному расположению источника освещения (Солнца), спутника и растений и к поглощению восходящего излучения в атмосфере. Нормализованный дифференциальный вегетационный индекс
NDVI =
f 2 − f1 f 2 + f1
в значительной степени лишен этого недостатка. Это связано с тем, что f1 и f2 изменяются приблизительно пропорционально при изменении взаимного расположения Солнца, спутника и растений. Для растений в нормальном состоянии NDVI близок к 0,6–0,65; низкие значения NDVI, порядка 0,3−0,4, свидетельствуют о недостатке влаги или о заболевании. Это может быть вызвано неблагоприятной экологической обстановкой, поэтому NDVI является также индикатором загрязнения окружающей среды. Более точно о состоянии растительности из космоса можно судить, если использовать не два, а большее число участков видимого и ближнего ИК диапазона. Это позволяет точнее различать сельскохозяйственные культуры, определять занимаемую ими площадь и оценивать урожайность. Спутники с многоспектральной аппаратурой эффективны при мониторинге загрязнения окружающей среды, при поиске полезных ископаемых, при изучении океанских ресурсов и др. Кроме индекса NDVI, состояние растений характеризует нормализованный дифференциальный индекс влагосодержания NDWI:
NDWI =
f 2 − f3 . f 2 + f3
Здесь f2 – по-прежнему яркость в ближнем инфракрасном (0,75−0,9 мкм) участке спектра, а f3 – яркость на длинах волн 1,63−1,65 мкм (см. рис. 2.1). NDWI учитывает, что f3 значительно сильнее зависит от влагообеспеченности растения, чем f2.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-12-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
По аналогии с индексами для растений вводится нормализованный дифференциальный снеговой индекс NDSI, который позволяет различать облака и снег/лед, оценивать степень загрязнения снегового покрова. В видимом диапазоне яркость снега и облаков f1 приблизительно одинаковая, но при λ ≈ 1,6 мкм яркость снега f3 близка к нулю, а яркость облаков почти такая же, как в видимом диапазоне.
NDSI =
f1 − f 3 . f1 + f 3
При дистанционном зондировании поверхности Земли атмосфера является возмущающей средой, которая искажает спутниковые данные, а в некоторых участках электромагнитного диапазона, например в дальнем инфракрасном с длиной волны около 100 мкм, вообще препятствует дистанционному зондированию. С другой стороны, спектральные линии поглощения газов однозначно характеризуют эти газы, а интенсивность и ширина линий отражают физические параметры газов (температуру, плотность, общее количество молекул). Это дает возможность дистанционными методами изучать саму атмосферу. До высоты 100 км атмосферные газы равномерно перемешаны. К главным газам атмосферы относят кислород O2 (около 21 % воздуха по объему), азот N2 (около 78 %) и аргон Ar (несколько менее 1 %). Влияние их на наблюдение Земли из космоса незначительно. Важным компонентом атмосферы является водяной пар, содержание которого в атмосфере не постоянно и относительно невелико. Он имеет очень большое число линий поглощения в инфракрасном и микроволновом диапазонах спектра, начиная с λ = 0,72 мкм и далее у 0,81; 0,94; 1,1; 1,38; 1,87; 2,7−3,2; 6,3 мкм. Углекислый газ CO2 имеет две узкие линии поглощения при λ = 2,7 мкм, λ = 4,26 мкм и вызывает сильное поглощение в дальней инфракрасной зоне спектра начиная с λ = 13 мкм; центр линии приходится на λ = 15 мкм. Известны 30−40 газов, содержащихся в атмосфере в небольших количествах (так называемых малых газов), имеющих как естественное, так и антропогенное происхождение. Некоторые из них, а также углекислый газ могут оказывать влияние на климат Земли и на здоровье человека. К числу малых газов естественного происхождения относят закись азота N2O и метан CH4 (результат деятельности бактерий), сернистый ангидрид SO2, сернистый карбонил COS, сероводород H2S и др. (вулканические выбросы). К малым газам антропогенного происхождения относят отходы топок, производства, транспорта, сельского хозяйства: SO2, CO, хлорводород HCl, фреоны CClxFy и другие. Малые газы, водяной пар и CO2 вызывают ослабление излучения из-за дискретного поглощения в таких важных диапазонах длин волн, как ближний
Цифровая обработка аэрокосмических изображений. Конспект лекций
-13-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
инфракрасный (~1 мкм) и тепловой инфракрасный (λ >10 мкм). В результате в дальнем ИК прозрачным сохраняется только один широкий диапазон длин волн 8–12 мкм, в то время как в ближнем и среднем ИК в зоне длин волн менее 4 мкм имеются четыре узких диапазона, которые используются для дистанционного зондирования. Малые газы, а также СO2 − это многоатомные газы, имеющие электронные переходы с энергией диссоциации порядка 3−5 эВ, а также вращательно-колебательные переходы с энергией возбуждения порядка 0,1 эВ и менее. Первые из них могут быть возбуждены солнечным излучением УФ и видимого диапазона, вторые – квантами ИК и радиодиапазона. Естественный аэрозоль − твердые и жидкие частицы, взвешенные в воздухе, − включают космическую, вулканическую и почвенную минеральную пыль, пыльцу растений, частицы морской соли, капли облаков и туманов, частицы дыма лесных и торфяных пожаров. Антропогенный аэрозоль − это частицы сажи, пепла, цемента и другие отходы производства и транспорта. К числу малых газов относится также озон O3, образующийся в верхних слоях атмосферы под воздействием ультрафиолетового излучения Солнца. Молекулы озона O3, находящиеся, в основном, в стратосфере, сильно влияют на общее поглощение только в одном небольшом участке инфракрасной зоны (λ = 9,59 мкм). Однако озон активно поглощает энергию в ультрафиолетовой зоне и в зоне миллиметровых радиоволн. Слой озона толщиной всего 3 мм (при нормальном давлении и температуре) ослабляет УФ излучение Солнца с длиной волны λ = 0,255 мкм в 1040 раз. И озон, и другие газы при поглощении преобразуют энергию Солнца в тепловую. Видимый диапазон спектра прозрачен, однако в наиболее коротковолновой его части (фиолетовый и голубой участки) велики «помехи» от молекулярного рассеяния солнечного света. Атмосфера не является прозрачной в дальней инфракрасной зоне спектра с длиной волны более 14 мкм. И только при длине волн намного длиннее этих (около 1 мм) атмосфера вновь становится все более прозрачной, поскольку лишь некоторые более слабые переходы вызывают поглощение. На рис. 2.2 показаны окна прозрачности атмосферы в ИК-диапазоне.
Рис. 2.2. Окна прозрачности в атмосфере
Цифровая обработка аэрокосмических изображений. Конспект лекций
-14-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
Рис. 2.3. Диаграмма, поясняющая наблюдение под углом к надиру
Атмосфера ослабляет восходящее излучение от поверхности Земли, и в полосах прозрачности происходит поглощение и рассеяние света молекулами газов, капельками воды, пылинками. Оптическая толщина τ – безразмерная величина, произведение объемного коэффициента ослабления света атмосферой на геометрическую длину пути светового луча. При малости эффектов многократного рассеяния, т. е. в пределах справедливости закона Бугера, имеем: I1 = I0 exp(–τ), где I0 и I1 − интенсивности в начальной (на поверхности Земли) и в конечной (на орбите спутника) точках при наблюдении в надире. Если наблюдение проводится под углом δ к надиру (рис. 2.3), то для однородной атмосферы I2 = I0 exp(–τ sec δ). Формула не учитывает кривизну Земли и возможные локальные неоднородности (туман, дымки, облака пыли и т. д.), поэтому расчет приближенный. При рассеянии света молекулами газов, капельками воды, пылинками наблюдается ряд закономерностей. Интенсивность молекулярного рассеяния пропорциональна λ–4, эффект наиболее заметен в коротковолновой части спектра, он ответствен за голубой цвет неба. Рассеяние на аэрозолях (размер частиц от 0,1λ до 10λ) приводит к более слабой зависимости интенсивности от длины волны λ–α, 0 < α < 4. Частицы дыма и облаков имеют размеры, много большие, чем длина волны видимого и ИК-диапазонов. Спутник может принимать информацию с больших площадей, при этом различные участки поверхности наблюдаются под разными углами δ, и луч от них проходит разные расстояния в атмосфере. В результате одинаковые по оптическим свойствам участки поверхности могут иметь различную яркость. Для расчетов по формуле Бугера необходимо знать оптическую толщину атмосферы τ. Это можно сделать, измеряя на Земле ослабление солнечной радиации. Со спутника τ можно оценить, наблюдая яркость объектов с заранее известными оптическими характеристиками. Грубо оценить τ в ви-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-15-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне
димом участке спектра можно, используя зависимость между τ и метеорологическими характеристиками тропосферы – давлением, температурой и влажностью воздуха и др. Корректный учет влияния атмосферы основан на теории переноса излучения в атмосфере, позволяющей уточнить яркость объектов путем решения обратной задачи. Искусственные спутники Земли позволяют не только наблюдать из космоса поверхность суши, водоемов и облаков, но и определять средствами оптической спектроскопии концентрацию некоторых газов и аэрозоля. Естественные и антропогенные примеси вызывают локальное загрязнение территорий, но они могут разноситься потоками воздуха по всему земному шару. Например, выбросы в атмосферу Норильского горно-металлургического комбината заметны на Аляске и в Канаде, в Японии идут кислотные дожди из-за промышленных выбросов в Китае. Основную роль в выявлении глобального загрязнения атмосферы отводится спутниковым методам. Для оценивания содержания малых газов, СO2 и аэрозолей используются спутниковые спектрофотометры. Облака SO2 можно видеть на рис. 2.4, построенном по данным спутника TOMS/EP за 1 октября 1994 г. Здесь видны выбросы при извержении вулкана Ключевская сопка (отмечена крестом) и выброс Норильского комбината (стрелка). Спектрофотометры УФ и видимого диапазона регистрируют интенсивность рассеянного «назад» излучения Солнца. Спектрофотометры ИК диапазона регистрируют интенсивность прошедшего через атмосферу теплового излучения от поверхности Земли и облаков. Частицы аэрозолей, как правило, имеют несферическую форму; под действием воздушных потоков они ориентируются приблизительно в одном направлении, поэтому солнечный свет, рассеянный аэрозолями, имеет эллиптическую поляризацию. Измеряя характеристики поляризации рассеянного излучения, можно оценить концентрацию аэрозолей.
SO2 0
5
10
15
20
25
30
35
Цифровая обработка аэрокосмических изображений. Конспект лекций
-16-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 2. Методы исследования в оптическом диапазоне Рис 2.4. Выбросы диоксида серы в атмосферу (по данным спутника TOMS/EP)
Спектрофотометры УФ и видимого диапазона регистрируют интенсивность рассеянного «назад» излучения Солнца. Спектрофотометры ИКдиапазона регистрируют интенсивность прошедшего через атмосферу теплового излучения от поверхности Земли и облаков. Частицы аэрозолей, как правило, имеют несферическую форму; под действием воздушных потоков они ориентируются приблизительно в одном направлении, поэтому солнечный свет, рассеянный аэрозолями, имеет эллиптическую поляризацию. Измеряя характеристики поляризации рассеянного излучения, можно оценить концентрацию аэрозолей. Контрольные вопросы и задания 1. Что такое отражательная способность? 2. Для каких поверхностей справедлив закон Ламберта? 3. Какова длина волны линий поглощения хлорофилла? 4. Что такое вегетационный индекс? 5. Как вычислить нормализованные дифференциальные индексы: вегетационный, снеговой и индекс влагосодержания? 6. Найдите на рис. 2.2 линии поглощения озона и углекислого газа в ИК-диапазоне. 5. Пусть оптическая толщина атмосферы τ = 0,2. Во сколько раз отличаются интенсивности принимаемого аппаратурой спутника излучения при наблюдении в надир и под углом δ = 30° ?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-17-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 3 Методы изучения земли из космоса План лекции
1. 2. 3. 4. 5. 6. 7.
Оптические методы. Сканер с цилиндрической и с линейной разверткой. Мгновенный угол зрения, пространственное разрешение. Космическая радиолокация. Боковой обзор. Синтез апертуры. Радиовысотомеры, скаттерометры, радиометры.
Первые изображения Земли из космоса были получены с помощью фотокамеры, эта методика применятся и в настоящее время. Спутник с фоторегистрацией «Ресурс-Ф1М» (Россия) позволяет фотографировать Землю в интервале длин волн от 0,4 до 0,9 мкм. Отснятые материалы спускаются на Землю и проявляются. Анализ снимков, как правило, проводится помощью проекционной аппаратуры. Метод обеспечивает высокую геометрическую точность изображения и возможность увеличения снимков. Однако он обладает низкой оперативностью; изображение представлено в виде фотографий, а не в цифровой форме; диапазон спектра ограничен видимым участком и ближним ИК. Этих недостатков лишены сканерные методы. Сканер с цилиндрической разверткой содержит объектив с точечным фотоприемным устройством (фотоэлектронный умножитель, фотодиод, фоторезистор). Перед объективом качается (вращается) зеркало, отражение от которого попадает на фотоприемное устройство (рис. 3.1). При качании (вращении) зеркала и движении аппарата над Землей построчное считывается сигнал, пропорционального освещенности в того участка земной поверхности, на который в данный момент направлено зеркало. С помощью фотодиода регистрируется излучение в ультрафиолетовом, видимом и ближнем ИК-диапазоне, с помощью фоторезистора регистрируется излучение в тепловом ИК-диапазоне и оценивается температура поверхности Земли. Сканерная информация в цифровой форме передается со спутника по радио в реальном времени или в записи на бортовой накопитель; на Земле она обрабатывается на ЭВМ. Линейный сканер содержит расположенные в линию неподвижные фоточувствительные элементы на приборах с зарядовой связью (ПЗС) − линейку ПЗС или несколько таких линеек. Число фотоприемников в линейке достигает 1 000 и более, длина линейки – не более 1−3 сантиметра. На линейки через объектив фокусируется изображение земной поверхности, все элементы находятся в фокальной плоскости.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-18-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса К
С
Рис. 3.1. Схема работы сканера с цилиндрической разверткой
Рис. 3.2. Схема работы сканера с линейной разверткой
Линейка ориентирована поперек направления движения спутника, она перемещается вместе со спутником, последовательно «считывая» сигнал, пропорциональный освещенности различных участков поверхности и облаков (рис. 3.2). Линейные сканеры на ПЗС работают в видимом и ближнем ИК-диапазоне. Важными характеристиками сканера являются полоса захвата G, радиометрическое разрешение ΔI, мгновенное поле зрения Δϕ, пространственное разрешение ΔL. Радиометрическое разрешение ΔI (яркостное, температурное) определяется динамическим диапазоном датчика и числом уровней дискретизации (числом бит), соответствующих переходу от яркости абсолютно «черного» к абсолютно «белому». Мгновенное поле зрения зависит от характеристик объектива и размеров фотоприемника. Это интервал углов Δϕ, в пределах которых в каждый момент времени на фотоприемник попадает изображение земной поверхности или облаков. Если спутник находится на расстоянии L от некоторой области на поверхности Земли, то фотоприемник единовременно регистрирует излучение от участка поверхности с линейным размером ΔL = Δϕ⋅L в пределах мгновенного угла зрения (здесь Δϕ выражено в радианах). Величина ΔL – это пространственное разрешение сканера на местности. Если два объекта на поверхности Земли находятся на расстоянии менее ΔL, то их изображения сливаются. Сканерные изображения, как и все цифровые изображения, состоят из отдельных элементов − пикселов квадратной или прямоугольной формы с линейным размером ΔL, которые хорошо видны, если увеличить изображение. При работе с картой важно знать её масштаб. Если 1 см карты соответствует 1 км на местности, то масштаб равен 1:100 000, так как в 1 км содержится 100 000 см. Разрешение на местности, даваемое сканером, − это другая характеристика, но бывает необходимо сравнивать спутниковое изображение и карту некоторого масштаба. На 1 см карты можно рассмотреть некоторые детали, на изображении, содержащем приблизительно 10 пикселов, − тоже. Поэтому условно можно считать, что разрешение в 1 км соответствует мас-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-19-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса
штабу карты в 1:1 000 000, разрешение в 100 м − масштабу 1:100 000, разрешение в 30 м − масштабу 1:30 000. Пространственное разрешение ΔL зависит от параметров оптической системы и от расстояния L от спутника до объекта: ΔL наилучшее (минимальное) в подспутниковой точке (надире), когда расстояние L минимально и равно высоте спутника над Землей. При отклонении от надира у сканеров с цилиндрической и линейной разверткой L увеличивается и разрешение становится хуже. Разрешение сканера AVHRR спутника NOAA в надире ΔL = 1,1 км, при максимальном отклонении сканера от направления в надир разрешение становится равным приблизительно 4 км. Сканер HRVIR спутника SPOT-4 имеет разрешение в надире ΔL = 10 и 20 м. В объективах сканеров используется, как правило, зеркальная оптика. Линзовая оптика нежелательна, так как показатели преломления и поглощения света в линзах различны для различных длин волн, а сканер должен работать в широком диапазоне – от видимого участка до инфракрасного. Зеркальные объективы имеют вогнутое зеркало параболической формы, на внутреннюю поверхность которого нанесена тонкая отражающая металлическая пленка. Свет, отраженный основным зеркалом, попадает на площадку, где в фокальной плоскости объектива размещены фотоприемники. Мгновенное поле зрения Δϕ определяется размером апертуры объектива и размерами фотоприемника. Апертура (действующее отверстие оптической системы) для параболического зеркала – это круг диаметра D, замыкающий зеркало. При малых значениях мгновенного поля зрения его величина приближенно Δϕ = λ/D, а пространственное разрешение составляет ΔL ∼ λ·L/D, где λ −длина волны. Таким образом, чем меньше отношение длины волны к диаметру апертуры, тем лучше разрешение оптической системы. Пусть, например, λ = 1 мкм, D = 10 см, Δϕ = λ/D = 10−5 рад. Если расстояние L от спутника до поверхности Земли равно 1000 км, то пространственное разрешение составляет ΔL = L⋅Δϕ = 10 м. Из-за дифракции электромагнитных волн изображение точки несколько расплывается. Поэтому идеальный фотоприемник должен иметь размер Δ порядка длины волны (это размер так называемого второго кружка Эйри). Таково предельное разрешение, зависящее от размеров оптической системы. Это разрешение существенно зависит от длины волны, при λ = 10 мкм и тех же условиях ΔL = 100 м. Увеличение размера фотоприемника Δ приводит к увеличению Δϕ, при некотором Δ величина Δϕ, в основном, определяется размером Δ и почти не зависит от λ. Оптическая система с главным зеркалом диаметром D = 20 см установлена в сканере AVHRR (спутник NOAA), у которого разрешение ΔL = 1,1 км одинаковое и при λ = 0,7 мкм, и при λ = 12 мкм. Оптические сканеры регистрируют отраженное и рассеянное солнечное излучение, а также тепловое излучение Земли. Это пассивные методы дистанционного зондирования природной среды.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-20-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса
При использовании активных методов на спутник устанавливают собственный источник энергии, которая посылается на Землю (радиолокационный передатчик); аппаратура спутника регистрирует отраженный сигнал. Радиолокация Земли из космоса − важное направление в дистанционном зондировании, имеющее ряд преимуществ перед оптическими пассивными. В частности, она позволяет «видеть» подстилающую поверхность сквозь облака и в ночное время практически при том же пространственном разрешении. Радиолокаторы космического базирования работают в микроволновом диапазоне, обычно на длинах волн короче 30 см. Как и в оптическом диапазоне, используются окна прозрачности атмосферы. Например, работа не ведется вблизи линий поглощения кислорода (1,35 см) и водяного пара (5 мм). Принцип импульсной радиолокации в общих чертах состоит в следующем. На спутнике устанавливается передатчик, посылающий с помощью антенны в направлении Земли импульсы с высокочастотным заполнением (рис. 3.3). После этого наступает пауза, в течение которой производится прием отраженных сигналов. Если импульс отражается от некоторого объекта, расположенного на расстоянии L от спутника, то он вернется назад через интервал времени Δt = 2L/c, где с − скорость света, множитель 2 учитывает, что сигнал проходит путь L дважды. Чем дальше объект от радиолокатора, тем больше Δt.
Антенна
Объект на поверхности Земли
Рис. 3.3. К принципу работы радиолокатора бокового обзора
Сигналы от различных объектов приходят в разное время, это автоматически реализует сканирование по дальности. Измеряя Δt, можно найти расстояние до объекта. Интенсивность отраженных сигналов зависит от дальности и различна для разных объектов, так как они отличаются размерами и электрофизическими характеристиками. Для достижения высокого пространственного разрешения вдоль строки необходимо использовать очень короткие импульсы, поскольку электромагнитная волна распространяется со скоростью света, проходя 300 м за 1 мксек. Укорочение импульса приводит к уменьшению его энергии и не всегда приемлемо, поэтому высокочастотное заполнение сравнительно длинного импульса (длительностью в несколько мксек) модулируют в передатчике специальным образом, а в приемнике применяют процедуру сжатия (укорочения) отраженного сигнала (рис. 3.4). Для современной техники разрешение в 1−10 м не является пределом. Радиолокатор перемещается вместе со спутником, последовательно считывая по строкам сигнал с интенсивностью, пропорциональной отражательной способности различных участков поверхности. Строки, как и в сканерах оптического диапазона, расположены поперек движения спутника. Цифровая обработка аэрокосмических изображений. Конспект лекций
-21-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса
Рис. 3.4. Сжатие импульсов при боковом обзоре
Отсюда следует, что антенна такой радиолокационной станции, собирающая отраженные сигналы, должна быть направлена именно в этом, боковом направлении, поэтому такого рода устройства называют радиолокационными станциями бокового обзора (РЛС БО). РЛС БО может содержать две антенны − одна смотрит вправо, другая – влево, участок под спутником не просматривается. Пространственная разрешающая способность РЛС БО в направлении движения спутника (разрешение между строками) зависит от направленных свойств приемной антенны. Антенна выполняет те же функции, что и оптическая система, суммируя в пределах апертуры энергию, приходящую от некоторого участка местности на поверхности. И в этом случае справедливы приведенные выражения для углового и пространственного разрешения. Но длина волны в радиодиапазоне на несколько порядков больше, чем длина волны оптического диапазона. Например, спутник ERS, летящий на высоте Н = 780 км, принимает радиолокационные сигналы, отраженные от земной поверхности, на длине волны λ = 5,3 см при дальности L = 900 км. Какого диаметра приемную параболическую антенну следовало бы на него установить, чтобы получить предельное разрешение ΔL = 30 м? Нетрудно найти, что диаметр антенны должен быть равен 2R = 2λ·L/ΔL = 2 км, что нереально. Все же найден способ обойти это ограничение путем использования радиолокаторов с синтезированной апертурой (РСА, английское сокращение SAR). Идея РСА, в принципе, достаточно проста. В РСА используется движение самого спутника и установленной на нем антенны с реальной апертурой (скорость более 7 км/с). Сигналы, принятые антенной, запоминаются и далее суммируются (накапливаются) компьютером, так что сигнал от объекта М, принятый в точке Р (рис. 3.5) в момент времени ti, складывается с сигналом от этого же объекта, который ранее принимался в момент tm, когда спутник находился в точке Р'.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-22-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса Антенна
М
Р′ Р
Рис. 3.5. К принципу синтеза апертуры
Для объектов, находящихся ближе к спутнику, используют меньший размер синтезированной апертуры, для дальних объектов размер апертуры растет пропорционально росту расстояния L. Это позволяет уменьшить мгновенное поле зрения Δϕ для дальних объектов и сделать разрешение независимым от дальности, что обычно недостижимо в оптическом диапазоне. Если λ = 5,3 см, то для получения пространственного разрешения в 30 м на дальности L = 1000 км размер синтезированной апертуры должен составлять 1,77 км, на дальности L = 1 200 км – 2,12 км. На практике применяются как РЛС БО с реальной апертурой (их называют также некогерентными РЛС БО), так и РСА, так называемые когерентные РЛС БО. Преимуществом некогерентных РЛС БО являются более широкая полоса обзора и относительная простота как самого радиолокатора, так и системы обработки информации. Радиолокационные системы с синтезированной апертурой позволяют получать наиболее высокое разрешение, но требуют сложной системы обработки на борту. В целом же пространственное разрешение РЛС БО (1−100 м для РСА и 1−2 км для некогерентных РЛС БО) сравнимо с разрешением оптических систем. Существенным информативным фактором в радиодиапазоне является поляризация отраженной волны. Под поляризацией понимают направление вектора напряженности электрического поля Е. РЛС может излучать сигналы с горизонтальной поляризацией (вектор Е расположен горизонтально) либо с вертикальной поляризацией, когда этот вектор расположен вертикально, однако иногда применяются оба вида поляризации − горизонтальная на одной длине волны, вертикальная на другой. Отраженная от объекта волна может частично сменить свою поляризацию, поэтому приемная антенна спутника нередко построена таким образом, чтобы принимать сигналы с двумя видами поляризации на каждой частоте. Сравнивая сигналы двух поляризаций, т. е. оценивая анизотропию поляризации сигнала, можно получить дополнительные сведения об объекте, его структуре и электрофизических характеристиках. Если средства дистанционного зондирования оптического диапазона наиболее эффективны при изучении растительности, обнаружении пожаров, оценке температуры поверхности, то активные средства радиодиапазона − при получении сведений о рельефе, почве и геологических структурах, при изучении льдов, в океанологии. К средствам активного радиолокационного зондирования относят также высотомеры и скаттерометры. Радиолокационные высотомеры могут быть Цифровая обработка аэрокосмических изображений. Конспект лекций
-23-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 3. Методы изучения земли из космоса
использованы для получения информации о форме морской поверхности, гравитационных аномалиях, высоте волн, скорости ветра, уровнях приливов, скорости поверхностных течений, ледовом покрове и т. д. Скаттерометры (измерители характеристик рассеяния) оценивают эффективную площадь рассеяния морской поверхности и величину ее анизотропии в зависимости от скорости и направления ветра. Радиометрическое зондирование в микроволновом диапазоне является пассивным радиотехническим методом наблюдения земной поверхности из космоса (частоты 1−100 ГГц). Радиометры, как и приборы дальнего ИК-диапазона, регистрируют собственное тепловое излучение поверхности. В радиодиапазоне справедлив закон Релея-Джинса, по которому интенсивность излучения прямо пропорциональна температуре. По сравнению с приборами инфракрасной области, радиометры обладают рядом преимуществ: возможностью получения информации о параметрах верхнего слоя грунта (например, о влажности на глубинах до 1–2 м), о параметрах ледяного покрова, морского волнения и др. В радиодиапазоне наблюдаются значительные яркостные контрасты при одинаковых температурах объектов. Радиометры обладают худшим угловым разрешением и более низкой точностью измерения температуры, чем приборы ИК-диапазона. Контрольные вопросы и задания
1. Как устроены сканеры с цилиндрической и линейной разверткой? 2. Что такое мгновенное поле зрения? 3. Что такое пространственное разрешение сканера? 4. От чего зависит пространственное разрешение? 5. Какого размера следовало бы установить зеркальный объектив на геостационарном спутнике, чтобы получить разрешение в 10 м в зеленом участке спектра? 6. Карте какого масштаба соответствует панхроматическое изображение со спутника SPOT-4 с разрешением 10 м? 7. Охарактеризуйте принцип работы радиолокатора бокового обзора. 8. Опишите принцип синтеза апертуры.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-24-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 4 Орбиты космических аппаратов План лекции
1. Невозмущенное движение космического аппарата. Задача Кеплера. 2. Возмущенное движение космического аппарата. 3. Круговая орбита. Орбитальная скорость и период обращения. 4. Солнечно-синхронная орбита. Траектория движения искусственного спутника Земли (ИСЗ) называется его орбитой. Свободный полет спутника при выключенных маршевых реактивных двигателях происходит под действием гравитационных сил и по инерции, движение спутника подчиняется законам небесной механики. Если считать Землю строго сферической с равномерным распределением массы внутри неё, а действие гравитационного поля Земли − единственной силой, действующей на спутник, имеем так называемую задачу Кеплера, которая сводится к решению уравнения
m d2r/dt2 = − γ mM r/r3,
(4.1)
где m − масса спутника; M = 5,976⋅1027 г − масса Земли; r – радиус-вектор, соединяющий спутник и центр Земли, r − его модуль. Решение уравнения в полярных координатах r, v дается соотношением r = p/(l + e cos v).
(4.2)
Это уравнение кривой второго порядка − эллипса (или окружности − частного случая эллипса). Эллиптическая орбита изображена на рис. 4.1, где в точке S находится спутник, в точке G − Земля, a = AO и b= OС – большая и малая полуоси эллипса; e = (1 − b2/a2)1/2 − эксцентриситет орбиты; угол ПGS − угловая координата v радиуса-вектора r (так называемая истинная аномалия); фокальный параметр p = b2/a = K2/γm2M, где K − момент количества движения спутника. Орбита спутника характеризуется также периодом обращения Т − временем между двумя последовательными прохождениями одной и той же точки орбиты. В рамках задачи Кеплера спутник движется в плоскости, проходящей через центр Земли, − плоскости орбиты. В так называемой абсолютной или звездной системе координат плоскость орбиты неподвижна. Абсолютная система − это декартова система координат с началом в центре Земли, неподвижная относительно звезд. Ось Z направлена вдоль оси вращения Земли и указывает на север, ось X направлена на точку весеннего равноденствия, а ось Y перпендикулярна осям X и Y. Точка весеннего равноденствия − это та точка на небесной сфере, в которой находится Солнце 21 марта в 0 ч по всемирному времени. Плоскость орбиты пересекается в общем случае с плоско Цифровая обработка аэрокосмических изображений. Конспект лекций
-25-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 4. Орбиты космических аппаратов
стью экватора Земли, линия пересечения называется линией узлов. Точка, в которой орбита пересекает плоскость экватора при движении спутника с юга на север, называется восходящим узлом В орбиты, точка пересечения при движении спутника с севера на юг – нисходящим узлом Н. Линия узлов
Спутник
Рис. 4.1. Эллиптическая орбита
Положение восходящего узла определяется долготой восходящего узла, т.е. углом Ω между восходящим узлом и точкой весеннего равноденствия, отсчитываемым против часовой стрелки, если смотреть со стороны Северного полюса. Относительно линии узлов задают два угла в плоскости орбиты. Угол ω − угловое расстояние, отсчитываемое от восходящего узла в плоскости орбиты до перигея орбиты П, т. е. ближайшей к Земле точки орбиты спутника; ω называют аргументом перигея. Угол i между плоскостью орбиты и плоскостью экватора называется наклонением орбиты. Угол i отсчитывается от плоскости экватора, с восточной стороны восходящего узла орбиты, против движения часовой стрелки. По наклонению различают экваториальные (I = 0°), полярные (I = 90°) и наклонные орбиты (0 < I < 90°, 90 < I < 180°). Долгота восходящего узла Ω, наклонение i, аргумент перигея ω характеризуют положение плоскости орбиты и ее ориентацию в пространстве. Форму и размер орбиты задают фокальный параметр p и эксцентриситет e. Для привязки движения спутника ко времени в число элементов вводится время прохождения спутником точки начала отсчета t0. Совокупность параметров Ω, ω, i, p, e, t0 называется кеплеровскими элементами, элементами орбиты. Зная параметры Ω, ω, i, p, e и положение спутника на орбите в момент t0, можно найти это положение в любой другой момент времени t1. Пусть дана эллиптическая орбита спутника, движущегося вокруг Земли G. Проведем из центра этой орбиты О окружность радиусом, равным большой полуоси эллипса (рис. 4.2).
Цифровая обработка аэрокосмических изображений. Конспект лекций
-26-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 4. Орбиты космических аппаратов
Рис. 4.2. К вычислению положения спутника
Пусть в момент tп спутник находился в перигелии орбиты П, а через некоторое время в момент t0 сместился в точку S. Угол ПGS (между направлением на перигелий и радиусом-вектором), как указывалось, называется истинной аномалией v в момент t0. Проведем через S прямую, перпендикулярную к оси ОП и пересекающуюся в точке Р с окружностью. Угол ПОР называется эксцентрической аномалией Е в момент t0. Представим теперь точку, которая выходит из перигелия одновременно со спутником и движется по окружности равномерно со скоростью, равной средней скорости движения спутника по орбите. Эта средняя скорость называется средним движением и равна n = 360°/T, где Т — период обращения. Если в момент t0 такая точка займет положение Р', то угол ПОР' будет равен М = п(t0 − tп). Эта величина называется средней аномалией в момент t0. Решая трансцендентное уравнение
E − e sin E = M, которое называется уравнением Кеплера, можно найти эксцентрическую аномалию Е. Истинная аномалия v, характеризующая положение спутника на орбите в абсолютной системе координат в момент t0, связана с Е и эксцентриситетом е соотношением tg v /2 = [(1 + e)/(1 − e)]1/2 tg E/2. Зная среднее движение n и истинную аномалию v в момент t0, можно вычислить tп и далее истинную аномалию v в момент t1, т. е. определить положение спутника на орбите. Однако решение задачи Кеплера даёт лишь приближенное описание орбиты спутника. Во-первых, массы внутри Земли распределены неравномерно, так как полярный радиус Земли меньше экватрориального радиуса. Во-вторых, на движение спутника влияет сопротивление земной атмосферы. В-третьих, необходим учет светового давления солнечных лучей. В-четвертых, нужно учи Цифровая обработка аэрокосмических изображений. Конспект лекций
-27-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 4. Орбиты космических аппаратов
тывать притяжение Луны и Солнца и др. Влияние этих факторов на движение ИСЗ мало по сравнению с силой притяжения Земли. Они носят название возмущающих сил, а движение спутника с учетом их воздействия – возмущенным движением. Основным источником возмущений являются первый фактор. Если учитывать только первую зональную гармонику в разложении гравитационного потенциала Земли (она описывает сжатие Земли с полюсов), то окажется, что в основном изменяется ориентация орбиты в пространстве, а форма и размеры орбиты остаются постоянными. За один оборот долгота восходящего узла Ω и аргумент перигея ω изменяются на ΔΩ = − 0º,58 (R0/a)2 cos2 i/(1 − e2)2, Δω = 0º,29 (R0/a)2 (5cos2 i − 1)/(1 − e2)2, где R0 = 6 378,14 км − экваториальный радиус. Эти выражения дают в первом приближении поправки к долготе восходящего узла Ω и аргументу перигея ω и позволяют уточнить положение орбиты в абсолютной системе координат. Спутник, движущийся в земной атмосфере, испытывает аэродинамическое торможение, зависящее от плотности атмосферы на высоте полета, от скорости спутника, площади его поперечного сечения и массы. Возмущение орбиты за счет аэродинамического торможения содержит регулярную и нерегулярную составляющие. К регулярным возмущениям приводит суточный эффект (ночью, т. е. в конусе земной тени, плотность атмосферы на данной высоте меньше, чем днем). Движение воздушных масс, влияние потоков заряженных частиц, выбрасываемых Солнцем, приводят к нерегулярным возмущениям. Для природоведческих спутников сопротивление атмосферы играет заметную роль только при низких орбитах; при высоте перигея более 500−600 км возмущающее ускорение от неравномерности распределения масс превышает на 2 порядка и более ускорение от торможения в атмосфере. При высоте перигея от 500−600 до нескольких тысяч км к основному возмущающему фактору добавляется давление солнечного света. Влияние давления солнечных лучей выражается в появлении дополнительных малых периодических возмущений элементов орбиты. Если же спутник движется так, что регулярно попадает в конус земной тени, то имеют место также и небольшие постоянные изменения элементов. Но величина ускорения за счет давления света на несколько порядков меньше, чем возмущающее ускорение за счет основного фактора. Еще слабее влияние притяжения Луны и Солнца. Существуют модели движения спутников по орбите, учитывающие все основные возмущающие силы. Они позволяют с высокой точностью предсказывать значения орбитальных элементов на многие месяцы вперед. Примером является модель, разработанная в Институте космических исследова-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-28-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 4. Орбиты космических аппаратов
ний РАН. Однако в практике дистанционного зондирования чаще всего применяются орбитальные элементы в формате NORAD (США) из сети Интернет (http://www.celestrak.com). По этому адресу представлены орбитальные элементы для спутников самого различного назначения, запущенных в разное время в различных странах, в том числе архивные материалы. Формат NORAD использует достаточно простые модели движения спутников, но орбитальные элементы постоянно корректируются по данным сети радиолокационных станций и станций оптического наблюдения (для низколетящих спутников корректировка может производиться несколько раз в день). Достоинством элементов NORAD является их доступность, однако эти орбитальные элементы сравнительно быстро устаревают. В частности, если при расчете орбиты спутника NOAA использовать элементы NORAD недельной давности, то окажется, что подспутниковая точка может сместиться на несколько км относительно её истинного положения. Зная орбитальные элементы, можно предсказать время прохождения спутника над тем или иным районом, направить антенну приемной станции на спутник, осуществить географическую привязку изображений, полученных с помощью спутника. Спутники для дистанционного зондирования Земли запускают в основном на круговые орбиты. Малое значение эксцентриситета орбиты спутника NOAA-18, равное е = 1,0008831, достаточно типично. Такой спутник пролетает над различными участками Земли на одинаковой высоте, что обеспечивает равенство условий съемки. Справедливо выражение
mV2/R = mMγ/R2. В левой части стоит центробежная сила, справа – сила притяжения спутника к Земле. Здесь V − скорость спутника на орбите; R = R0 + H – расстояние между спутником и центром Земли, причем R0 = 6 370 км − средний радиус Земли; H – высота спутника над поверхностью Земли; γ = 6,67⋅10−14 м3/г⋅с2 − гравитационная постоянная. Таким образом, V = (Mγ/R)1/2, период обращения спутника равен T = 2πR/V. Обозначим:
B = (Mγ)1/2 = 6,31⋅102 км3/2/с. Тогда V = B/R1/2, T = 2πR3/2/B. Скорость перемещения подспутниковой точки по поверхности Земли VЗ может быть определена по формуле VЗ = V⋅R0/R. Пусть H = 1 000 км, тогда R = 7370 км. Используя приведенные формулы, находим, что скорость на орбите V = 7,35 км/с, VЗ = 6,35 км/с, период обращения T = 105 мин. Низкоорбитальные спутники (H менее 1 000 км) обычно выводятся на приполярные солнечно-синхронные орбиты. Эти орбиты имеют наклонение i, близкое к 90°, обеспечивают съемку всей поверхности Земли, включая полярные области. Поворот орбиты относительно Земли синхронизован с вращением Земли относительно Солнца, так что в течение всего времени
Цифровая обработка аэрокосмических изображений. Конспект лекций
-29-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 4. Орбиты космических аппаратов
угол между плоскостью орбиты и направлением на Солнце постоянен (рис. 4.3). Это позволяет производить съемку Плоскость орбиты спутника приблизительно в один и тот же час местного времени в течение всего года. Наиболее удобное время для съемки − около местного полдня. Солнце Спутник NOAA-18 имеет орбиту с Земля наклонением 98,86°, так что за сутки плоскость орбиты поворачивается относительно Земли на 0,986°, за год − на 360°. Однако из-за возмущений, вызванных неравномерностью распределения масс Земли, сопротивлением атмосферы, давлением солнечных лучей и т. п., в течение нескольких лет плоскость орбиты несколько Рис. 4.3. Солнечно-синхронная орбита меняется. Некоторые метеорологические спутники запускают на геостационарную орбиту высотой 36 тыс. км с периодом 24 ч. Эти спутники находятся над одной и той же точкой на экваторе и обеспечивают постоянный обзор одной и той же части планеты на широтах от 50° с.ш. до 50° ю.ш. Контрольные вопросы
1. В чем причина возмущенного движения спутника на орбите? 2. Что относят к кеплеровским элементами орбиты? 3. Каков период обращения и орбитальная скорость японского спутника исследования природных ресурсов Jers-1, если высота орбиты составляет 568 км? 3. С какой скоростью движется по поверхности Земли проекция спутника, если высота орбиты 900 км? 4. Что такое солнечно-синхронная орбита?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-30-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 5 Космические аппараты для дистанционного зондирования План лекции
1. Спутники с низким пространственным разрешением. 2. Спутники со средним пространственным разрешением. 3. Спутники с высоким пространственным разрешением. Спутники для дистанционного зондирования имеют различное назначение и в связи с этим отличаются характеристиками: орбитой, пространственным разрешением, полосой обзора и набором спектральных каналов. Основное назначение спутников с низким пространственным разрешением – метеорология и гидрология, однако уже около 30 лет они используются и как природоведческие. На конец 2008 г. на солнечно-синхронных орбитах высотой 830−870 км с периодом обращения около 100 мин функционирует четыре спутника NOAA (США) и спутник FengYun-1D (Китай). В сканерах этих космических аппаратов применена цилиндрическая развертка с полосой обзора в 3000 км, что позволяет, например, на одном витке орбиты наблюдать всю Сибирь. Пространственное разрешение сканеров низкое – 1,1 км в подспутниковой точке и 4 км на краю полосы обзора. Спутники NOAA (рис. 5.1) имеют длину 4,18 м, диаметр 1,88 м, вес 1 030 кг. Площадь солнечных батарей спутника 11,6 м2, мощность батарей не менее 1,6 кВт. Четыре спутника NOAA обеспечивают до 16 сеансов приема в сутки.
Рис. 5.1. Спутник NOAA
Сканер AVHRR спутника NOAA имеет зеркальную оптическую систему диаметром 20 см, сканирование осуществляется путем вращения дополнительного зеркала из бериллия с частотой 6 об/с. Угол сканирования ± 55°. Из-за кривизны Земли зона радиовидимости спутника с земной поверхности составляет ±3 400 км, поэтому за один пролет спутника удается получить информацию с поверхности около 3 000×7 000 км. Спектральные каналы сканера приходятся на окна прозрачности атмосферы и выделяются светофильтрами:
Цифровая обработка аэрокосмических изображений. Конспект лекций
-31-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
1) 0,58−0,68 мкм (красный участок спектра); 2) 0,725−1,0 мкм (ближний ИК); 3) 3,55–3,93 мкм (участок ИК диапазона, в который попадает излучение от лесных и других пожаров); 4) 10,3–11,3 мкм (канал для измерения температуры поверхности суши, воды и облаков); 5) 11,4–12,4 мкм (канал для измерения температуры поверхности суши, воды и облаков). Первый канал работает в видимой части оптического диапазона, с его помощью можно наблюдать поверхность суши, воды и облаков. На него приходится линия поглощения хлорофилла, поэтому, используя данные первого и второго каналов, можно вычислить нормализованный дифференциальный вегетационный индекс NDVI и оценить состояние растительности. На некоторых спутниках серии NOAA предусмотрено переключение аппаратуры третьего канала с длины волны 3,55–3,93 мкм на длину волны линии поглощения снега и льда около 1,6 мкм. На этой длине волны снег и лед имеют малую яркость, а облака почти такие же яркие, как и в видимом диапазоне. Используя снеговой индекс NDSI, можно различить снег/лед и облака, оценить состояние снежного и ледяного покрова. В первом и втором каналах сканера AVHRR в качестве детекторов излучения применяются кремниевые фотодиоды. В четвертом и пятом каналах установлены охлаждаемые до 105К фоторезисторы на основе (HgCd)Te, в третьем канале – охлаждаемый фоторезистор на основе InSb. Сканер AVHRR имеет мгновенное поле зрениях Δϕ = 1,26⋅10–3 рад. Выбор разрешения на местности в подспутниковой точке связан с тем, что скорость спутника на орбите составляет 7,42 км/с, его проекция движется по поверхности Земли со скоростью 6,53 км, выполняется 6 сканов/с, за время одного скана проекция перемещается на 6,53/6 км = 1,09 км. Указанному полю зрения в подспутниковой точке соответствует пиксел 1,1×1,1 км. Сигналы каждого канала квантуются на 1024 уровня Передатчик спутника имеет мощность 5,5 Вт, частота 1700 МГц. Скорость передачи цифровой информации со сканера AVHRR составляет 665,4 Кбит/с. На спутнике установлена также аппаратура HIRS для определения температуры, давления и влажности в тропосфере на разных высотах (вертикальные профили) в полосе обзора 2 240 км. Для этого HIRS содержит сканирующий спектрофотометр ИК-диапазона, использующий свойство углекислого газа изменять положение и ширину линии поглощения на длинах волн порядка 14−15 мкм в зависимости от температуры и давления. Этот же прибор позволяет оценивать общее содержание озона (ОСО) в столбе атмосферы по поглощению теплового излучения от поверхности Земли и атмосферы на длине волны 9,59 мкм. Вертикальные профили и ОСО вычисляются на приемном конце путем решения обратных задач. Кроме указанной аппаратуры, на спутник установлены: прибор SSU для исследования стратосферы; микроволновый прибор MSU для измерения температурных профилей стратосферы; аппаратура поиска и спасения по
Цифровая обработка аэрокосмических изображений. Конспект лекций
-32-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
международной программе Коспас/SARSAT; система ARGOS для сбора метеорологической и океанографической информации с автоматических метеостанций, морских буев и воздушных шаров; некоторые другие приборы. ARGOS позволяет следить за миграцией крупных животных и птиц, к телу которых прикреплены малогабаритные передатчики. Сканер MVISR спутника FengYun-1D имеет спектральные каналы: 0,58−0,68 мкм, 0,84−0,89 мкм, 3,55−3,93 мкм, 10,3−11,3 мкм, 11,5−12,5 мкм, 1,58−1,64 мкм, 0,43−0,48 мкм, 0,48−0,53 мкм, 0,53−0,58 мкм, 0,9−0,96 мкм. Первому и второму каналам сканера AVHRR соответствуют два последних спектральных канала, но у китайского спутника эти каналы более узкие, что может обеспечить более точную оценку состояния растительности. Пять дополнительных каналов предназначены для исследования мирового океана. Для приема информации со спутников NOAA и FengYun-1D в Сибирском федеральном университете установлена станция АлисаТМ отечественного производства, работающая в диапазоне 1700 МГц. В конце ХХ в. и начале ХХI в. функционировали российские метеорологические спутники Метеор-3 и Метеор-3М, аналогичные по назначению рассмотренным выше космическим аппаратам. Классическими спутниками для дистанционного зондирования считаются космические аппараты среднего разрешения LANDSAT, разработанные в США. Всего было запущено 6 спутников. Благодаря высокому качеству изображений, точной калибровке, обширному архиву данных спутники приобрели большую популярность в мире. На сайте http://www.abs-gogle.com/ можно видеть изображение всей Земли в условных цветах с разрешением 30 м, построенное по архивным данным со спутников этой серии. LANDSAT-7 был выведен на солнечно-синхронную орбиту высотой 705 м с периодом обращения 99 мин, на нем установлен сканер ЕТМ+ с цилиндрической разверткой, ширина полосы обзора 183 км. Сканер имеет 7 узких спектральных каналов: 0,45−0,515 мкм (разрешение 30 м), 0,525−0,605−мкм (разрешение 30 м), 0,63−0,69 мкм (разрешение 30 м), 0,75−0,90 мкм (разрешение 30 м), 1,55−1,75 мкм (разрешение 30 м), 10,4−12,5 мкм (разрешение 60 м), 2,09−2,35 мкм (разрешение 30 м) и один широкий канал 0,52−0,9 мкм (разрешение 15 м). На конец 2008 г. перспективы программы LANDSAT остаются неопределенными. LANDSAT-5 вырабатывает последний ресурс, LANDSAT-7 работает с неполадками. Российский спутник Ресурс-О1, ныне прекративший активное существование, был оборудован оригинальным сканером МСУ-СК с конической разверткой и разрешение 150×250 м при полосе обзора 600 км с пятью спектральными каналами, перекрывающими диапазон от 0,5 до 12,5 мкм. При конической развертке происходит перемещение визирного луча по поверхности конуса с осью, направленной в подспутниковую точку. Сканирующий луч описывает по сферической поверхности Земли дугу в переднем секторе сканирования. За счет перемещения спутника изображение представляет собой совокупность дуг. Достоинством такого вида развертки является постоянство угла между поверхностью Земли и направлением на спутник, что особенно важно при изучении Цифровая обработка аэрокосмических изображений. Конспект лекций
-33-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
растительности. Постоянным является также расстояние L от спутника до каждой точки дуги, так что разрешение сканера МСУ-СК, в отличие от сканеров с цилиндрической и линейной разверткой, постоянно по всему полю. Так как L постоянно, то постоянно и атмосферное ослабление восходящего излучения для достаточно больших участков изображения. Это существенно упрощает атмосферную коррекцию. Отсутствуют искажения изображения за счет кривизны Земли, характерные для других сканеров. На функционирующих в конце 2008 г. космических аппаратах TERRA и AQUA (США) установлен сканер с цилиндрической разверткой MODIS, имеющий 36 спектральных каналов. Солнечно-синхронные орбиты спутников имеют высоту 705 км, полоса обзора сканера составляет 2 300 км. Два спектральных канала 0,62−0,67 мкм (красный участок спектра) и 0,84−0,88 мкм (ближний инфракрасный) имеют пространственное разрешение в 250 м; пять каналов, предназначенных для исследования поверхности Земли, облачности и аэрозолей и перекрывающие длины волн 0,46−0,56 мкм и 1,23−2,15 мкм, имеют пространственное разрешение в 500 м; остальные каналы на длины волн от 0,4 до 14 мкм и предназначенные для изучения океана, атмосферы, температурных измерений и др., имеют разрешение в 1 км. Наряду со сканерами с цилиндрической разверткой значительное распространение получили сканеры с линейной разверткой. Электронная «начинка» таких устройств мало чем отличается от аппаратуры широко распространенных планшетных сканеров офисного и бытового назначения и содержит линейки на приборах с зарядовой связью, имеющих от 2 500 до 14 000 светочувствительных элементов (пикселов), аналого-цифровой преобразователь и некоторые другие узлы. Сканеры с линейной разверткой не содержат подвижных частей и просты по конструкции. С использованием сканеров с линейками на ПЗС созданы спутники дистанционного зондирования с высоким пространственным разрешением (десятки см – единицы м). Космический аппарат QuickBird, принадлежащий частной американской компании Digital Globe, Inc., обеспечивает пространственное разрешение в 0,6 м при наблюдении в широком спектральном диапазоне 0,45−0,9 мкм и 2,44 м при использовании четырех раздельных каналов (синий, зеленый, красный и ближний инфракрасный участки спектра). Полоса обзора составляет 16,5 км. Архивные изображения земной поверхности с разрешением порядка 1 м, полученные с этого спутника и с аппарата IKONOS (также принадлежит частной американской компании) встречаются среди изображений с разрешением 30 м на сайте http://www.abs-google.com В России эксплуатируется спутник Ресурс-ДК с разрешением 1 м и менее, полосой обзора 30 км, однако его гражданское применение ограничено специальным постановлением Правительства РФ. Высокое разрешение позволяет существенно расширить область применения дистанционного зондирования. Возможен детальный анализ объектов на суше и воде, инвентаризация лесных и сельскохозяйственных терри-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-34-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
торий, контроль природопользования, проведение земельного кадастра, контроль застройки в городах и сельской местности и т. п. Космические аппараты со сканерами низкого разрешения имеют большую полосу обзора (2 300−3 000 км), поставляют оперативную информацию и позволяют ежедневно охватывать наблюдением даже такой большой регион, как Красноярский край. Космические аппараты со сканерами высокого и среднего разрешения не работают в оперативном режиме. Аппараты со средним разрешением имеют полосу обзора не более 200−300 км, аппараты с высоким разрешением – не более 10−30 км. Над каждой точкой Земли они пролетают приблизительно один раз в 15−16 дней, правда, у многих из них есть возможность по командам с Земли поворачивать сканер в боковом направлении, это позволяет наблюдать интересующий район один раз в 3−5 дней. В Сибирском федеральном университете установлена станция УниТМ Скан -36 для приема изображений земной поверхности со спутников высокого разрешения на солнечно-синхронных орбитах: SPOT-4 (Франция), IRS-P6 (Индия), EROS A и EROS В (Израиль), а также с космических аппаратов TERRA и AQUA. Спутник SPOT-4 массой 2 755 кг вращается на орбите высотой 822 км, период обращения 101 мин. Два сканера HRVIR могут работать в одинаковом или в разных режимах. Возможность осуществлять сканирование под углом позволяет спутникам серии SPOT получать данные в полосе шириной 900 км. Уникальной особенностью аппаратов SPOT является получение стереоскопических изображений. Сканер HRVIR имеет 5 узких спектральных каналов с разрешением 20 м на длины волн от 0,5 до 1,75 мкм и один широкий канал 0,5−0,73 мкм (разрешение 10 м). Полоса обзора каждого сканера 60 км. Индийский спутник ResourseSat-1 (IRS-P6) массой 1 360 кг имеет солнечно-синхронную орбиту высотой 817 км, период обращения 101 мин. На нем установлены три сканера. Сканер LISS-4 с разрешением 5,8 м и полосой обзора 24 км имеет три спектральных каналах: 0,52−0,59 м, 0,62−0,68 м, 0,76−0,86 м; если передавать изображение только в одном из них, то полоса обзора достигает 70 км. Возможно осуществлять сканирование под углом, что позволяет расширить полосу наблюдения. Сканер LISS-3 обеспечивает разрешение в 23 м при полосе обзора в 140 км, сканер AWiFS состоит из двух электронно-оптических модулей, имеющих разрешение 56 м, совместная работа модулей обеспечивает полосу обзора 740 км. Сканеры работают в упомянутых выше участках спектра, к которым добавлен канал 1,55−1,7 мкм. Рассмотренные выше космические аппараты отличаются значительными размерами и массой. Среди них самым тяжелым является Ресурс-ДК (масса 6,5 т). Однако современные технологии и простота конструкции сканеров с линейной разверткой позволяют создавать малогабаритные и дешевые космические аппараты дистанционного зондирования. К числу таких аппаратов относятся израильские EROS A и EROS В массой 250 кг, запущенные россий-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-35-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
скими носителями. Спутники имеют один спектральный канал, охватывающему видимый участок спектра. Пространственное разрешение EROS A составляет 2 м при полосе обзора 13,5 км, EROS В имеет разрешение 0,7 м в полосе 7 км. Небольшая английская фирма Surrey Satellite Technology Limited (SSTL) при университете в графстве Surrey недалеко от Лондона изготовила целую группировку спутников массой всего в 130 кг, которые успешно работают на своих орбитах. Группировка носит название «Disaster Monitoring Constellation» (DMC) – спутниковая система мониторинга чрезвычайных ситуаций. Большинство из спутников запущено российскими носителями. Созвездие спутников является международным, но сами аппараты принадлежат разным государствам: AlSat-1 – алжирский, NigeriaSat-1 – нигерийский, BilSat-1 принадлежит Турции, UK-DMC – Великобритании, DMC+4 – Китаю (рис. 5.2) и т. д. Страны-участники владеют и управляют своими аппаратами, однако каждый имеет возможность принимать информа- Рис. 5.2. Китайский малый спутник цию со всех спутников. Спутниковая группииз группировки DMC ровка DMC предоставляет пользователям возможность получать изображения своего региона с разрешением порядка 30 м в полосе 300 км ежедневно и, следовательно, постоянно вести мониторинг чрезвычайных ситуаций и оперативно принимать меры. Считается, что рынок малых космических аппаратов дистанционного зондирования к 2020 г. составит не менее 2 млрд дол., а объем услуг по продаже изображений земной поверхности будет не менее 20 млрд дол. К концу 2008 г. в России не осталось собственных гражданских аппаратов дистанционного зондирования. В последние годы были запущены на орбиту несколько малых студенческих спутников, разработанных студентами МАИ, МВТУ им. Баумана и др. Это учебные и радиолюбительские спутники, не несущие существенной практической нагрузки. 23 мая 2008 г. был осуществлен запуск малого космического аппарата «Юбилейный» в честь 50-летия первого искусственного спутник Земли. Разработчиком являются ОАО ИСС им. акад. М. Ф. Решетнева. Спутник предназначен для проведения ряда научных экспериментов, для передачи по радио записанных заранее аудиосообщений, фото- и видеоизображений, рассказывающих о достижениях космической отрасли России. Вещание производится в радиолюбительском диапазоне 435 МГц и принимается в любых точках Земли при прохождении спутника в зонах радиовидимости. Космическая платформа малого космического аппарата «Юбилейный» предназначена для создания на ее базе космических аппаратов массой до 100 кг негерметичного конструктивного исполнения. На неё может быть установлен сканер с линейной разверткой на базе ПЗС с соответствующей оптической системой. Цифровая обработка аэрокосмических изображений. Конспект лекций
-36-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 5. Космические аппараты для дистанционного зондирования
Создание такой аппаратуры по силам студентам и сотрудникам Сибирского федерального университета вместе со студентами и сотрудниками Сибирского аэрокосмического университета при участии ОАО ИСС им. акад. М. Ф. Решетнева. Прием информации со спутника возможен с помощью станции УниСканТМ. Предполагаемый малый спутник может быть использован как в Красноярском крае, так и во всём Сибирском федеральном округе для контроля природопользования, в том числе лесопользования, составления земельного кадастра, для изучения растительных сообществ, оценки урожая сельскохозяйственных культур, оценки последствий стихийных бедствий: наводнений, землетрясений, лесных пожаров. Он может быть эффективен в геологии и геофизике, при изучении загрязнения почвы и водоемов, льдов на суше и на воде, при выборе трасс нефтепроводов и газопроводов и контроле их состояния. Возможен запуск на орбиту серии таких спутников. Целевая аппаратура дистанционного зондирования должна включать в себя сканер с оптической системой и линейкой ПЗС, аналого-цифровой преобразователь, устройство кодирования, передатчик и антенну. Оптическая система должна быть направлена в надир с высокой точностью (не менее 0,1 град), для этого предусматривается система ориентации с датчиком ориентации и исполнительными механизмами. Контрольные вопросы и задания 1. Перечислите длины волн спектральных каналов сканера AVHRR спутника NOAA. Каково назначение этих каналов? 2. Каков диапазон длин волн у сканера с линейной разверткой? 3. Почему спутники среднего и высокого разрешения не обеспечивают оперативное наблюдение за поверхностью Земли? 4. Каково назначение спектральных каналов сканера MODIS спутников TERRA и AQUA. 5. Выйдите на сайт http://www.abs-google.com и найдите на спутниковом изображении корпуса СФУ.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-37-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 6 Прием данных дистанционного зондирования План лекции
1. Особенности распространения радиоволн на трассе спутник-Земля. 2. Оценка мощности сигнала в месте приема. 3. Оценка скорости передачи. 4. Приемная станция АлисаТМ. 5. Приемная станция УниСканТМ-36. Станции для приема информации со спутников на Земле (их принято называть земными станциями) содержат антенну с опорно-поворотным устройством (ОПУ), радиоприемное устройство и средства обработки, хранения и отображения информации. Чаще всего используются зеркальные антенны с параболическим рефлектором. ОПУ служит для наведения антенны на спутник по командам компьютера, в который заложены орбитальные данные. В фокусе антенны установлен облучатель, сигнал с которого усиливается малошумящим усилителем (МШУ). Далее сигнал по кабелю поступает на приемник, цифровой сигнал с выхода приемника обрабатывается на компьютере. Наиболее дорогой частью станции является антенна с ОПУ. Чаще всего используются ОПУ с азимутально-угломестной подвеской антенны, позволяющие разворачивать её на ±180º по горизонтали и на 0º−90º или (–90º)−(+90º) по зенитному углу, отсчитываемому от зенита к горизонту. При выборе конструкции антенны приходится учитывать различные факторы, в частности особенности распространения радиоволн на трассе Земля − космос. Для передачи сигналов с природоведческих спутников чаще всего используются радиоволны дециметрового и сантиметрового диапазонов или, соответственно, частоты 300 МГц и 30 ГГц. В указанном обширном диапазоне частот отдельные полосы переуплотнены различными радиослужбами. Так, полоса частот 300 МГц – 10 ГГц интенсивно используется наземными радиостанциями. Здесь существует повышенный уровень взаимных помех, снижается качество радиосвязи. Радиоволны от спутника к земной станции проходят сквозь атмосферу Земли. Приходится учитывать влияние тропосферы (0−11 км) и ионосферы (выше 80 км). Распространение радиоволн в указанном интервале частот сопровождается небольшим затуханием в атмосферных газах и в осадках, изменяется поляризация волны, возникают дисперсионные искажения. При распространении линейно-поляризованных (в частности, горизонтально-поляризованных и вертикально-поляризованных) радиоволн в ионосфере происходит их расщепление на две эллиптически поляризованные компоненты (обыкновенная и необыкновенная), которые распространяются с разной скоростью из-за влияния магнитного поля Земли. В результате сложения этих компонент в точке приема плоскость поляризации результирующей волны будет повернута на некоторый угол (эффект Фарадея).
Цифровая обработка аэрокосмических изображений. Конспект лекций
-38-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
Угол поворота плоскости поляризации зависит от электронной концентрации Ne в ионосфере и напряженности геомагнитного поля H вдоль пути радиоволн в ионосфере и будет иметь регулярную зависимость от времени суток, сезона и фазы цикла солнечной активности и случайные изменения, связанные с геомагнитными бурями и нерегулярными ионосферными неоднородностями. На частоте 1 ГГц угол поворота лежит в пределах 1−100º и уменьшается с ростом частоты как 1/f 2. Эффект поворота плоскости поляризации учтен в конструкции антенны: используются антенны и облучатели, способные принимать сигналы с круговой поляризации, например, спиральные антенны и спиральные облучатели. Если через ионосферу распространяются широкополосные сигналы, то время распространения будет различным для различных составляющих спектра широкополосного сигнала, что вызывает его искажения. Это явление, известное как относительная дисперсия, характеризуется разностью задержек между нижней и верхней частотами спектров сигналов, распространяющихся через ионосферу. Относительная дисперсия зависит от Ne и H и обратно пропорциональна f 3, на частоте 1 ГГц может иногда достигать 0,4 нс/МГц и приводить к искажению сигналов, при полосе частот 100 МГц − это 0,4 мкс. Мощность сигнала в месте приема может быть оценена следующим образом. Если L − расстояние между передатчиком и приемником, Рпер − мощность передатчика, то при условии, что излучение энергии происходит равномерно по всем направлениям (изотропный излучатель), вся энергия распределяется по площади сферы радиуса L, равной 4πL2. Мощность, приходящаяся на 1 м2, т. е. плотность потока мощности, равна
П = Рпер/4πL2. Реальная передача информации со спутника происходит только в нижнюю полусферу, в сторону Земли. Поэтому приведенное выражение следует умножить на коэффициент D ≥ 1, называемый коэффициентом направленного действия антенны (КНД). КНД − это отношение плотности потока мощности, излучаемой антенной в направлении максимума её диаграммы направленности к плотности потока мощности, которая излучалась бы изотропным излучателем, при условии равенства общей излучаемой мощности. КНД связан с эффективной площадью апертуры S и длиной волны λ соотношением D = 4πS/λ2. Если излучение происходит равномерно по всем направлениям в нижнюю полусферу, то D = 2. На природоведческих спутниках обычно устанавливают передающие антенны с D = 3−4, это позволяет земным станциям принимать информацию практически с любых направлений − от горизонта до горизонта. Таким образом,
П = РперD/4πL2.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-39-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
Приемная антенна − это барьер, поглощающий поток энергии, излучаемый передающей антенной. Пусть площадь апертуры приемной антенны равна Sпр. Если пренебречь потерями в приемной антенне, то мощность сигнала на её выходе
Рпр = S·П = Sпр Рпер D/4πL2.
(6.1)
В это выражение в явном виде не входит КНД приемной антенны, но с ростом Sпр увеличивается отношение Sпр/λ2, увеличивается КНД и сужается диаграмма направленности. Последнее свойство ценно тем, что снижается уровень помех и шумов, которые могут поступать в антенну с боковых направлений. Однако слишком узкая диаграмма направленности требует большой точности наведения антенны. Пусть радиус апертуры приемной параболической антенны r = 60 см; Рпер =5,5 Вт; D = 3; 870 км < L < 3 000 км. Эффективная площадь антенны Sпр всегда меньше её геометрической площади πr2 из-за затенения облучателем и некоторых явлений электродинамического характера. Пусть Sпр = 0,9 м2, её КНД при λ = 17,6 см − около 260, ширина диаграммы направленности по первому минимуму – около 10º. Эти реальные числа, соответствующие мощности передатчика спутника NOAA, минимальному и максимальному расстоянию L от спутника до приемной станции, размеру антенны станции АлисаТМ для приема информации с этого спутника. Расчет по формуле (6.1) дает максимальное значение Рпр = 1,4·10−12 Вт, минимальное значение Рпр = 1,1·10−13 Вт. Современная радиотехника располагает средствами усиления до требуемого уровня и значительно более слабых сигналов. Однако есть причины, не позволяющие работать со сколь угодно малыми сигналами. Этими причинами являются внешние помехи и шумы, а также внутренние шумы радиоустройств. Для уверенного приема сигналов без применения сложных способов помехоустойчивого кодирования требуется, чтобы мощность сигнала по крайней мере на порядок превосходила мощность шума. Источником внутренних шумов радиоустройств в конечном итоге является дискретная природа электричества, так как электрический ток − это поток дискретных частиц − электронов. Интенсивность шума принято описывать следующим образом. Все источники внешних и внутренних шумов заменяются эквивалентным источником шума в виде некоторого активного сопротивления (резистора). Известно, что на зажимах резисторов из-за хаотического теплового движения электронов возникает разность потенциалов, изменяющаяся случайным образом. Средняя мощность такого шума (его называют тепловым) описывается формулой Найквиста: Р = 4 k TΔf, где k = 1,38 · 10–23 Дж/град − постоянная Больцмана, Т − температура резистора, Δf − полоса частот, в пределах которой производится измерение средней мощности шума. Если входное сопротивление приемника равно входному сопротивлению антенны (т. е. приемник и антенна согласованы), то эквивалентная мощность шума
Цифровая обработка аэрокосмических изображений. Конспект лекций
-40-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
Рш = k Tш Δf. В нашем случае Δf равно ширине полосы пропускания приемника, равной, в свою очередь, ширине полосы частот, необходимой для передачи информации со спутника. Тш − это эквивалентная шумовая температура антенны и приемника, не совпадающая с термодинамической температурой, при которой находятся антенна и приемник. Земные станции для приема сигналов с природоведческих спутников устанавливают в таких местах, где мал уровень помех, в этом случае наибольшее влияние оказывают внутренние шумы и, главным образом, шумы первых каскадов усилителя радиосигналов. Поэтому во входных каскадах применяют малошумящие усилители (МШУ), которые конструктивно обычно помещают непосредственно в облучателе антенны и совмещают с преобразователем частоты, который преобразует несущую частоту сигнала в более низкую. Современные МШУ имеют в микроволновом диапазоне Тш порядка 15−70 К. Пусть Тш = 70К, Δf = 1,5 МГц, что соответствует условиям приема сигналов со спутника NOAA. В этом случае Рш = 1,4· 10−15 Вт, что на 2−3 порядка меньше, чем мощность сигнала. Мощность сигнала при прочих равных условиях определяется размерами антенны и её КНД, средняя мощность шума − шумовой температурой. Отношение мощности сигнала к средней мощности шума (отношение сигнал/шум) – важнейшая характеристика качества приема. Выбор размеров приемной антенны определяется требованиями к коэффициенту качества и в конечном итоге шириной полосы частот, необходимой для передачи информации со спутника. Последняя зависит от скорости передачи информации С. Для вычисления С необходимо знать параметры сканирующего устройства и скорость перемещения подспутниковой точки VЗ по Земле. Если разрешение сканера вдоль направления движения спутника равно ΔL, то в секунду считывается информация с VЗ/ΔL строк. Пусть I − число бит, которое используется для записи яркости каждого пиксела, n − число спектральных каналов, K − коэффициент, зависящий от типа применяемого при передаче информации помехоустойчивого кодирования, K > 1; N − число пикселов в строке, связанное с шириной полосы обзора G соотношением N = G/ΔL. Тогда
C = VЗ ·N ·I ·K· n/ΔL = VЗ ·G ·I ·K· n/ΔL2. Например, для ΔL= 1,1 км, VЗ = 6,56 км/с, G =1670 км, I=10 бит, n = 5, К = 1 скорость передачи информации С составит 500 Кбит/с. Если ΔL= 100 м, что было бы очень желательно, то при тех же условиях С = 50 Мбит/с. Улучшение разрешения приводит к увеличению информационного потока, который обратно пропорционален квадрату разрешения.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-41-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
Полоса частот Δf, необходимая для передачи информации со спутника, зависит от вида модуляции высокочастотного колебания, ориентировочно Δf = (3−3,5)C. Для первого примера Δf = 1,5 МГц, для второго Δf не менее 150 МГц. Очевидно, что при прочих равных условиях средняя мощность шума для второго примера на два порядка выше и равна 1,4·10−13 Вт. Чтобы сохранить необходимое отношение сигнал/шум, требуется в 100 раз увеличить площадь антенны и её КНД, а диаметр антенны − в 10 раз. Таким образом, если при скорости передачи в 500 Кбит/с, пространственном разрешении 1,1 км и полосе обзора 1 670 км можно применять антенну диаметром 1 м, то при скорости передачи 55 Мбит/с, пространственном разрешении 100 м с сохранением той же полосы обзора − антенну диаметром не менее 3−4 м. Такие антенны с ОПУ являются достаточно дорогими сооружениями. Если использовать антенну диаметром 3 м,то при Рпер = 10 Вт максимальное значение мощности принимаемого сигнала Рпр = 1,6·10−11 Вт, минимальное значение Рпр = 1,4·10−13 Вт, что приемлемо. В Сибирском федеральном университете установлена станция АлисаТМ для приема данных дистанционного зондирования с космических аппаратов NOAA (США) и FengYun-1D (Китай) в диапазоне 1 670−1 710 МГц при скорости передачи информации от 0,5 до 8 Мбит/с (рис. 6.1). Параболическая антенна диаметром 1,2 м с правой круговой поляризацией установлена на опорно-поворотном устройстве, обеспечиваю- Рис 6.1. Антенна станции АлисаТМ щем возможность вращения по азимуту на 170°, с опорно-поворотным устройством по зенитному углу на (–80°)−(+90°). Кроме антенной системы, в состав станции входит приемный блок, универсальный демодулятор, интерфейс связи с компьютером, программное обеспечение для управления приемом и записи данных на жесткий диск компьютера (Alisa), для предварительной обработки данных со спутника MetOp (METOP), для визуализации и анализа изображений (ScanMagic® LL), для ведения электронного каталога космических изображений (ScanEx Catalogue Manager®). Для обеспечения максимального радиуса обзора место установки антенны должно соответствовать условию: углы закрытия от любых препятствий не более 5° от горизонта в любом направлении. Качественный прием возможен при отсутствии радиопомех в диапазоне 1 670−1 710 МГц, которые создают передающие устройства радиорелейных линий связи, базовые станции сотовой связи. Станция УниСкан™-36 Сибирского федерального университета (рис. 6.2) работает на частотах от 7 750 до 7 850 МГц и от 8 025 до 8 400 МГц при скорости передачи информации до 80 Мбит/с. Станция предназначена для Цифровая обработка аэрокосмических изображений. Конспект лекций
-42-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
приема данных дистанционного зондирования с космических аппаратов TERRA/MODIS, AQUA/MODIS, SPOT-4, IRS-P6, EROS A и EROS B.
Рис. 6.2. Антенна станции УниСканТМ-36 с опорноповоротным устройством
Рис 6.3. Место оператора станции УниСканТМ-36
В случае создания спутника дистанционного зондирования Сибирского федерального университета возможен прием данных и с этого аппарата. Для адаптации приемной станции к новому спутнику и формату не потребуется никаких аппаратных модификаций – только дополнительное программное обеспечение при условии, что параметры формата лежат в указанных пределах; мощность излучения со спутника достаточна для приема на данную антенную систему. Станция имеет параболическую антенну диаметром 3,1 м с правой круговой поляризацией имеет трехосное опорно-поворотное устройство, обеспечивающее вращение по азимуту в пределах (–270°)−(+270°), по зенитному углу (–90°)−(+90°). Вес антенной системы 1 500 кг, диапазон рабочих температур (–50°)−(+50°)С, предельная скорость ветра 40 м/с. Программное обеспечение выполняет несколько функций. Во-первых, это управление станцией. Все операции по управлению станцией, кроме включения общего питания, выполняются программно с помощью приложения ScanReceiver®. По командам оператора (рис. 6.3) или автоматически программа выполняет переключение режимов работы; инициализацию программируемых аппаратных модулей в конфигурации, необходимой для приема конкретного типа данных; управление движением антенны при сопровождении спутников; управление электронными компонентами станции (демодуляторами, источниками питания, интерфейсными устройствами и др.). В процессе приема в одном из окон приложения выводятся в виде изображения данные одного из спектральных каналов, что дает визуальное представление о качестве приема.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-43-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 6. Прием данных дистанционного зондирования
Приложение ScanReceiver® поддерживает ввод, контроль синхронизации, декодирование и запись цифрового потока на жесткий диск ПК. Файлы данных могут сопровождаться дополнительной информацией (имя спутника, время приема, орбитальные данные, координаты станции и т. п.), необходимой для последующей обработки и архивного учета. В состав программного обеспечения входит приложение управления каталогом изображений ScanEx Catalog Manager®. При эксплуатации приемной станции в архиве данных могут быть накоплены тысячи отдельных снимков. Кроме параметров снимка, в каталоге сохраняется метка тома диска и расположение файла на нем, что позволяет при необходимости легко отыскать требуемые файлы в случае, когда они записаны на съемных носителях (СD или DVD дисках). Приложение ScanEx Image Processor® осуществляет операции по предварительной и тематической обработке изображений, в том числе: импорт/экспорт и визуализацию растровых данных; геометрическую коррекцию; компенсацию дымки на изображениях; радиометрические преобразования; арифметические операции с растровыми слоями; вычисление текстурных характеристик изображений; автоматическую векторизацию; расчет тематических продуктов по данным MODIS и др. Контрольные вопросы и задания
1. Какие длины волн применяются для передачи данных дистанционного зондирования с орбиты? 2. Назовите причины, ограничивающие скорость передачи информации со спутников дистанционного зондирования. 3. Сколько надо делать сканов в секунду, чтобы обеспечить разрешение в 50 м с полосой обзора 2 400 км? Какова должна быть скорость передачи информации в этом случае? 4. Какой размер должна иметь антенна для приема потока информации в 100 Мбит/с со спутника, находящегося на расстоянии 2 000 км, если шумовая температура МШУ составляет 100 K, а мощность передатчика 10 Вт? 5. Какой объем памяти требуется для хранения одного стандартного кадра размером 185×185 км, полученного с помощью сканера MSS спутника LANDSAT?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-44-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ
Лекция 7 Восстановление спутниковых изображений План лекции
1. Геометрические искажения спутниковых изображений. 2. Геометрическая коррекция и топографическая привязка спутниковых изображений. 3. Радиометрическая коррекция. 4. Атмосферная коррекция. Рассмотрим схему формирования спутниковых изображений с учетом кривизны Земли. Пусть спутник огибает поверхность Земли по круговой орбите на высоте H. Это равноценно движению спутника по прямой, но над поверхностью цилиндра. Кажущееся изображение, которое строит сканер спутника с цилиндрической или линейной разверткой это проекция на поверхность цилиндра F (рис. 7.1).
Рис. 7.1. Диаграмма формирования спутниковых сканерных изображений
В действительности же сканер отображает земную поверхность, т. е. внешнюю поверхность цилиндра G. Будем считать, что Земля − шар радиуса R0 = 6 370 км; собственное вращение Земли за время построения сканерного изображения учитывать не будем. Пусть L = SA − расстояние от спутника S до некоторой точки земной поверхности при сканировании, ΔL − разрешение в надире, Δϕ − мгновенное поле зрения, α – угол сканирования (угол визирования), под углом γ дуга AK видна из центра Земли. Используя теорему синусов и учитывая, что для всех значений угла α выполняется соотношение (H + R0)⋅sin α < H, получаем Цифровая обработка аэрокосмических изображений. Конспект лекций
-45-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
SO/sin β = AO/sin α; sin β = ( 1+ H/ R0)⋅sin α; γ = π − β − α; γ = π − arcsin[(1+H/R0)⋅sin α] − α; L = R ⋅ sin γ/sin α. Длина дуги AK, отвечающей развертке внешней поверхности цилиндра G, равна y = AK = R0γ. Длина дуги MK, соответствующей кажущемуся изображению x, равна MK = Hα, откуда α = x/H. Таким образом,
y = R⋅{π − arcsin[(1+H/R0)⋅ sin (x/H)] − x/H}.
(7.1)
Используя (7.1), можно пересчитать координату x вдоль строки кажущегося изображения в координату вдоль строки реального изображения. Знание расстояния L позволяет уточнить пространственное разрешение. Минимальная дальность Lmin = H, при этом разрешение ΔL = Δϕ⋅H; при максимальном угле сканирования αmax дальность равна Lmax, разрешение ΔL1 = Δϕ⋅Lmax вдоль направления движения спутника. Но поверхность видна со спутника под углом αmax, поэтому поперек направления движения ΔL2 = ΔL1/cos αmax. Таким образом, на максимальной дальности поперек направления движения пикселы оказываются сжатыми в ΔL2/ΔL раза, вдоль – в ΔL1/ΔL раза. Кажущаяся полоса обзора Fmax = H⋅αmax, реальная полоса Gmax = 2⋅R⋅βmax. Для спутника NOAA H = 870 км, αmax = 55о, Δϕ = 1,26⋅10−3 рад, ΔL = 1,1 км. Максимальная дальность Lmax = 1 827 км, полоса обзора G около 3 000 км, разрешение ΔL1 = 2,31 км и ΔL2 = 4,02 км. На максимальной дальности поперек направления движения пикселы оказываются сжатыми в 3,65 раза, вдоль – в 2,1 раза. Две реки, текущие параллельно направлению движения спутника и находящиеся на расстоянии 1,1 км друг от друга, в надире были бы различимы, но на краю скана они сливаются. Если не проводить коррекцию, то полоса обзора кажется равной F = 2⋅H⋅αmax = 1 670 км. На рис. 7.2 представлены кажущееся и действительное изображения двух сканов. За время одного скана спутник NOAA перемещается на 1,1 км при разрешении в надире 1,1 км. На некотором расстоянии от надира строки изображения начинают заметно перекрываться. Определим область спутникового изображения с малыми искажениями как участок, где строки перекрываются не более чем на 10 %, т. е. на ~0,1 км. При этом ΔL1 = 1,3 км. Этот участок соответствует кажущейся полосе обзора в ±475 км и действительной полосе обзора в ±540 км от надира. Разрешение вдоль скана на границе участка составляет ΔL2 = 1,54 км, вдоль скана пикселы вытянуты в 1,4 раза.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-46-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
Рис. 7.2. Кажущееся и реальное изображение двух строк сканирования
Для спутников с малой полосой обзора (спутник «Ресурс-О1-3», сканер МСУ-Э; спутник SPOT, сканер HRVIR) геометрические искажения изображений за счет кривизны Земли при наблюдении в надир незначительны. Искажения возникают при отклонении оси сканирования от надира, которое может достигать ~30° (перспективные искажения). Это иллюстрирует рис. 7.3, построенный на основании (7.1), где в центре показана полоса шириной 45 км − область кажущегося изображения при отклонении оси сканера МСУ-Э на 30°. В действительности изображение несколько вытянуто вдоль направления сканирования (60,5 км). При этом разрешение вдоль направления движения спутника составляет ΔL1 = 41 м на максимальной дальности и ΔL1 = 39 м на минимальной, в то время как в надире ΔL1 = 35 м. В надире для МСУ-Э разрешение вдоль линии сканирования ΔL2 = 45 м, при отклонении оси сканирования на 30° ΔL2 = 60 м.
Рис. 7.3. Искажение изображения при отклонении оси сканирования на 30°
Радиолокационные станции бокового обзора наблюдают поверхность Земли под углом к надиру, существенно превышающем углы отклонения оси сканирования оптических сканеров МСУ-Э и других. Таким образом, радиолокационным изображениям в еще большей степени присущи те же перспективные искажения, что и упомянутым выше сканерам. На радиолокационных изображениях предметов на местности возникают также некоторые специфические искажения. При формировании сканерных изображений в оптическом диапазоне источник энергии (Солнце) находится в одной точке небесной сферы, а приемник на борту спутника − в другой. При использовании РЛС БО и источник энергии (передатчик), и приемник находятся в одной точке (на спутнике), на Цифровая обработка аэрокосмических изображений. Конспект лекций
-47-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
блюдение производится под углом визирования в 20−30° к горизонту. Может случиться так, что радиоволна упадет на склон горы под прямым углом. В этом случае изображение склона сожмется почти до нуля, а задний склон окажется в зоне радиотени и растянется (это можно заметить на следующем слайде). Полностью устранить эти искажения путем обработки на ЭВМ не представляется возможным. В то же время на изображении, полученном оптическим сканером, оба склона имеют размеры, более близкие к реальным. Рассмотренные причины геометрических искажений спутниковых изображений не являются единственно возможными. Солнечно-синхронные орбиты природоведческих спутников проходят не через ось вращения Земли, а имеют наклон относительно нее. Поэтому если спутник движется с севера на юг (нисходящий виток орбиты), то вверху изображения будет не север, как на карте, а, например, северо-северо-восток. К тому же во время сеанса приема спутниковой информации Земля поворачивается на некоторый угол (за 1 мин на 0,25°). Кроме «свежих» сканерных изображений приходится обрабатывать архивные изображения, для которых орбитальные данные неизвестны, так же, как бывает неизвестен угол отклонения оси сканирования от надира (для спутников «Ресурс-01-3», сканер МСУ-Э; спутник SPOT, сканер HVR). В этих случаях необходим другой метод геометрической коррекции. Объекты на спутниковых изображениях бывает необходимо сопоставлять с географической картой (осуществить географическую привязку спутниковых данных) для определения географических координат объектов. Географическую привязку и геометрическую коррекцию возможно объединить в одну операцию совмещения деталей спутникового изображения и карты. Пусть система координат (х,у) соответствует спутниковому изображению, а система (u,v) − карте. Требуется найти преобразование uk = f(хk,уk), vk = g(xk,yk), устанавливающее соответствия между положением k-го пиксела на изображении и географическими координатами. Так как вид функций f и g заранее не известен, то чаще всего применяется полиномиальная аппроксимация. Обычно используются полиномы второй степени:
uk = а0 + а1хk + а2уk + a3xkyk + a4xk2+ a5 yk2, (7.2) vk = b0 + b1xk + b2уk + b3xkyk + b4xk2+ b5yk2. Первые члены с коэффициентами a0, b0 ответственны за сдвиг изображения по x и по y. Члены с коэффициентами а1, а2, b1, b2 отвечают за линейное изменение масштаба по x и по y и поворот, члены с a3 и b3 − за поворот, члены с a4, a5, b4, b5 − за нелинейное изменение масштаба и поворот. Коэффициенты аi и bi определяются из решения системы (7.2). На изображении и на карте отыскивают одинаковые точки (их называют контрольными точками − control points, reference points), их координаты подставляют в уравнения. В качестве контрольных точек удобно использовать элементы
Цифровая обработка аэрокосмических изображений. Конспект лекций
-48-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
гидросети − устья рек, мысы, крутые изгибы русла рек и т. п. Количество точек должно быть достаточным для решения уравнений. Для полиномов второго порядка можно ограничиться 6 контрольными точками, но желательно, чтобы их число достигало 15−20 с распределением по всему полю, это позволяет использовать метод наименьших квадратов и сделать оценку коэффициентов менее зависимой от ошибок в определении координат на изображении и на карте. Измерительная аппаратура природоведческих спутников Земли перед запуском тщательно проверяется и калибруется, после запуска спутниковая информация в течение некоторого времени (до нескольких месяцев) проходит верификацию. В результате полученные данные могут быть надежно использованы для решения различных практических задач. Спутники функционируют на орбите в течение нескольких лет, с течением времени измерительная аппаратура деградирует под воздействием неблагоприятных факторов космического пространства. Поэтому показания датчиков сканеров необходимо корректировать. Эта процедура носит название радиометрической коррекции. Рассмотрим радиометрическую коррекцию на примере обработки данных сканера AVHRR спутника NOAA. Сканер AVHRR имеет по одному каналу видимого и ближнего инфракрасного диапазона (1-й и 2-й каналы), один ИК канал на 3,5 мкм (3-й канал) и два канала теплового ИК диапазона (4-й и 5-й каналы). Предусмотрена бортовая калибровка последних трех каналов, для этого сканер направляется на космическое пространство (эта точка принимается за ноль) и в полость абсолютно черного тела, установленного на борту, что дает две точки для коррекции температуры по линейному закону. Корректировочные коэффициенты для 3−5-го каналов включены в файл данных, передаваемых со спутника. 1-й и 2-й каналы калибруются только на Земле перед запуском спутника, соответствующие коэффициенты также включены в файл данных. С течением времени возникает необходимость корректировать показания 1-го и 2-го каналов, применяется процедура, состоящая в том, что наблюдаются одни и те же объекты на Земле, текущая интенсивность излучения сравнивается с результатами предыдущих наблюдений. И текущие, и полученные прежде данные подвержены разбросу из-за влияния атмосферы, прозрачность которой постоянно меняется, из-за естественной изменчивости природных объектов и других факторов. Корректировочные коэффициенты для 1-го и 2-го каналов определяются путем статистической обработки. Коэффициенты ежемесячно обновляются, их можно найти в сети Интернет: http://40.90.207.25:8080/EBB/ml/niccal.html. В качестве примера рассмотрим процедуру калибровки и корректировки данных 4-го канала. Показания U датчика этого канала после аналого-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-49-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
цифрового преобразования лежат в пределах 0−1 023 (10-битное кодирование). Пусть U = 427. Плотность потока мощности можно найти по формуле B(λ,T)·λ2 = A + K·U, где A = 590,888 Вт·мкм/м2ср, K = −1,60156 Вт·мкм/м2ср − корректировочные коэффициенты из файла данных. В нашем примере B(λ,T) = 907,022/λ2 Вт/м2мкм·ср. Из формулы Планка (1.1) получаем, что радиационная температура объекта при λ = 10,96 мкм, с1 = 1,1911⋅108 Вт⋅мкм4/м2ср, c2 = 14 388 мкм⋅К, равна
T = λ/c2 ln (c1/λ5 B + 1) = 284,57 К. Пусть U = 428, т. е. показания датчика изменились на единицу. В этом случае В = 905,421/λ2 Вт/м2мкм, Т = 284,46 К. Таким образом, изменению показаний датчика ΔU = 1 соответствует изменение температуры ΔT = 0,1К. Величина ΔT характеризует радиационное разрешение датчика. Задача атмосферной коррекции является наиболее сложной из задач реставрации результатов дистанционного зондирования Земли. В первую очередь, это связано с тем, что, как правило, информация об оптической толщине τ атмосферы над интересующими объектами отсутствует. Обычно космические изображения суши, на которых значительную часть занимает облачность, выбраковываются. Нередко дальнейшая обработка оставшихся изображений ведется без атмосферной коррекции. Лучшим выходом из положения была бы установка по всей поверхности суши сети солнечных спектрофотометров. Назначение этих приборов − измерение интенсивности I солнечного излучения, прошедшего через атмосферу, в различных участках спектра. Зная интенсивность I0 за пределами атмосферы, по закону Бугера I = I0 exp(−τ sec δ) можно оценить τ для разных длин волн оптического диапазона: τ =1/sec δ·ln(I0/I). Здесь δ − зенитный угол Солнца (см. рис 2.3). К сожалению, такой сети не существует, приходится довольствоваться данными немногих спектрофотометров или прибегать к косвенным методам коррекции. Например, можно оценить яркость в голубом участке спектра. Если атмосфера прозрачная, то яркость ее невелика. Увеличение яркости свидетельствует о наличии аэрозоля. Такой метод не очень точен, но атмосферная коррекция по голубому участку спектра применяется при обработке изображений, полученных с помощью сканера MODIS (спутники TERRA и AQUA). Проще дело обстоит с атмосферой над морями и океанами. В красном и ИК участках спектра поверхность воды по своим оптическим характеристикам
Цифровая обработка аэрокосмических изображений. Конспект лекций
-50-
I. ДИСТАНЦИОННОЕ ЗОНДИРОВАНИЕ Лекция 7. Восстановление спутниковых изображений
близка к абсолютно черному телу. Существенно больший коэффициент отражения и рассеяния имеют туманы, дымки, облака, их хорошо видно на фоне воды. Это позволяет оценить оптическую толщину τ. Данные по τ над морями и океанами помещены в сети Интернет по адресу: http://las.saa.noaa.gov/las-bin/climate_server/, их можно использовать для коррекции спутниковых изображений прибрежных районов. Контрольные вопросы и задания
1. В чем причины искажения изображений, передаваемых со спутников дистанционного зондирования? 2. К каким дополнительным искажениям изображения приводит вращение Земли в течение 15-минутного сеанса приема информации со спутника NOAA на средних широтах? 4. Каково минимальное число опорных точек, необходимых для геометрической коррекции изображения при использовании полиномов первой и третьей степени? 5. Напишите систему уравнений для определения коэффициентов полинома второй степени для геометрической коррекции изображения. 6. Показания датчика 4-го канала сканера AVHRR спутника NOAA равны 329. Какова температура объекта на поверхности Земли? 7. Спутник наблюдает некоторый район суши под углом 22° к надиру, оптическая толщина атмосферы τ = 0,12. Во сколько раз атмосфера ослабляет излучение от объектов в этом районе?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-51-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8 Технические средства обработки изображений План лекции
1. Виды изображений. 2. Ввод изображений с помощью настольного сканера. 3. Современные мониторы. 4. Струйный и лазерный принтеры. 5. Зависимость разрешения при печати от числа градаций яркости. Будем называть изображением функцию двух переменных f(x,y), определенную в некоторой области C плоскости Oxy и имеющую определенное множество своих значений. Например, обычную черно-белую фотографию можно представить как f(x,y) ≥ 0, 0 ≤ x ≤ a, 0≤ y ≤ b , где f(x, y) − яркость (иногда называемая оптической плотностью или степенью белизны) изображения в точке (x,y); a − ширина; b − высота кадра. С учетом особенностей функции f обычно выделяют следующие классы изображений: 1. Полутоновые (серые) изображения (рис. 8.1, а). Примерами таких изображений могут служить обычные черно-белые фотографии. Множество значений функции в С может быть дискретным (f ∈ {f0, ..., fl}, l > 1), либо непрерывным (0 ≤ f ≤ fmax). В один класс c полутоновыми обычно относят цветные фото- и телевизионные изображения. Экспериментально установлено, что практически любой цвет, видимый человеком, (но не всякий) может быть представлен как сумма определенных количеств m1, m2 ,m3 трех линейно-независимых так называемых основных цветов:
f = m1⋅ E1 + m2⋅E2 + m3⋅E3. В соответствии с принятой системой RGB основными являются цвета, соответствующие монохроматическим излучениям с длиной волны: λ1 = 0,7 мкм (красный − R); λ2 = 0,5461 мкм (зеленый − G); λ3 = 0,4358 мкм (голубой − B). Здесь множество значений функции f представляет собой 3-мерное пространство интенсивностей (m1, m2, m3) основных цветов. Если m1 = m2 = m3 = m, то, в зависимости от величины m, получаются различные оттенки серого цвета − от черного до белого. Если m1 ≠ m2 ≠ m3, то изображение окрашено в различные цвета.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-52-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
а
б
в
г
Рис. 8.1. Виды изображений
При космической и аэросъемке применяют многоспектральную фото-, теле- и сканерную аппаратуру, спектральные каналы могут лежать как в видимом, так и в невидимых УФ и ИК участках спектра; число таких каналов может достигать n = 5−10 и более. Здесь множество значений функции f представляет собой n-мерное пространство интенсивностей (m1, m2, …, mn). При визуализации таких изображений на мониторах ЭВМ каждому вектору из этого пространства можно присвоить какой-либо видимый человеческим глазом цвет, не обязательно основной. В результате получим аэро- или космическое изображение в условных цветах. Человеческий глаз не различает оттенки серого изображения, яркость которых отличается друг от друга менее чем на 1−2 %, но хорошо различает цвет. С помощью компьютера различным уровням яркости полутонового изображения можно сопоставить некоторую цветную шкалу и окрасить изображение в так называемые ложные цвета. Правильно подобранная шкала позволяет оператору визуально выделять объекты, мало отличающиеся по яркости. 2. Бинарные (двухуровневые) изображения (рис. 8.1, б). Здесь множество значений функции f ∈ (0,1). Обычно 0 – это черный цвет, а 1 − белый. Примером бинарного изображения являются карты водоемов, карты плоских деталей на конвейере и т. д. 3. Линейные изображения (рис. 8.1, в). Типичный пример − карта изолиний, изображение береговой линии, различные контуры. Изображение представляет собой одну кривую или семейство кривых. 4. Точечные изображения (рис. 8.1, г). Типичный пример − кадр участка звездного неба. Изображение представляет собой k точек с координатами (xi, yi) и яркостью fi, i = 1, …, k. Все многообразие задач обработки изображений можно представить как преобразования между классами изображений, а также как преобразования внутри класса. Так, понятие «улучшение качества» обычно относят к преобразованиям полутоновых (или цветных) изображений; сегментация состоит в преобразовании полутонового изображения в бинарное; линейные Цифровая обработка аэрокосмических изображений. Конспект лекций
-53-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
изображения получают, оконтуривая бинарные изображения; кривые и линии преобразуют в точечные изображения, отыскивая критические точки контуров (в случае многоугольников этими точками являются вершины). Критические точки обычно используются в задачах машинного зрения как признаки при распознавании образов. При обработке изображений, получаемых при дистанционном зондировании Земли из космоса, критические или опорные точки (обычно это элементы гидросети) используются для совмещения изображения с картой, при коррекции геометрических искажений изображения. Можно считать, что преобразование изображений из класса с меньшим номером в класс с большим номером относится к задачам сжатия изображений и распознавания образов. После проведения операции распознавания, когда объект идентифицирован, часто бывает необходимо провести измерение геометрических и других параметров объектов на изображении. Например, по космическому снимку можно оценить площадь гари после лесного пожара и координаты его центра тяжести. Для определения площади необходимо получить бинарное изображение, где объект (пожарище) белого цвета, а фон − черного (или наоборот). После нахождения указанных координат бинарное изображение пожарища превращается в точечное, где точка − центр тяжести. Преобразование изображений класса 4 в изображения класса 3 связано с интерполированием и аппроксимацией, обеспечивающими проведение гладкой кривой через заданные точки. Преобразование изображений класса 3 в изображения класса 2 называется заполнением контура. Иногда возможны преобразования изображений класса 2 в изображения класса 1 путем сглаживания бинарного изображения или подмешивания низкочастотного шума. Преобразования изображений из класса с большим номером в класс с меньшим обычно относят к задачам машинной графики. Важным современным направлением обработки изображений является восстановление трехмерного изображения по его двумерным проекциям − компьютерная томография, играющая большую роль в медицине и в технологическом контроле в промышленности. Регистрация, компьютерная обработка и воспроизведение изображений предполагают их организацию в виде двумерного массива fij, i = 1, ..., n, j = 1, ..., m, где fij – яркость пиксела (элемента изображения) в i-й строке и j-м столбце. Такая организация используется в датчиках изображений − сканерах авиационного и космического базирования, телевизионных камерах, настольных сканерах, в цифровых фотоаппаратах и др. Рассмотренный способ представления изображений называется растровой графикой. Растровая графика используется также в мониторах ЭВМ. На рис. 8.2 несколько строк растрового изображения показаны в увеличенном виде, видны отдельные пикселы.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-54-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
Рис. 8.2. Фрагмент растрового изображения
Рассмотренные датчики позволяют получать полутоновые и цветные изображения в аналоговой форме. Для ввода в ЭВМ их необходимо преобразовать в некоторую числовую матрицу. Процесс преобразования называется дискретизацией и состоит из выборки и квантования. Первая заключается в выборе на поле наблюдения некоторого множества точек, в каждой из которых измеряется величина яркости f(x, y). При использовании ПЭВМ для обработки изображений нередко применяется формат 512×512, так что упомянутое множество точек состоит из 512 ⋅ 512 = 262 144 пикселов. Выборка производится с некоторым шагом, который и характеризует пространственное разрешение. При использовании сканеров космического базирования разрешение обычно определяется скоростью спутника и частотой сканирования. В настоящее время основным устройством ввода изображений в ЭВМ с плоских оригиналов является планшетный сканер (Desk Scanner) – (рис. 8.3). В практике дистанционных исследований он применяется для ввода топографических карт. Типичный планшетный сканер содержит источник света, систему зеркал (одно из них вместе с лампой перемещается посредством шагового двигателя вдоль сканируемого изображения). Световой поток попадает через линзовый объектив в ПЗС-матрицу, которая обычно состоит из трех ПЗС-линеек с пленочными или матричными светофильтрами. Оптическое разрешение по строке определяется размером ПЗС-матрицы и составляет 2 400 и более точек на дюйм, в перпендикулярном направлении − числом шагов развертки (1 200 точек на дюйм и более). Предусмотрено программное обеспечение для повышения разрешения путем интерполяции.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-55-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
Рис. 8.3. Планшетный сканер
Для квантования и преобразования f(x, y) в числовой код в устройствах ввода используется аналого-цифровой преобразователь (АЦП). Поскольку человеческий глаз обычно не в состоянии различать уровни освещенности, отличающиеся друг от друга менее чем на 1−2 %, для качественного представления полутонового изображения вполне достаточно иметь 28 = 256 уровней квантования, т. е. по 1 байту на пиксел. Эта величина характеризует тоновое разрешение. При дискретизации цветного изображения обычно затрачивают по 1 байту на каждый из трех основных цветов, т. е. 3 байта на пиксел (24-битное кодирование, 24-битная глубина цвета). Черно-белые сканеры регистрируют не менее 256 градаций серого, цветные – не менее 256 градаций каждого из трех основных цветов, т. е. не менее 16,7 млн оттенков. В некоторых системах, например в сканерах космического базирования, число уровней квантования выбирается исходя из конкретной задачи. К числу устройств, специально предназначенных для ввода изображений в ПЭВМ, относятся цифровые фото- и видеокамеры. Типичная цифровая фотокамера содержит ПЗС-матрицу, обычно с разрешением 5 мегапикселов и более, АЦП и процессор; изображение в цифровой форме записывается на полупроводниковую память. В ПЭВМ изображение вводится либо через кабель, либо через бесконтактное устройство ввода на ИК, либо через флеш-карту. По качеству изображения твердые копии небольшого формата, полученные с помощью цифровой камеры, не уступают обычной фотографии размера 9х13 см, однако 35-миллиметровые фотонегативы обычно допускают 10-кратное увеличение без существенной потери качества; на увеличенном в 3−4 раза изображении с цифровой камеры просматривается пиксельная структура. Цифровая обработка аэрокосмических изображений. Конспект лекций
-56-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
Для визуализации изображений используются цветные мониторы на электронно-лучевых трубках, жидкокристаллических плазменных дисплеях. Современные электронно-лучевые мониторы имеют трубки с диагональю 15, 17, 20 и более дюймов, разрешение 15-дюймового монитора составляет 1024х768 пикселов при размере зерна экрана 0,24−0,27 мм, 20-дюймовый монитор может иметь размер зерна 0,24 мм. Каждое зерно состоит из трех точек люминофора, способных светиться красным, зеленым и синим светом соответственно. Наиболее экологичными считаются электронно-лучевые мониторы с повышенной частотой кадровой развертки (75 Гц и более). Жидкокристаллические дисплеи меньше утомляют зрение, чем электронно-лучевые. Жидкокристаллический дисплей представляет собой две тонкие пластины из кварцевого стекла, на внутренней стороне которых нанесены матрицы из электродов, каждая «ячейка» соответствует одному пикселу. На внешние части стекол наносится поляризующая пленка. Затем две кварцевые панели складываются вместе, между ними создается вакуум, и туда закачивается состав из жидких кристаллов. Сзади панель подсвечивается источником света. Жидкие кристаллы − органические полимеры, изменяющие прозрачность при приложении электрического поля. В отличие от мониторов на электронно-лучевой трубке, разрешение которых можно менять достаточно гибко, ЖК-дисплеи имеют фиксированный набор «физических» пикселов, поэтому они рассчитаны на работу в максимальном разрешении, заданном производителем. Например, мониторы формата 1 024х768 содержат 1 024 элемента по горизонтали и 768 − по вертикали. Если пользователь пожелает перевести этот монитор в режим 640х480, то изображение будет выводиться на середину экрана, а по краям будут оставаться темные поля. Возможно применение интерполяции, тогда изображение занимает весь экран, однако оно будет выглядеть не очень качественным, например, буквы могут иметь не плавные очертания, а ступенчатые. Жидкокристаллические мониторы дают более блеклые цвета, чем электронно-лучевые. Плазменные экраны совмещают технологии электронно-лучевых трубок и жидкокристаллических экранов. Они состоят из отдельных ячеек, в которых находится инертный газ при низком давлении, а на стенку, обращенную к зрителю, нанесен люминофор. При электрическом разряде в газе испускается УФ-излучение, которое возбуждает свечение люминофора. Диапазон яркости электронно-лучевых трубок и плазменных экранов равен 1:500, а диапазон яркости ЖК-мониторов – 1:50. Для профессиональной обработки изображений использование ЖК-мониторов нежелательно. Твердые копии получают с помощью принтеров и плоттеров. Матричные принтеры мало пригодны для вывода изображений. Струйные принтеры обеспечивают значительно лучшее качество при той же цене, что и матричные. В конструкции современных принтеров чаще всего используется одна
Цифровая обработка аэрокосмических изображений. Конспект лекций
-57-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
из двух технологий − пьезоэлектрическая или термическая, различающиеся способом вывода струи красителя из печатающей головки. Пьезоэлектрическая техника drop-on-demand (капля по требованию) использует печатающие головки, в которых размещены миниатюрные пьезоэлектрические пластинки. С компьютера на пластинку подаются электрические импульсы, пластинка изменяет свои размеры, а в заполненном чернилами канале увеличивается давление, что в свою очередь приводит к выбрасыванию капли красителя. Скорость движения капли − около 20 м/с. Диаметр сопла составляет не менее 15−25 мкм (это ограничено технологией), диаметр вылетевшей из него капли примерно вдвое превышает диаметр сопла и равен 30−50 мкм, при ударе о лист бумаги капля несколько расплывается. Таким образом, разрешение струйного принтера при диаметре сопла 20 мкм составляет 25 мм/0,04 мм, т. е. около 600 точек на дюйм. В других конструкциях струйных принтеров используется термическая разновидность технологии «капля по требованию». В картридже принтера имеется канал, через который поступают чернила. В канале установлены миниатюрные нагревательные элементы, способные за несколько микросекунд создать высокую температуру. При этом появляется пузырек пара, выталкивающий каплю красителя из сопла. Со скоростью до нескольких десятков метров в секунду капля выбрасывается наружу, а в канал «втягивается» следующая порция чернил. Современные струйные принтеры печатают 2−10 страниц формата А4 в минуту с разрешением до 1 400 точек на дюйм. Некоторые струйные принтеры реализуют такое же качество изображений, какое достигается на цветных фотографиях небольшого размера. Практически все струйные принтеры позволяют печатать цветные изображения. Более совершенны лазерные принтеры, например, использующие технологию Xerox. Специальный фоточувствительный барабан заряжают статическим электричеством. К барабану могут притягиваться частички красящего порошка (тонера). Лучом света полупроводникового лазера за счет фотоэффекта некоторые участки барабана разряжаются, к ним тонер не притянется. Затем через барабан «прокатывается» лист бумаги, тонер переходит на бумагу и закрепляется нагреванием. Лазерные принтеры могут обеспечивать более высокое разрешение, чем струйные. Однако указанное выше разрешение реализуется при печати не полутоновых, а бинарных изображений, к числу которых можно отнести буквы текста, черные линии на белом фоне и т. д. Для печати полутоновых изображений, как правило, приходится имитировать полутона с помощью создания растра. Например, растр полутонового изображения может печататься в виде ячеек 8х8 пикселов; в зависимости от заполнения ячейки точками черного цвета можно имитировать 82 = 64 градации полутонов. Незаполненная ячейка имеет белый цвет, заполненная 8 точками имитирует 12 %-й уровень почернения, заполненная 32 точками – 50 %-й уровень. Так же обстоит дело и Цифровая обработка аэрокосмических изображений. Конспект лекций
-58-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 8. Технические средства обработки изображений
при цветной печати красителем каждого цвета. Следовательно, при печати изображений разрешения принтера по полутонам и по элементам зависят друг от друга. Обычно, если разрешение принтера составляет 600 точек на дюйм, то имитируют 64 полутона, имеем 600/8 = 75 ячеек на дюйм. Лучшего результата можно достичь, если отказаться от строгого соответствия между полутоновыми ячейками и печатными точками, т. е. использовать так называемый диффузионный метод печати. Контрольные вопросы и задания
1. Предложите математические модели линейного и точечного изображений. 2. После идентификации объект представлен в виде черного пятна на белом фоне. Как определить его площадь? 3. С какой скоростью движется электронный луч вдоль строки по экрану размером 30х40 см при скорости кадровой развертки 100 Гц и 800 строках в кадре при воспроизведении линии? 4. Чему должен быть равен поперечник луча лазера, обеспечивающего разрешение лазерного принтера в 2 000 точек на дюйм? 5. Пусть диагональ монитора составляет 20 дюймов при соотношении высоты кадра и его ширины 3/4, размер зерна 0,25 мм. Чему равно разрешение такого монитора (число точек по вертикали и горизонтали)? 6. Принтер имеет разрешение 800 точек на дюйм. Каково его разрешение при печати растровым методом изображения с 256 градациями полутонов? 7. Что такое раскраска изображения в условные цвета и в ложные цвета?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-59-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 9 Форматы графических файлов План лекции
1. Растровая и векторная графика. 2. Сжатие исзображений без потерь и с потерями. 3. Структура графического файла. При растровом способе записи изображений в памяти ЭВМ формируется машинный кадр в виде совокупности N строк, каждая строка содержит по M пикселов. Для объектов в виде линий (сетка географических координат, карта гидросети и т. д.) применяется также векторная форма записи, когда в ячейках памяти записывают числа: координаты пиксела x, y и величину его яркости f либо координаты начала и конца прямой линии и её яркость (цвет). Из линий могут быть образованы сложные фигуры. Векторные данные могут быть представлены также в виде алгоритма. Например, информация о том, что изображение является окружностью цвета C, радиуса R с координатами центра x0, y0, может быть записана в векторной форме на Бейсике как CIRCLE(x0, y0),R,C. Атрибуты векторного файла могут содержать данные о яркости (цвете) линий и фона. Пусть изображение содержит две прямые с известными координатами начала и конца каждой (рис. 9.1, а) Изображение в векторной форме, имеет вид (x1,y1; x2,y2; x3,у3). Изображение в растроа вой форме, отвечающее этим прямым, представлено в условном виде на рис. 9.2, б. Это изображение, содержащее две прямые с яркостью w на фоне a в виде 3 строк по 10 пикселов, обычно записывается в памяти ЭВМ в б виде: aaaawwwwwwaaaawaaaaaaaaawaaaaa. Для вывода такого изображения на монитор Рис. 9.1. Изображение двух прямых необходимо привести данные о числе строк и пикселов в строке. Каждая из форм записи имеет свои достоинства и недостатки. Растровая форма записи более универсальна, более информативна, идеально соответствует архитектуре ЭВМ. Однако если увеличить растровое изображение линий, то они станут толще. Векторная графика лишена этого недостатка. При любом масштабе точка изображается пикселом, линия имеет одинаковую толщину. Это чрезвычайно важно при работе с геоинформационными системами (ГИС), когда необходимо последовательно переходить от мелкомасштабных изображений к крупномасштабным − от карт местности к планам, содержащим изображения городов,
Цифровая обработка аэрокосмических изображений. Конспект лекций
-60-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 9. Форматы графических файлов
жилых кварталов и отдельных домов с различными коммуникациями, причем изображения сопровождаются текстовой и цифровой информацией. Векторная графика более ориентирована на работу с базами данных, чем растровая. Она, в принципе, более экономична, чем растровая (нет нужды приводить информацию о «пустых» пикселах) и потому очень эффективна при работе с географическими картами, поскольку в векторной форме в памяти ЭВМ хранятся лишь данные о линиях на карте и их атрибуты. При работе с космическими изображениями Земли приходится одновременно использовать растровую и векторную графику, например накладывать изображение земной поверхности на географическую карту, накладывать координатную сетку на изображение и т. д. Поэтому в программном обеспечении станций приема и обработки космической информации предусматривается преобразование вектор-растр. Для хранения растровых изображений требуется значительный объем памяти ЭВМ. Изображение размером 1 024х1 024 пикселов в пяти спектральных каналах, получаемое со сканера AVHRR спутника NOAA (10битное квантование), требует для хранения 6,25 Мбайт. Не все пикселы несут информацию, нередко одни и те же значения повторяются много раз, например, если большой фрагмент окрашен однородно. В настоящее время разработаны различные методы экономной записи изображений в память ЭВМ и сжатия изображений, существует много форматов записи. Один из самых простых методов сжатия – групповое кодирование. В соответствии с этой схемой серии повторяющихся величин заменяются одной величиной с указанием их количества. Вместо последовательности значений яркости abbbcccddeeeeeeeeef можно записать: 1a3b3c2d9e1f. Этот метод легко реализуем, он хорошо работает с длинными сериями повторяющихся величин, например, при наличии больших областей с одинаковой яркостью либо цветом, в этом случае он удобнее, чем рассмотренное ниже кодирование кодами переменной длины. Если серия содержит незначительно отличающиеся величины, можно указывать и величину скачка яркости. Групповое кодирование используется в форматах TIF, PCX, BMP и др., оно не требует составления кодовой таблицы. Космическое изображение природного объекта (место впадения р. Селенга в Байкал) при 24-битном представлении RGB, 780х780 пикселов имеет размер 1,46 Мбайт. Групповое кодирование в формате BMP сжимает изображение до 479 Кбайт. Опыт показал, что групповое кодирование хорошо справляется со сжатием изображений объектов, содержащих большие участки, однородные по тону (цвету). Статистическое кодирование обычно более эффективно, чем групповое. В теории информации доказано, что наибольшим средним количеством информации на одно сообщение (энтропией) обладает источник, выдающий сообщения со случайными, независимыми, равномерно распределенными значениями. Если интервал изменения этих значений равен [a, b], то вероятность появления любого значения из этого интервала одинакова, значения яркости необходимо кодировать словами одинаковой длины. С этой точки зрения, «наиболее информативным изображением» будет Цифровая обработка аэрокосмических изображений. Конспект лекций
-61-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 9. Форматы графических файлов
шум с равномерным законом распределения при статистической независимости яркости всех пикселов. Однако реальные изображения существенно отличаются от случайного двумерного поля. Они содержат фон и некоторые связные объекты. И фон, и объекты, как правило, имеют повторяющиеся значения яркости, некоторые значения яркости встречаются часто, другие – редко. Реальное изображение обладает избыточностью, и если ее устранить, для его хранения потребуется меньший объем памяти. Избыточность устраняется путем рационального кодирования, учитывающего неравную вероятность (точнее, частоту) появления яркостей пикселов и их взаимозависимость. Проще всего учесть неравную вероятность появления различных значений яркости. В настоящее время широко применяется статистическое кодирование по методу Хаффмана, для которого длина кодового слова зависит от вероятности появления сообщения. Кодирование по Хаффману требует в качестве первого этапа проведения анализа изображений и определения вероятности (точнее, частоты) появления яркостей (либо основных цветов) пикселов изображения и составления кодовой таблицы с учетом этих вероятностей. Далее всем яркостям присваиваются кодовые слова из таблицы. При этом происходит сжатие изображения, так как для передачи этой совокупности (или записи ее в память ЭВМ) потребуется меньше бит, чем для записи равномерным кодом. Пусть растровое изображение имеет вид abbbcccddeeeeeeeeef. Частоты, с которыми появляются значения яркости, равны: a: 1, b: 3, c: 3, d: 2, e: 9, f: 1. Для кодирования этих 6 значений можно использовать равномерный 3-битный код, например, записать a: 001; b: 011; c: 100; d: 101; e: 110; f: 111. Общая длина кодовой комбиРис. 9.2. Кодирование по Хаффмену нации в этом случае составит 19⋅3 = 57 (бит). Для кодирования по Хаффману используем двоичное дерево (рис. 9.2). Наиболее редко встречающиеся значения в этом примере – a и f. Они становятся первой парой: a присваивается 0-я ветвь, f – 1-я. 0 и 1 станут младшими битами кодов для a и f. Старшие биты будут получены из дерева по мере его построения. Суммируем частоты a и f, в сумме получаем 2. Эта пара далее объединяется с символом d, который также имеет частоту 2. Паре a и f присваивается 0-я ветвь этого дерева, а d присваивается ветвь 1. Теперь код для a заканчивается на 00, для f – на 01, для d – на 1. Дерево продолжает строиться, так что наименее распространенные величины описываются более длинными кодами, а наиболее распространенные − одним (или более) битами. В нашем случае имеем: a: 0000; b: 010; c: 011; d: 001; e: 1; f: 0001, общая длина кодовой комбинации теперь равна 41, коэффициент сжатия 1,39:1.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-62-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 9. Форматы графических файлов
Алгоритм Хаффмана позволяет в определенных случаях достигать сжатия больше, чем 8:1. Однако он требует два прохода: один для создания кодовой таблицы, второй – для кодирования. Кодирование и декодирование по Хаффману больших массивов информации – сравнительно медленные процессы, это характерно и для других кодов переменной длины. Существуют процедуры, не требующие предварительного создания кодовой таблицы, в этих процедурах кодовая таблица создается и уточняется по мере поступления данных (адаптивные методы сжатия ). К числу таких процедур относится схема сжатия LZW (Лемпела-Зива-Велча), которая используется в форматах GIF и TIF. 24-битное изображение устья р. Селенга размером 780х780 пикселов, 1,46 Мбайт, сжатый по методу LZW в формате TIF, занимает 436 Кбайт против 479 Кбайт при групповом кодировании в формате BMP. Рассмотренные методы не охватывают всех известных схем сжатия изображений. Особенностью их является отсутствие потери информации при сжатии. Это важно при хранении исходных данных. Существуют алгоритмы сжатия с потерями, к числу которых относится JPEG (Joint Photographic Experts Group), расширение jpg. Этот алгоритм использует идею, реализованную в современных системах цветного телевидения (SECAM, PAL, NTSC) и применяется в цифровых фотоаппаратах, в издательских системах. Учитывается, что человеческий глаз очень чувствителен к изменению яркости изображения, но не замечает цвет мелких его деталей. В телевидении данные о цветности передаются в сильно сжатом виде, так что кадр черно-белого и кадр цветного телевизионного изображения занимает одинаковую полосу частот. Алгоритм JPEG переводит цветное изображение из пространства цвета RGB в пространство YCbCr, как в телевидении. Y определяет яркость пиксела, Cb задает насыщенность синего цвета, Cr – насыщенность красного. Насыщенность зеленого при необходимости вычисляется из комбинации Y, Cb, Cr. Если исключить цветность, т.е. Cb, Cr, то, используя Y, можно получить полутоновое изображение. После перехода к пространству YCbCr осуществляется фильтрация данных раздельно для Y, Cb, Cr в окне 8х8 пикселов с использованием дискретного косинусного преобразования Фурье. Оцениваются амплитуды гармонических составляющих, те составляющие, амплитуды которых ниже некоторого порога, не учитываются. Для амплитуд Cb, Cr порог устанавливается более высоким, чем для Y, и мелкие детали изображения становятся полутоновыми. Далее Y, Cb, Cr кодируются с использованием кодов переменной длины по Хаффману. Алгоритм JPEG обеспечивает очень высокий коэффициент сжатия. Изображение устья р. Селенга, сжатое по методу JEPG, занимает всего 65 Кбайт вместо 1,46 Мбайт у исходного изображения в формате TIF. JPEG нередко
Цифровая обработка аэрокосмических изображений. Конспект лекций
-63-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 9. Форматы графических файлов
может хранить полноцветные изображения, субъективно неотличимые от подлинника, используя несколько больше одного бита на пиксел при сжатии. Однако он не слишком хорошо обрабатывает изображения с небольшим количеством цветов и резкими границами, например, мультипликацию. Опыт показал, что алгоритм JEPG мало пригоден для хранения изображений, получаемых при исследовании Земли из космоса и предназначенных для последующей обработки на ЭВМ. Однако он полезен при создании иллюстраций к статьям, презентациям, отчетам. При обработке изображений применяются и другие дискретные ортогональные преобразования, в частности, вейвлет-преобразования. С их использованием разработаны новые быстрые алгоритмы сжатия изображений и новые форматы, например, JPEG-2000. Пространства цвета RGB и YCbCr – не единственный способ представления цветных изображений в ЭВМ. Для работы с цветными принтерами и другими печатающими устройствами изображение из пространства RGB или YCbCr переводится в CMYK (С – cyan, M – magenda, Y – yellow). В этом пространстве представлены голубой (C), пурпурный (M), желтый (Y) и черный (K) цвета. При печати используются красители этих цветов, применение черного красителя повышает контраст, тем более, что качественный черный цвет невозможно получить, смешивая красители голубого, пурпурного и желтого цветов. Самые дешевые струйные принтеры, тем не менее, имеют чернила только трех цветов (cyan, magenda, yellow), более дорогие, предназначенные для фотопечати, до 7−8 цветов. Введение еще одного способа представления цвета продиктовано законами физической оптики. На дисплее мы видим свет, испускаемый люминофором. На бумаге наблюдается изображение в отраженном и рассеянном свете, глаз регистрирует те цвета, которые остались после поглощения падающего света красителями. Каждый графический файл состоит из двух основных частей: заголовка и собственно данных. Цветные изображения содержат также таблицу, в соответствии с которой элементам изображения присваиваются значения основных цветов. Заголовок начинается с идентификатора, указывающего, в каком формате (TIF, BMP, GIF и т. д.) записан файл. Далее содержатся общие сведения о структуре файла (ширина и высота изображения, является ли оно цветным, использование сжатия и т. д.). Форма представления этих сведений различная для каждого формата. Наиболее развитым, но и самым сложным форматом является ТIF-формат (Tag Image File Format). Файлы в формате ТIF используются не только в IBM-совместимых, но и во многих других компьютерных системах. Каждая серьезная программа обработки изображений может читать и записывать ТIF-файлы. В этом формате можно хранить все виды изображений, т. е. монохромные (бинаризованные и полутоновые), цветные с палитрой
Цифровая обработка аэрокосмических изображений. Конспект лекций
-64-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 9. Форматы графических файлов
из 16 и 256 цветов и RGB-изображения c 24-битным кодированием. Наряду с основной информацией об изображении (размеры изображения, данные о цвете), в заголовке ТIF-файла можно записать множество дополнительных сведений об изображении. Еще один формат файла, пригодный для обмена данными между компьютерами различных систем, – это формат Targa (TGA). Он не создает никаких проблем и практически исключает несовместимость между программами. Но и этот формат имеет недостаток, заключающийся в том, что разрешение изображения в файле обычно не запоминается. Формат GIF известен всем пользователям Интернета. Целью разработки формата было обеспечение максимального сжатия видеоданных при их записи в память, чтобы уменьшить объем файлов и минимизировать затраты на их загрузку и передачу по каналам связи. Стандартная версия формата GIF ограничивается изображениями с палитрой, содержащей максимум 256 цветов. Контрольные вопросы и задания
1. В чем особенности применения растровой и векторной графики? 2. Что такое групповое кодирование? 3. Закодируйте по Хаффмену строку aaabbbbcddddddeefffffffff. 4. Что теряется при кодировании изображения в формате JPEG? 5. Что теряется при кодировании изображения в формате GIF? 6. Для чего применяется формат CMYK?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-65-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 10 Модели изображений. Преобразования яркости и контраста План лекции
1. Каузальные, полукаузальные и некаузальные модели. 2. Авторегрессионные модели. 3. Растяжка и эквализация гистограммы. При моделировании случайных полей на ЭВМ числа от датчика случайных чисел преобразуются в числовую матрицу, обладающую определенными свойствами. В зависимости от того, какие отсчеты датчика участвуют в формировании текущего значения поля, модели случайных полей разделяются на каузальные, полукаузальные и некаузальные. Основное различие между этими моделями обусловлено их пространственными особенностями, которые зачастую приводят к принципиально различным алгоритмам. Если для формирования отсчета поля (белая точка на рисунке) с координатами (x, y) используются текущий отсчет датчика и предыдущие его отсчеты x1 ≤ x и y1 ≤ y (рис. 10.1, а), то модель называют каузальной (от лат. causa − причина).
а
б
в
г
Рис. 10.1. Схемы формирования изображений
Иногда под каузальной моделью понимают модель, использующую данные области, геометрия которой определяется растровой разверткой (рис. 10.1, б). При работе в реальном времени, когда известны лишь эти данные и потому выполняется условие причинности, такая схема единственно возможная. Полукаузальный фильтр использует входные данные верхней полу Цифровая обработка аэрокосмических изображений. Конспект лекций
-66-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
плоскости (рис. 10.1, в), а некаузальный – данные всей плоскости (рис. 10.1, г). Могут использоваться не все данные соответствующей области, а лишь некоторая их часть (например отмеченная штриховой линией на рис. 10.1, а, б, в, г). Пример изображения, построенного по каузальной методике, можно видеть на рис. 10.2. Это модель космоснимка леса в виде совокупности кружков различного диаметра, случайным образом размещенных на плоскости, причем кружки не перекрываются (в природе имеет место «расталкивание» крон деревьев в спелом древостое).
Рис. 10.2. Модель космоснимка леса
При построении модели первоначально, по случайному закону выбирается центр первой окружности в окрестности левого верхнего угла, рисуется эта окружность. Далее в ее окрестности случайным образом ставятся следующие точки − центры других окружностей. Окружность рисуется, если выполняется условие: (Ri + Rj)2 >(xi – xj)2+(yi – yj)2, где (xi ,yi), (xj ,уj) – координаты центров ближайших соседей, а Ri, Rj – их радиусы (i ≠ j). По этой схеме постепенно, сверху вниз, заполняется всё поле. В программном обеспечении современных ЭВМ есть алгоритм моделирования случайных чисел, распределенных равномерно в интервале от 0 до 1. Эти числа являются статистически независимыми в достаточно длинной последовательности. Математическое ожидание таких чисел μ1 = 0,5, дисперсия σ2 = 1/12. Если вычесть из этих чисел μ1, получим последовательность, распределенную равномерно в интервале от минус 0,5 до 0,5. Из последовательности равномерно распределенных случайных чисел можно получить последовательность нормально распределенных случайных чисел. Из теории вероятностей известно, что сумма независимых одинаково распределенных случайных величин имеет нормальный закон распределения при условии, что слагаемые дают равномерно малый вклад в сумму (центральная предельная теорема). Чтобы получить один отсчет случайного числа с нормальным законом распределения, достаточно просуммировать 8–10 равномерно распределенных случайных чисел, полученных по описанной методике, однако удобнее использовать 12 чисел, при этом σ2 = 1/12. Цифровая обработка аэрокосмических изображений. Конспект лекций
-67-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
Пусть исходная последовательность чисел {xi} с равномерным законом распределения имеет μ1 = 0 и σ2 = 1/12. Учитывая, что значения этой реализации xi и xj при i ≠ j статистически независимы, просуммируем 12 таких чисел и получим реализацию {hk} c нормальным законом распределения, с нулевым средним и единичной дисперсией. Умножим все hk на постоянное число σ и прибавим к ним постоянную μ1. Новая реализация fj будет иметь заданную дисперсию и среднее значение. Используя случайные числа xi или hk, можно моделировать изображение, если последовательно, строка за строкой, присваивать пикселам эти случайные значения яркости. Необходимо учитывать, что яркость – величина неотрицательная. Если её значения fj лежат в интервале от 0 до 255, то при нормальном законе распределения можно положить, например, μ1 = 127, σ = 50, при этом значения fj < 0 и fj > 255 мало вероятны. Можно задавать большие σ, в этих случаях отрицательным fj следует присваивать нулевые значениям, а fj > 255 присваивать значения fj = 255. Полученное таким образом изображение – это совокупность не связанных друг с другом точек (шум), Более реалистичные изображения удается получить, если использовать авторегрессионную модель, позволяющую генерировать однородное, однородное и изотропное или неоднородное случайное поле с заданными корреляционной функцией и математическим ожиданием. Авторегрессионные методики типично каузальные. Рассмотрим простейшую линейную авторегрессионную модель изображения – авторегрессию по строкам. Это может быть, например, модель строки телевизионного сигнала, когда значения яркости считываются вдоль строки с некоторым шагом:
fi = ρfi −1 + (1 − ρ)μ1 + hi 1 − ρ2 ,
(10.1)
где fi и fi−1 – значения яркости на i-м и (i-1)-м шаге; hi – одинаково распределенные независимые случайные числа с нулевым средним и единичной дисперсией (порождающий случайный процесс), параметры ρ, μ1, σ постоянные. Отсюда следует, что статистические характеристики случайной последовательности {fi} должны быть инвариантны относительно изменения начала отсчета пикселов в строке, т. е. строка {fi} обладает свойствами однородного случайного поля. Приведенное рекуррентное соотношение описывает линейное инерционное преобразование случайной последовательности hi. Усредним правую и левую части выражения (10.1), скобки < > означают усреднение: = ρ + (1 − ρ) μ1, откуда < fi > = = μ1. Перепишем авторегрессионное уравнение (10.1) в виде
Цифровая обработка аэрокосмических изображений. Конспект лекций
-68-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
f i − μ1 = ρ( fi −1 − μ1 ) + (1 − ρ)μ1 + hi σ 1 − ρ2 . Умножим правую и левую часть на (fi−1 – μ1) и усредним: <( fi − μ1) (fi−1 − μ1)> = ρ <( fi−1 − μ1)2 >. Среднее от произведения fi−1 hi равно нулю, т.к. fi−1 и hi статистически независимы (случайное число hi появилось позже, чем fi−1). Выражение <( fi − μ1) (fi−1 − μ1)> = R1 − это коэффициент корреляции между яркостями двух соседних пикселов в строке. Возведем левую и правую часть авторегрессионного уравнения в квадрат и усредним: <(fi − μ1)2>= ρ2 <(fi−1 − μ1)2> + σ2< hi2>(1− ρ2). Так как = 1, то <(fi − μ1)2> = <(fi−1 − μ1)2> = σ2 − дисперсия случайной последовательности {fi}. Параметр ρ = R1/σ2 − это нормированный на σ2 коэффициент корреляции между fi и fi−1, 0 ≤ ρ ≤ 1. Умножим левую и правую часть авторегрессионного уравнения (10.1) на (fi−2 – μ1) и усредним. Получим: <(fi − μ1)⋅(fi−2 − μ1)> = R2 − коэффициент корреляции между значениями яркости двух пикселов, отстоящих друг от друга в строке через один шаг. Можно показать, что R2 = ρ2⋅σ2. Продолжая эту процедуру, найдем, что коэффициент корреляции между значениями яркости пикселов, разделенных вдоль строки n шагами, Rn = ρnσ2 = σ2 e−αn, где α = ln(1/ρ). Таким образом, случайная последовательность {fi} имеет экспоненциальную функцию автокорреляции; fi обладает нормальным законом распределения, если hi распределено по нормальному закону или если hi имеет отличный от нормального закон распределения, но ρ близко к 1 (имеет место нормализация случайного процесса fi). Попытка трансформировать закон распределения путем нелинейного преобразования {fi} приводит к «неуправляемой» функции корреляции, попытка сделать вначале нелинейное преобразование последовательности независимых отсчетов {hi}, а после этого провести линейное не всегда приводит к желаемому результату, т. к. линейная система нормализует случайный процесс при достаточно большом ρ. В такой модели существует некоторая зависимость между яркостью пикселов в строке, но каждая соседняя строка случайным образом следует за предыдущей, изображение, скорее, похоже на узор на ткани, чем на снимок земной поверхности, полученный из космоса. Трехточечная авторегрессионная модель изображения может быть записана в виде f i , j = μ1 + ρ1 ( fi −1, j − μ1 ) + ρ2 ( f i , j −1 − μ1 ) − ρ1ρ2 ( f i −1, j −1 − μ1 ) + σρ12ρ22 hi , j 1 − ρ12ρ22 .
Цифровая обработка аэрокосмических изображений. Конспект лекций
-69-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
Здесь i − номер строки, j − номер пиксела в строке, ρ1 и ρ2 – коэффициенты корреляции значений яркости рядом расположенных пикселов в соседних строках и в одной строке. По-прежнему hi,j − одинаково распределенные независимые случайные величины с нулевым средним и единичной дисперсией. Функция автокорреляции яркостей пикселов, разделенных n столбцами и m строками, есть произведение двух экспонент Rmn = ρ1mρ2nσ2 = σ2e−αne−βn, где α = ln(1/ρ1), β = ln(1/ρ2). Трехточечная модель при правильном подборе параметров позволяет создавать достаточно реалистичные изображения, очень похожие на спутниковые изображения земной поверхности (рис. 10.3). Эти изображения можно использовать при моделировании на ЭВМ различных алгоритмов обработки изображений.
Рис. 10.3. Изображение, построенное по трехточечной модели
Приблизиться к однородному и изотропному полю можно, используя более сложные авторегрессионные модели, например, четырехточечную. Схема авторегрессии находит применение и в других задачах, например, при восстановлении пропущенных пикселов. Гистограмма яркости изображения, построенного по трехточечной модели, имеет вид кривой нормального закона распределения (рис. 10.4). Гистограмма показывает, сколько пикселов n с близким значением яркости f попадает в интервал от fi до f + ∆fi. Параметры, входящие в трехточечную модель, имеют определенный физический смысл: μ1 – это средняя яркость всех пикселов, σ – величина стандартного отклонения, характеризующая контраст. Параметры 1/α, 1/β задают характерный размер «пятен» на изображении (в пикселах). При ρ1 = ρ2 = 0,9 имеем 1/α = 1/β = 9,5 (пикселов). Максимум гистограммы соответствует μ1, в данном случае он совпадает с медианой. Увеличение яркости приводит к смещению гистограммы вправо, уменьшение – влево. При увеличении σ гистограмма расширяется, контраст увеличивается.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-70-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
Рис. 10.4. Гистограмма яркости
При цифровой обработке возможно изменение яркости и контраста. Слабый контраст – достаточно распространенный дефект сканерных, фотографических и телевизионных изображений, обусловленный ограниченностью диапазона воспроизводимых яркостей. Под контрастом обычно понимают разницу между максимальным и минимальным значениеми яркости. Учитывая специфику цифровой обработки изображений, далее будем называть среднее значение μ1 яркостью изображения, а стандартное отклонение σ будем считать мерой контраста. Путем цифровой обработки контраст можно повысить, изменяя яркость каждого элемента изображения и увеличивая диапазон яркостей. Для этого разработано несколько методов. Пусть, например, уровни некоторого полутонового изображения занимают интервал от 6 до 158 со средним значением яркости 67 при возможном наибольшем интервале значений от 0 до 255. На рис. 10.5 слева приведена гистограмма яркостей такого изображения, Это изображение является малоконтрастным, превалирует темный оттенок. Возможным методом улучшения контраста может стать так называемая линейная растяжка гистограммы (stretch), когда уровням исходного изображения, лежащим в интервале [fмин, fмакс], присваиваются новые значения с тем, чтобы охватить весь возможный интервал изменения яркости, в данном случае [0, 255]. При этом контраст существенно увеличивается (справа на рис. 10.5). Преобразование уровней яркости осуществляется по формуле gi = с + d fi,
(10.2)
здесь fi − старое значение яркости i-го пиксела, gi − новое значение, c, d − коэффициенты. На рис. 10.4 fмин = 6, fмакс = 158. Выберем c и d, чтобы gмин = 0, gмакс = 255. Из (10.2) получаем c = −10,01; d = 1,67. Цифровая обработка аэрокосмических изображений. Конспект лекций
-71-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
Рис. 10.5. Растяжка гистограммы
Возможен вариант, когда на весь максимальный интервал уровней яркости [0, 255] растягивается не вся гистограмма, лежащая в пределах от fмин до fмакс, а её наиболее интенсивный участок (fмин', fмакс'), малоинформативным левому «хвосту» присваиваются значения 0, правому «хвосту» 255. Эту процедуру называют нормализацией гистограммы. Целью выравнивания гистограммы (эту процедуру называют также линеаризацией и эквализацией − equalization) является такое преобразование, чтобы, в идеале, все уровни яркости приобрели бы одинаковую частоту, а гистограмма яркостей отвечала бы равномерному закону распределения. Пусть изображение имеет формат: N пикселов по горизонтали и M по вертикали, число уровней квантования яркости равно J. Общее число пикселов равно N ·M, на один уровень яркости попадает в среднем no = N ·M/J пикселов. Например, N = M = 512, J = 256. В этом случае no = 1024. Расстояние ∆f между дискретными уровнями яркости от fi до fi+1 в гистограмме исходного изображения одинаковое, но на каждый уровень выпадает различное число пикселов. При эквализации гистограммы расстояние ∆gi между уровнями gi и gi+1 различно, но число пикселов на каждом уровне в среднем одинаковое и равно n0. Пусть уровнями с малой яркостью обладает небольшое количество пикселов, как на рисунке слева. Например, уровень яркости 0 на исходном изображении имеют 188 пикселов, уровень 1 − 347 пикселов, уровень 2 − 544 пиксела. В сумме это 1 079 пикселов, т.е. приблизительно n0. Присвоим всем этим пикселам уровень 0. Пусть на исходном изображении число пикселов с уровнями яркости 3 и 4 в сумме приблизительно также равно n0. Этим пикселам присваивается уровень 1. С другой стороны, пусть число пикселов с уровнем 45 на исходном изображении составляет 3 012, т. е. приблизительно 3n0. Всем Цифровая обработка аэрокосмических изображений. Конспект лекций
-72-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста.
этим пикселам присваивается некоторый одинаковый уровень gi, не обязательно равный 45, а соседние два уровня остаются незаполненными. Эти процедуры повторяются для всех уровней яркости. Исходное изображение показано на рис. 10.6 слева, результат эквализации можно видеть на рис. 10.6 справа.
Рис. 10.6. Эквализация
В каждом конкретном случае выбирают тот метод преобразования гистограмм, которая приводит к наилучшему, с точки зрения пользователя, результату. Процедуру видоизменения гистограммы можно рассматривать как попиксельное преобразование входной яркости fj, f0 ≤ fj ≤ fJ, в выходную яркость gk, g0 ≤ gk ≤ gK, в результате которого исходное распределение вероятностей P{fj} переходит в распределение вероятностей Р{gk}, имеющее желаемую форму. Очевидно, что сумма вероятностей яркостей всех пикселов должна равняться единице: J
∑ P{fj} = 1, j=0
K
∑ Р{gk} = 1. k =0
Вероятность попадания исходной яркости fj в интервал от 0 до m должна равняться вероятности попадания яркости преобразованного изображения gk в интервал от 0 до n для всех m ≤ J, n ≤ K: m
n
j=0
j=0
∑ P{fj} = ∑ Р{gk}. В случае конкретного изображения распределение в левой части заменяют на гистограмму H(fj), поэтому Цифровая обработка аэрокосмических изображений. Конспект лекций
-73-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 10. Модели изображений. Преобразования яркости и конраста. m
∑ H{fj} = j=0
n
∑ H{gk}. j=0
Решая это уравнение, можно найти требуемое преобразование gk = T{fj}. Решение записывается в виде таблицы, в которой для каждого входного уровня fj указывается соответствующий выходной уровень gk. Контрольные вопросы и задания
1. В чем разница между каузальными, полукаузальными и некаузальными моделями изображений? 2. Напишите выражение для плотности вероятности равномерного, в интервале [A, B], закона распределения. 3. Непрерывная случайная величина f распределена по равномерному закону распределения в интервале [A, B]. Чему равны математическое ожидание, дисперсия и медианное значение f? 4. Составьте программу моделирования случайного поля по двух- и трехточечной авторегрессионной модели. 5. Что такое растяжка, нормализация и эквализация гистограммы? 6. Какие статистические характеристики изображения описывают его яркость и контраст?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-74-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 11 Линейная пространственно-инвариантная фильтрация План лекции
1. 2. 3. 4. 5.
Модель искаженного изображения. Линейные пространственно-инвариантные фильтры. Двумерное преобразование Фурье. Глобальная фильтрация. Инверсная фильтрация.
Реальные изображения наряду с полезной информацией содержат различные помехи. Источниками помех являются собственные шумы фотоприемных устройств, зернистость фотоматериалов, шумы каналов связи. Наконец, возможны геометрические и радиометрические искажения, изображение может быть расфокусировано (но расфокусировка не типична для спутниковых изображений с разрешением 10 м и более); для изображений с разрешением 1 м и менее турбулентность атмосферы приводит к размыванию мелких деталей при коротких экспозициях. Модель искаженного помехами непрерывного изображения имеет вид: f(x, y) = m(x, y)·Qs(x, y) + n(x, y), где f(x, y) − искаженное изображение, m(x, y) − мультипликативная помеха, модулирующая изображение по яркости, s(x, y) − исходное изображение; Q − функционал, описывающий геометрические и радиометрические искажения, а также расфокусировку; n(x, y) − аддитивная помеха, накладывающаяся на изображение. Модуляция спутникового изображения по яркости может происходить из-за того, что атмосфера над различными точками Земли имеет различную прозрачность, восходящее излучение от этих точек проходит различный путь в атмосфере. При реставрации изображений необходимо восстановить исходное изображение. Выше рассмотрены методы устранения геометрических, радиометрических искажений, атмосферной коррекции, восстановления пропущенных пикселов. Будем считать, что эти искажения отсутствуют, m(x, y) = 1. Таким образом, f(x, y) = Qs(x, y) + n(x, y). Результат реставрации ŝ(x, y) = g(x, y) запишем как следствие воздействия на f(x, y) некоторого оператора: g(x, y) = Tf(x, y). Оператор T (системный оператор) указывает на правило, по которому «входному сигналу» f(x, y) ставится в соответствие «выходной сигнал»
Цифровая обработка аэрокосмических изображений. Конспект лекций
-75-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 11. Линейная пространственно-инвариантная фильтрация
g(x, y). Для того чтобы модель была полной, необходимо также указать области допустимых значений f(x, y) и g(x, y). При реставрации применяют оператор Т, минимизирующей расстояние между g(x, y) и s(x, y) при заданных статистических характеристиках случайных полей s(x, y), n(x, y) и известном F. В качестве критерия близости g(x, y) и s(x, y) часто используют критерий минимума среднеквадратической ошибки: min <[g(x, y) − s(x, y)]2>. В задачах улучшения изображений обычно считается, что n(x, y) = 0, функцией оператора Т является сглаживание резких перепадов яркости, подчеркивание или выделения контуров и т. п. Мы будем рассматривать пространственно-инвариантные операторы, выходная реакция которых не зависит от изменения начала отсчета по x и по y и от ориентации объектов на изображении. Первое условие означает, что оператор переводит однородное случайное поле в однородное. Второе условие означает, что оператор переводит изотропное поле в изотропное. Отметим, что свойства пространственной инвариантности выполняются строго, если области допустимых значений координат x, y попадают в интервал (−∞, ∞). Реальные изображения имеют конечные размеры, A ≤ x ≤ B; C ≤ y ≤ D, условие пространственной инвариантности выполняется приближенно. Оператор называется линейным, если для него справедлив принцип суперпозиции – реакция на сумму сигналов f1(x, y) и f2(x, y) равна сумме реакций на каждое из воздействий в отдельности: T [f1(x, y) + f2(x, y)] = T f1(x, y) + Т f2(x, y); для любого произвольного числа α справедливо T αf(x, y) = α Т f(x, y). Свойства линейности выполняются строго, если области допустимых значений яркости f, g попадают в интервал (−∞, ∞). При цифровой обработке яркость − величина вещественная, неотрицательная и ограниченная, обычно 0 ≤ f, g ≤ 255. Если каждому g(x, y) отвечает единственное f(x, y), то оператор Т может быть представлен в виде g(x, y) = ∫∫ f(x', y') h (x, y, x', y')dx'dy'.
(11.1)
Здесь интегрирование ведется по всей области, где определены x, y. Выражение (11.1), где интегрирование ведется по всей области определения x и y, характеризует преобразование всего изображения целиком − глобальную фильтрацию. Можно обрабатывать изображение по частям, в этом случае осуществляется локальная фильтрация.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-76-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 11. Линейная пространственно-инвариантная фильтрация
Ядро преобразования (11.1) h(x, y, x', y') в оптике именуют функцией рассеяния точки (ФРТ). Это изображение точечного источника на выходе оптической системы, которое уже является не точкой, а некоторым пятном. В соответствии с (10.1), все точки изображения f(x', y') превращаются в пятна, происходит суммирование (интегрирование) всех пятен. Не следует думать, что эта процедура обязательно приводит к расфокусировке изображения, наоборот, можно подобрать такую ФРТ, которая позволит сфокусировать расфокусированное изображение. Для того чтобы для ФРТ выполнялось условие пространственной инвариантности, т. е. чтобы она не изменялась при изменении начала отсчета по x и по y, например, на величину х0 и величину у0, ФРТ должна иметь вид: h(x, y, x', y') = h(x−x', y−y'), т. к. выполняется: h(x, y, x', y') = h(x+x0, y+y0, x'+x0, y'+y0). Кроме того, ФРТ должна обладать осевой симметрией. При обработке растровых изображений на прямоугольной сетке проще всего реализовать ФРТ конечных размеров в виде прямоугольной матрицы форматом NxN, например, 3х3: a11 a12 a11 a12 a22 a12 a11 a12 a11 Только три элемента матрицы размером 3х3 независимы, в этом случае матрица инвариантна относительно поворотов, кратных 90°. Опыт обработки изображений показывает, что отсутствие более строгой осевой симметрии ФРТ слабо сказывается на результатах. Иногда используют 8-угольные матрицы, инвариантные относительно поворотов на 45°. Пусть f(x, y) – функция двух переменных, определенная на интервалах (−∞ < x < ∞), (−∞ < y < ∞) и удовлетворяющая условию абсолютной интегрируемости: ∞
∫∫ |f(x, y)| dxdy < ∞.
−∞
Тогда существует интеграл Фурье, это означает следующее: ∞
F(u, v) =
∫∫ f(x, y) exp[−2π i(ux+vy)] dxdy,
(11.2)
−∞
∞
f(x, y) =
∫∫ F(u, v) exp[2π i(ux+vy)] du dv
(11.2')
−∞
Цифровая обработка аэрокосмических изображений. Конспект лекций
-77-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 11. Линейная пространственно-инвариантная фильтрация
Комплексная экспонента является линейной комбинацией синуса и косинуса, i – мнимая единица: exp[i2π (ux+vy)] = cos [2π (ux+vy)] + i sin [2π (ux+vy)]. Выражение (11.2) носит название прямого, а (11.2') – обратного преобразования Фурье. Переменные x и y – это координаты; u и v называются пространственными частотами; функция F(u, v) называется спектром пространственных частот, или спектром. Используя преобразование Фурье, мы переходим от координатной плоскости (x, y) к частотной плоскости (u, v). Преобразование Фурье линейное, так как интеграл – линейная функция. Переход в частотную плоскость имеет смысл, так как некоторые свойства у спектра проще, чем у функции f(x, y), описывающей распределение яркости в координатной плоскости. Пусть, например, требуется найти результат глобального линейного преобразования некоторого изображения ∞
∫∫ f(x', y') h ( x– x', y – y')dx'dy'.
g(x, y) =
(11.3)
−∞
В координатной плоскости для этого требуется вычислить интеграл типа свертки (11.3), что часто бывает делом достаточно сложным. Если ввести частотный коэффициент передачи К(u, v), который на практике для ФРТ всегда существует и который связан парой преобразований Фурье с ФРТ: ∞
К(u, v) =
∫∫ h (x, y) exp[−2π i(ux+vy)] dxdy,
(11.4)
−∞ ∞
h (x, y) =
∫∫ К(u, v) exp[2π i(ux+vy)] du dv,
(11.4')
−∞
то в плоскости пространственных частот (11.3) сведется к перемножению функций F (u, v) и К(u, v): G(u, v) = F (u, v) · К(u, v),
(11.5)
где G(u, v) – спектр после линейного преобразования. Спектр F (u, v) от вещественной функции f(x, y), вообще говоря, является комплексной функцией. Для пространственно-инвариантных ФРТ частотный коэффициент передачи К(u, v) всегда вещественный и инвариантный относительно поворотов вокруг начала координат. Реальное растровое изображение fn, m имеет конечные размеры: A ≤ x ≤ B, C ≤ y ≤ D и состоит из отдельных пикселов, расположенных с некоторым шагом в узлах прямоугольной сетки. В этом случае для перехода в частотную плоскость применяется двойное дискретное преобразование Фурье (ДДПФ):
Цифровая обработка аэрокосмических изображений. Конспект лекций
-78-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 11. Линейная пространственно-инвариантная фильтрация
Fp, q = 1/NM
N −1 M −1
∑∑
fn, m exp[– 2πi( pn/N + qm/M)],
(11.6)
n=0m=0
fn, m =
N −1 M −1
∑ ∑ Fp, q exp[2πi( pn/N + qm/M)].
(11.6')
n=0m=0
Здесь N – число пикселов по x; M – число пикселов по y. Величины Fp, q называются коэффициентами ДДПФ, которые вычисляют следующим образом: вначале в (11.6) производится суммирование по n (по строкам), потом полученный числовой массив суммируется по m (по столбцам), можно и наоборот. Разработан также алгоритм, сводящий двумерное дискретное преобразование Фурье к одномерному. Коэффициент F0 – это среднее значение яркости изображения. Общее число комплексных коэффициентов Fp, q равно N·M, однако часть из них связана между собой. Если N – четное число, например, то FN–p, q = F*p, q, звездочка означает комплексную сопряженность, так что число независимых коэффициентов равно N ·M/4. Для вычисления ДДПФ, согласно (11.6), необходимо выполнить N2·M2 операций с комплексными числами, что требует значительных затрат времени. Если N = M = 512, то общее число операций составляет 5124 ≈ 6, 8·1010. С целью ускорения вычислений разработаны алгоритмы быстрого преобразования Фурье (БПФ), имеющие логарифмическую сложность. При их применении общее число операций оценивается как N logN · M logM, что для приведенного примера составляет 2·107 операций. Таким образом, вычисления ускоряются более чем в 3 000 раз. При линейной фильтрации изображений в частотной плоскости требуется умножить спектр пространственных частот на частотный коэффициент передачи согласно (11.5) и выполнить два двумерных преобразования Фурье с использованием алгоритма БПФ – прямое и обратное. Преобразование Фурье осуществляется от всего изображения целиком, спектр F(u, v) хранит информацию обо всем изображении целиком, поэтому мы говорим о глобальной фильтрации. В зависимости от выбора коэффициента передачи К(u, v), можно выделять изображение на фоне помех, улучшать и ухудшать резкость изображения, выделять контуры объектов на изображении и т. п. Качество обработки при этом несколько лучше, чем при локальной линейной фильтрации. Типичной задачей глобальной фильтрации, не характерной, впрочем, для цифровой обработки космических изображений земной поверхности, является восстановление расфокусированных изображений. Запишем спектр такого изображения в виде F1(u, v) = F (u, v) · К(u, v),
Цифровая обработка аэрокосмических изображений. Конспект лекций
-79-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 11. Линейная пространственно-инвариантная фильтрация
где F(u, v) – спектр исходного изображения; К(u, v) – коэффициент передачи оптической системы, отвечающий ФРТ. Очевидно, что для того чтобы определить F(u, v) по известным F1(u, v) и К(u, v), необходимо умножить F1(u, v) на К1(u, v)=1/К(u, v). Эта процедура носит название инверсной фильтрации. Задача инверсной фильтрации относится к числу обратных некорректных задач математической физики. Во-первых, решение может не существовать. Во-вторых, если решение существует, то может быть не единственным. Заметим, что функция К(u, v) в некоторых точках может быть равна нулю, тогда решение обращается в бесконечность. В-третьих, решение может быть неустойчивым, т. е. небольшие вариации исходных данных могут привести к существенным изменениям решения. Выходом из положения является регуляризация решения. Коэффициент передачи записывается в форме К1(u, v) =1/[К (u, v) + α γ(u, v)]. Здесь γ(u, v) – стабилизирующая функция, например, γ(u, v) = u2 + v2; α – параметр регуляризации. Подбором α обычно удается достаточно качественно восстановить расфокусированное изображение. Контрольные вопросы и задания
1. Что такое линейный оператор? 2. Что такое функция рассеяния точки? 3. Напишите выражение для прямого и обратного дискретного преобразования Фурье. 4. Сколько операций приблизительно потребуется для выполнения дискретного и выполнения быстрого преобразования Фурье от изображения размером 1 024х2 048 пикселов? 5. Что такое инверсная фильтрация? 6. При каких условиях обратная задача считается корректно поставленной?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-80-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 12 Фильтрация в пространственной области План лекции
1. Линейные сглаживающие фильтры. 2. Линейные фильтры для выделения контуров. 3. Нелинейные фильтры. На практике глобальная фильтрация применяется редко. Чаще используют локальную фильтрацию, когда интегрирование и усреднение проводится не по всей области определения x и y, а по сравнительно небольшой окрестности каждой точки изображения. Функция рассеяния точки при этом имеет ограниченные размеры. Достоинством такого подхода является хорошее быстродействие. При обработке растровых изображений, которые состоят из отдельных пикселов, интегрирование заменяют суммированием. Линейное преобразование в случае локальной фильтрации принимает вид gij= ∑ akl fi+k,j+l, D
суммирование ведется по некоторой окрестности D точки (i, j); akl − значения ФРТ в этой окрестности. Яркости пикселов f в этой точке и в её окрестности умножаются на коэффициенты akl, преобразованная яркость (i, j)-го пиксела есть сумма этих произведений. Обычно набор коэффициентов akl представляют в виде прямоугольной матрицы (маски), например размерности 3х3: a11 a12 a13 H = a21 a22 a21
a31 a32 a33 Элементы матрицы обычно удовлетворяют условию пространственной инвариантности, поэтому a11 = a13 = a31 = a33, a12 = a21 = a23 = a32. Фильтрация осуществляется перемещением слева направо (или сверху вниз) маски на один пиксел. При каждом положении апертуры производятся упомянутые выше операции, а именно перемножение весовых множителей akl с соответствующими значениями яркостей исходного изображения и суммированием произведений. Полученное значение присваивается центральному (i,j)-му пикселу. Маска содержит нечетное число строк и столбцов, чтобы центральный элемент определялся однозначно.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-81-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
Рассмотрим некоторые фильтры, сглаживающие шум. Пусть маска размером 3х3 имеет вид
H1 =
1
1
1
1
2
1
1
1
1
Тогда яркость (i,j)-го пиксела после фильтрации определится как gi,j = (fi-1,j−1 + fi−1,j + fi,j–1 + fi,j−1 + 2 fi,j + fi,j+1 + fi+1,j−1 + fi+1,j + fi+1,j+1). Хотя коэффициенты akl можно выбрать из среднеквадратического или иного условия близости не искаженного шумом si,j и преобразованного gi,j изображений, обычно их задают эвристически. Разумно потребовать, чтобы не происходило изменения средней яркости обработанного изображения. Для этого gi,j следует пронормировать, поделив на коэффициент K, равный сумме элементов матрицы akl. В нашем случае коэффициент K=10. Приведем еще некоторые матрицы шумоподавляющих фильтров и их нормирующие коэффициенты: H2 K = 9
H3 K = 16
H4 K = 14
1
1
1
1
2
1
2
1
2
1
1
1
2
4
2
1
2
1
1
1
1
1
2
1
2
1
2
Наряду с масками 3х3 используются маски большей размерности, например 5х5, 7х7 и т. п. В отличие от фильтра H2, у фильтров H1, H3, H4 весовые коэффициенты на пересечении главных диагоналей матрицы больше, чем коэффициенты, стоящие на периферии. Фильтры H1, H3, H4 дают более плавное изменение яркости по изображению, чем H2. Однако часто в пределах апертуры значения полезного изображения все же изменяются заметным образом. Это бывает, в частности, когда в пределы маски попадают контуры. С физической точки зрения, все H1−H4 являются фильтрами нижних частот (усредняющими фильтрами), подавляющими высокочастотные гармоники и шума, и полезного изображения. Это приводит не только к ослаблению шума, но и к размыванию контуров на изображении. Пусть, например, на изображении имеется перепад яркости от 100 к 200, изображение обрабатывается маской Н2.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-82-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
а
б
в
г
Рис. 12.1 Если маска находится в положении а, когда в её пределы попадают только значения яркости f = 100, то gi,j = 1/9 ·9·100 = 100. Если маска находится в положении г, то gi,j = 1/9·9·200 = 200. Таким образом, в этих случаях изменения яркости не происходит. Если же маска занимает положение б, то gi,j = 1/9·(6·100 + 3·200) = 133. Для положения маски в имеем: gi,j = 1/9·(3·100 + 6·200) = 167. Следовательно, резкий профиль перепада яркости (100-200) стал сглаженным: (100-133-166-200). Рассмотренная выше процедура фильтрации характеризовалась тем, что выходные значения фильтра g определялись только через входные значения фильтра f. Такие фильтры называются нерекурсивными. Фильтры, в которых выходные значения g определяются не только через входные значения f, но и через соответствующие выходные значения, называются рекурсивными. Линейные фильтры могут быть предназначены не для подавления шума, а для подчеркивания перепадов яркости и контуров. Выделение вертикальных перепадов осуществляется дифференцированием по строкам, горизонтальных − по столбцам. Дифференцирование производится в цифровой форме: gi,k = ∆fi,k/∆ x= fi,k − fi,k−1 (по строкам); gi,k = ∆fi,k/∆y = fi,k − fi−1,k (по столбцам). Здесь ∆x = 1 − приращение вдоль строки, равное 1 пикселу; ∆y = 1 − приращение вдоль столбца, также равное 1 пикселу. Выделение перепадов по диагонали можно получить, вычисляя разности уровней диагональных пар элементов. Для выделения перепадов используются следующие наборы весовых множителей, реализующих двумерное дифференцирование:
H5 север
H6 северо-восток H7 восток
H8 юго-восток
Цифровая обработка аэрокосмических изображений. Конспект лекций
-83-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
1
1
1
1
1
−1 1
1
1
1
1
1
1 −2 1
−1 −2 1
−1 −2 1
1 −2 1
−1 −1 −1
−1 −1 1
−1 1
−1 −1 −1
H9 юг
H10 юго-запад
−1 −1 −1
1 −1 −1
1
1 −2 1
1 −2 −1
1 −2 −1
1 −2 −1
1
1
1
1 −1
1 −1 −1
1
1
1
1
1
H11 запад
1 −1
H12 северо-запад
1
1
1
Название географических направлений говорит о направлении склона перепада, вызывающего максимальный отклик фильтра. Эти фильтры не удовлетворяют условию пространственной инвариантности. Сумма весовых множителей масок равна нулю, поэтому на участках изображения с постоянной яркостью эти фильтры дают нулевой отклик. Горизонтальный перепад можно также выделить путем вычисления приращения разности яркостей пикселов вдоль строки, что равноценно вычислению второй производной по направлению (оператор Лапласа): gi,k = ∆2fi,k/∆x2 = [ fi,k − fi,k-1] − [ fi,k+1 −fi,k ] = − fi,k-+ 2 fi,k 1 − fi,k+1. Это отвечает одномерной маске H = | −1 2 −1|, сумма элементов равна нулю. Таким же образом можно искать перепады по вертикали и по диагонали. Для выделения перепадов без учета их ориентации используются двумерные операторы Лапласа: H13
H14
H15
0 −1 0
−1 −1 −1
1 −2 −1
−1 4 −1
−1 8 −1
−2 4 −2
0 −1 0
−1 −1 −1
1 −2 −1
Операторы Лапласа реагируют на перепады яркости в виде ступенчатого перепада и на «крышеобразный» перепад. Они также выделяет изолированные точки, тонкие линии, их концы и острые углы объектов. Линия подчеркивается в 2 раза ярче, чем ступенчатый перепад, конец линии в 3 раза ярче, а точка − в 4 раза. Оператор Лапласа выделяет в основном неструктурированные элементы, поэтому он чувствителен к шуму. Хотя подчеркивание перепадов с помощью оператора Лапласа происходит без учета их ориентации, оператор Лапласа не инвариантен к ориентации перепадов: например, отклик оператора на наклонный перепад в диагональном направлении почти вдвое больше, чем в горизонтальном и вертикальном. С физической точки зрения, фильтры H5−H15 являются фильтрами верхних частот, они выделяют высокочастотные составляющие полезного
Цифровая обработка аэрокосмических изображений. Конспект лекций
-84-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
изображения, ответственные за перепады яркости и контуры, и подавляют «постоянную составляющую». Однако при их использовании уровень шума на изображении возрастает. Фильтры для выделения перепадов и границ, как и фильтры H1−H4 для подавления шума, могут быть рекурсивными. Изображение с подчеркнутыми границами (контурами) субъективно воспринимается лучше, чем оригинал. При использовании оператора Лапласа для этих целей применяют три типовых набора весовых множителей: H16
H17
H18
0 −1 0
−1 −1 −1
1 −2 −1
−1 5 −1
−1 9 −1
−2 5 −2
0 −1 0
−1 −1 −1
1 −2 −1
H16−H18 отличаются от фильтров H13−H15 тем, что к центральному элементу матрицы прибавлена 1, т. е. при фильтрации исходное изображение накладывается на контур. Для повышения помехоустойчивости при выделении и наложении контуров, для устранения эффекта размывания контуров при подавлении шума следует переходить к нелинейной обработке. Примером нелинейного фильтра для подавления шума, построенного эвристически, служит медианный фильтр. Метод медианной фильтрации, а также алгоритмы экстремальной фильтрации, использующие значения минимума и максимума текущей окрестности, относятся к так называемым ранговым методам фильтрации. Медианная фильтрация gi,j = Me{fi+k,j+l} нечувствительна как к отрицательным, так и к положительным выбросам. При медианной фильтрации (i, j)-му пикселу присваивается медианное значение яркости, т. е. такое значение, частота которого равна 0,5. Пусть, например, используется маска 3х3, в пределы которой наряду с более или менее равномерным фоном попал шумовой выброс, этот выброс пришелся на центральный элемент маски:
68 79 74 63 212 83 66 71 89 Вариационный ряд имеет вид 63, 66, 68, 71, 74, 79, 83, 89, 212. В данном случае медианное значение − пятое по счету (выделено), так как всего чисел в ряду 9. При медианной фильтрации значение 212, искаженное шумовым выбросом, заменяется на 74, выброс на изображении полностью подавлен. Медианный фильтр обладает некоторыми чертами линейного фильтра: Me{αfij} = α Me{fij}, Me{fij + c0} = c0 + Me{fij}, Цифровая обработка аэрокосмических изображений. Конспект лекций
-85-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
где α и с0 – постоянные величины. Однако принцип суперпозиции не выполняется: Me{fij +sij} ≠ Me{fij}+ + Me{sij}, т. е. это нелинейный фильтр. Функция рассеяния точки для медианного фильтра есть нуль. При размерах окна (2k + 1)·(2k + 1) происходит полное подавление помех, состоящих не более чем из 2(k2 + k) пикселов, а также тех, которые пересекаются не более чем с k строками или k столбцами. При этом не изменяется яркость в точках фона. Разумеется, при медианной фильтрации может происходить искажение объекта на изображении, но только на границе или вблизи нее, если размеры объекта больше размеров маски. Фильтр обладает высокой эффективностью при подавлении импульсных помех, однако это качество достигается подбором размеров маски, когда известны минимальные размеры объектов и максимальные размеры искаженных помехой локальных областей. На случайный шум с нормальным законом распределения такой фильтр воздействует слабее, чем линейный усредняющий фильтр (приблизительно на 60 % менее эффективно). Помимо ранговых алгоритмов фильтрации, при нелинейной обработке изображений находят применение пороговые алгоритмы, наиболее известен из которых σ-фильтр. Идея построения σ-фильтра основана на том, что закон распределения шума можно приближенно считать гауссовским. Часто шум обусловлен многими независимыми или слабо зависимыми факторами. Известно, например, что сумма небольшого числа (5−6) независимых равномерно распределенных слагаемых достаточно хорошо подчиняется гауссовскому закону распределения. Свойство нормализации закона распределения суммы независимых случайных величин (при условии равномерно малого вклада слагаемых в сумму) следует из центральной предельной теоремы теории вероятностей. Предположение о гауссовском характере закона распределения суммы выполняется тем лучше, чем большее число факторов ее обуславливают. Для гауссовского распределения 95,5 % его значений лежит в пределах отклонений от среднего значения, меньших 2σ. В соответствии с алгоритмом σ-фильтра оценивается среднее значение и среднеквадратическое отклонение яркостей в пределах достаточно большой маски; пикселы, имеющие яркость выше этого допуска, исключаются. Конечно, это нелинейная операция. Вместо исключенных пикселов подставляется среднее по окрестности, возможна интерполяция с использованием схемы авторегрессии. Выбранный допуск не настолько велик, чтобы исказить пикселы, принадлежащие крутым кромкам и мелким деталям и слабо искаженные шумом. Наиболее успешно σ-фильтр справляется с импульсными помехами в виде точек небольшой площади. Вероятность того, что такая помеха попадет на контур, обычно невелика, при использовании σ-фильтра искажения контуров практически не происходит. В этом его преимущества по сравнению с линейным и медиан Цифровая обработка аэрокосмических изображений. Конспект лекций
-86-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
ным фильтрами. Однако преимущества σ-фильтра заметнее всего проявляются, когда распределение шума на изображении близко к нормальному. Сигмафильтр может быть реализован в рекурсивной форме. Нелинейные фильтры, как и линейные, могут применяться для выделения контуров и перепадов яркости. Отличие нелинейных алгоритмов состоит в том, что они используют нелинейные операторы дискретного дифференцирования. В фильтре Робертса используется перемещающаяся по изображению маска 2х2: fi,j
fi,j+і
fi+1,j
fi+1,j+1
дифференцирование производится с помощью одного из выражений: gi,j = {(fi,j − fi+1,j+1)2 + (fi,j+1 − fi+1,j)2}1/2, gi,j = | fi,j − fi+1,j+1| + | fi,j − fi+1,j+1| . В фильтре Собела используется окно 3х3: fi−1,j−1
fi−1,j
fi−1,j+1
fi,j−1
fi,j
fi,j+1
fi+1,j−1
fi+1,j
fi+1,j+1
Центральному (i,j)-му пикселу вместо fi,j присваивается значение яркости где
gi,j = (X2 + Y2)1/2 либо gi,j = |X| + |Y|, X = (fi−1,j−1 + 2fi−1,j + fi−1,j+1) − (fi+1,j−1 + 2fi+1,j + fi+1,j+1);
Y = (fi−1,j−1 + 2fi,j−1 + fi+1,j−1) − (fi−1,j+1 + 2fi,j+1 + fi+1,j+1). В отличие от фильтра Лапласа, при использовании фильтров Робертса и Собела контуры объектов и помехи в виде точек и линий имеют одинаковую яркость.
Контрольные вопросы и задания
1. На фоне изображения с постоянной яркостью f = 120 наблюдается точка размером в 1 пиксел с яркостью 10 и в стороне линия шириной в
Цифровая обработка аэрокосмических изображений. Конспект лекций
-87-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 12. Фильтрация в пространственной области
1 пиксел с яркостью 200. Подсчитайте, что произойдет с этими объектами, если к изображению применить фильтр Н1. 2. Как изменяются коэффициенты фильтра Н4 в рекурсивном варианте при перемещении маски по изображению? 3. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция фильтров Н5, Н7, Н9 на этот перепад? Отрицательным значениям яркости присваивать 0. 4. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция фильтра Лапласа Н14 на этот перепад? Как реагирует оператор Лапласа на точку размером в 1 пиксел с яркостью 10 на фоне изображения с яркостью 100 и линию шириной 1 пиксел с яркостью 150? Рассмотрите варианты, когда отрицательным значениям яркости присваивается 0 и положительное значение по модулю. 5. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция фильтра Лапласа Н16 на этот перепад? Как реагирует оператор Лапласа на точку размером в 1 пиксел с яркостью 10 на фоне изображения с яркостью 100 и линию шириной 1 пиксел с яркостью 150? Рассмотрите варианты, когда отрицательным значениям яркости присваивается 0 и положительное значение по модулю. 6. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция медианного фильтра на этот перепад? Как реагирует медианный фильтр на точку размером в 1 пиксел с яркостью 10 на фоне изображения с яркостью 100 и линию шириной 1 пиксел с яркостью 150? 7. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция каждого из двух вариантов фильтра Робертса на этот перепад? 8. На изображении наблюдается перепад яркости от 100 вверху к 200 внизу. Какова реакция каждого из двух вариантов фильтра Собела на этот перепад?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-88-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 13 Сегментация изображений План лекции
1. 2. 3. 4.
Способы сегментации. Расчет порога при пороговой сегментации. Сегментация путем наращивания областей. Сегментация путем выделения границ.
Одним из самых распространенных методов выделения объектов на космических изображениях Земли является сегментация. Этот метод носит черты и детерминированного, и статистического подходов. Под сегментацией, в широком смысле, понимают преобразование полутоновых или цветных изображений в изображения, имеющие меньшее число тонов или цветов, чем исходные. В узком смысле сегментацией называют преобразование полутонового изображения в двухуровневое (бинарное), содержащее всего два уровня яркости − минимальный (обычно это 0) и максимальный (обычно 255). При этом объект и фон разделены, легко определить число объектов, характеристики их местоположения (координаты, поворот выделенной оси объекта относительно координатных осей и т. п.), геометрические характеристики (например, площадь каждого объекта, периметр, средний, минимальный, максимальный размеры) и, наконец, идентифицировать объект − указать, что это такое. Целью сегментации является выделение областей (сегментов), однородных в каком-то определенном смысле. Однородность является признаком принадлежности области к определенному классу. Очень часто сегментация используется для выделения областей, близких по одинакового тону и/или цвету. Вместе с тем сегментация часто используется для выделения областей, однородных в смысле некоторого более сложного свойства (например типа текстуры). Такие области принято называть кластерами. Текстурой в теории обработки изображений называют структуру, которая характеризуется наличием повторяющегося «рисунка», состоящего из некоторых однородных участков приблизительно одинаковых размеров. Примером текстурного изображения являются фотоснимок кирпичной стены, аэрофотоснимок городских кварталов, космическое изображение участка летней тундры с многочисленными круглыми озерами. Текстурной матрицей принято называть матрицу совместной встречаемости (вероятности) пар уровней серого тона у соседних пикселов. Пусть, например, значения элементов изображения fij представлены N градациями (обычно N = 256). Тогда текстурная матрица − матрица T размером NхN, (k,l)-й элемент которой есть вероятность (относительная частота) того, что соседние пары пикселов имеют значения fk и fl. Так как tkl = tlk, то текстурная
Цифровая обработка аэрокосмических изображений. Конспект лекций
-89-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 13. Сегментация изображений
матрица симметрична. В качестве характеристик текстуры могут рассматриваться различные скалярные характеристики текстурной матрицы. Применяются три основных способа сегментации изображений: пороговая, путем наращивания областей, путем выделения границ. Пороговая сегментация состоит в объединении близких по характеристикам областей изображения в небольшое число сегментов. Если яркость превышает порог, то область относят к одному сегменту, если она ниже порога – то к другому. Простейший случай – разбиение на два сегмента (бинаризация). Пороговая сегментация может выполняться на основе априорно заданных порогов. Другой, более адекватный, способ заключается в том, что пороги выбираются как границы мод гистограммы изображения. Рассмотрим этот способ на примере бинаризации полутонового изображения, у которого гистограмма содержит две моды. Этот случай типичен для задачи выделения площадей, покрытых снегом и льдом на фоне леса и оттаявшей земли по результатам дистанционных исследований (рис. 13.1, а – исходное изображение).
Рис. 13.1. Пороговая сегментация
Гистограмма изображения (рис. 13.1, б) имеет две моды − одна отвечает более темному фону, вторая − объектам с большей яркостью, т. е. снегу/льду, между модами видна зона минимума. Моды перекрываются слабо, порог выбран посередине зоны между максимумами мод. Бинаризованное изображение показано на рисунке 13.1, в. Сложнее провести сегментацию, когда гистограммы фона и объекта имеют сильно перекрывающиеся «хвосты» и возможно, что при этом часть пикселов объекта может быть отнесена к фону, а часть пикселов фона отнесена к объекту. Таким образом, относительно яркости текущего пиксела f может быть принято два решения: d = 1 или d = 2, соответствующих отнесению f
Цифровая обработка аэрокосмических изображений. Конспект лекций
-90-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 13. Сегментация изображений
к первой либо ко второй области. Пусть d = 1 отвечает f < b, d = 2 отвечает f > b. Здесь b − порог. Ищем решающее правило d, которое минимизировало бы функцию = c11 p11 + c12 p12 + c21 p21 + c22 p22,
(13.1)
где рij − вероятность принятия решения j, если на самом деле f принадлежит Ui. Для учета возможных ошибок введена функция потерь c(i,d), представляющая собой количественную меру потерь, возникающих при принятии решения d, если на самом деле f принадлежит классу Ui. Функцию c(i,d) иногда также называют функцией (или матрицей) штрафов (штрафной функцией) или риска. В нашем случае двух классов функция потерь принимает 4 значения: c11 отвечает случаю, когда принято решение, что f принадлежит классу U1, если f действительно принадлежит этому классу; c22 отвечает случаю, когда принято решение, что f принадлежит классу U2, если f действительно принадлежит этому классу; c12 отвечает ошибочному решению отнесения первого класса ко второму; c21 − отнесению второго класса к первому. Пусть p − априорная вероятность появления первого класса, тогда вероятность появления второго класса будет 1− p. Плотность вероятности распределения яркости пикселов первого класса w1(f), второго − w2(f). Плотности вероятности w1(f) и w2(f) считаются известными или могут быть найдены из гистограммы. Средние суммарные потери записываются в виде b
∞
b
∞
0
0
0
0
= c11p ∫ w1(f) d f + c12 p ∫ w1(f)df + c21(1 − p) ∫ w2(f)df +c22(1 − p) ∫ w2(f)df. Величины cij, i,j = 1, 2,…, p, считаются известными. Неизвестна граница b (порог) в пространстве признаков U, разделяющая классы U1 и U2. Оптимальное в смысле минимума суммарных средних потерь решающее правило определяется значением порога b, при котором Q = имеет минимум. Это значение можно найти из условия дQ/дb = 0, т. е. дQ/дb = (c11 − c12)pw1(b) + (c11 + c12)p + (c21 − c22)(1 − p)w2(b) + (c21 + c22)(1 − p) = 0. Отсюда получаем уравнение для определения порога: Λ(b) = Λc = w2(b)/w1(b) = p(c11 − c12)/(1 − p )(c22 − c21). Решив это уравнение, получим оптимальное в смысле минимума средних потерь значение граничного порога b. Величина Λ(f) = w2(f)/w1(f) называется отношением правдоподобия, а величина Λc = w2(b)/w1(b) − критическим значением отношения правдоподобия. Критическое значение определяется из соотношения Λc = p(c11 − c12)/(1 − p )(c22 − c21).
Цифровая обработка аэрокосмических изображений. Конспект лекций
-91-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 13. Сегментация изображений
Отношение правдоподобия сравнивается с Λс, решающее правило, соответствующее минимуму средних потерь, имеет вид ⎧Λ ( f ) > Λ c => d = 2 ⎪ ⎨Λ ( f ) > Λ c => d = 1 ⎪Λ ( f ) > Λ => граница c ⎩
или
⎧ f > b => d = 2 ⎪ ⎨ f > b => d = 1 ⎪ f > b => граница. ⎩
В случае, когда число классов больше двух, исходное множество U последовательным делением на два подмножества разбивают на необходимое число классов. Сначала выделяют два подмножества первого уровня U1 и U2: U1UU2 =U, U1∩U2 = ∅. Затем U1 и U2 также разбивают на два подмножества второго уровня U11, U12, U21 и U22: U11UU12 = U1, U11∩U12 = ∅, U21UU22 = U2, U21∩U22 = ∅ и т. д. Процесс принятия решения при этом также сводится к последовательному отнесению f к одному из двух классов текущего уровня, т.е. реализуется метод последовательных дихотомий. В способе сегментация путем наращивания областей выделяются однородные области. Рассмотрим сегментацию путем наращивания областей с использованием критерия однородности по величине вектора яркости. Схема алгоритма этого метода предусматривает выбор стартового пиксела и рассмотрение смежных с ним пикселов для проверки близости их значений, например, по евклидову расстоянию. Если значения яркости текущего и какого-либо смежного пикселов оказываются близкими, то эти пикселы зачисляются в одну область. Таким образом, область формируется в результате сращивания отдельных пикселов. На следующем этапе область проверяется на однородность и, если результат проверки оказывается отрицательным, то область разбивается на более мелкие участки. Процесс продолжается до тех пор, пока все выделенные области не выдержат проверку на однородность. Возможны реализации алгоритма, использующие формирование областей как сращиванием отдельных пикселов, так и сращиванием небольших областей. Общая схема проверки области на однородность состоит в следующем. Пусть F(R) − заданная мера однородности области R. Если R12 = R1∩R2, то критерий однородности можно задать, потребовав, чтобы выполнялось условие F(R12) ≤ ε, ε − заданный порог. Различные алгоритмы сегментации прежде всего классифицируются по виду меры F(R). В самых простых случаях в качестве F могут использоваться величины размаха F(R) = max fij − min fkm ( i , j )∈R
( k ,m )∈R
либо выборочные дисперсии
Цифровая обработка аэрокосмических изображений. Конспект лекций
-92-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 13. Сегментация изображений 2
⎛ ⎞ F(R) = 1/n ∑ ⎜ fij − 1/ n ∑ f km ⎟ , ( i , j )∈R ⎝ ( k ,m )∈R ⎠ где n − площадь (число пикселов) области R. При обработке многоспектральных данных дистанционного зондирования в качестве F(R) обычно выбирают расстояние между пикселами в пространстве яркостей в спектральных каналах по метрике Евклида: F(R) = [A1(f1ij − f1km)2 + A2(f2ij − f2km)2 + A3(f3ij − f3km)2 + … ]1/2. Здесь f1ij − яркость (i,j)-го пиксела в первом канале, f2ij − яркость во втором канале и т. д.; Аk − весовые коэффициенты, учитывающие зависимость яркостей объектов в каналах; ниже в примере Аk = 1 для всех k. В более сложных вариантах метода сегментации путем наращивания областей могут быть использованы скалярные характеристики текстурной матрицы. В некоторых случаях одним из показателей однородности может служить, к примеру, след текстурной матрицы. Таким образом, при сегментации путем наращивания областей учитывается структура области, её однородность. Это бывает важно при обработке данных дистанционного зондирования, нередко этот метод дает лучшие результаты, чем другие методы, не учитывающие связность и рассчитанные на отнесение изолированного пиксела к некоторому классу. Ниже приведены примеры алгоритмов наращивания областей. 1. Алгоритм построения связной области по строкам (по столбцам). Построение начинается с произвольно выбранной точки изображения. Применяется для выпуклых областей. 2. Для односвязной (имеющей один контур) невыпуклой области подходит алгоритм наращивания, аналогичный правилу одной руки при обходе лабиринта. 3. Для q-связной (имеющей q взаимно непересекающихся контуров) области также следует использовать алгоритм наращивания получающихся q контуров. 4. При использовании квадратной или прямоугольной сетки используются два вида связности: 4- и 8-связность:
4-связность
8-связность
Сегментация путем выделения границ предусматривает использование оператора градиента. После этого для установления факта, что действительно обнаружена граница, применяется процедура разделения по порогу. Затем Цифровая обработка аэрокосмических изображений. Конспект лекций
-93-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 13. Сегментация изображений
пикселы, идентифицированные как граничные, соединяются в замкнутые кривые, окружающие соответствующие области. В этом методе, как и в других методах сегментации, существенным является критерий однородности области, по характеристике которой и вычисляются значения градиента. Прямые методы сегментации путем выделения границ предусматривают применение к исходному изображению градиентных фильтров (Робертса, Собела, Лапласа и др.). Задача построения границ сегментов на изображении градиента выступает в качестве самостоятельной задачи. Вообще говоря, эта задача довольно сложная и может быть решена лишь в самых простейших случаях. Например, можно выделять локальные максимумы градиента всех строк и столбцов изображения. Для границ простой формы (прямолинейных, дуг окружностей и т. п.) может быть использована процедура аппроксимации исходного изображения градиента какой-либо параметрической функцией. Примером такой задачи является ориентация искусственного спутника Земли по кадру изображения части края земного диска (поиск так называемой инфракрасной вертикали). Контрольные вопросы
1. Как выбрать оптимальный порог при пороговой сегментации? 2. Как производится сегментация путем наращивания областей, что такое 4-связность и 8-связность? 3. Какие находят границы объектов в методе сегментации путем выделения границ? 4. Что такое кластер на изображении? Каковы его признаки?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-94-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 14 Распознавание изображений План лекции
1. Кластерный анализ. Алгоритм ISODATA. 2. Теорема Байеса. 3. Ошибки классификации. Под распознаванием образов (классификацией) понимают процедуру, позволяющую вынести решение о принадлежности данного изображения или его фрагмента к одному из n классов, n > 1. Это решение выносится на основании наличия признаков того или иного класса. Результатом является выделение объектов на изображении, разделенных на классы. Распознавание образов относят к тематической обработке изображений. Перед этим обычно выполняют предварительную обработку − восстанавливают и улучшают исходное изображение. Задачи распознавания изображений решаются на основе общей теории распознавания образов. Распознавание образов − раздел кибернетики, разрабатывающий принципы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций. В общей теории распознавания образов различают два типа задач: задачи таксономии (обучение без учителя) и задачи собственно распознавания (обучение с учителем). В задачах таксономии необходимо разделить предъявляемые объекты по нескольким группам (образам) только на основе их описаний. Задача второго типа возникает при необходимости определить класс, к которому принадлежит описание некоторого объекта. Предполагается, что имеется набор из N объектов, для которых известны образы (классы), к которым они принадлежат. Эту совокупность называют обучающей выборкой, а составляющие её объекты – эталонами. Необходимо, исходя из обучающей выборки, определить класс, к которому принадлежит описание некоторого объекта. Формальное решение задачи распознавания принято записывать в виде решающей функции i = d(x), где i − номер класса, к которому принадлежит описание распознаваемого объекта − вектор признаков x. Кластерный анализ позволяет решать задачи обоих классов. Кластер – это однородный участок изображения, с точки зрения некоторого набора признаков (яркостных, геометрических, текстурных, физических/биофизических). Пикселы, принадлежащие к разным кластерам, отличаются по этим же признакам. К яркостным признакам относятся: а) вектор яркости f = {f1, f2,…, fn}, где f1, f2,…, fn – значения яркости пиксела в первом, втором, n-м спектральном канале, средние значения и/или дисперсия яркости кластера в этих же каналах и т. д.; б) к геометрическим признакам можно отнести площадь S, периметр Р, минимальный и максимальный моменты инерции Imin и Imax области бинар½ ного изображения, фактор формы объекта или кластера: Кф = Р/S . Если Цифровая обработка аэрокосмических изображений. Конспект лекций
-95-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 14. Распознавание изображений ½
½
фигура – круг радиуса R, то Кф = 2π R/(πR2) = 2π = 3,545. У круга величина Кф минимальная. Для квадрата со стороной а Кф = 4, для прямоугольника со сторонами а и 0,1а Кф = 2,2/0,316 = 6,324. Границы фигур можно найти, используя градиентные фильтры (Лапласа, Робертса, Собела и т. п.); в) к текстурным признакам в теории обработки изображений относят структуры, которые характеризуется наличием повторяющегося «рисунка», состоящего из некоторых однородных участков приблизительно одинаковых размеров. Примером текстурного изображения являются фотоснимок кирпичной стены, аэрофотоснимок городских кварталов, космическое изображение участка летней тундры с многочисленными круглыми озерами. Текстурной матрицей принято называть матрицу совместной встречаемости (вероятности) пар уровней серого тона у соседних пикселов. В качестве характеристик текстуры могут рассматриваться различные скалярные характеристики текстурной матрицы. г) к физическим/биофизическим признакам относятся значения снегового индекса NDSI и вегетационного индекса NDVI, учитывающие физические или биофизические свойства снега, льда и зеленой растительности в оптическом диапазоне. Оценка сходства в кластерном анализе основано на понятие расстояния, в выражение для которого может быть включена не только яркость, но и некоторые другие признаки. Если расстояние меньше порога, то элемент изображения относят к соответствующему кластеру. При использовании многоспектральных данных дистанционного зондирования в расстояние входят значения яркости (i, j)-го пиксела изображения в различных каналах. Совокупность этих значений можно записать в виде вектора fij. Кластеры формируются так, чтобы расстояние между отдельными пикселами в каждом кластере было минимальным, а расстояния между пикселами, относящимися к различным кластерам, были как можно больше. Наиболее распространенной мерой подобия (сходства) является евклидово расстояние между векторами fij и fmn. Если {fkij}, {fkmn} – компоненты этих векторов, k – номер спектрального канала, то евклидово расстояние
rE =
∑( f
kij
− f kmn ) 2 .
k
Мерой сходства может быть также косинус угла между векторами, определяемый как отношение скалярного произведения векторов к произведению их норм: (f , f ) cos ϕ = ij mn . fij f mn Косинус максимален при близости направления векторов. Процедура кластеризации может основываться на оптимизации какого-нибудь показателя качества, например, критерий минимума суммы квадратов ошибки:
Цифровая обработка аэрокосмических изображений. Конспект лекций
-96-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 14. Распознавание изображений K
2
ε = ∑ ∑ fk − μk . k =1 f ∈S k
где K – число кластеров; Sk – множество объектов (пикселов), относящихся к k-му кластеру; μk – вектор средних значений для класса k. В задачах таксономии методы определения принадлежности точек одному и тому же кластеру связаны с обучением без учителя. Некоторые из этих методов используют последовательное слияние имеющихся кластеров. Сначала каждая точка данных рассматривается как отдельный эмбриональный кластер. На каждом шаге итерационного процесса выявляются два кластера, содержащие две точки, расположенные друг к другу ближе, чем любые две точки других кластеров. Эти два кластера сливаются. Итерационный процесс заканчивается, когда либо найдено ожидаемое число кластеров, либо расстояние до следующей точки, добавляемой к кластеру, превышает заданный порог. Для управления этими процессами разработаны многочисленные эвристики. Противоположная стратегия разъединяет имеющиеся кластеры вдоль линий «разрежения». Первоначально весь набор точек рассматривается как один большой кластер. На каждом этапе определяется кластер, который можно разбить на два. Итерационный процесс заканчивается, когда либо достигнуто желаемое число кластеров, либо дальнейшее разбиение неперспективно по некоторому предварительно определенному критерию. Однако в большинстве интересующих нас случаев мы знаем, какие точки принадлежат одному классу. В алгоритме ISODATA вначале достаточно произвольно выбираются K векторов в качестве различных стартовых точек, производится кластеризация по минимуму расстояния от этих центров с использованием евклидовой метрики. После этого вычисляются векторы средних значений μk, находится средний квадрат ошибки ε. В следующем цикле производится повторная кластеризация по минимуму расстояния от векторов средних значений μk. При этом число кластеров может измениться, изменятся и векторы средних значений, и величина ε. При следующей итерации производится кластеризация по минимуму расстояния от новых векторов средних значений, вновь вычисляется ε. Процесс продолжается до тех пор, пока величина ε не перестанет заметно уменьшаться. Алгоритм ISODATA предусматривает управление процессом кластеризации: можно изменять число кластеров; количество пар кластеров, которые можно объединить; допустимое число циклов итерации и т. п. Существует несколько подходов, отличающихся структурой описания классов признаков. Детерминированный подход предполагает, что в любой точке пространства признаков с ненулевой априорной вероятностью могут появляться реализации только одного класса. При таком подходе необходимо выделить систему детерминированных свойств, т. е. таких признаков, определение которых не связано с теми или иными принципиально случайными механизмами. Цифровая обработка аэрокосмических изображений. Конспект лекций
-97-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 14. Распознавание изображений
Статистический подход предполагает, что в одной точке пространства признаков с отличной от нуля априорной вероятностью могут появляться реализации, относящиеся к различным классам. Это может быть связано с неизбежными случайными ошибками, а также с тем, что признаки являются принципиально случайными величинами. Последнее характерно для задач дистанционного зондирования. Статистические методы позволяют производить классификацию, которая в среднем является наиболее правильной. Методы статистического распознавания образов обычно используют функции распределения вероятностей, связанные с классами образов. В некоторых случаях форма функций распределения вероятностей считается известной (например нормальной) и по обучающим образам необходимо оценить только отдельные параметры, связанные с этими функциями (такие как математические ожидания, дисперсии, функции корреляции). Метод называется параметрическим. Если форма функций распределения вероятностей не известна, метод является непараметрическим. При статистическом подходе к распознаванию часто используется теорема Байеса − одна из фундаментальных теорем теории вероятностей. Речь идет о случайных событиях, т. е. таких, для которых невозможно заранее предсказать точный результат в каждом конкретном случае. Однако при большом числе реализаций эти события можно характеризовать средними результатами, стабильными и воспроизводимыми. Если могут произойти два события А и В, то следует говорить о трех различных вероятностях: событие А происходит с вероятностью Р(А); событие В происходит с вероятностью Р(В); события А и В происходят одновременно с вероятностью Р(А В); ее называют вероятностью совместного события (совместной вероятностью). Пусть Аi (i = 1, 2, ..., n) и В − случайные события. Вероятность того, что событие Аi произойдет, при условии, что событие В уже произошло (условную вероятность), принято записывать в виде
Р ( Ai/B). ↑↑ Вероятное Известное Эту условную вероятность называют апостериорной. Ее можно вычислить по теореме Байеса:
P(Ai/B) =
P ( Ai B ) = P( B)
P( Ai ) P( B / Ai ) , ∑ P( Ai ) P( B / Ai )
(14.1)
поскольку Р(В) = ∑ P(В/Аj)Р(Aj). Здесь Р(Аi) − априорная вероятность события Аi. Используя апостериорные вероятности, можно разработать различные методы автоматической классификации. Пусть Хk − вектор измерений, пред Цифровая обработка аэрокосмических изображений. Конспект лекций
-98-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 14. Распознавание изображений
ставляющий k-й класс. Априорная вероятность того, что эта реализация относится к классу с номером k, есть Р(Хk). Обычно априорная вероятность считается заданной самой постановкой задачи. Например, для лесных территорий бывает известен процент площади, занятой лиственными и хвойными породами. Необходимо отнести неизвестный наблюдаемый объект Z (например, некоторый пиксел изображения) к одному из известных классов, Сk, с минимальной ошибкой. Яркость пиксела задана в m спектральных каналах. Результатом является вектор измерений Хm (вектор яркости пиксела), для которого можно найти условную вероятность (или ее плотность): P(Хm/Ck). ↑↑ Вектор измерений Известный класс Решение об отнесении неизвестного объекта к классу с номером k можно считать оправданным, если выполняется условие P(Ck/ Xm) > P(Cj/Xm), j≠ k. Эти вероятности могут быть вычислены согласно теореме Бaйеса с использованием условных вероятностей P(Хm/Ck): P(Ck/Xm) =
P (C j ) P( X m / C j ) P (Ck ) P ( X m / Ck ) , P(Cj/Xm) = , P( Xm ) P( Xm )
(14.2)
откуда следует решающее правило – необходимо определить, какая из апостериорных вероятностей больше: P(Ck)P(Xm/Ck) или P(Cj)P(Xm/Cj). Используя (14.2), получаем P( X m / C1 ) P (C2 ) > . P ( X m / C2 ) P(C1 )
(14.3)
В левой части неравенства стоит дробь, которую называют отношением правдоподобия. Решение о том, что наблюдается объект первого класса, принимается тогда, когда отношение правдоподобия превышает выражение в правой части. Правая часть содержит только известные члены и представляет собой величину порога, не зависящего от наблюдаемой величины. Процесс классификации связан с некоторым риском, так как возможны ошибки. Подсчитаем вероятность ошибки, которая может возникнуть при использовании этой процедуры. Решая (14.3), найдем порог Х*, такой, что при Хm ≤ X* считается, что объект принадлежит к первому классу, в противном случае – что ко второму. Пусть из-за случайного характера величины Хm принято ошибочное решение, что объект принадлежит к первому классу, в то время как на самом деле он принадлежит ко второму. Цифровая обработка аэрокосмических изображений. Конспект лекций
-99-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 14. Распознавание изображений
Возникает ложная тревога, вероятность которой выражается через условную плотность вероятности w(Хm/C2): X*
Pл.т = ∫ w(Хm/C2)dХm. −∞
Возможно, что Хm < X*, но объект принадлежит к первому классу, возникает пропуск обнаружения, вероятность которого выражается через условную плотность вероятности w(Хm/C1): ∞
Pп.о = ∫ w(Хm/C1)dХm. X*
Суммарная ошибка классификации равна сумме двух вероятностей: Рош = Рл.т + Рп.о.
Контрольные вопросы и задания
1. Назовите этапы кластеризации при использовании алгоритма ISODATA. 2. Сформулируйте теорему Байеса. Что такое апостериорная вероятность? 3. Как найти вероятность ложной тревоги и вероятность пропуска обнаружения? 4. Что такое отношение правдоподобия?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-100-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 15 Параметрические методы классификации План лекции
1. Роль нормального распределения в задачах классификации. 2. Метод максимального правдоподобия. 3. Метод минимальных расстояний. 4. Метод параллелепипедов. При дистанционном зондировании яркость каждого пиксела складывается из яркостей природных объектов, попавших во мгновенное поле зрения сканера. Объекты случайным образом отражают и рассеивают солнечное излучение, так что яркость пиксела есть сумма случайных величин. Из теории вероятностей известно, что сумма независимых, одинаково распределенных случайных величин имеет нормальный (гауссовский) закон распределения (центральная предельная теорема). Таким образом, есть основания полагать, что для природных объектов яркость пикселов может подчиняться нормальному закону распределения. Названная выше причина не единственная, по которой в задачах параметрического распознавания изображений широко используется гипотеза о нормальном законе распределения яркости пикселов. При распознавании монохроматических изображений для распределения яркости почти всегда удается подобрать один из известных одномерных законов (нормальный, биномиальный, экспоненциальный, пуассоновский и др.). Иное дело изображения, получаемые с помощью сканеров, имеющих n спектральных каналов, n > 1. В этом случае для описания статистических характеристик требуется n-мерное совместное распределение величин яркости в каналах. Как указывают многие авторы, в настоящее время уровень знаний таков, что пока точному многомерному анализу, за редкими исключениями, поддаются лишь задачи, где рассматривается нормальный многомерный закон распределения. n-мерная нормальная функция плотности вероятностей яркости имеет вид wn(fij) = (2π)– n/2⏐R⏐–1/2 · exp[–½(fij – μ)T · R–1(fij – μ)].
(15.1)
Вектор данных, характеризующий яркость (i, j)-го пиксела во всех n спектральных каналах, обозначен через fij, вектор математического ожидания – через μ, корреляционная матрица – через R, ⏐R⏐ – определитель корреляционной матрицы, R–1 – матрица, обратная к R; символ (fij – μ)T означает транспонирование вектора.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-101-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 15. Параметрические методы классификации
μ1 μ2
f 1 ij f 2 ij
R11 R21
R12 R22
... ... R1n ... ... R2 n
fij = ... , μ = ... , R = ...
...
... ...
...
... μт
f n ij
... Rn1
... Rn 2
... . ... ... ... ... ... Rnn
Компоненты вектора fij: f1ij, f2ij,…, fnij – яркость пиксела в первом, втором и т.д. каналах; компоненты вектора μ: μ1, μ2, …, μn – математическое ожидание яркости пиксела для первого, второго и т.д. канала. На главной диагонали корреляционной матрицы на пересечении р-й строки и р-го столбца стоит величина Rрр = σр2 – значение дисперсии яркости пикселов в р-м канале (характеристика контраста). Rps = Rsp – это коэффициент корреляции значений яркости пикселов в р-м и s-м каналах. Методы классификации, основанные на нормальном законе распределения, удовлетворительно работают даже при заметных отклонениях от нормальности. Пусть имеется спутниковое сканерное изображение земной поверхности, полученное в n спектральных каналах, которое представляет собой совокупность пикселов, яркость (i, j)-го пиксела описывается вектором fij с n компонентами. Требуется отнести этот пиксел к одному из М классов. Предварительно создается обучающая выборка – спутниковое изображение, на котором по наземным данным определены участки, отвечающие различным классам (например, водоемы, сельхозпосевы, городские и сельские застройки и т. п.). Пользователь указывает границы этих классов, происходит процесс обучения, т. е. компьютер оценивает вектор математического ожидания и корреляционную матрицу для каждого из классов. Далее производится обработка интересующего нас спутникового изображения. Компьютер для каждого классифицируемого пиксела определяет вектор измерений fij и в каждом классе k формирует условные плотности вероятностей w(fij/Ck). Для этого в многомерный нормальный закон распределения (15.1) подставляются μk и Rk – задаваемые условия, т. е. в данном случае оценки вектора математического ожидания и корреляционной матрицы эталонного объекта «k». Таким образом, для каждого пиксела формируется М условных плотностей вероятностей, которые сравниваются с некоторым порогом Qkl. Сравнение позволяет определить, какая из гипотез наиболее правдоподобна. Отношение правдоподобия Lkl для классов k и l имеет вид Lkl =
w(fij / Ck )
−1/ 2
exp ⎡⎣ − 1 2 (fij − μ k )T R −k 1 (fij − μ k ) ⎤⎦
. T −1 1 ⎡ ⎤ exp ⎣ − 2 (fij − μ k ) R k (fij − μ k ) ⎦ Rl Вместо отношения правдоподобия Lkl можно использовать любую монотонную функцию от него, например, натуральный логарифм ln Lkl: w(fij / Cl )
=
Rk
−1/ 2
Цифровая обработка аэрокосмических изображений. Конспект лекций
-102-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 15. Параметрические методы классификации
ln Lkl = ½ ln
Rl + ½[(fij – μk)T R −k 1 (fij – μk)] – ½[(fij – μl)T R l−1 (fij – μl)]. Rk
В этом случае величина lnLkl сравнивается с порогом qkl = ln Qkl. Первый член ½ln ⎡⎣ R l R k ⎤⎦ и множитель ½ в выражении для ln Lkl могут быть включены в qkl. Таким образом, задача выяснения, к k-му или l-му классу относится (i,j)-й пиксел, сводится к сравнению квадратичных форм: A = [(fij – μk)T R −k 1 (fij –μk)] и B = [(fij – μl)T R l−1 (fij – μl)]. Нередко полагают, что qkl = 0. В этом случае считается, что (i,j)-й пиксел относится к k-му классу, если квадратичная форма A < В, т. е. когда компоненты вектора fij теснее группируются вокруг μk. Квадратичная форма [(fij – μk)T R −k 1 (fij – μk)] характеризует расстояние между и классифицируемым пикселом с вектором яркости fij. Она часто применяется в задачах распознавания изображений. В случае, когда вектор яркости пиксела fij состоит из двух компонент, т. е. для двух спектральных каналов, квадратичная форма имеет вид ⎡ ( f1ij − μ1k ) 2 ( f 2ij − μ 2 k ) 2 ( f − μ1k )( f 2ij − μ 2 k ) ⎤ 1 Pk = + − 2ρ12 k 1ij ⎢ ⎥ . (15.2) 2 2 2 σ1k σ2 k σ1k σ2 k (1 − ρ12 k ) ⎣ ⎦
R12 k – нормированный коэффициент корреляции σ1k σ 2 k двух спектральных каналов для объекта «k» эталонного изображения. Распознавание по методу максимального правдоподобия (МП) использует значительный объем статистических данных и успешно справляется со сложными задачами. При справедливости предположения о нормальном законе распределения вектора fij метод МП обеспечивает оптимальное распознавание. Однако этот метод требует достаточно большого количества операций и является сравнительно медленным. Было бы желательно, чтобы при его использовании учитывались не только яркости в спектральных каналах для каждого одиночного пиксела (попиксельная классификация), но и его окружение. К сожалению, такой учет приводит к еще большему замедлению процесса распознавания и на практике пока применяется редко. Поэтому в некоторых случаях рассмотренный вариант метода МП по качеству проигрывает более простым методам, которые принимают во внимание взаимные связи соседних пикселов. Квадратичную форму [(fij – μk)T R −k 1 (fij – μk)] можно упростись, если положить Rmpk = 0, m ≠ p, т. е. не учитывать корреляцию яркостей пиксела в спектральных каналах. В (15.2) останутся только два члена, множитель перед квадратными скобками обратится в 1. В случае двух классов k и s получаем выражения: Здесь обозначено: ρ12 k =
Цифровая обработка аэрокосмических изображений. Конспект лекций
-103-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 15. Параметрические методы классификации n
( f mij − μ mk ) 2
m =1
σ2mk
r =∑ 2 k
n
( f mij − μ ms ) 2
m =1
σ2ms
, rs = ∑ 2
(15.3)
Здесь m – номер спектрального канала; n – общее число каналов, rk2 можно рассматривать как квадрат расстояния в пространстве яркости по евклидовой метрике между классифицируемым пикселом с вектором fij и вектором среднего значения μk эталонного объекта «k». При использовании этого варианта считается, что пиксел относится к тому классу, для которого меньшее из двух: rk2 или rs2 . Однако точность определения rk2 существенным образом зависит от точности оценивания σ2nk , как и в методе максимального правдоподобия. Дальнейшее упрощение приводит к методу минимальных расстояний (минимальных дистанций), когда решение о том, к какому классу относится пиксел, принимается на основании сравнения расстояний между пикселами и средними значениями в пространстве яркости без учета вектора дисперсии яркости эталонного объекта: rk2 =
n
∑ (fmij – μmk)2.
m =1
Это самый простой и быстрый метод классификации, он требует минимальных сведений о классах, но нередко уступает методу максимального правдоподобия в точности классификации. Сравнение с результатами классификации по МП показывает, что в данном случае лучше всего выделились гари и другие элементы элементы ландшафта, лишенные растительности. Хуже выделились лиственные древостои. Метод минимальных расстояний не учитывает окружения пиксела, поэтому иногда может уступать и методам кластерного анализа, и методам сегментации по наращиванию областей и по выделению границ. Метод минимальных расстояний основан на евклидовой метрике и, по существу, не связан с нормальным законом распределения. На практике находит применение ещё один простой метод классификации, связанный с нормальным законом, – метод параллелепипедов (метод прямоугольников). Он использует сведения о классах в виде векторов средних значений яркости μk и векторов дисперсий σ 2mk , полученные в процессе обучения. Известно, что для нормально распределенной случайной величины 95,4 % её значений лежат в пределах отклонений от среднего значения, меньших 2σ. Рассмотрим случай двух спектральных компонент. На рис. 15.1. по оси абсцисс отложены значения яркости f1 в первом канале, по оси ординат – значения яркости f2 во втором канале. Здесь же указаны средние значения яркости μ11 и μ12 для первого и второго классов в первом канале, μ21 и μ22 для первого и второго классов во втором канале.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-104-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 15. Параметрические методы классификации
Рис. 15.1. К методу параллелепипедов
От значения средней яркости в обе стороны отложены значения среднеквадратического отклонения σ11, σ12, σ21, σ22 для первого и второго класса в каждом из двух каналов. В двумерном случае получились прямоугольники, в трех- и более мерном случае имеем параллелепипеды в соответствующем пространстве. Если компоненты вектора яркости f1ij и f2ij таковы, что попадают в левый прямоугольник, принимается решение о принадлежности пиксела к первому классу, если они попадают в правый прямоугольник – то ко второму. Прямоугольники могут частично перекрываться, особенно это характерно для областей, примыкающих к углам прямоугольника. В этом случае возникает неопределенность. Метод параллелепипедов относится к числу быстрых методов классификации, однако, по качеству распознавания они уступают большинству из рассмотренных методов, что видно из изображения. Метод параллелепипедов целесообразнее всего использовать для предварительной классификации. Он наиболее эффективен при нормальном законе, так как для него выполняется упомянутое выше «правило двух сигма». Контрольные вопросы и задания
1. По каким формулам вычисляются среднее значение, дисперсия и коэффициент корреляции выборочных значений? 2. Какова роль нормального распределения в задачах классификации? 3. Что такое параметрические и непараметрические методы классификации? 4. Сформулируйте, в чем состоит метод классификации по минимальным расстояниям и метод параллелепипедов.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-105-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 16 Непараметрические методы классификации План лекции
1. Особенности непараметрических методов классификации. 2. Робастные алгоритмы. Ранговая статистика. 3. Двухвыборочный алгоритм Вилкоксона. 4. Декорреляция фона. Параметрические методы статистической классификации изображений являются мощным средством тематической обработки. Специфика дистанционного зондирования в оптическом диапазоне состоит в том, что изображение представлено в виде нескольких слоев, каждый из которых получен в одном из спектральных каналов. Для использования параметрических методов необходимо знать многомерные функции распределения вероятностей, связанные с классами образов. Часто эти функции не известны и должны оцениваться по множеству обучающих образов. Мы вынуждены использовать многомерный нормальный закон, хотя не известны доказательства, что многомерные функции распределения вероятностей яркостей многоспектральных изображений имеют именно такой вид. Даже в одномерном случае нормальный закон распределения, строго говоря, несправедлив хотя бы из-за того, что яркость – величина неотрицательная. В случае принятия гипотезы о нормальности распределения по обучающим образам необходимо оценить только отдельные параметры, связанные с этими функциями (такие как математические ожидания, дисперсии, функции корреляции). Параметрические методы обычно легче реализуются, но требуют большего объема априорной информации или фундаментальных предположений относительно природы образов. Если форма функций распределения вероятностей не известна заранее, метод является непараметрическим. Непараметрические методы имеют большие потенциальные возможности для точной оценки функций распределения вероятностей и для точного распознавания, но это преимущество обычно требует сложных распознающих систем, большого числа обучающих образов и, главное, больших временных затрат. Непараметрические алгоритмы обычно синтезируют эвристически. Нередко используются локальные оценки вероятности по эмпирической частоте. Среди непараметрических алгоритмов следует выделить робастные (устойчивые) алгоритмы, справедливые с той или иной эффективностью при различных законах распределения. Примером непараметрического алгоритма является метод минимальных расстояний, рассмотренный в 15-й лекции. Хотя там он выведен из нормального закона распределения, метод использует средние значения яркости и дисперсии или только средние значения яркости объектов, найденные из обучающей выборки. При этом предположения о функции распреде-
Цифровая обработка аэрокосмических изображений. Конспект лекций
-106-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 16. Непараметрические методы классификации
ления не используются, лишь бы средние значения яркости и дисперсии существовали. Примером непараметрического алгоритма, используемого при подавления шума в виде точек и линий на изображении, является алгоритм медианной фильтрации, рассмотренный в 11-й лекции.
Участок леса с просекой
Результат применения фильтра Лапласа
Рис. 16.1. Тестовое изображение
Рассмотрим типичный робастный алгоритм, так называемый ранговый, который учитывают отклонение элементов наблюдаемой выборки от элементов случайной выборки (шума). Пример – изображение леса с разрешением 30 м, где видны кроны деревьев и просека. Требуется обнаружить и выделить изображение просеки. Можно использовать градиентный фильтр, например, фильтр Лапласа. Просека становится более заметной, но пикселы, относящиеся к ней, окружены другими пикселами, которые можно интерпретировать как шум.
Рис. 16.2. Строка изображения, содержащая пикселы объекта и шум
Рассмотрим одну строку изображения, которая показана на рис. 16.2. Здесь А – пикселы объекта (просеки), для удобства показано, что они имеют большую яркость. Пусть хi – выборочные значения яркости пикселов: х1
х2
х3
х4
х5
х6
х7
х8
х9
х10
4
3
13
8
5
18
9
6
11
15
Рангом Ri элемента выборки хi называется число элементов n этой выборки, меньших или равных хi. Если элементы выборки расположить в порядке возрастания от меньшего к большему (сформировать вариационный ряд по возрастанию), то получим:
Цифровая обработка аэрокосмических изображений. Конспект лекций
-107-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 16. Непараметрические методы классификации Ri хi
1
2
3
4
5
6
7
8
9
10
3
4
5
6
8
9
11
13
15
18
х2
х1
х5
х8
х4
х7
х9
х3
х1
х6
Ранг R9 элемента х9 равен 7, ранг R2 элемента х2 равен 1, ранг R6 элемента х6 равен 10. Когда наблюдается только шум, то при независимости и однородности значения яркости пикселов величины рангов равновероятны при любых функциях распределения. Если же в выборке содержится смесь шума и некоторого неслучайного изображения, то величины рангов не будут равновероятными. Для обнаружения локальных контурных признаков (ЛКП) можно использовать двухвыборочный алгоритм Вилкоксона. Формируются две выборки, одна из которых X = х1, х2,…, хn, является опорной и принадлежит области фона, другая Y = y1, y2,…, ym – рабочая. Входящие в Y элементы могут быть как пикселами фона, так и пикселами искомого изображения, т. е. в состав вектора Y включены те пикселы, которые соответствуют ожидаемому положению интересующего объекта:
Ri хi
1 3
2 4
3 5
4 6
Ri уi
1 3
2 4
3 5
7 11
Без ЛКП 5 8 С ЛКП 8 13
6 9
7 11
8 13
9 15
10 18
9 15
10 18
11 24
12 24
13 24
Составляются два вариационных ряда – один для элементов опорной выборки X и второй для рабочего Y. Ранги элементов рабочей выборки определяются с учетом рангов элементов опорной выборки, т. е. для тех элементов рабочей выборки уj, которые совпадают (или близки) к элементам опорной выборки хi, сохраняются те же ранги. Значения яркости уj пикселов, относящихся к области А, превышают хi, поэтому они попадут в конец вариационного ряда с новыми, большими, номерами (рангами), а в общей последовательности номеров произойдет скачок, исчезнут ранги 4, 5, 6. Далее определяется ранговая статистика R = ∑Ri, сравнение которой с порогом R0 приводит к решению о наличии или отсутствии ЛКП согласно правилу: R ≥ R0, ЛКП имеется; R < R0 ЛКП отсутствует. В рассмотренном примере R = 55, если ЛКП отсутствует и R = 76, если ЛКП имеется. При отсутствии ЛКП элементы обоих векторов X и Y образуют однородное множество случайных величин, подчиняющихся одному и тому же закону распределения w(x). В этом случае элемент ра6очей выборки с равными шансами
Цифровая обработка аэрокосмических изображений. Конспект лекций
-108-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 16. Непараметрические методы классификации
занимает любое положение в вариационном ряду, а это означает, что случайная величина Ri подчиняется равновероятному закону распределения: w(Ri) = 1/(n +1), Ri = 0, 1, 2,...п. На данное распределение не оказывает влияния конкретный вид распределения некоррелированного фона w(x). Но тогда и закон распределения w(R) решающей статистики R при фактическом отсутствии в Y яркостного перепада не зависит от распределения фона w(x). Следовательно, от w(x) не зависит и вероятность ложного обнаружения ЛКП, которому соответствует верхнее условие в процедуре R ≥ R0. Для практического применения особенно важно, что и выбор порога ранговой процедуры R0, который подчиняют требованию получения желаемой величины вероятности ложного обнаружения, также не связан с распределением фона w(x). Таким образом, применение рангового алгоритма автоматически стабилизирует вероятность ложного обнаружения, делая ее независимой от вида (и тем более от параметров) закона распределения фона. Это свойство достигается только при условии, что все случайные величины, образующие выборки X и Y, независимы; в противном случае в закон распределения w(R) будут входить параметры, описывающие зависимость элементов. При наличии объекта А элементы вектора Y статистически превышают элементы X, поэтому закон распределения ранга w(Ri) перестает быть равномерным: вероятности больших значений Ri увеличиваются за счет уменьшения вероятностей малых значений. Эта тенденция проявляется тем сильнее, чем больше величина яркостного перепада. На изображении участка леса с просекой яркости пикселов фона зависимы статистически, это типично для многих изображений случайного фона. Поэтому для корректного использования рангового алгоритма необходимо преобразовать изображение. Будем считать, что яркости пикселов фона на рисунке подчиняются нормальному закону распределения, для которого независимость и некоррелированность элементов изображения эквивалентны друг другу. Поэтому преобразование изображения сводится к декорреляции фона. Пусть фон представляет собой однородное и изотропное случайное поле, у которого статистические характеристики одинаковы по строкам и столбцам. В качестве модели фона (изображения крон деревьев) используем четырехточечную модель f(i, j) = α[f(i − 1, j) + f(i, j − 1) + f(i + 1, j) + f(i, j + 1)] + z(i, j):
Цифровая обработка аэрокосмических изображений. Конспект лекций
-109-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 16. Непараметрические методы классификации
Здесь i и j – номера строк и столбцов; z(i, j) – случайное поле с нормальным законом распределения и некоррелированными отсчетами; α – параметр, характеризующий степень влияния соседних отсчетов на данный отсчет поля f(i, j). Для декорреляции фона используем следующую процедуру: g(i, j) = f(i, j) – α[f(I − 1, j) + f(i, j − 1) + f(I + 1, j) + f(i, j + 1)] = z(i, j), 0
−α
0
−α
1
−α .
0
−α
0
Декорреляция осуществляется путем обработки изображения приведенным здесь скользящим окном, учитывающим конфигурацию соседних отсчетов. Результат этой обработки при отсутствии ЛКП совпадает с порождающим процессом z(i, j), который по свойствам своей корреляционной функции близок к белому шуму. Для того чтобы при обнаружении ЛКП использовать независимую выборку, ее отсчеты следует располагать так, чтобы их взаимная корреляция равнялась нулю. Вид сигнала, прошедшего через процедуру декорреляции, зависит от значений параметра α, поэтому остановимся на их определении. Примем условие одинаковости характеристик изображения по строкам и столбцам. Поскольку параметр α участвует в процедуре декорреляции, его выбор необходимо подчинить минимизации ошибок декорреляции <[g(i, j) – z(i, j)]2> при = 0, <[z(i, j)]2> = σz2, <[f(i, j) – ]2> = σf2, причем коэффициент корреляции между соседними отсчетами равен <(f(i, j) – )(f(i, j + 1) – )> = σf2 ·ρ, где ρ – нормированный коэффициент корреляции между соседними пикселами фона. В качестве модели коэффициента корреляции примем выражение <(f(i, j) – ) (f(I + n, j + m)– )> = σf2 ρ n 2 + m2 , при этом <[ z(i, j) – g(i, j)]2> = σz2 + 4α2 σf2 – 2 α 4σf2 ρ + 2·2 α2 σf2 ρ2 + 2·4 α2 σf2 ρ1/2.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-110-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 16. Непараметрические методы классификации
Приравнивая нулю производную по α левой части этого выражения, находим: д/дα <[ z(i, j) – g(i, j)]2> = 8α σf2 – 8 σf2 ρ + 8 α σf2 ρ2 + 16 α σf2 ρ1/2 = 0, α = ρ/(1 + 2ρ1/2 + ρ2). Процедура декорреляции воздействует и на сигнальную (А) составляющую изображения. Необходимо оценить изменение яркостного перепада, происходящее при этом воздействии. Представим полную модель исходного изображения h(i, j) в виде суммы непрерывной (фоновой) составляющей f(i, j) и ступенчатой функции s(i, j), описывающей яркостный перепад: h(i, j)= s(i, j)+ f(i, j). Для изображений вида на рис. 16.1 значения коэффициента корреляции ρ обычно лежат в пределах от 0,9 < ρ < 1. Этому соответствует 0,25 < α < 0,255. Изменение параметра α в таких небольших пределах незначительно изменяет отклик оператора декорреляции на яркостный перепад s(i, j). Поэтому ниже приведено сечение выходного сигнала, рассчитанное при α = 0,25. Коэффициенты преобразования принимают вид 0
−0,25
−0,25
1
0
−0,25
0
0
−0,25 = 0,25 −1
0
0
−1
0
4 −1 . −1 0
Это не что иное, как фильтр Лапласа, коэффициенты которого поделены на 4. Линия (ЛКП) преобразуется фильтром Лапласа обычным образом, причем яркость всех элементов делится на 4. Множитель 0,25 не является принципиальным, можно его упустить. Контрольные вопросы
1. В чем специфика непараметрических методов классификации? 2. Что такое робастный алгоритм? 3. Что такое ранговая статистика? 4. Как осуществить декорреляцию фона в виде изображения леса?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-111-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ
Лекция 17 Дополнительные средства обработки изображений План лекции
1. Нейрокомпьютеры в обработке изображений. 2. Метод главных компонентов. Кроме рассмотренных выше методов и алгоритмов предварительной и тематической обработки аэрокосмических изображений, в настоящее время разработаны и продолжают разрабатываться новые методы и алгоритмы. К их числу относятся новые вегетационные индексы, метод главных компонентов, вейвлет-анализ, сингулярный спектральный анализ, фрактальный анализ и др. Мощным инструментом в задачах распознавания изображений становится нейроинформатика. Существуют специально организованные нейрокомпьютеры, но чаще используется эмуляция нейрокомпьютера на обычных ПЭВМ. Основной структурной единицей нейрокомпьютера является формальный нейрон, суммирующий входные сигналы с определенными весовыми коэффициентами и выдающий результирующий сигнал на входы других нейронов и на выход нейронной сети. Обучение нейрокомпьютера сводится к подбору весовых коэффициентов для получения требуемого результата. Специализированные компьютеры и компьютерные программы могут в принципе дать лучшее решение задач конкретного класса, но нейрокомпьютер способен решать широкий круг задач и практически не хуже. Нейрокомпьютеры особенно эффективны там, где нужно подобие человеческой интуиции – для распознавания образов (распознавание сложных изображений, чтение текстов и т. п.). Именно для таких задач обычно трудно формализовать набор признаков и создать явный алгоритм. Ядром используемых представлений является идея о том, что нейроны можно моделировать довольно простыми автоматами, а структура нейрокомпьютера, гибкость его функционирования и другие важнейшие качества определяются связями между нейронами. Каждая связь – это достаточно простой элемент, служащий для передачи сигнала. Особенностью нейрокомпьютерного подхода является использование обучения вместо программирования. Труд программиста заменяется трудом учителя (тренера). Программист предписывает ЭВМ все детали работы, учитель – создает «образовательную среду», к которой приспосабливается нейрокомпьютер. Обучение обычно строится на основе задачника – набора примеров с заданными ответами. Эти примеры предъявляются системе. Нейроны получают по входным связям сигналы – условия примера, преобразуют их, несколько раз обмениваются преобразованными сигналами и,
Цифровая обработка аэрокосмических изображений. Конспект лекций
-112-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
наконец, выдают ответ – также набор сигналов. Отклонение от известного правильного ответа штрафуется. Обучение состоит в минимизации штрафа как функции связей. Для описания алгоритмов и устройств в нейроинформатике выработана специальная «схемотехника», в которой элементарные устройства – сумматоры, синапсы, нейроны и т. п. – объединяются в сети, предназначенные для решения задач. Схемотехника представляет собой особый язык для описания нейронных сетей. При программной и аппаратной реализации описания переводятся на языки другого уровня. Самый важный элемент нейросистем – это адаптивный сумматор, который вычисляет скалярное произведение вектора входного сигнала x и вектора настраиваемых параметров α.
Рис. 17.1. Формальный нейрон
Стандартный формальный нейрон (рис. 17.1) состоит из входного сумматора, нелинейного преобразователя и точки ветвления на выходе. Нелинейный преобразователь сигнала получает скалярный входной сигнал x и переводит его в ϕ(x). Точка ветвления служит для рассылки сигнала по нескольким адресам: она получает скалярный входной сигнал x и передает его всем своим выходам. Существуют две базовые архитектуры – слоистые и полносвязные сети. В первых нейроны расположены в несколько слоев (рис. 17.2). Нейроны первого слоя получают входные сигналы, преобразуют их и через точки ветвления передают нейронам второго слоя. Далее срабатывает второй слой и т. д. до k-го слоя, который выдает выходные сигналы для интерпретатора и пользователя. Число нейронов в каждом слое может быть любым и никак заранее не связано с количеством нейронов в других слоях. Часто применяются трехслойные сети, в которых каждый слой имеет свое наименование: первый – входной, второй – скрытый, третий – выходной.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-113-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
Рис. 17.2. Схема слоистой нейронной сети
В полносвязных сетях каждый нейрон передает свой выходной сигнал остальным нейронам, включая самого себя. Выходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети. Все входные сигналы подаются всем нейронам. Для полносвязной сети входной сумматор нейрона фактически распадается на два: первый вычисляет линейную функцию от входных сигналов, второй – линейную функцию от выходных сигналов нейронов, полученных на предыдущем шаге. Функция активации нейронов (характеристическая функция) ϕ – нелинейное преобразование выходного сигнала сумматора, ϕ может быть одним и тем же для всех нейронов, в этом случае сеть называют однородной (гомогенной). Если же ϕ зависит еще от одного или нескольких параметров, значения которых меняются от нейрона к нейрону, то сеть называют неоднородной (гетерогенной). Слоистая и полносвязная архитектуры не налагают существенных ограничений на участвующие в них элементы. Единственное важное требование, предъявляемое архитектурой к элементам сети, – это соответствие размерности вектора входных сигналов элемента (она определяется архитектурой) числу его входов. Если полносвязная сеть функционирует заданное число тактов k до получения ответа, то ее можно представить как частный случай k-слойной сети, все слои которой одинаковы и каждый из них соответствует такту функционирования полносвязной сети. Существенное различие между полносвязной и слоистой сетями возникает тогда, когда число тактов функционирования заранее не ограничено – слоистая сеть так работать не может. Важным моментом в организации нейронной сети является обучение. Обучение можно рассматривать как оптимизацию и строить соответствующие алгоритмы, программное обеспечение и, наконец, устройства. Требуется решить задачу минимизации некоторой функции – оценки, зависящей от части сигналов (входных, выходных) и от параметров сети. В настоящее время
Цифровая обработка аэрокосмических изображений. Конспект лекций
-114-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
разработаны эффективные методы минимизации оценки, позволяющие за приемлемое время осуществлять обучение нейрокомпьютера. Решающий вклад в создание быстрых методов обучения внесла красноярская школа нейроинформатики А.Н. Горбаня. Для станции приема и обработки спутниковой природоведческой информации УниСканТМ-36 разработана нейросетевая программа распознавания изображений ScanEx NeRIS®. Другим эффективным методом обработки изображений является метод главных компонентов. Сканерная информация поступает на пункт приема в виде совокупности полутоновых изображений. Число таких изображений может быть достаточно большим (10 каналов сканера MVISR спутника FengYun-1D, 36 каналов сканеров MODIS спутников TERRA и AQUA). Для распознавания изображений с современных сканеров требуется сформировать пространство признаков достаточно большой размерности m, возможно, потребуется иметь эталоны, представленные во всех 36 спектральных каналах сканера MODIS. Совокупность признаков, используемых при распознавании образов, должна в наибольшей степени отражать те свойства объектов, которые важны для распознавания. От размерности m признакового пространства в значительной степени зависит вычислительная сложность процедур обучения и принятия решения, достоверность распознавания и затраты времени. Сокращение числа признаков иногда способно увеличить расстояние между признаками и упростить процедуру распознавания. Первоначальный набор признаков формируется до начала распознавания из числа доступных измерению характеристик объекта g1, g2, …, gm, отражающих существенные для распознавания свойства. На следующем этапе из первоначального можно сформировать новый набор h1, h2, ..., hn, состоящий из меньшего числа признаков, n < m. Уменьшение количества признаков снижает затраты, но может привести к падению достоверности распознавания. Таким образом, требования минимума общей размерности задачи и максимума достоверности распознавания оказываются противоречивыми, необходим разумный выбор размерности признакового пространства или выполнение правильного, без заметного уменьшения информативности, преобразования совокупности данных, с целью уменьшения числа признаков. В качестве критерия правильности выбора новых признаков используют среднеквадратическую ошибку аппроксимации признаков {g1, g2,…,gm} с помощью {h1, h2,..., hn}, среднее межклассовое расстояние, внутриклассовый разброс наблюдений, энтропию одного класса относительно другого и т. д. При отображении на мониторе ЭВМ результатов многоспектральных дистанционных исследований возникает еще одна проблема: нам доступны три цвета (RGB), которые можно присвоить как условные трем спектральным каналам, в то время как число каналов превышает эту цифру. Важно так
Цифровая обработка аэрокосмических изображений. Конспект лекций
-115-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
преобразовать информацию, чтобы появилась возможность адекватно и без больших потерь представить её на экране монитора. Для преобразования пространства признаков G = (g1, g2, …,gm) в новое пространство H = (h1, h2,..., hn) наибольшее распространение получили линейные методы с использованием некоторого оператора А: H = AG.
(17.1)
Преобразование (17.1) может осуществлять переход от одной координатной системы, в которой признаки gi, например, компоненты векторов яркости пикселов fij, коррелированы, к другой, где они не коррелированы. В этом случае процедура носит название преобразования Карунена–Лоэва. Пусть имеется m изображений одного и того же участка Земли в m спектральных каналах. Вычисляются коэффициенты корреляции Rik между всеми изображениями, причем Rii = σi2. Дисперсия яркости σi2 характеризуют контраст i-го изображения. Формируется корреляционная матрица R:
R=
σ12
R12
... R1m
R21
σ22
... R2 m
...
...
...
...
Rm 2 ...
σ2m
Rm1
.
Собственные числа корреляционной матрицы находятся из решения матричного уравнения [R – λI] = 0, I – единичная матрица. Диагональная матрица Λ упорядоченных по убыванию собственных чисел матрицы R имеет вид
λ1 0 ... 0 0 λ 2 ... 0 Λ= . ... ... ... ... 0 0 ... λ m В качестве матрицы А используется матрица собственных векторов Р корреляционной матрицы R. Решается матричное уравнение [R – λI]P = 0. Матрица А удовлетворяет условию А–1 ≡ АT, что означает сохранение среднего контраста совокупности изображений. В результате преобразования (17.1) происходит поворот координат в m-мерном пространстве, такой, что новые изображения становятся некоррелированными. После этого отбираются n (n < m) новых изображений, соответствующих наибольшим собственным числам λi. Эти изображения – главные компоненты имеют наибольший контраст, в них сосредоточена практически вся информация, ранее находившаяся в исходных изображениях. Трем главным компонентам можно присвоить три основных Цифровая обработка аэрокосмических изображений. Конспект лекций
-116-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
цвета (RGB) и визуализировать преобразованное изображение в условных цветах на мониторе. Рассмотрим пример. Пусть наблюдение Земли со спутника производится в двух спектральных каналах, т.е. вектор яркости fij содержит два компонента f1ij и f2ij, корреляционная матрица яркостей пикселов имеет вид R=
2,6 1,2 1,2 1,3
,
где σ12 = 2,6 – дисперсия яркости пикселов в первом канале; σ22 = 1,3 – дисперсия яркости во втором, R12 = R21 = 1,2 – коэффициент корреляции между значениями яркости в этих каналах. Перейдем к новым координатам d1ij и d2ji путем поворота на угол φ исходной декартовой системы координат f1ij и f2ij: d1ij = f1ij cos φ – f2ij sin φ, d2ji = f1ij sin φ + f2ij cos φ.
Потребуем, чтобы в новых координатах компоненты вектора яркости стали некоррелироваными. Вычислим коэффициент корреляции компонент d1ij и dij2. Средние значения = cos φ – sin φ, = sin φ + cos φ. Введем центрированные значения яркости: s1ij = f1ij – , s2ij = f2ij – , đ1ij = d1ij – , đ2ij = d2ji – .
Коэффициент корреляции R12d компонент đ1ij и đ2ij равен: R12d = <đ1ij đ2ij> = (<s1ij 2> – <s2ij 2>) sin φ cos φ + <s1ij s2ij> (cos 2φ – sin 2φ ) = = ½[<( f1ij – )2> – <(f2ij – )2>] sin 2φ + <( f1ij – )(f2ij – )> cos 2φ = = ½[σ12 – σ22] sin 2φ + R12 cos 2φ.
Коэффициент корреляции R12d = 0, если tg 2φ = 2R12 /(σ22 – σ12). В частном случае, когда (σ22 – σ12) = 0, то и <đ1ijđ2ij> = 0 для любого φ. При этом R12 = 0. В нашем случае коэффициент корреляции R12d = 0, если tg 2φ = 1,7143, φ = 29º52′, sin φ = 0,498, cos φ = 0,867. Матрица преобразования А принимает вид A=
cos ϕ − sin ϕ sin ϕ
cos ϕ
=
0,867 −0,498 0,498
0,867
.
Используем матричный подход. Собственные числа матрицы R можно найти из решения матричного уравнения
Цифровая обработка аэрокосмических изображений. Конспект лекций
-117-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
2,6 − λ
1,2
1,2
1,3 − λ
= 0.
Получаем уравнение: λ2 – 3,9 λ + 1,94 = 0, откуда λ1 = 3,31, λ2 = 0,58. Матрица собственных чисел имеет вид Λ=
3,31 0 . 0 0,58
Собственные векторы корреляционной матрицы R, соответствующие собственному значению λi, есть решение системы (2,6 – λ1)а1 + 1,2а2 = –0,69а1 + 1,2а2 = 0, 1,2 а1 + (1,2 – λ1) = 1,2 а1 – 2,09а2 = 0, эти уравнения не являются независимыми, но система имеет нетривиальное решение, так как определитель системы равен нулю: а1 = –0,739а2. Преобразование с использованием матрицы А не должно изменять средний контраст, поэтому потребуем, чтобы транспонированная матрица АТ ≡ А–1, откуда а12 + а22 = 1, а1 = 0,867, а2 = – 0,498. Система, содержащая λ2, имеет решение а1 = 0,498, а2 = 0,867, это те же значения, что и выше. Выражение (17.1) принимает вид s1 0,867 0,498 f1 = ⋅ , s2 −0,498 0,867 f 2
(17.1')
s1, s2 – новые значения яркости пикселов в каналах; f1, f2 – старые значения. Дисперсия s1 равна λ1 = 3,31, дисперсия s2 равна λ2 = 0,58; на s1 приходится 84,9 % суммарной дисперсии – это главный компонент. В результате преобразования исходного многоспектрального изображения с помощью процедуры Карунена–Лоэва возникает новое многоспектральное изображение, но в данном случае уже нельзя говорить о том, к какому спектральному каналу относятся компоненты этого изображения. Отметим, что новые компоненты некоррелированы, т. е., по существу, не повторяют друг друга. При обработке семи каналов сканерной информации LANDSAT наибольшей дисперсией обладают первый – третий компоненты; пятый−седьмой компоненты обычно уже похожи на случайные поля с практически некоррелированными значениями яркости, т. е. на шум. Так как максимальная дисперсия приходится на первый компонент, то при визуализации преобразованного изображения путем присвоения первому, второму и третьему компонентам условных RGB-цветов обычно оказывается необходимым
Цифровая обработка аэрокосмических изображений. Конспект лекций
-118-
II. ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ Лекция 17. Дополнительные средства обработки изображений
предварительно увеличить контраст второго и особенно третьего компонента. Контрольные вопросы
1. В чем принципиальное отличие подхода к распознаванию изображений с использованием нейрокомпьютера от других рассмотренных в этой главе методов? 2. Что такое формальный нейрон, каковы его функции? 3. В каких случаях и как следует использовать метод главных компонентов?
Цифровая обработка аэрокосмических изображений. Конспект лекций
-119-
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Кашкин, В. Б. Дистанционное зондирование Земли из космоса. Цифровая обработка изображений / В. Б. Кашкин, А.И. Сухинин. – М. : Логос, 2001. − 264 с. 2. Кашкин В. Б. Цифровая обработка изображений (дистанционное зондирование Земли из космоса) : метод. указания для студентов / сост. В. Б. Кашкин. − Красноярск : КГТУ, 1998. − 79 с. 3. Рис, У. Основы дистанционного зондирования / У. Рис – М. : Техносфера, 2006. − 346 с. 4. Методы обработки аэрокосмической информации : метод. указания к практическим занятиям / сост. В. Б. Кашкин. − Красноярск : ИПЦ КГТУ, 2004. − 24 с. 5. Описание пакета прикладных программ IDRJSI [Электр. ресурс]. Режим доступа : http : //www.geo.pu.ru/ecobez/edu/books/rsgis/index.htm. 6. Обработка изображений : метод. указания : в 2 ч. / сост. И. А. Агапов, В. Б. Кашкин. − Красноярск : Краснояр. гос. ун-т, 1995. − 50 с. 7. Визильтер, Ю. В. Обработка и анализ цифровых изображений с примерами из LabVIEW IMAQ Vision / Ю. В. Визильтер, С. Ю. Желтов и др. – М. : ДМК Пресс, 2007. − 464 с. 8. Гарбук С. В. Космические системы дистанционного зондирования Земли / С. В Гарбук, В. Е. Гершензон. – М. : Сканэкс, 1997. – 296 с. 9. Цифровая обработка изображений в информационных системах / И. С. Грузман, В. С. Киричук и др. – Новосибирск : Изд-во НГТУ, 2002. − 352 с. 10. Трифонов, Т. А. Геоинформационные системы и дистанционное зондирование в экологических исследованиях / Т. А. Трифонов. − М. : Академический проект, 2005. − 252 с. 11. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. − М. : Техносфера, 2006. − 1072 с. 12. Гонсалес, Р. Цифровая обработка изображений в среде MATLAB / Р. Гонсалес, Р. Вудс, С. Эддинс/ − М. : Техносфера, 2006. − 616 с. 13. Валентюк, А. Н. Оптическое изображение при дистанционном зондировании / А. Н. Валентюк, К. Г. Предко. − Минск : Навука i тэхнiка, 1991. − 360 с. 14. Кац, Я. Г. Основы космической геологии / Я. Г. Кац, А. В. Тевелев, А. И. Полетаев. − М. : Недра, 1988. − 236 с. 15. Яншин, А. Л. Автоматизированная обработка изображений природных комплексов Сибири / А. Л.Яншин, В. А.Соловьев. − Новосибирск : Наука, 1988. − 224 с. 16. Радиолокационные методы исследования Земли / ред. Ю. А. Мельника. – М. : Сов. Радио, 1980. − 262 с.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-120-
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
17. Брюханов, А. В. Аэрокосмические методы в географических исследованиях / А. В. Брюханов, Г. В. Господинов, Ю. Ф. Книжников. – М. : Изд.во МГУ, 1982. − 231 с. 18. Фомин, Я. А. Статистическая теория распознавания образов / Я. А. Фомин, Г. Р. Тарловский. – М. : Радио и связь, 1986. − 264 с. 19. Павлидис, Т. Алгоритмы машинной графики и обработки изображений / Т. Павлидис. − М. : Радио и связь, 1986. − 400 с. 20. Ярославский, Л. П. Цифровая обработка сигналов в оптике и голографии / Л. П. Ярославский. − М. : Радио и связь, 1987. − 296 с. 21. Василенко, Г. И. Восстановление изображений / Г. И.Василенко, А. М. Тараторин. − М. : Радио и связь, 1986. − 302 с. 22. Сухинин, А. И. Система космического мониторинга лесных пожаров в Красноярском крае / А. И. Сухинин // Сибирский экологический журнал. − 1966. − Т. 3. −№ 1. − С. 85−92. 23. Герман, М. А. Метеорологическое зондирование атмосферы из космоса / М. А.Герман. – Л. : Гидрометеоиздат, 1985. − 260 с. 24. Обиралов, А. И. Фотограмметрия и дистанционное зондирование / А. И. Обиралов, А. Н. Лимонов, Л. А. Гаврилова. – М. : Колос, 2006. − 334 с. 25. Климов, А. С. Форматы графических файлов / А. С. Климов – СПб : ДиаСОФТ ЛТД, 1995. − 478 с. 26. Шихт, Г. Ю. Цифровая обработка цветных изображений / Г. Ю. Шихт. – М. : ЭКОМ, 1997. − 136 с. 27. Горбань, А. Н. Нейронные сети на персональном компьютере / А. Н. Горбань, Л. А. Россиев. – Новосибирск : Наука, 1996. − 276 с 28. Голяндина, Н. Э. Метод «Гусеница» SSA : анализ временных рядов. − СПб : Изд-во СПб ун-та, 2004. − 74 с. 29. Мала, С. Вейвлеты в обработке сигналов. − М. : Мир, 2005. − 671 с. 30. Потапов А. А. Фракталы в дистанционном зондировании / А. А. Потапов // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники. – М., 2000. – № 6. – С. 3−65.
Цифровая обработка аэрокосмических изображений. Конспект лекций
-121-