МИНИСТЕРСТВО КУЛЬТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное образовательное учреждение высшего профессиональ...
59 downloads
270 Views
7MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО КУЛЬТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное образовательное учреждение высшего профессионального образования «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КИНО И ТЕЛЕВИДЕНИЯ» Кафедра
киновидеоаппаратуры
2010 Трубникова Т.А., Гудинов К.К., Двуреченский С.А., Гусев В.П. Цифровая фотоаппаратура: Учебное пособие. – СПб.: Изд. СПбГУКиТ, 2010. - 158 с. Рецензент: профессор Нестерова Е.И.
Т.А.ТРУБНИКОВА, К.К. ГУДИНОВ, С.А. ДВУРЕЧЕНСКИЙ, В.П. ГУСЕВ
ЦИФРОВАЯ ФОТОАППАРАТУРА
Рекомендовано к изданию в качестве пособия кафедрой киновидеоаппаратуры. Протокол № 3 от 6.12.10
Учебное пособие для студентов дневного, вечернего и заочного отделений специальности 200101 «Приборостроение» и направления 200100 «Приборостроение»
Санкт-Петербург
© Санкт-Петербургский государственный университет кино и телевидения, 2010.
учебного
Введение В настоящее время все большее применение находят способы получения изображения, основанные на переводе оптического сигнала изображения в электрический сигнал с последующей его обработкой, возможностью хранения, преобразования, вывода на телевизионный экран или на монитор компьютера, а также – воспроизведения с помощью современных принтерных устройств. Настоящее учебное пособие предназначено для изучения курса «Цифровая фотоаппаратура» студентами всех форм обучения специальности 200101 «Приборостроение», а также направления (бакалавриат) 200100 «Приборостроение». Курс «Цифровая фотоаппаратура» изучается на кафедре киновидеоаппаратуры студентами 5-го курса (9 семестр) очного отделения и 6-го курса заочного отделения.
1. ПРИНЦИПЫ ПОСТРОЕНИЯ ЦИФРОВОГО ФОТОАППАРАТА 1.1 Структурная схема цифрового фотоаппарата Поскольку назначение цифрового фотоаппарата (ФА) не отличается от обычного, то и его внешний вид, и ряд устройств аналогичны обычному фотоаппарату (см. рис. 1.1.).
Рис. 1.1 Структурная схема цифрового фотоаппарата
157
158
Необходимо отметить, что электронный фотоаппарат может осуществлять запись и аналогового сигнала, а цифровая форма записи появилась для взаимодействия с компьютерами (с целью программной обработки изображения). Объектив 1 фокусирует изображение в плоскости фото-преобразователя 4 (назначение затвора и диафрагмы аналогично традиционному фотоаппарату). В фотопреобразователе 4 сигнал изображения преобразуется в электрический сигнал, пропорциональный по величине в каждой данной точке сигналу изображения. В качестве фотопреобразователя в современных цифровых фотоаппаратов используются ПЗС - линейки, ПЗС - матрицы, а также – КМОП-структуры, о которых будет рассказано ниже. Для преобразования аналогового сигнала, снимаемого с фото-преобразователя, в цифровую форму, служит аналогоцифровой преобразователь (АЦП) 5, с которого оцифрованный сигнал поступает в блок 6, необходимый для достижения совместимости полученного сигнала с компьютером, и далее – на носитель записи 7. В качестве носителей записи в современных цифровых фотоаппаратах служат карты ФЛЭШ-памяти (флэш-карты), а также гибкие и жесткие магнитные диски. Питание электромеханических элементов осуществляется в блоке 10. В некоторых фотоаппаратах предусмотрены видеоконтрольные устройства, которые могут выполнять роль обычного визира, либо служат для просмотра отснятой информации. В качестве таких устройств используются жидкокристальные дисплеи (ЖКД), однако в ряде цифровых фотоаппаратов оптические визирные устройства также предусмотрены. Более сложно устройство для получения цветных изображений, но об этих особенностях будет рассказано позже. В некоторых цифровых аппаратах имеется возможность одновременной записи звуковых сигналов, для чего 157
служит специальная «звуковая» карта. В этом случае фотоаппарат снабжается также микрофоном и преобразователем звукового сигнала. Таким образом, ЦФА становится «короткометражной» видеокамерой. Цифровые фотоаппараты могут иметь телевизионный выход в основных стандартах (PAL,SEKAM). В этом случае изображение можно просматривать на экране телевизора, записывать на видеомагнитофон и воспроизводить в аналоговом виде. 1.2. Устройство и принцип работы ПЗС - элементов ПЗС - элементы – это приборы с зарядовой связью (CCD-charje-coupled-device) . Принцип действия ПЗС основан на свойствах соединения МОП (металл – окисел – полупроводник),в котором при энергетическом воздействии (как электрическом, так и световом) образуются заряды, пропорциональные количеству энергии (см. рис 1.2). При воздействии световой энергии в таком соединении образуются так называемые «не основные» носители заряда – «дырки», которые при помощи управляющего напряжения выводятся из ПЗС – элементов и подвергаются дальнейшей обработке (рис.1.2.). На подложку из полупроводника - кремния (Si) или германия (Ge) наносится тонкий слой диэлектрика (окиси кремния, окиси германия и т. д..), и сверху – тонкие ячейки из металла – электроды. Они, как правило, изготавливаются из алюминия или поликремния. По вертикали сочетание этих материалов представляет собой микроконденсаторы, а по – горизонтали – набор таких микроконденсаторов. Толщина каждого слоя не превышает 0,1 – 0,6 мкм (а в настоящее время эти размеры становятся все меньше). Если к электроду 1 (см. рис.1.2.) приложить отрицательное напряжение U1, электроны в подложке (не основные 158
носители заряда) уйдут от поверхности в глубину n- полупроводника, и в области электрода 2 на границе раздела «полупроводник – диэлектрик» образуется область, обедненная электронами, то есть, потенциальная яма для не основных носителей заряда – «дырок».
Рис. 1.2 Принцип работы ПЗС - элементов При освещении этой области определенной величиной светового потока в электроде образуются свободные электроны, вызванные воздействием лучистой энергии, а их количество пропорционально величине светового потока. Начинает работать «ячейка – конденсатор» МОП: все «дырки» в потенциальной яме притягиваются к границе диэлектрика, причем количество притянутых «дырок» также пропорционально величине светового потока. Таким образом, под каждым микроконденсаторм образуется так называемый «пакет зарядов». Теперь, если приложить к электроду 3 напряжение 157
\U3\ ,<\U2\,под ним образуется потенциальная яма, более глубокая, чем под электродом 2, и заряды из-под электрода 2 «перетекут» под электрод 3. Если в этот момент с электрода 2 снять напряжение, все «дырки» под электродом 3.Далее – повышая отрицательное напряжение под электродом 4 ,5 и т.д. можно переносить заряды в пределах линейки ПЗС и таким образом считывать значения тока, в каждый данный момент образуемого цепи. Таким образом, линейка ПЗС позволяет распределение освещенности в строке изображения объекта превращать в зарядовые пакеты носителей, хранить зарядовую информацию и преобразовывать ее в видеосигнал при последовательной смене потенциалов( на так называемых «ламелях»).за счет формирования сдвигового регистра ПЗС. Наибольшее распространение получили перемещающие заряд регистры (рис 1.3.), образованные тремя электродами, соединенными токопроводящими шинами и образующими трехфазную электродную систему, так как они контролируют направление перемещение заряда всего тремя значениями величины напряжения. Когда под ламелью 2 накопятся заряды, высокий потенциал с нее снимается и переносится на ламель 3, т.е. \U3\ >\U1\ ,которое не равно \U2\. Заряды перетекут в потенциальную яму под ламелью 3 одновременно во всех элементах сдвигового регистра. Налево они не потекут, так как \U1<\U2\,(см.рис. 1.3.). По ширине линейки делают «стоп - каналы» диэлектрического типа, не позволяющие зарядам растекаться в стороны. Длина одного электрода составляет 20 мкм (а в настоящее время – и меньше).Таким образом, размер одного пикселя (элементарной площадки изображения) определяется тремя ламелями по длине линейки (6+6+6+2=20мкм) и 20 мкм по ширине.(Как уже было сказано, постепенно эти размеры 158
сокращаются). В современных фотоаппаратах, использующих линейки ПЗС, сканирующих изображение в направлении, перпендикулярном ширине кадра, файл получаемого снимка может достигать 300 Мбайт (т.е. количество элементов в кадре составит до 80 млн. пикселей).
Однако за время накопления зарядов в потенциальных ямах под действием освещенности накапливаются также термогенерированные носители заряда, которые составляют паразитную добавку к информационному заряду, что приводит к появлению «темнового» тока при считывании сигнала, аналогично явлению возникновения вуали в светочувствительных материалах. Этот недостаток можно уменьшить, перекрывая экраном (затвором) световой поток на момент считывания информации или разделяя процессы накопления и считывания зарядов в различных линейках (см. рис. 1.4.).
Рис. 1.4 Устройство перекрытия ПЗС – линеек для уменьшения темнового тока
Рис. 1.3 Вывод зарядов с ПЗС - линейки 157
Из нескольких линеек ПЗС изготавливают двумерные матрицы ПЗС, в которых каждый светочувствительный регистр соединен с элементом сдвигового регистра, выводящего зарядовые пакеты из матрицы. Выходной сдвиговый регистр не должен быть светочувствительным, так как он выполняет только функцию переноса зарядов, то есть – формирования видеосигнала. 158
В настоящее время находят применение ПЗС - матрицы с построчным, покадровым и построчно-кадровым переносом зарядов (см. рис. 1.5.), причем построчно-кадровый вариант переноса считается оптимальным.
габаритов, КМОП-структуры обладают также пониженной энергоемкостью. Однако на данное время эти элементы еще не лишены ряда недостатков: несмотря на повышенное количество пикселей в подобных матрицах, а следовательно и увеличенной разрешающей способности, они требуют повышенной освещенности по сравнению с обычными матрицами, так как фотоячейки перекрываются дополнительными электросхемами. Это требует при использовании таких структур более длительных значений выдержек в процессе съемки. 1.3. Регистрация цветного изображения в ЦФА
Рис. 1.5 ПЗС - матрица В последнее время разработан новый тип фотоматрицы: так называемая КМОП – матрица (комплиментарный металл – окисел – полупроводник). КМОП -матрица – это микросхема, содержащая как сами ячейки ПЗС, так и цепи считывания сигнала, аналого-цифрового преобразователя и первичной обработки изображения. Помимо уменьшенных 157
Получение цветного изображения в электронной (цифровой) происходит почти также, как и в видеокамерах. Необходимо наличие цветоделительных устройств для создания и фиксации трех основных цветов R, G и B различной интенсивности. Известны фотоаппараты с несколькими способами получения цветного изображения: 1)При помощи одной линейки ПЗС; 2)При помощи одной ПЗС- матрицы с трехкратным экспонированием изображения; 3).При помощи одной ПЗС - матрицы с однократным экспонированием изображения; 4) При помощи трех ПЗС- матриц с однократным экспонированием с однократным экспонированием изображения. В зависимости от способа получения цветного изображения и цифровые фотоаппараты подразделяются на следующие типы: Фотоаппараты с задней разверткой; Трех-кадровые фотоаппараты; Однокадровые фотоаппараты с одной матрицей; 158
Однокадровые фотоаппараты с тремя матрицами. На рис. 1.6. показан принцип действия фотоаппарата с задней разверткой. Сканирующая головка содержит три ПЗС линейки, перекрытые синим, зеленым и красным фильтрами, так что каждая линейка считывает свой цвет, а другой – не пропускают фильтры. Головка перемещается с небольшим шагом вдоль фокальной плоскости объектива, регистрируя за один шаг одну линейку пикселей.
Такие фотоаппараты обладают высокой разрешающей способностью, но для экспонирования им требуется очень большое время выдержки. Поэтому они используются только для съемки неподвижных объектов, причем затвор должен быть открыт в течение всего экспонирования. Нетрудно видеть, что в процессе съемки возможно использование только постоянного освещения объекта, и нельзя применять фотовспышку. На рис. 1.7. изображен трехкадровый фотоаппарат. Он также предназначен для съемки неподвижных объектов. В качестве фото-преобразователя у таких фотоаппаратов используется одна плоская ПЗС -матрица. Такие фотоаппараты имеют меньшую разрешающую способность, чем те, что оснащены ПЗС - линейками, но требуют и меньшего времени выдержки, а следовательно позволяют использовать фотовспышку.
Рис. 1.6 Цифровой фотоаппарат с задней развёрткой Рис. 1.7 «Трёхкадровый» цифровой фотоаппарат 157
158
Для получения одного кадра производится три последовательных снимка через три фильтра: красный, зеленый, синий. Диск, на котором расположены фильтры, поворачивается таким образом, чтобы в процессе экспонирования одноцветный фильтр располагался между объективом и ПЗС матрицей. Иногда с целью повысить качество цветопередачи «зеленое» экспонирование производится дважды. Это связано с неодинаковой спектральной чувствительностью ПЗС - элементов к различным цветам. Однокадровый фотоаппарат с одной матрицей показан на рис. 1.8.
Рис. 1.8 «Однокадровый» цифровой фотоаппарат с одной матрицей Эти фотоаппараты обладают высокой скоростью съемки, но гораздо меньшей разрешающей способностью, а также – худшим качеством цветопередачи. Такие фотоаппа157
раты иначе называются фотоаппаратами « с вычислением цветов». В них используется одна матрица, покрытая пленкой, содержащей слой светофильтров из основных цветов(красного, зеленого и синего).В результате на поверхности матрицы образуются так называемые «триады цвета». Процесс фиксации изображения на поверхности матрицы протекает быстро и позволяет использовать в качестве источника света фотовспышку. Поэтому этот способ получения цветного изображения. В этом случае можно использовать фотовспышку. Для улучшения качества изображения наиболее широко применяется процесс, называемый «интерполяцией». Этот процесс выполняется микропроцессором цифрового фотоаппарата. Цифровой обработке подвергаются 8 пикселей, окружающих обрабатываемую ячейку. Эта обработка усредняет и вычисляет цвета и яркости соседних ячеек и тем самым вводит в обрабатывающие информацию системы сведения о состоянии соседних ячеек. На рис. 1.9. изображен однокадровый фотоаппарат с тремя матрицами. Каждая из трех матриц предназначена для приема информации об одном из основных цветов и его интенсивности. Методы цветоделения в цифровых фотоаппаратах, как уже было сказано, аналогичны методам, используемым в видео- и телекамерах. Цветоделительная призма расщепляет поступивший световой поток на три основных составляющих, которые направляются на соответствующие матрицы (иногда этих матриц не три, а четыре – устанавливается еще одна матрица , чувствительная к зеленому цвету. В некоторых фотоаппаратах фильтры расположены более сложно: определенным образом размещены синие и красные фильтры, а зеленые – расположены в удвоенном количестве. Такие фотоаппараты имеют не очень высокую разрешающую способность, и к тому же - достаточно высокую стоимость, поскольку высококачественные ПЗС- матрицы до сих пор достаточно сложны и дороги в изготовлении. 158
1.4. Аналого-цифровые преобразователи Запись видеосигнала, поступившего с фотопреобразователя, может осуществляться как в аналоговой, так и в цифровой форме. Для перевода сигнала из аналоговой в цифровую форму необходимо устройство аналого-цифрового преобразователя (АЦП). Функциональная схема цифровой записи сигнала представлена на рис.1.10.
Рис. 1.10 Функциональная схема цифровой записи сигнала
Рис. 1.9 «Однокадровый» цифровой фотоаппарат с тремя матрицами Существуют комбинированные цифровые фотоаппараты, в которых сочетается однокадровая и многокадровая технологии. Необходимо помнить, что пока ПЗС и КМОП элементы не обладают изопанхроматической спектральной чувствительностью. Наиболее чувствительны ПЗС - элементы на базе кремния к красной и инфракрасной части спектра. Другие полупроводники, (например, теллур или германий) имеют требуемую чувствительность, но нуждаются в охлаждении в процессе работы, тогда как кремниевые основы работают при комнатной температуре (18 –20 град. С).
157
В аналого-цифровом преобразователе происходят следующие процессы: - дискретизация аналогового видео сигнала с определенным шагом; - квантование сигнала – замена действительного мгновенного значения сигнала округленным целым числом; - кодирование сигнала - образование кодовых комбинаций импульсов в двоичной системе исчисления (пример см. на рис 1.11). В результате дискретизации аналоговый сигнал заменяется на ряд коротких импульсов,амплитуды которых равны значениям аналогового сигнала через шаг дискретизации (см. рис. 1.11.). Отсчеты, полученные в результате дискретизации, поступают на вход преобразователя, в котором весь возможный диапазон аналогового сигнала делится на ряд уровней квантования. Для сигнала изображения в настоящее время количество этих уровней не меньше 256.
158
Рис. 1.11 Пример преобразования аналогового сигнала в цифровой Основная функция аналогово-цифрового преобразователя состоит в том, что, если амплитуда какого- либо из отсчетов аналогового сигнала оказывается внутри данного уровня квантования, то на выходе АЦП генерируется строго определенная комбинация цифр двоичного кода. Вследствие дискретизации сигнала по пространственным координатам возможны искажения сигнала, вызванные этой дискретизацией. Они могут проявляться как в виде муар -эффекта (искажения I-го рода), так и в виде заметности строчной (растровой) структуры изображения (искажения II157
го рода). Однако известно, что в современных средствах записи – преобразования – воспроизведения (ЗПВ) информации шаг пространственной дискретизации у* выбирается таким образом, что искажения изображения, вызванные пространственной дискретизацией изображения, не заметны для глаза (т. е. для зрительного анализатора). При использовании аналого-цифрового преобразователя (АЦП) вводится понятие разрядности представления сигнала изображения. Этот параметр определяет максимальное количество уровней «серого» - или уровней яркости, которое может фиксировать ПЗС - элемент. Разрядность оценивается в единицах, называемых «бит», которые соответствуют единицам измерения информационной емкости по Хартли, и, следовательно – определяет количество уровней яркости, представляющее данное изображение. Для черно-белого штрихового изображения количество разрядов составляет 1 бит (да – нет; 0 –1 ). Для черно-белого полутонового изображения используются градации яркости. Чем больше разрядность, тем на большее количество деталей по яркости разбивается изображение. В ЦФА используется 16(4 бита), 64 (6 бит ) и 256 (8 бит ) уровней. На рис. 1.11 показан сигнал информационной емкостью 3 бита. Таким образом, после экспозиции каждая ячейка ПЗС матрицы оказывается электрически заряженной до значения, которое пропорционально количеству света, попавшему на нее. Информация о величине электрического сигнала в каждой ячейке матрицы считывается и преобразуется в цифровой код и заносится в карту памяти как последовательность чисел. Каждое число отображает состояние одной ячейки (либо записывается на магнитный диск в виде частотномодулированного сигнала). Для цветных ЦФА количество уровней яркости, а значит и величина информационной емкости утраивается. 158
1.5. Цветной жидкокристаллический дисплей (ЖКД)
Принцип работы одной ячейки ЖКД показан на рис. 1.12.
Некоторые цифровые фотоаппараты оснащены обычными (оптическими) видоискателями, но наряду с этим многие камеры оснащены цветным ЖКД, который позволяет увидеть изображение именно в том виде, в котором оно будет занесено в карту памяти. При этом можно оценить не только границу кадра и глубину резко изображаемого пространства, но и правильность выбора экспозиции. Основным предназначением ЖКД обычно считается просмотр снимков после съемки и удобное визирование кадра при съемке. При просмотре кадров можно это делать последовательно для серии до 9 кадров одновременно. При этом можно стереть не понравившиеся снимки. ЖКД может использоваться и в качестве панели управления. Он дублирует установки и режимы фотоаппарата с помощью системы «меню». К недостаткам ЖКД в настоящее время относится очень большое потребление энергии для источника питания фотоаппарата. Кроме этого, значения яркости и контрастности ЖКД сильно зависят от освещения, поэтому его не рекомендуется применять на ярком солнечном свете. Кроме этого качество изображения ЖКД зависит от угла рассматривания изображения: не рекомендуется рассматривать изображение на ЖКД под острым углом. Работа ЖКД основана на изменении поляризации светового потока, проходящего через жидкие кристаллы под действием электрического поля. Жидко-кристальные дисплеи требуют обязательной подсветки (либо сзади, либо сбоку) от дополнительного источника освещения. Чаще всего это – рассеянный (люминесцентный ) источник света. За панелью дисплея расположена плоская призма, которая равномерно распределяет свет по ее поверхности. 157
Рис. 1.12 Принцип работы жидкокристаллического дисплея (ЖКД) Экран жидкокристаллического дисплея представляет собой матрицу из ячеек жидких кристаллов. Для того, чтобы получить двумерное плоское изображение, нужно «адресовать» фиксирование и считывание информации в каждой отдельной ячейке. Известны два метода адресации и, следовательно, два типа матриц, предназначенных для этого: пассивную и активную. В пассивной матрице точка изображения активизируется подачей напряжения на проводники – электроды строки и столбца. При этом электрическое поле возникает не только в точках пересечения адресных проводников, но и на всем пути тока, что препятствует достижению высокой контрастности изображения. Фирма Toshiba разработала цветной ЖКД на тонкопленочных полевых транзисторах (технология TFT – Thin Film Transistor). В активной матрице каждой точкой управляет свой электронный переключатель. Это позволяет повысить уровень контрастности изображения, а также – величину раз158
решающей способности. Подобная технология нашла применение в Note – books, цифровых фотоаппаратах, а также – в различных цифровых приставках. Дисплей с TFT – экраном (см. рис. 1.13) представляет собой матрицу из ячеек, каждая из которых управляется транзистором, которым, в свою очередь, управляют через адресную шину и шину данных. Элемент изображения формируется из трех жидкокристаллических ячеек, в каждой из которых находится тонкоплёночный транзистор с аналоговым управлением.
Рис. 1.13 Жидкокристаллический дисплей с TFT - экраном Перед каждым элементом ячейки установлен светофильтр (R,G,B) –так же, как в мониторе телевизора. 1.5 Цифровые носители информации Обязательным элементом современных цифровых фотокамер являются сменные устройства памяти, которые необходимы для записи и хранения получаемых изображений. Наиболее современным решением является использование в 157
качестве запоминающих устройств специальных карт памяти, которые обладают: большой ёмкостью, высокой скоростью чтения и записи, малыми размерами, минимальным энергопотреблением и стойкостью к любого рода воздействиям. В настоящее время широкое распространение получили следующие типы носителей информации: Compact Flash, Secure Digital Card, xD – Picture Card, Memory Stick. Карта памяти Compact Flash (CF) Формат CompactFlash (рис.1.14) можно считать достаточно распространенным в использовании для профессиональных цифровых фотоаппаратов. Он разработан и предложен компанией San Disk (1988, Саннивэйл, Калифорния, США) в 1994 году.
Рис. 1.14 Карты памяти Compact Flash В настоящее время существует четыре типа карт Compact Flash: • CF Type I 42,8×36,4×3,3 мм, вес 11,4 г., ёмкость до 4 Гб (128, 256, 512 Мб, 1.0, 2.0, 4 Гб). Скорость записи/чтения около 1,2 Мб/с. Применялась ранее в любительских цифровых фотоаппаратах. • CF Ultra Type II 42,8×36,4×5 мм, вес 13,5 г, ёмкость до 8 Гб (512 Мб, 1Гб, 2, 4, 8 Гб), скорость чтения 10 Мб/с, скорость записи 9 Мб/с. 158
• CF Extrem Type III 42,8×36,4×5 мм, вес 13,5 г., ёмкость до 8 Гб, скорость чтения и скорость записи 20 Мб/с. • CF Extrem Type IV 42,8×36,4×5 мм, вес 13,5 г., ёмкость до 64 Гб, скорость чтения и скорость записи 40 Мб/с. У карты CF Extrem Pro скорость чтения и скорость записи достигает 90 Мб/с. Карта CF имеет наибольшее быстродействие, повышенную устойчивость к вибрации и ударным нагрузкам. Как и прочие карты памяти, CF способна хранить информацию без использования внутреннего или внешнего источника питания, в рабочем состоянии может использоваться напряжение 3,3 В или 5 В - каждая из карт поддерживает любое из этих напряжений, подсоединение выполняется 50штырьковым разъемом. K достоинству карт относится наличие встроенного контроллера. Это обеспечивает самую широкую совместимость и стандартизацию интерфейса. Карта может быть подключена к устройствам с тем же интерфейсом вне зависимости от конкретной модификации и использованной технологии. Кроме того, CF поддерживает интерфейсный стандарт АТА, и при считывании через специальное устройство компьютер видит его как обычный жесткий диск без необходимости установки драйверов самой карты. Возможность потери данных предотвращается благодаря наличию специальной схемы обнаружения дефектов, а также технологии проверки и коррекции ошибок ЕСС. CF имеет показатели ударопрочности, допускающие в нерабочем состоянии перегрузки до 2000 г. Более новые типы карты Type II, Type III, Type IV с большим объемом не допускают установку в слот для тонкой Type I, но гарантируют обратную совместимость - карт Type I. К недостаткам этой карты относится довольно высокая цена (не в последнюю очередь из-за встроенного контроллера) и относительная неустойчивость работы многокон157
тактного штырьково-гнездового разъема по сравнению с плоскими контактами Memory Stick (минус, который проявляется чаще всего при неаккуратном обращении). Выводы карты выполнены в виде гнезд, расположенных на нижней кромке корпуса в два ряда. Приемная часть слота – два ряда тонких металлических игл. Если карту вставить в слот под углом и приложить при этом усилие, выводы легко подогнуть и слот окажется неработоспособным. Карта памяти Secure Digital (SD) Стандарт Secure Digital был разработан компаниями Panasonic, SanDisk и Toshiba – рис. 1.16. Это – пара совместимых форматов карт флэш-памяти – MultiMediaСard (MMC – рис.1.15) и Secure Digital (SD – рис.1.3). Карточки этих форматов компактны - 24 × 32 × 1,4 мм. Электрические выводы контактной группы карт MMC и SD совпадают. Конструктивные и функциональные отличия карт двух форматов – в большей толщине SD (2,1 мм), в ограничении объема карт более старого формата MMC 128 Мбайт и в наличии на карте SD дополнительных контактов – 9 вместо 2 на MMC. На SD имеется переключатель, блокирующий запись, и электронная схема защиты информации от копирования. Формат MMC был разработан SanDisk и Siemens. А стандарт SD – компаниями Panasonic, SanDisk и Toshiba. Достоинством является их взаимозаменяемость с MMC, прочность конструкции и портативные размеры. Объем карты такого типа – 128, 256, 512 МБ, 1.0, 2.0, 4.0, 8.0, 16, 32 Гб. SD тип II. 512, 1Гб, 2 Гб, скорость 9 – 10 мб/с, 10 лет; SD тип III. 512, 1Гб, 2 Гб, скорость 20 мб/с, 10 лет; SDHC 4, 8, 16, 32 Гб.
158
В 2003 году появилась линейка карт xD-Picture Card. Они имеют меньшие размеры (20×25×1,7 мм), более высокую скорость обмена данными и ёмкость (вплоть до 8 мб/с).
Рис. 1.15. Карта памяти Multi Media Card (MMC) Рис. 1.17. Карта памяти хD Picture Card
Рис. 1.16. Карта памяти Secure Digital (SD) Карта памяти xD – Picture Card Этот стандарт разработан компаниями Olimpus и Fuji в 2003 году. 157
Для перехода на новый стандарт был разработан специальный слот, позволяющий устанавливать в него как карты SmartMedia, так и карты xD-Picture Card. Контакты для карт SmartMedia располагались с левой стороны слота, а для модулей xD-Picture Card - с правой. В целом же стандарт xD-Picture Card является последней по хронологии создания системой хранения данных на основе карт памяти. Стандарт карт памяти (известный также как SSFDC Solid State Floppy Disk Card), поддерживается известными производителями, в первую очередь Olimpus, Fuji, Sanyo, Sega, Samsung и другими с 2003 г. Карта (рис. 1.4) выпускается в версиях для 3,3 В и 5 В (замена не допускается). Карта памяти xD намного тоньше CF, и это позволило создать оригинальный адаптер для загрузки данных с карты на ПК через 158
дисковод. Кроме того, относительно простая технология изготовления обеспечивает более низкую стоимость. Память xD дешевле, и из-за отсутствия на карте контроллера - все схемы управления размещаются на камере или устройстве, использующем карту. Минус такого подхода в том, что с выходом новых версий карт некоторые контроллеры оказываются не в состоянии опознать карту, сказываются и жесткие требования установки версий с разным напряжением. Новые карты рассчитаны на 3,3 В и не подлежат установке в устройства с 5В. Возможна и обратная ситуация, в некоторых новых аппаратах нельзя использовать старые карты на 5В. Объем карты такого типа –64, 128, 256, 512 МБ, 1.0, 2.0 Гб. Карта памяти Memory Stick (MS) Карты памяти MS имеют размеры 21,5×50×2,8 мм и весят около 4 г.
для блокировки записи. Скорость передачи данных при записи достигает 1,5 Мбайт/c, а при чтении – 2,54 Мбайт/с. Энергопотребление карты невысокое, но выше, чем у ММС, в то же время скорость записи ниже, чем у того же типа карт, хотя для чтения равна или несколько выше. Ее можно использовать в фотоаппаратах среднего класса. Карта надежна в эксплуатации и имеет доступную цену. Объем карты такого типа – 128, 256, 512 МБ, 1.0,2.0, 4.0 Гб. Карта флэш-памяти формата MS содержит переключатель защиты от записи. Широкое распространение получили карты модифицированного стандарта Memory Stick Pro 1 – 16 Гб. Они отличаются вдвое меньшими размерами и встроенным переключателем банков памяти. Карты нового стандарта совместимы со слотами MS через адаптер. Недостатком формата MS является его закрытость. Memory Stick – фирменный формат, и это значит, что карты MS применяются во всех цифровых устройствах производства фирмы Sony, то есть никакие другие карты в данных устройствах работать не будут. 2. ОСНОВНЫЕ ПОКАЗАТЕЛИ ЦИФРОВЫХ ФОТОАППАРАТОВ
Рис. 1.18 Сравнительно небольшая толщина карты позволила, как и в случае SM и ММС, помимо традиционных считывающих устройств выпустить и адаптер. Карты Memory Stick имеют фирменный интерфейс последовательного типа и оснащены плоским 10-контактным разъемом с переключателем 157
2.1 Формат изображения Как и для телевидения, так и для цифровой фотоаппаратуры, формат представляет соотношение сторон кадра (Н/В) – высоты и ширины кадра, или наоборот (В/Н) - ширины к высоте. Стандартные форматы в настоящее время: 4/3 и 16/9 ( последний – для широкоформатного изображения).
158
2.2. Разрешающая способность цифрового изображения Для оценки качества изображения, полученного цифровыми методами, принято различать две разновидности разрешающей способности: так называемое «оптическое» и «интерполяционное» разрешение. Оптическое разрешение цифрового фотоаппарата зависит только от качества объектива и фотопреобразователя. В ЦФА оптическое разрешение в настоящее время, в основном, определяется количеством и размерами ячеек ПЗС – линейки или ПЗС – матрицы. Понятие «оптическое разрешение» не совпадает с известным показателем «разрешающая способность», N,мм-1, однако, зная оптическое разрешение (ОР), можно определить и разрешающую способность ЦФА. Под оптическим разрешением (ОР) ПЗС – матрицы понимают отношение количества отдельных светочувствительных элементов матрицы (по вертикали или по горизонтали ) к высоте или длине рабочей области матрицы. Оптическое разрешение выражается в единицах:ppi (количество пикселей на дюйм – piksels per inch). Иногда в цифровых системах оптическое разрешение выражают просто в пикселях, приходящихся на площадь фотокадра. Следовательно, оптическое разрешение фотоматрицы можно оценить двумя способами: 1) Её размером в пикселях по вертикали и горизонтали (например, 4272 × 2848 пикселей); 2) Общим количеством пикселей в матрице. Чтобы связать величину оптического разрешения с разрешающей способностью, необходимо понять, что, в сущности, оптическое разрешение определяет частоту дискретизации ПЗС – элемента:
ОР =
Р = f д , мм -1 , 25,4 157
где Р – количество пикселей по длине (или высоте ) кадра. Один дюйм(inch) равен 25,4 мм. fд – частота дискретизации, мм –1. Тогда шаг дискретизации ПЗС – матрицы составит:
y* =
1 , мм fд
(2.2)
Зная выражение для определения ПЧХ фотопреобразователя и считая ПЗС – элемент изотропным, можно определить величину разрешающей способности следующим образом: ПЧХ считывающео элемента определится по выражению:
f К ( f x ) = − π ( x ) 2 N
(2.3)
Это справедливо для фотоприемников. Для систем с пространственной дискретизацией выражение (2.3) можно представить в следующем виде:
y *× fx 2 К 'эс ( f x ) = − π ( ) , 2
(2.4)
Таким образом, можно записать:
fx f × y* = x N 2
(2.1)
158
(2.5)
И далее:
N=
2 мм-1 y*
(2.6)
или: N = 2 × f д ,мм –1, (2.7) где f д можно найти по выражению (1), зная «оптическое разрешение». Считая ПЗС – элементы изотропными, разрешающую способность системы вдоль оси Y (Ny) определим аналогичным образом. Приведем пример: пусть оптическое разрешение камеры составляет 300 ppi. Тогда частота дискретизации будет:
fд =
300 = 12 мм-1 25,4
(2.8)
Следовательно, разрешающая способность на поверхности ПЗС – матрицы, Nм, составит 24 мм-1. Для того, чтобы определить разрешающую способность отпечатка при его рассматривании (т. е. с участием зрительного анализатора), необходимо привести разрешающую способность системы в плоскости фотоприемника сначала к плоскости фотоотпечатка, а затем – к сетчатке глаза. Разрешающая способность в плоскости отпечатка (Nб) определится следующим образом:
Nб =
Nм
β отп ,
(2.9)
где βотп - коэффициент увеличения от поверхности матрицы до отпечатка. 157
Для того, чтобы определить коэффициент ßотп , необходимо знать размеры рабочей поверхности ПЗС-матриц. Они очень малы. Известно, что в настоящее время для цифровых фотоаппаратов используются ПЗС-матрицы следующих размеров: 2/3 дюйма по диагонали (8,8 × 6,6) мм; 1/2 дюйма по диагонали (6,6 × 4,8) мм и 1/3 дюйма по диагонали (4,8 ×3,6) мм. Возьмем для примера матрицу размерами 8,8 × 6,6 мм. и два требуемых размера отпечатков: 1) 9 × 12см и 2) 18 × 24 см. Определим для обоих случаев итоговую разрешающую способность в плоскости сетчатки глаза Nс. Коэффициент увеличения отпечатка определится следующим образом:
β отп =
H отп , hм
(2.10)
где Hотп – высота отпечатка, hм – высота рабочей поверхности матрицы.
β отп1 =
90 ≅ 13,6 6,6
β отп 2 =
180 ≅ 27,2 6,6
Тогда разрешающую способность фотоаппарата, приведенную к плоскости бумаги Nб найдем для двух вариантов:
N б1 =
24 ≅ 1,8 мм 13,6
158
N б2 =
24 ≅ 0,9 мм 27,2
Разрешающую способность системы, приведенную к сетчатке глаза Nс можно найти из выражения:
N отп
Nс =
β за
,
(2.11)
где βза – увеличение зрительного анализатора при рассматривании отпечатков невооруженным глазом. Известно, что в этом случае:
β pf =
f за′ , L
(2.12)
где L – расстояние от глаз до отпечатка. Оптимальное расстояние (или «расстояние наилучшего видения»)составляет 250 – 350мм., f΄за – фокусное расстояние зрительного анализатора (его усредненное значение - ~ 16мм. Выбрав величину L = 320 мм, получим: βотп = 0,05. Тогда:
N с1 =
1,8 = 36 мм −1 0,05
N с2 =
0,9 = 18 мм −1 0,05
Сравнив полученные значения с разрешающей способностью зрительного анализатора (Nза = 130 – 140мм-1),можно оценить качество полученного изображения в обоих случаях. Как показывают полученные результаты, в первом случае оно лучше, чем во втором, однако, оба снимка будут иметь недос157
таточную четкость изображения. Таким образом, для получения качественного изображения требуется большее разрешение (для первого случая – в три раза, для второго – в шесть раз). В настоящее время это трудно достижимо, так как увеличение оптического разрешения требует уменьшения размеров ячейки ПЗС. Однако, развитие элементной базы происходит очень быстро, и следовательно, размеры ячеек ПЗС будут уменьшаться, а значит – будет увеличиваться оптическое разрешение системы. Это значит, что информационная емкость цифрового фотоаппарата также повысится. Некоторое улучшение качества изображения вносит интерполяционное разрешение. Это программное повышение оптического разрешения. При интерполяции каждый пиксель разбивается на несколько пикселей, которым присваеваются усреднённые цвета и оптические плотности соседних, реально считанных пикселей (см. рис. 2.1). Детальность изображения не увеличивается, но оно чётче прорабатывается в мелких деталях и мягче – в крупных. 2.3. Глубина цвета Этот параметр зависит от разрядности аналогоцифровового преобразователя (АЦП), см. раздел 1.4. Чем больше разрядность АЦП, тем больше оттенков каждого цветового канала может различить ПЗС матрица, и тем более полными будут цвета на изображении. Так, например, разрядность в 8 бит на канал цветности даёт 256 уровней яркости каждого цвета (стандарт современного цветного телевидения). Однако для цифровых фотоаппаратов специального назначения (профессиональных и студийных) существуют разрядности 30 (10 × 3) и 36 (12 × 3).
158
2.4. Светочувствительность ? В обычных фотоаппаратах можно улучшить качество изображения отпечатков, увеличив светочувствительность фотоплёнки. В цифровых фотоаппаратах максимальная чувствительность ПЗС элементов является постоянной и зависит от размеров пикселя. Чем больше размеры пикселя, тем больше светочувствительность ПЗС элемента, но тем меньше его разрешающая способность. Светочувствительность ПЗС матриц оценивается также, как для фотоплёнок, в единицах ISO (Internernational Standard Organisaision). Чем меньше светочувствительность ПЗС элементов, тем больше необходимо время экспозиции кадра. Это затрудняет съёмки при малых освещениях. В некоторых цифровых фотоаппаратах используются дополнительные усилители сигнала, поступающего с ПЗС элементов, но при этом усиливается не только полезный, но и шумовой сигнал. 3. КЛАССИФИКАЦИЯ ЦИФРОВЫХ ФОТОАППАРАТОВ Зарубежная промышленность выпускает большое количество различных моделей цифровых фотоаппаратов, отличающихся конструкцией, техническими характеристиками, различными видами применяемого носителя. В настоящее время фирмы-изготовители цифровой фототехники предлагают очень разные решения конструктивного исполнения и концепции управления цифровых фотоаппаратов. Если по любому плёночному фотоаппарату можно сразу сказать, к какому классу он принадлежит, то классификация цифровых фотоаппаратов находится в стадии становления. Это связано с тем, что отрасль изготовления цифровой фототехники только формируется и категории пользователей и требования, предъявляемые ими к цифровым фотоаппара157
там ещё только определяются. Одной из разновидностей классификаций для цифровой фотоаппаратуры является классификация по степени качества. Условно цифровые фотоаппараты можно разделить на три группы: -любительские; -профессиональные; -студийные Быстрая смена поколений цифровой фототехники меняет границы этих групп. Современные цифровые фотокамеры, несмотря на некоторые, присущие только им отличительные особенности, всё же имеют сходство с традиционными фотоаппаратами и обычно состоят из следующих основных узлов и механизмов: светонепроницаемого корпуса; съёмочного объектива с механизмом, обеспечивающим его фокусировку (наводку на резкость); видоискателя; фотографического затвора; светочувствительного элемента-матрицы; запоминающего устройства в виде твердотельных карт памяти или устройства для записи на жесткий диск. Многие модели цифровых фотокамер оснащены системами экспозиционной автоматики и фиксированными программами съёмки, а также различными дополнительными устройствами - электронными импульсными осветителями (ЭИО), специальными разъемами для установки дополнительной памяти или непосредственного подключения к компьютерам, устройствам печати и так далее. Любительские цифровые фотоаппараты Любительская цифровая фотокамера ориентирована на то, чтобы обеспечить хорошее качество изображения в автоматическом режиме. Любительские цифровые фотоаппараты делятся на компактные и полупрофессиональные. Компактные цифровые фотоаппараты имеют матрицу с разрешающей способ158
ностью порядка 10 – 12 миллионов пикселов. Такой разрешающей способности достаточно лишь для печати фотографий малого и среднего форматов. Современные графические редакторы позволяют отредактировать изображение на ПК без каких-либо потерь в качестве. В компактных цифровых фотоаппаратах используются матрицы размером (диагональю) 1/4 – 2/3”, формат сжатия JPEG, электронный затвор. Визирование производится по жидкокристаллическому дисплею (в большинстве моделей). Фотосъёмка осуществляется в автоматическом, либо одном из фиксированных режимов. Носителем информации (в зависимости от фирмы – производителя фотоаппарата) служит одна из распространенных карт памяти - Secure Digital Card, xD – Picture Card, Memory Stick, не имеющих встроенного контроллера. В фотоаппаратах этой группы обычно используются объективы с переменным фокусным расстоянием. Полупрофессиональные цифровые фотоаппараты обладают матрицей с большей разрешающей способностью 12 – 16 миллионов пикселов. Они могут иметь как встроенную, так и съёмную оптику, матрицы размером (диагональю) 1,5 – 1,6”, оптическое визирное устройство и ЖК-дисплей, электромеханический затвор. В основном они ориентированы на работу в автоматическом режиме, но должны обеспечивать возможность ручного управления экспозиционными параметрами, фокусировкой и другими функциями фотоаппарата, имеют значительно большее количество фиксированных режимов и дополнительных возможностей (серийная съемка, автобрекетинг, регулировка баланса белого, многоточечная автофокусировка и др.) Полупрофессиональные модели цифровых фотоаппаратов должны уметь сохранять снимки с максимальным качеством, без применения алгоритмов сжатия. Для этих целей используются форматы RAW и TIFF. Почти все любительские фотокамеры позволяют запи157
сывать видеоролики, но качество записи оставляет желать лучшего. Используются разные форматы записи, разная разрешающая способность, степень сжатия, возможна запись звука. Фотоаппараты могут работать в режиме диктофона, либо позволяют записывать короткие аудиокомментарии к сделанным снимкам. Профессиональные цифровые фотоаппараты Эти фотоаппараты имеют матрицу с высокой разрешающей способностью - порядка 18 – 21 миллионов пикселов (цифровые задники до 60 миллионов пикселов). В профессиональные фотокамеры устанавливают сенсоры больших физических размеров 2 – 3,5”, приближенных к размерам кадрового окна пленочной малоформатной камеры (24×36 мм). Это позволяет использовать на профессиональном цифровом фотоаппарате оптику от плёночных аналогов. Большинство профессиональных цифровых фотоаппаратов выполнено на базе плёночных. Все они имеют зеркальный видоискатель. Главным достоинством такого видоискателя является отсутствие параллакса. Основное преимущество профессиональных зеркальных цифровых фотокамер – возможность использования многочисленной высококачественной сменной оптики и различных аксессуаров и приспособлений к традиционным зеркальным фотоаппаратам для различных видов съёмки. Зеркальный видоискатель к тому же дает возможность визуально контролировать точность фокусировки, эффекты, обеспечиваемые светофильтрами и другими оптическими насадками. Носителем информации служит карта памяти CompactFlash, имеющая встроенный контроллер. Такие фотоаппараты имеют более широкие возможности: • наличие синхроконтакта для подключения автономных ЭИО (фотовспышек);
158
• возможность сохранения снимков с максимальным качеством, без алгоритмов сжатия; • высокая точность и разнообразные способы экспозамера и фокусировки; • высокая скорость записи снимков, возможность серийной съемки, более длительный ресурс работы; • лучшие эргономические показатели. Все эти возможности зависят от класса модели. Студийные цифровые фотоаппараты Это самый дорогой класс фототехники, в них реализованы все возможности, доступные на данный момент. Речь идет как о характеристиках используемых объективов (как правило, это объективы с переменным фокусным расстоянием), так и о характеристиках матрицы (разрешающая способность порядка 16,7 миллионов пикселов), замера экспозиции, автоматической фокусировки и возможности ручных настроек различных параметров. Фотоаппараты также обладают высокой цветопередачей - до 16 каналов на бит. Устанавливаются на штативе. Студийные цифровые фотоаппараты подключаются к компьютеру, тем самым обеспечивая допуск к жёсткому диску. В таких фотоаппаратах используются наиболее совершенные объективы, в которых максимально устранены все виды аберраций. Фотоаппараты этого класса преимущественно используются для изготовления плакатов и фотоснимков высокого качества и больших форматов. Помимо вышеуказанных критериев существенным отличием класса цифрового фотоаппарата является разрядность аналого-цифрового преобразователя. При фотосъемке цифровым фотоаппаратом электрический сигнал с матрицы ПЗС в аналоговой форме поступает в аналого-цифровой преобразователь (АЦП), где происходят 157
следующие процессы: - дискретизация сигнала с определённым шагом; - квантование сигнала, т.е. замена действительного мгновенного значения сигнала ближайшим целым округлённым числом; - кодирование сигнала, т.е. замена десятеричных значений сигнала комбинацией кодовых импульсов в двоичном коде. Так, например, при квантовании сигнала на 8 уровнях его дискретизированные значения: 0, 1, 2, 3, 4, 5, 6, 7. Тогда кодированный сигнал будет представлять следующие комбинации импульсов: 000; 001; 010; 011; 100; 101; 110; 111. При использовании АЦП вводится понятие разрядность представления изображения. Этот параметр определяет максимальное количество уровней яркости сигнала, которое может фиксировать ПЗСэлемент. Разрядность оценивается следующим образом: H = log 2 L ,бит,
(3.1)
где L – количество уровней яркости представленного сигнала. Так, чёрно-белое штриховое изображение имеет разрядность 1 бит, 8-уровневый сигнал – 3 бита и т.д. Для стандартного фото- и телевизионного сигнала характерен 256уровневый сигнал с разрядностью 8 бит. Однако следует помнить, что для регистрации цветного изображения каждый цвет должен описываться 8 битами, и, следовательно, действительное количество разрядов составит 8×3 бит. Современные любительские компактные цифровые фотоаппараты имеют разрядности 3×8, полупрофессиональные 3×10, профессиональные 3×12, а студийные – 3×16 бит.
158
Применяемая оптика В цифровой фототехнике применяются два типа объективов. Первый тип — это объективы с постоянным фокусным расстоянием, в цифровых фотоаппаратах обычно это широкоугольные объективы (фокусное расстояние 23-35 мм, значения приведены к значениям для 35 мм пленки). Фокусное расстояние зависит от размера формируемого изображения (размера матрицы). Они достаточно хорошо передают большинство сюжетов (как правило, речь идет об общих планах). Второй тип - это объективы с переменным фокусным расстоянием от 35 мм до 70 мм, благодаря чему имеется возможность варьирования компоновки кадра. Наряду с оптическим изменением фокусного расстояния, большинство камер имеет возможность цифрового изменения фокусного расстояния (с потерей качества). Для всех цифровых фотокамер стандартным стало наличие объектива с переменным фокусным расстоянием (вариообъектива) и автоматической фокусировкой. Автофокусный вариообъектив применяется в подавляющем большинстве моделей и варьируется как по габаритам, так и по кратности, светосиле, оптическому разрешению и уровню геометрических и хроматических аберраций. Для уменьшения габаритов объектива в цифровой фототехнике стал применяться выдвигающийся вариообъектив. Наличие автоматической фокусировки, помимо более резкого изображения близкорасположенных объектов съёмки, обеспечивает более высокую светосилу объективов. Если приходится снимать в помещении со слабым источником света либо на улице в сумерках, то оптика должна быть как можно более светосильной. Как правило, таковым считается объектив, минимальное значение диафрагменного числа которого 2,8 и ниже. Производители вариообъективов считают светосильной оптику с самыми разными параметра157
ми, однако правильнее всего называть этим термином такой объектив, у которого при "коротком" фокусе максимальное относительное отверстие эквивалентно 1/2,0-1/2,8, а при "длинном" фокусе - 1/2,5-1/3,0. Такая оптика обеспечивает более интенсивный световой поток, чем обычные объективы, поэтому можно использовать короткие выдержки и уменьшить риск смазывания кадра. Установка различных насадок (насадочных линз и светофильтров) на светосильные объективы не вызывает существенного ослабления светового потока. Использование этих насадок совместно с обычными объективами ограничено. Другим способом сделать фотокамеру компактнее является "переламывающаяся" схема, при которой объектив с видоискателем и вспышкой располагаются в одном блоке, а отсеки для аккумуляторов и сменной памяти, ЖК-дисплей и вся электроника - в другом. Между собой блоки соединяются шарниром, и потому могут поворачиваться на довольно большой угол. "Переламывающая" конструкция, помимо преимуществ (компактность, возможность съёмки из неудобных положений), обладает также серьёзным недостатком - поскольку ЭИО расположен в одном блоке с объективом, его излучатель находится слишком близко к оптической оси объектива, в результате значительно возрастает риск появления "красных глаз" на снимке. Именно поэтому в последних моделях "переломной" схемы используются откидывающиеся на шарнире вверх ЭИО. Большими возможностями обладают зеркальные цифровые фотокамеры. Отличительными чертами этой техники является использование вариообъективов достаточно высокой кратности (порядка 6-×) с большим диаметром входной зрачка и возможностью ручной фокусировки. К числу других особенностей относится наличие колодки для крепления до-
158
полнительной фотовспышки, управляемой экспозиционным автоматом камеры и зеркального видоискателя. Характерные режимы съёмки P — режим программной линии. Автоматический режим, при котором фотоаппарат автоматически, на основе заложенной логики (программной линии) и результатах экспозамера, устанавливает подходящие для правильного экспонирования кадра выдержку и диафрагму. Фотограф может вводить лишь экспокоррекцию. AUTO — автоматический режим. В нем, аналогично режиму «P», в фотоаппарате автоматически устанавливается выдержка и диафрагма. Доступ к таким настройкам, как выбор светочувствительности матрицы (ISO) и установка баланса белого, в этом режиме бывает недоступен и выбирается на основе логики заложенной в программном обеспечении к фотоаппарату. Помимо работы в полностью автоматическом режиме (P, AUTO) большинство моделей цифровых фотоаппаратов позволяют выполнять съёмку в одном из полуавтоматических режимов, адаптированных под конкретный сюжет. Av (или A) — режим приоритета диафрагмы. Полуавтоматический режим, при котором фотограф задает требуемую диафрагму, а экспонометрическое устройство фотоаппарата по результатам замера экспозиции подбирает подходящую для правильного экспонирования кадра выдержку. Кроме того, возможно внесение экспокоррекции. Tv (или S) — режим приоритета выдержки. Полуавтоматический режим, при котором фотограф задает требуемую выдержку, а экспонометрическое устройство фотоаппарата по результатам замера экспозиции подбирает подходящую для правильного экспонирования кадра диафрагму или сообщает о невозможности применения таковой. Также возможно 157
внесение экспокоррекции. M — «Manual». Полностью ручной режим. В этом режиме фотограф вручную задает необходимые выдержку и диафрагму, а фотоаппарат их отрабатывает. A-dep — режим приоритета глубины резко изображаемого пространства. Автоматический режим, при котором фотоаппарат пытается установить такую ГРИП, чтобы в ней оказались все найденные датчиками автофокуса точки. Таким образом фотоаппарат сперва устанавливает значение диафрагмы, а затем, произведя экспозамер, подбирает под нее выдержку. B — «Bulb». Ручная выдержка. Полностью ручной режим камеры, в котором длительность выдержки зависит от времени, которое фотограф удерживает кнопку спуска в нажатом положении. Чаще всего этот режим используется в сочетании с фотографическим тросиком и штативом во избежание нарушения неподвижности фотоаппарата. Диафрагму фотограф устанавливает вручную. Easy (или «простая съёмка») — аналог режима Auto, имеющийся на некоторых компактных фотокамерах. В этом режиме настройки и меню фотоаппарата обычно заблокированы и доступными являются только кнопка спуска, рычаг (кнопка) изменения фокусного расстояния и отключение вспышки. Портрет – режим для отделения человека от основного фона. «Размытие» фона обеспечивается установкой максимального относительного отверстия, что уменьшает до минимума глубину резко изображаемого пространства объектива. Спорт – фотосъёмка с минимальной выдержкой фотоаппарата. Этот режим не допускает «смазывания» изображения. Панорама – режим, при котором фотограф устанав158
ливает фотоаппарат на штатив и делает первый снимок панорамы. Затем фотоаппарат поворачивается вправо вокруг своей оси и выбирается его положение для следующего снимка. При этом встроенный ЖК-дисплей выполняет функцию видоискателя. Поверх наблюдаемого в данный момент времени изображения в левой части дисплея накладывается часть предыдущего снимка. Выполнив таким образом несколько снимков, итоговое изображение совмещается в панораму. Съемка панорам имеет три подрежима. Вариант AUTO самый простой – после первого снимка на экране появляются реперные отметки, которые нужно совместить при втором и третьем снимке (некоторые модели фотоаппаратов делают их автоматически, и даже распознают направление движения – панораму можно снимать в двух направлениях, влево или вправо). В подрежиме MANUAL также делаются три кадра. На экране появляется полупрозрачный край предыдущего кадра, который нужно совместить с началом следующего. Кнопку спуска затвора нужно нажимать самостоятельно, что дает возможность совместить снимки более тщательно. Наконец, подрежим PC – просто съемка отдельных кадров, которые потом нужно соединять в графическом редакторе. Фотоаппарат выводит полупрозрачную подсказку, как и в варианте MANUAL. Можно задать одно из четырех направлений съемки и сделать до десяти кадров. Sv — режим приоритета чувствительности матрицы. Автоматический режим, при котором фотограф устанавливает нужную ему чувствительность матрицы, а подходящая для правильного экспонирования кадра экспопара выбирается автоматически на основе измерения освещённости, выбранной чувствительности матрицы и заданной экспокоррекции. Tav — режим приоритета выдержки и диафрагмы. Полуавтоматический режим, при котором фотограф устанавли157
вает необходимые выдержку и диафрагму, а автоматика фотоаппарата подбирает соответствующую правильному экспонированию кадра чувствительность. В современных фотоаппаратах применяются и другие, менее распространённые режимы фотосъёмки. 4. ОСОБЕННОСТИ ЦИФРОВЫХ ФОТОАППАРАТОВ Основным преимуществом цифровых фотоаппаратов в настоящее время является высокая оперативность получения изображений при наличии соответствующей аппаратуры (компьютера, принтера или TV-монитора, а также – возможность их разнообразной технической и художественной обработки). Однако на сегодняшний день необходимо отметить ряд недостатков, присущих цифровой фотоаппаратуре, таких как: 1. Зависимость качества изображения от формата отпечатка; 2. В большинстве цифровых фотоаппаратов невозможно получить изображение движущихся объектов с высоким качеством; 3. Любительские цифровые фотоаппараты имеют невысокую разрешающую способность, а некоторые – неадекватную передачу цвета; 4. Ограничение количества снимков, накладываемое объёмом носителя информации; 5. Пропорциональность качества снимков объёму, который они занимают; 6. Для печати фотографий необходим качественный принтер; 7. Наряду с тем, что в конструкции плёночных и цифровых фотоаппаратов много общего, их многое отличает. Ряд отличий, таких как формат изображения, вид носителя записи и др., были рассмотрены выше, однако существуют осо158
бенности, которые также необходимо учитывать при эксплуатации цифровой фотоаппаратуры. 4.1. Скорость работы цифрового фотоаппарата При съёмке цифровым фотоаппаратом, по сравнению с плёночным, имеются дополнительные затраты времени, от которых зависит общее быстродействие аппарата. Одна из таких задержек возникает между моментом нажатия на спусковую кнопку и фиксацией изображения на матрице ПЗС. Она составляет 1 – 2 с и объясняется тем, что при нажатии на кнопку спуска аппарат подготавливается к съёмке, т. е. в это время происходит определение экспозиционных параметров, фокусировка объектива, подготовка к работе матрицы и установка «баланса белого». Другая задержка возникает между двумя последовательными съёмками, так как закодированное изображение необходимо обработать и записать на носитель. В различных аппаратах это время может составлять от 1 до десятков секунд. На время обработки сигнала в цифровом фотоаппарате влияют три фактора: - быстродействие элементов ПЗС; - скорость обработки и сжатия сигнала изображения; - скорость передачи данных из процессора на носитель. В некоторых цифровых фотоаппаратах имеется режим, при котором серия из нескольких снимков производится до тех пор, пока нажата пусковая кнопка. В этом случае увеличение частоты съёмки приводит к уменьшению разрешающей способности, а значит, к ухудшению качества изображения. 4. 2. Особенности объективов цифровых фотоаппаратов Размер кадра в плоскости изображения цифрового фо157
тоаппарата определяется размерами матрицы ПЗС. В любительских аппаратах используются матрицы небольших размеров с диагональю от 1/3 дюйма до 1 дюйма, тогда как стандартный кадр малоформатного плёночного аппарата имеет размеры 24 × 36 мм. Поэтому нормальные объективы таких фотоаппаратов имеют меньшие фокусные расстояния, чем у стандартных плёночных фотоаппаратов. Напоминаем, что нормальное фокусное расстояние объектива равно диагонали кадра. Этот факт автоматически увеличивает светосилу объектива, величина которой зависит от относительного отверстия: D ε= , (4.1.) f′ где D – диаметр входного зрачка объектива, f ′ - его фокусное расстояние. Тогда светосила объектива определится следующим образом: 1 J = πε 2 . (4.2.) 4 С другой стороны цифровое изображение, снятое при малой освещённости, можно искусственно «осветлить» программным способом, но нужно учитывать, что при этом возрастёт и шумовой сигнал. 4.3. Вертикальное и горизонтальное расположение фотоаппарата при съёмке (книжный и альбомный форматы) В обычных плёночных фотоаппаратах, чтобы изменить формат изображения, достаточно повернуть фотоаппарат на 900, тогда как при повороте цифрового аппарата при просмотре изображения оно окажется повёрнутым на 900. В этом случае необходимо развернуть его снова с помощью программы редактирования. В некоторых цифровых фотоаппаратах име-
158
ется специальный режим работы, в котором фотоаппарат автоматически определяет, в каком положении он находится в процессе съёмки. При необходимости процессор фотоаппарата сам развернёт изображение. 4.4. Стабилизация изображения Под стабилизацией изображения понимаются меры от сползания границ кадра на матрице вследствие изменения положения фотоаппарата в процессе съёмки. В киносъёмочной аппаратуре это называется «дрожание рук оператора». Стабилизаторы изображения можно разделить на три типа - оптические, электронные и цифровые. Электронный стабилизатор воздействует не на оптические элементы, а на сенсор (матрицу) фотоаппарата, перемещая его в вертикальной плоскости таким образом, чтобы сфокусированное объективом изображение оставалось неподвижным. В этом способе часть пикселей на матрице камеры отводится на стабилизацию и не участвуют в формировании изображения [8]. "Лишние" пиксели служат своеобразным буфером - при дрожании камеры изображение "плавает" по матрице, электроника фотоаппарата фиксирует эти колебания, используя эти "буферные" пиксели и вносит необходимую коррекцию, компенсируя «дрожание» изображение. При этом важно, чтобы при своем «дрожании» изображение всегда находилось в пределах матрицы, не уходя за буферную зону, иначе электроника не сможет вычислить и применить необходимые поправки. Основной особенностью электронного стабилизатора является то, что стабилизация происходит с помощью самой матрицы и электроники обработки изображения. При этом включение стабилизации влияет на работу этой системы. В частности, могут измениться экспозиционные параметры. Ещё одним недостатком является то, что 157
включение системы электронной стабилизации неизбежно сказывается на процессе формирования и обработки изображения с матрицы. Это приводит к различного рода артефактам изображения, наиболее известным из которых является "залипание" изображения при панорамировании фотоаппарата - стабилизатор не сразу её "отпускает", отчего изображение движется рывками. Тот же эффект может проявиться и при съемке движущихся предметов - система электронной стабилизации может решить, что это перемещение относится ко всему изображению и начнет "стабилизировать" его, пытаясь вернуть перемещающиеся объекты "на место". Кроме того, неэффективно используется матрица - до половины пикселей на ней не участвуют в формировании изображения Цифровой способ стабилизации изображения основан на резервировании дополнительных элементов ПЗС матрицы под возможное смещение изображения. Активная площадь матрицы уменьшается, а при выступлении изображения за её границы используются дополнительные наружные ячейки. Цифровой стабилизатор работает по интерполяционным алгоритмам, заменяя пиксели "размытых" участков изображения "резкими". Эта схема относительно дешева и экономична по энергопотреблению, но эффективна лишь при небольших вибрациях фотоаппарата. Самым действенным способом является оптическая стабилизация. В оптическом стабилизаторе применяется целая система, которая встраивается в объектив. Она состоит из отклоняющей линзы, подвижного тубуса, соленоида или двигателя, перемещающих линзу в вертикальной плоскости (относительно оптической оси самой линзы и объектива в целом) и гироскопа, удерживающего линзу в строго горизонтальном положении при перемещениях фотоаппарата. Как только электроника фиксирует движение фотоаппарата, отклоняющая линза компенсирует эти перемещения, отклоняя свето158
вые лучи таким образом, что сфокусированное изображение на поверхности матрицы остается неподвижным. Оптический способ стабилизации изображения аналогичен подобным устройствам к киносъёмочной аппаратуре и предполагает размещение элементов оптической системы внутри аппарата на подвижной (гиро-) подвеске. Таким образом, при качании фотоаппарата его оптическая система не изменит своего положения. Этот способ не влияет на качество изображения и хорошо работает в широком диапазоне увеличений, но дорог, а также ведёт к увеличению габаритов фотоаппарата и к повышенному энергопотреблению. Поэтому он используется, в основном, в полупрофессиональных и профессиональных фотоаппаратах. Схема работы оптического стабилизатора приведена на рис. 4.1 [9].
Рис. 4.1 Работа оптического стабилизатора 157
Стабилизатор изображения сдвигает группу линз объектива в параллельной к матрице плоскости. Когда объектив перемещается вследствие сотрясения, световые лучи от объекта (его изображение) сдвигаются относительно оптической оси, вызывая появление смазанного изображения. Сдвигая группу линз стабилизации в плоскости, перпендикулярной плоскости матрицы в необходимых пределах для компенсации перемещения объектива можно добиться эффекта, когда лучи достигающие плоскости матрицы фактически остаются неподвижными. На рис. 4.1 показано как механически происходит исправление хода лучей в случае, когда объектив смещается. Центр изображения при этом сдвигается вниз по плоскости матрицы. Когда группа линз стабилизации сдвигается в вертикальном направлении, лучи, формирующие изображение преломляются, и центр изображения возвращается в центр кадра. Так как паразитические движения происходят и в горизонтальном и в вертикальном направлениях, группа линз блока стабилизации может сдвигаться и в вертикальном и в горизонтальном направлениях в плоскости перпендикулярной оптической оси объектива и параллельной плоскости матрицы. Перемещения фотоаппарата улавливаются двумя гироскопическими сенсорами. Сенсоры определяют направление (угол) и скорость перемещения («дрожания») камеры с объективом, обычно возникающей при съёмке с рук. Для предохранения гиросенсоров от ошибок, связанных с реакцией на перемещение зеркала камеры или срабатыванием затвора, сенсоры заключены в специальные защитные блоки Группа линз блока стабилизации (рис. 4.2) имеет прямой привод от сердечников (соленоид). Устройство мало, легко, потребляет более чем умеренное количество энергии, отличается малым временем отклика - быстрой реакцией на команды. Устройство позволяет эффективно компенсировать вибрации с частотой от 0,5 до 20 Гц. Позиция блока стабили158
зации определяется с помощью инфракрасных светодиодов излучателей (IREDs -Infrared Emitting Diodes) на оправе блока и устройства определения положения (PSD-Position sensing Device), расположенных на плате электроники блока. Таким образом, изначально устройство стабилизации имеет обратную связь для точного позиционирования. Устройство стабилизации имеет также блокиратор, который устанавливает группу линз стабилизации в центральную нейтральную позицию, в случае, когда устройство стабилизации изображения выключено [9].
пьютером. Он учитывает такие параметры, как текущее фокусное расстояние и положение стабилизирующих линз внутри объектива (3 и 5), передает управляющие команды на микроприводы (2), которые, в свою очередь, смещают соответствующие линзы в стабилизирующей группе (4) в нужных направлениях на требуемое расстояние. Эти элементы находятся в постоянной взаимосвязи, и на одну операцию (считывание данных с сенсоров, расчет, смещение линз) уходит 1/1000 секунды. Таким образом, внутри объектива идет непрерывная корректировка хода лучей перед попаданием их на светочувствительную поверхность. В итоге системы стабилизации изображения, использующие перемещение группы линз, позволяют избегать упомянутого выше жесткого соотношения выдержки и фокусного расстояния оптики при съемке с рук. Скорость срабатывания затвора при этом можно уменьшать в 4–8 раз.
Рис. 4.2 Устройство оптического стабилизатора На рис. 4.3 приведены основные элементы стабилизирующей системы, встроенной непосредственно в объектив [9]. Сенсоры движения регистрируют вращения камеры вокруг осей Y(1) и X(6). Их сигналы фиксируются микроком157
Рис. 4.3 Основные элементы стабилизирующей системы, встроенной в объектив
158
Пошагово устройство стабилизации изображения работает следующим образом [9]: 1. При нажатии кнопки спуска затвора наполовину, группа линз стабилизации разблокируется и активизируются гироскопические сенсоры для детекции перемещения камеры. 2. Гиросенсоры определяют угол и скорость перемещения камеры и посылают информацию об этом в микрокомпьютер. 3.Микрокомпьютер преобразует эти сигналы в команды управления устройством стабилизации и передает их в устройство стабилизации. 4. В соответствии с полученными командами устройство стабилизации смещает группу линз стабилизации перпендикулярно оптической оси. 5. При этом сдвиге датчики положения группы линз стабилизации обрабатывают информацию о смещении и передают эту информацию в микрокомпьютер. 6. Микрокомпьютер сравнивает сигналы управления переданные в шаге 3 с сигналами устройства детекции положения группы линз стабилизации и осуществляет таким образом контроль с помощью этой обратной связи. Это улучшает точность в управлении группой линз стабилизации изображения. 4.5. Цветовой баланс Для качественной цветопередачи необходимо, чтобы как фотопреобразователи, так и все остальные элементы ЦФА, регистрировали и воспроизводили цветное изображение одинаково. Однако ПЗС матрицы по-разному регистрируют и обрабатывают различные части спектра светового сигнала. Это зависит не только от их конструктивных особенностей и материалов полупроводника и его окисла, но и от установленного цветового баланса матрицы и цветового баланса света, падающего на объект съёмки. Белый цвет можно пред157
ставить, как сумму основных цветов в определённом соотношении: Б = gG + bB + rR, (4.3.) где r, g и b – множители, определяющие количество основных цветов. Но «белый» цвет не одинаков для различных условий съёмки: днём, на закате, в помещении, при солнечном свете или при облачности, и т. д. Поэтому цвет объекта съёмки зависит от света, которым он освещается. Установлено, что если белый цвет на изображении воспроизводится правильно, то и остальные цвета – тоже. Вследствие этого перед началом съёмки в цифровом фотоаппарате осуществляется баланс белого цвета. Регулируя баланс белого цвета, осуществляют настройку цифрового фотоаппарата при различных источниках освещения. При этом регулируется чувствительность ячеек ПЗС к различным цветам. После установки белого цвета система корректирует вклад каждого из основных цветов в общий спектр освещения. В ряде цифровых фотоаппаратов датчик цветовой температуры представляет собой два светочувствительных элемента (как правило – фотодиоды), перед которыми расположены красный и синий фильтры. Датчики измеряют уровень красной и белой составляющих освещения и таким образом определяют цветовую температуру источника освещения. В простых компактных цифровых фотоаппаратах датчиков нет, а цветовая температура определяется из соотношения красного и синего сигналов, формируемых на выходе ПЗС матрицы. В этом случае матрица работает точно лишь в ограниченном диапазоне цветовых температур. Матрица цифрового фотоаппарата может быть сбалансирована под различные цветовые температуры. Установленный баланс можно посмотреть предварительно на экране 158
ЖКД и изменить его. У данной системы есть несколько режимов работы: - auto (широкий диапазон освещения); - manual (ручной – с помощью регулятора); - sanny (для солнечного освещения); - incondencend (для освещения лампами накаливания); - fluorescent (источники освещения – лампы дневного света); - cloudy (при облачной погоде); - flash (с фотовспышкой). 5. ПЕЧАТЬ ИЗОБРАЖЕНИЙ Цифровой фотоаппарат является только одним звеном комплекса для получения изображений. Кроме него необходима следующая аппаратура: компьютер с высоким быстродействием и обширной памятью, печатающие устройства (принтеры) и графические программы обработки изображения. При необходимости можно перевести цифровой сигнал в аналоговую форму и рассматривать изображение на экране телевизора, а также – записать его на видеомагнитофон. В результате комплекс для просмотра изображений может иметь схему, представленную на рис. 5.1.
Рис. 5.1 Схема комплекса для получения изображения с цифрового фотоаппарата В настоящее время для печати фотоизображений могут использоваться струйные, лазерные и сублимацинонные принтеры. 157
158
5.1 Струйные принтеры Принцип работы чёрно-белого струйного принтера показан на рис. 5.2.
Рис. 5.2 Схема чёрно-белого струйного принтера 1 – сопло; 2 – пъезовибратор; 3 – диафрагма; 4 – бумага Для получения отпечатка используется метод записи струёй чернил или специального красителя. Непрерывный поток капель со скоростью 104 – 105 капель в секунду, создаваемый с помощью сопла 1 и пъезовибратора 2, приобретает определённый электрический заряд или намагниченность, зна157
чение которых соответствует оптической плотности записываемого изображения, и, следовательно, получает возможность отклоняться под действием электрического или магнитного поля. Поле возбуждается в диафрагме 3 с минимальным отверстием. В зависимости от величины заряда капли либо все проходят сквозь отверстие в диафрагме и попадают на бумагу 4 (см. рис. 5.2. а), либо частично отклоняются, а частично попадают на бумагу (рис. 5.2. б), либо отклоняются полностью, не достигая бумаги (рис. 5.2. в). В результате изображение на бумаге по оптической плотности пропорционально или негативно управляющему сигналу, который в свою очередь пропорционален яркости исходного изображения. Для получения цветного отпечатка используются три сопла с жёлтым, пурпурным и голубым красителями, расположенные таким образом, что на бумаге образуется триада точек, причём цветоделённые потоки наносятся на бумагу с пространственной частотой выше разрешающей способности зрительного анализатора (разрешающая способность зрительного анализатора Nза, приведённая к плоскости бумаги, составляет порядка 8 – 10 мм-1). Для увеличения контраста изображения добавляется четвёртое сопло с чёрным красителем. При таком способе печати восприятие нужного цвета достигается за счёт усреднения зрительным анализатором плотности и интенсивности точек различного цвета. Недостатком четырёхцветной печати является заметность растровой структуры изображения на светлых участках. Для предотвращения этого дефекта в настоящее время используются шести-, восьми- и даже двенадцатицветные принтеры, в которых добавляются светло-голубые, светложёлтые, светло-пурпурные и светло-серые красители. Растровая структура изображения перестаёт быть заметной, однако увеличивается расход красителя и размеры точки на бумаге, что ведёт к уменьшению разрешающей способности отпечатка. 158
Преодолеть последний недостаток позволил переход от непрозрачных к прозрачным красителям. В этом случае все сопла расположены так, что наносят красители в одну и ту же точку, и итоговый цвет образуется за счёт сложения нанесённых цветов(по аналогии с многослойными цветными кино- и фотоплёнками). Ещё одним перспективным способом печати является изменение плотности изображения за счёт изменения размеров точек, которое осуществляется изменением размеров диафрагм под действием управляющего сигнала. Красители струйных принтеров должны удовлетворять следующим, иногда противоречащим друг другу, требованиям: 1) они не должны быть слишком густыми для предотвращения засорения сопел; 2) но они также не должны быть слишком жидкими, иначе капли растекутся по бумаге; 3) они должны быстро сохнуть, но только на бумаге; 4) они должны иметь определённый и точный спектральный состав; 5) и наконец, они должны быть устойчивыми к выцветанию. До относительно недавнего времени красители для струйных принтеров зависели от влажности окружающего воздуха, и свежие отпечатки на простой бумаге могли смазываться. В настоящее время этот дефект преодолён. В связи с широким распространением цифровой фотографии для получения различного вида изопродукции: от обычных снимков до плакатов, постеров, репродукций художественных полотен и др., - красители для струйных принтеров подверглись ряду усовершенствований. Для разных носителей изображения, которых будет сказано позже, используется два вида красителей: на водной основе и на основе растворителей. Красители на водной основе применяются для бумаги различного качества, а красители на основе специаль157
ных растворителей – для полимерных материалов, например, виниловых плёнок. Растворитель внедряет красящие вещества в наружный слой носителя и испаряется, тогда как краска остаётся в материале носителя. В качестве носителей изображения для струйных принтеров может использоваться обычная бумага, однако для получения качественных отпечатков она, как правило, не применяется. Наиболее распространёнными для струйных фотопринтеров являются два типа бумаги: глянцевая и матовая. Глянцевая бумага – это по сути фотобумага без светочувствительного слоя, матовая имеет специальное минеральное покрытие очень высокой белизны. Однако в настоящее время в профессиональной цифровой фотографии появилось множество разновидностей специальной бумаги: бумага «под холст», бумага с повышенной впитываемостью, бумага с текстурным рисунком, бумага с повышенным глянцем и т.д. Как было сказано выше, в качестве носителей используются и другие материалы: виниловые плёнки, керамика, металл и др. 5.2. Лазерные принтеры Лазерные принтеры не нашли широкого применения в цифровой фотографии, так как являются более сложными, габаритными и дорогостоящими, чем струйные, однако обеспечивают высокое качество изображения даже на обычной бумаге. Принцип работы лазерного принтера показан на рис. 5.3. Принцип действия лазерного принтера иногда называется электрофотографическим, так как он основан на применении специального электрофотографического (ЭФГ) барабана 1. ОН выполняется, как правило, из алюминия и покрыт специальным фоточувствительным слоем (SeTe, KdSO3), обладающим внешним фотоэффектом. 158
Рис. 5.3. Схема лазерного принтера. 1 – электрофотографический (ЭФГ) барабан; 2 – постоянный источник света; 3 – щётка; 4 – вентилятор; 5 – коротрон; 6 – узел перенесения изображения на бумагу; 7 – узел кадрирования; 8 – узел приёма бумаги; 9 – подающее устройство; 10 – тонер; 11 – печатающий луч; 12 – красный, зелёный и синий лазеры; 13 – модуляторы видеосигнала; 15 – вращающаяся многогранная призма; 16 – устройство закрепления красителя на бумаге При попадании на поверхность барабана лучистой энергии фоточувствительный слой испускает электроны, количество которых пропорционально попавшему на поверхность световому потоку. Таким образом на поверхности барабана образуется положительный заряд, также пропорциональный величине светового потока. Краситель, заряженный 157
отрицательно, прилипает к барабану в количестве, пропорциональном его заряду. ЭФГ барабан 1 вращается с постоянной угловой скоростью. Первой операцией в работе принтера является удаление находящегося на барабане заряда, оставшегося от предыдущего изображения. Оно производится путём равномерной засветки барабана постоянным источником света 2, в результате чего с барабана удаляются лишние электроны, и остатки красителя снимаются при помощи магнитных щёток 3 и вентилятора 4. Затем при помощи коротрона 5 на барабан наносят равномерный отрицательный заряд (с напряжением 500 – 600 В) для приведения его в нейтральное состояние. Элемент 7 предназначен для экспонирования рамок, дат и других стандартных элементов. После этого осуществляется экспонирование барабана лучами лазеров 12, интенсивность которых регулируется лазерными модуляторами 13. Лазерные модуляторы – это устройства, коэффициент пропускания которых изменяется под действием электрического сигнала, который, в свою очередь, пропорционален оптической плотности элементарных участков изображения. За один оборот барабана экспонируется одна строка изображения. Развёртка лазерного луча вдоль барабана осуществляется при помощи вращающейся многогранной призмы 15. Полученное на барабане скрытое электростатическое изображение проявляется при помощи порошкового красителя (тонера) жёлтого, пурпурного и голубого цветов, наносимого при помощи магнитных щёток. Эта операция, как и операция развёртки, требует точного согласования частоты вращения барабана, призмы и щёток. Следующей операцией является печать, т. е. перенесение красителя на бумагу. Этот процесс осуществляется в отрицательном электростатическом поле (узел 6), чтобы положительно заряженные частицы порошка прилипали к бумаге. Если бумага имеет толщину более 100 мкм, интенсивность 158
переноса зависит от напряжённости поля, если же бумага тоньше, зависимость отсутствует. Чтобы закрепить тонер на бумаге, происходит её термическая обработка в устройстве 16. Она происходит в два этапа: проводя бумагу вдоль стола, нагретого до 1100С и сквозь ролики, нагревая её до 1400С. В это время барабан 1 проходит следующий цикл обработки. Как было сказано выше лазерные принтеры позволяют получить высокое качество изображения, которое, однако, зависит от скорости печати. 5.3. Сублимационные принтеры Принцип работы сублимационного принтера показан на рис. 5.4. Краситель нанесён на специальную ленту. Под действием нагретого печатающего элемента (или гребёнки элементов) краситель переносится на бумагу. В последних моделях между термоэлементами и бумагой имеется зазор, и на бумагу краситель попадает в виде паров, испаряющихся из ленты 3. Цветная печать осуществляется за четыре прохода бумаги относительно лент 3, которые содержат чёрный, жёлтый, пурпурный и голубой красители. Вне зависимости от конструкции и типа принтера, к ним предлагаются следующие требования: 1. Разрешающая способность принтера должна быть не меньше разрешающей способности ПЗС матрицы, приведённой к плоскости отпечатка 2. Должно выполняться соответствие основных цветов (R,G,B) при съёмке и дополнительных (C, M, Y) при печати. Поэтому, как и при съёмке на плёночную фотоаппаратуру, все основные фирмы балансируют процессы съёмки и печати для сохранения качества цветопередачи. 157
Рис. 5.4. Схема сублимационного принтера 1 – бумага; 2 – транспортирующий валик; 3 – лента с красителем; 4 – термоголовка.
158
ЛИТЕРАТУРА 1. Гудинов К.К., Двуреченский С.А. Цифровая фотоаппаратура: Методические указания по выполнению лабораторных работ. – СПб.: СПбГУКиТ, 2010. 2. Степаненко О.С. Сканеры и сканирование: Краткое руководство -М.:Изд. дом «Вильямс», 2004. 3. Шпунт Я.Б. Всё о сканерах. - М: АСТ: НТ Пресс, 2004. 4. Гонсалес Р., Вудс Р., Цифровая обработка изображений. М.: Техносфера, 2006. 5. Лидовский В.В., Теория информации: Учебное пособие: – М.: Спутник +, 2004. 6. Айсманн К., Дугган Ш., Грей Т., Цифровая фотография. Искусство фотосъёмки и обработки изображений Пер. с англ.- СПб.: ДиаСофтЮП, 2005. 7. Тайц А.М., Тайц А.А. Adobe Photoshop 7- СПб.: БХВ - Петербург, 2004. 8. http://shop.panoramatrade.com. 9. http://itc.ua/articles. 10. Беляев Е.А., Тюрликов А.М., Уханова А.С. Адаптивное арифметическое кодирование в стандарте JPEG 2000. Информационно-управляющие системы №6, 2007. 11. Домасаев М.С., Гнатюк С.П., Цвет, управление цветом, цветовые расчёты и измерения.- СПб.: Питер, 2009.224с. 9. Стратонович Р.Л., Теория информации., Москва., «Сов. радио» 1975, 424 стр. 10. Яковлев А.Н. Учебное пособие. Введение ввейвлет преобразование.- Новосибирск, 2003.-Издательство НГТУ, 2003, 104 с.
157
СОДЕРЖАНИЕ Введение....................................................................................3 1. Принципы построения цифрового фотоаппарата ..….…4 2. Основные показатели цифровых фотоаппаратов…...….23 3. Классификация цифровых фотоаппаратов ……....…..…35 4. Особенности цифровых фотоаппаратов……………...….49 5. Печать изображений ……....…………………………..…62 6. Сканеры и сканирование ……………..........................….69 7. Кодирование изображений……………...………………...79 8. Цветовая модель и цветовое пространство ………...…83 9. Сжатие изображений и форматы графических файлов....92 10. Редактирование в Adobe Photoshop ………………...…138 Литература............................................................................. 157
Редактор Л.Н. Торбачева Корректор О.А. Оськова Подписано в печать . . 10 г. Формат 60 × 84/16. Печать офсетная. уч. – изд. л. печ.. л. . Тираж 150 экз. Заказ Редакционно – издательский отдел СПбГУКиТ. 192102. С. -Петербург, ул. Бухарестская, 22. Подразделение оперативной полиграфии СПбГУКиТ. 192102. С. - Петербург, ул. Бухарестская, 22.
158
157
158
6. Сканеры и сканирование Сканер - периферийное устройство персонального компьютера, позволяющее вводить в компьютер в электронном виде статические оригиналы - изображения (текстовые документы, фотографии, рисунки, слайды, негативы). Переданная в компьютер информация представляет собой двумерный массив чисел. Элементы этого массива называют пикселами (от английского pixel- picture element). Имеются два основных класса компьютерных изображений: векторные и растровые. Векторные изображения определяются множеством точек, связанных математическими соотношениями. Растровые изображения задаются матрицей, описывающей точки экрана и их цвет. Чем выше качество растрового изображения (больше пикселов и больше глубина цвета), тем больше потребуется памяти для хранения информации для каждого пиксела. Растровые изображения ближе к фотографии, поскольку позволяют более точно воспроизводить основные характеристики фотографии: освещенность, прозрачность, плавность переходов, тональность и пр. В отличие от векторных изображений растровые изображения плохо масштабируются, нужные масштабы и разрешающая способность задаются при создании изображения. Один из способов получения растровых изображений - сканирование фотографий, слайдов или негативов. Если посмотреть на фрагмент растрового изображения в увеличенном виде, то можно заметить, что плавная линия представляется в виде ступени, но при высокой разрешающей способности и большом числе цветов эти ступеньки не заметны для глаза. Векторное изображение может отличаться очень высокой точностью передачи линий и сложных геометрических форм. Векторные изображения не могут быть получены путем сканирования, они создаются с помощью специальных пакетов векторной графики или путем специ69
альных математических преобразований растровых изображений. Лабораторная работа посвящена именно растровым изображениям. Оригиналы изображений можно разделить на непрозрачные (фотографии, рисунки, страницы документов и т.п.) и прозрачные (цветные и чёрно-белые слайды и негативы). Изображение непрозрачных оригиналов формируется при отражении света. Во втором случае оптическая система сканера обрабатывает не отражённый от оригинала свет, а лучи, прошедшие через слайд или негатив. Таким образом, расположение источников освещения для непрозрачных и прозрачных образцов отличается. Комбинированный сканер позволяет сканировать как непрозрачные, так и прозрачные оригиналы. Несмотря на большое количество типов сканеров, принцип их работы приблизительно одинаков (рис. 6.1). В основе сканирования лежит процесс оцифровки (аналогоцифровое преобразование) изображения оригинала для создания его электронного образа. Специальный источник света (сегодня это, как правило, специальная лампа с холодным катодом) освещает (для непрозрачных оригиналов) или просвечивает (для пленок) оригинал изображения, после чего при помощи оптики световой поток проецируется на фотоприёмники, которые в зависимости от яркости проекции передают электрические заряды в АЦП (аналого-цифровой преобразователь), где электрические сигналы преобразуются в компьютерный код. АЦП должен обеспечить точность преобразования, что находит выражение в его разрядности. Разрядность АЦП отображает то количество дискретных отчётов, которое может предоставить это устройство для преобразования входного аналогового сигнала. Разрядность АЦП сканера оценивается параметром «внутренняя глубина» цвета сканера. С выхода АЦП цифровые данные сканирования построчно через порт вводятся в персональный компьютер (ПК). 70
Конструктивно ФЭУ представляет собой стеклянный баллон с торцевым или боковым рабочим окном и расположенными внутри баллона электродами: катодом, анодом и диодами. Поток света через рабочее окно попадает на катод, выбивая из него электроны. При этом фототок, возникающий в фотоэлементе под воздействием света, прямо пропорциона-
лен интенсивности падающего на него светового потока. Система диодов умножает этот ток в миллионы раз за счет того, что они сделаны из материалов, имеющих высокий коэффициент вторичной эмиссии. Поток электронов от диода к диоду возрастает многократно, и через сопротивление нагрузки в анодной цепи ФЭУ протекает усиленный ток. За счет своей конструкции ФЭУ способен регистрировать очень слабые световые сигналы (вплоть до единичных фотонов) и, следовательно, имеет весьма широкий динамический диапазон (определяемый соотношением максимального и минимального сигналов). Спектральный диапазон ФЭУ для полиграфических целей подходит идеально, так как перекрывает видимый спектр. Однако сегодня ФЭУ используются в качестве светочувствительных приборов только в барабанных сканерах. Дело в том, что к стабильности работы ФЭУ предъявляются жесткие требования и по источнику питающего напряжения, и по другим электрическим параметрам, поэтому сегодня самыми распространенными фотоприемниками в большинстве сканеров являются ПЗС. Прибор с зарядовой связью (ПЗС) -это твердотельный электронный прибор, выполненный по технологии МОП (металл-оксид - полупроводник), состоящий из множества крошечных светочувствительных элементов, которые формируют заряд, пропорциональный интенсивности падающего на них света. Для создания прибора с зарядовой связью на поверхность полупроводникового кристалла (как правило, кремния) наносят прозрачную оксидную плёнку, служащую диэлектриком в микроскопических конденсаторах, обкладками которых являются поверхность самого кристалла и нанесенные на диэлектрик металлизированные электроды. Толщина электродов составляет доли микрона (0,1-0,6 мкм). К электродам в определенной последовательности подается низкое напряжение (5-10 В), под электродами образуются так называемые потен-
155
156
Центральный процессор (ЦП) собирает все строки и в определённом порядке откладывает их в буфер системного оперативного запоминающего устройства (ОЗУ). Для управления сканером используются средства аппаратного и программного интерфейсов. Оцифрованное изображение записывается в определенном формате для дальнейшего использования. Основным считывающим элементом любого сканера являются фотоприёмники. Сегодня наиболее часто используются фотоприёмники двух видов: фотоэлектронные умножители ФЭУ и приборы с зарядовой связью ПЗС или CCD Charge Coupled Device.
Рис. 6.1. Обработка сканированного изображения
циальные ямы (скопления электронов). Свободные электроны появляются в результате внутреннего фотоэффекта под воздействием света. Чем выше интенсивность светового потока, падающего на чувствительную площадку данного электрода, тем больше электронов скапливается под ним, образуя зарядовый пакет. В ПЗС линейке зарядовые пакеты передаются из одной потенциальной ямы в другую, добираясь, таким образом, до последней ячейки, с которой поступают на предусилитель. В одной ПЗС линейке может быть от нескольких сотен до нескольких тысяч фоточувствительных ячеек. От размера элементарной ячейки ПЗС зависит не только разрешающая способность сканера, но и максимальная величина удерживаемого заряда, а следовательно, и динамический диапазон. В сканере отдельные ПЗС монтируются в фотопринимающие матрицы (ПЗС матрицы или КДИ матрицы), которые могут быть выполнены как в виде ПЗС линеек, так и в виде прямоугольной матрицы. В цветных сканерах при линейном способе считывания информации микродатчики ПЗС размещаются на кристалле в одну линейку (для трёхпроходного сканирования - по одному на каждый исходный цвет) или в три линейки (для однопроходного сканирования). ПЗС линейка позволяет производить сканирование всей ширины исходного изображения и фиксировать его построчно. Данный способ формирования изображения (рис. 6.2) обычно используется в планшетных, роликовых и проекционных сканерах. В слайдовых сканерах, цифровых фото- и видеокамерах ПЗС датчики обычно имеют форму прямоугольной матрицы, что позволяет одновременно выводить не одну строчку изображения, а целый блок (кадр). В последние годы сканеры с технологией ПЗС пополнились еще одной разновидностью - КДИ модификация сканера. КДИ - это контактный датчик изображения (CIS, Contact Image Sensor). Принципиального различия (с точки зрения
МОП технологии) между КДИ и ПЗС матрицами нет. КДИ сканеры отличаются от ПЗС сканеров тем, что в них матрица растянута на всю ширину рабочей области, поэтому полностью отсутствует оптическая система. Второе отличие заключается в том, что в КДИ модификациях сканеров источник освещения заменяется светодиодами. При этом для цветного сканирования возникает необходимость в трех светодиодах на пиксел. Зеркала и объектив в КДИ сканерах не используются. КДИ сканеры имеют меньшие габариты, меньшую потребляемую мощность и меньшую стоимость, что достигается за счет отсутствия объектива, зеркал, призмы, применения светодиодов вместо лампы с холодным катодом, так как при нагретой лампе появились бы искажения (шумы) при сканировании.
155
156
Рис. 6.2. Оптическая схема сканера на ПЗС За счет отсутствия оптики и лампы КДИ сканеры менее капризны в эксплуатации и могут работать в экстремальных условиях. Однако, если сравнивать основные характеристики, результат оказывается явно в пользу ПЗС технологий, поэтому профессиональные модели сканеров всегда основаны на технологии ПЗС с использованием различного класса оптики.
В КДИ сканерах ввиду отсутствия оптики качество сканирования абсолютно равномерно. У ПЗС сканеров качество сканирования может существенно отличаться в центре рабочей области и по краям вследствие недостатков фокусировки оптической системы (этот эффект неизбежен для любых приборов, в которых используется объектив). И тем не менее технические параметры ПЗС сканеров существенно выше. Качество сканирования определяется следующими характеристиками устройства: Разрешающая способность сканера Разрешающая способность (разрешение) сканирования - это совокупность параметров, характеризующих минимальный размер деталей изображения, который сканер в состоянии считать. Разрешение сканера, в свою очередь, состоит из трех параметров: оптическое разрешение, аппаратное и интерполяционное. Разрешение определяет, сколько пикселов изображения может вводить сканер на единицу площади оригинала. Измеряется в пикселах на дюйм ppi (pixels per inch). С увеличением разрешения возрастает чёткость получаемого изображения. Оптическое разрешение Оптическое разрешение или горизонтальное разрешение (по оси X). Описывает объём реальной информации, который может ввести оптическая система сканера. Факторы, определяющие оптическое разрешение, зависят от характеристик и типа светочувствительных оптико-электронных преобразователей. Оптическое разрешение R опт (ppi) планшетного сканера в первую очередь зависит от числа светочувствительных сенсоров на линейке ПЗС: (6.1) = 2,54 N ПЗС , b где N пзс - количество сенсоров ПЗС на линейке скани-
R
опт
рующего элемента;
155
b- ширина сканера, см. Для формата А4 это 21 см. 2,54- отношение дюйма к см. Вместе с тем отражённые лучи попадают на линейку через объектив. Таким образом, оптическое разрешение находится в прямой зависимости от светотехнических характеристик применяемой оптики. Оно может быть ухудшено за счёт высокого уровня шумов в АЦП. Аппаратное разрешение Аппаратное разрешение сканера, или вертикальное разрешение (по оси Y). Каретка со считывающей головкой сканирования перемещается в планшете вдоль оригинала. Такое перемещение реализуется посредством шагового двигателя, работа которого основана на повороте ротора на определённый угол при воздействии импульсов синхронизации. Количество остановок шагового двигателя в пределах одного дюйма определяет аппаратное разрешение сканера. Оно определяется точностью механики сканера и задаётся минимальными перемещениями оптической системы. Аппаратное разрешение может вдвое превышать оптическое. Интерполяционное разрешение Фактическое разрешение для офисного планшетного сканера на ПЗС составляет максимум 1200 ppi. Тем не менее, в руководстве пользователя пишут о 4800 или даже 9600 ppi. Все эти чрезмерно высокие значения базируются на методе, называемом интерполяцией. Это увеличенное с помощью математических методов разрешение. Этот параметр чисто программный и к оптическому разрешению никакого отношения не имеет. Просто программа, входящая в комплект поставки сканера, доводит изображение до более высокого разрешения путем недостающих точек, присваивая им усредненные значения цвета соседних, реально считанных пикселов. Несмотря на то, что алгоритмы интерполяции не добавляют деталей в изображение, во многих случаях применение интерполяции
156
позволяет несколько улучшить изображение: сглаживаются границы растровых объектов и четче прорабатываются мелкие детали. Глубина цвета Глубина цвета, или разрядность битового представления - означает, сколько бит используется сканером для представления цвета одной точки изображения, выражается в информационных единицах - два в степени максимального числа цветов или градаций серого, которые может считывать сканер для каждого вводимого пиксела. Различают разрядность внешнюю и внутреннюю. Внутренняя разрядность - это количество бит информации о цвете для внутренних операций сканера до прохождения сигнала через АЦП и преобразования в цифровой код. Внешняя разрядность определяет битность цвета после прохождения сигнала через АЦП. Человеческий глаз способен воспринимать порядка 17 млн. оттенков цвета или 256 градаций серого. Это соответствует 24-битному представлению цвета или 8-битному для изображения в градациях серого. Внешняя разрядность для цветных сканеров обычно составляет 24 бита (по 8 бит на составляющую каждого цвета, R 2 8 ×G 2 8 ×B 2 8 =256×256×256= 2 24 итого 16,77 млн. цветов). Внутренняя разрядность обычно больше или равна внешней. У большинства сканеров она составляет 30-36 бит. Дополнительные биты во внутренней разрядности используются для улучшения точности цветопередачи и снижения влияния искажений на цвет, а в компьютер передаются все те же 24 бита. Рассмотрим основные факторы, влияющие на глубину цвета. 1.Сенсоры ПЗС чувствительны к фоновому электрическому шуму, искажающему достоверность информации о цветах. В связи с этим приходится повышать соотношение «сигнал/шум». 2. Между разрешением сканера и светочувствительно-
стью ПЗС существует противоречие. Для получения более высокого оптического разрешения ячейки ПЗС должны быть как можно, меньших размеров. Однако чем меньше их размеры, тем уже диапазон градаций яркости, который может различить каждый из них. 3. Восприятие элементов ПЗС перекрёстных помех. Перекрёстная помеха появляется в том случае, если свет насыщает не только свои, но и соседние сенсоры плотно упакованных линеек ПЗС считывающей головки, искажая чистоту сигналов. В результате в приграничных пикселах оцифрованного изображения возникает взаимное цветовое искажение. 4. Существенные помехи в достоверность информации вносит также АЦП. Неточность оцифровки данных АЦП приводит к тому, что «недостоверные биты» сенсоров ПЗС не позволяют сформировать гладкие переходы между смежными градациями яркости. Эта причина не даёт возможности реализовать заявленную номинальную разрядность битового представления. Поэтому в сканерах применяют компоненты, реализующие высокое значение глубины цвета,- 10, 12, 14 или 16 разрядов на цветовой канал. При этом «недостоверные биты» могут быть сдвинуты достаточно далеко, что позволит в конечном оцифрованном изображении довести число чистых тонов на канал цвета до 256 и более. Динамический диапазон Основной характеристикой любого оригинала является его оптическая плотность, определяющаяся способностью оригинала отражать или пропускать свет. Оптическая плотность лежит в пределах от 0, что соответствует белому цвету, до 4, что соответствует чёрному цвету. Динамический диапазон определяется как разница между самым светлым и самым тёмным участками оригинала, которые сканер в состоянии обработать. С увеличением динамического диапазона сканера возрастает количество вводимых градаций яркости и, следовательно, плавность перехо-
155
156
дов в смежных тонах изображения. Недостаточный динамический диапазон сканера может привести к искажениям цветопередачи при сканировании изображений, содержащих плавные тоновые переходы (переходы яркости), наподобие фотоснимков голубого неба, заката, или к потере деталей в снимках светлых и темных предметов. Типичные значения оптической плотности оригиналов: 0,9 для газетной печати, 1,5 – 1,9 для типографской печати на мелованной бумаге, 2,3 для фотографий, 2,8 для негативных пленок, 2,7-3,0 для любительских слайдов и 3,0 – 4,0 для высококачественных профессиональных диапозитивов и слайдов двойного формата. Разрядность обработки цвета и динамический диапазон находятся в прямой связи друг с другом. Динамический диапазон возрастает с увеличением разрядности цвета. Интерфейс передачи данных Интерфейс служит для подключения сканера к компьютеру и непосредственной передачи в него отсканированного изображения. В настоящее время в качестве интерфейса используют вход USB 2.0. Процесс сканирования включает в себя два этапа. Первый этап - это установка разрешающей способности и типа выходного изображения, а также сам процесс сканирования. Второй этап состоит в сохранении и редактировании полученного цифрового изображения. 7. Кодирование изображений За единицу количества информации принято такое количество информации при котором неопределённость уменьшается в 2 раза. Такая единица называется бит. Это минимальное количество информации, составляющее выбор из двух возможных вариантов. Когда создаётся возможность дать ответ на любой вопрос «да» или «нет», это и есть один
155
бит информации. В компьютере информация представляется двоичным кодированием, в виде последовательностей из нулей и единиц. Цифры 0 и 1 можно рассматривать как два равновероятных события, а один двоичный разряд содержит количество информации, равное 1 биту. Два двоичных разряда несут соответственно 2 бита информации. Информационный объём сообщения—количество двоичных символов, используемое для кодирования этого сообщения. Каждому символу на компьютере соответствует последовательность из 8 нулей и единиц, называемая байтом: 1 байт=8 бит Например, десятичное число 2 записывается в двоичной системе как 00000010. Используются и более крупные единицы измерения количества информации: 1Кбит (килобит) = бит =1024 бит 1Мбит (мегабит) = Кбит =1024 Кбит 1Гбит (гигабит) = Мбит =1024 Мбит 1Кбайт (килобайт) =байт =1024 байт 1Мбайт (мегабайт) =Кбайт =1024 Кбайт 1Гбайт (гигабайт) =Мбайт =1024 Мбайт 1Тбайт (терабайт) =Гбайт =1024 Гбайт Код пиксела - это информация о цвете пиксела. Последовательностью нулей и единиц можно закодировать и графическую информацию, разбив изображение на точки. Если точки будут только белые и чёрные, то каждую можно закодировать 1 битом. Для получения монохромного изображения (с полутонами серого) одного бита уже недостаточно. Для кодирования 4-х цветного изображения требуется два бита на 156
пиксель, поскольку два бита могут принимать 4 различных состояния. Для кодирования 8-цветного изображения требуется три бита памяти на один пиксел. Если наличие базового цвета обозначить 1 (единицей), а отсутствие 0 (нулём), то получится следующая таблица кодировки 8-ми цветной палитры, получаемой с помощью трёх основных цветов: красный, зелёный и синий (RGB) (табл. 7.1.). Таблица 7.1. Двоичный код восьми цветной палитры Цвет Красный Зелёный Синий Чёрный 0 0 0 Синий 0 0 1 Зелёный 0 1 0 Голубой 0 1 1 Красный 1 0 0 Розовый 1 0 1 Коричневый 1 1 0 Белый 1 1 1 Но с помощью трёх базовых цветов нельзя получить палитру больше 8 цветов. Если иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, то количество различных вариантов их сочетаний, дающих разные краски и оттенки увеличивается. 16- цветная палитра получается при использовании четырёх разрядной кодировки пиксела: к трём битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трёх цветов одновременно (табл. 7.2.). Большее количество цветов достигается при раздельном управлении интенсивностью базовых цветов. Интенсивность может иметь более двух уровней, если для кодирования каждого из базовых цветов выделить более одного бита. Количество различных цветов N и количество битов b для их кодировки связаны между собой формулой:
155
(7.1.) Объём памяти, занимаемый при сохранении на носитель одной фотографией равен: (в битах)
Цвет
(7.2.) Таблица 7.2.
Двоичный код 16- цветной палитры Интенсивность Красный Зелёный
Синий
Чёрный
0
0
0
0
Синий Зелёный Голубой Красный Розовый Коричневый Серый Тёмносерый Ярко- синий Ярко – зелёный Яркоголубой Яркокрасный Яркорозовый Яркожёлтый Ярко-белый
0 0 0 0 0 0 0 1
0 0 0 1 1 1 1 0
0 1 1 0 0 1 1 0
1 0 1 0 1 0 1 0
1 1
0 0
0 1
1 0
1
0
1
1
1
0
0
1
1
0
1
1
1
1
0
1
1
1
1
156
Где M и N количество пикселей по высоте и ширине, b- количество бит в коде пиксела. Считается, что человек способен различать 16 миллионов оттенков цвета. Для формального описания цвета придумано несколько цветовых моделей и соответствующих им способов кодирования. 8. Цветовая модель и цветовое пространство Цветовая модель - метод группировки цифровых значений согласно набору основных цветов. Назначение цветовой модели состоит в том, чтобы сделать возможным описание цветов некоторым стандартным, общепринятым способом. Цветовая модель определяет некоторую систему координат и подпространство внутри этой системы, в котором каждый цвет представляется единственной точкой. Большинство современных цветовых моделей ориентированы либо на устройства цветовоспроизведения (цветные мониторы, принтеры и др.), либо на определённые прикладные задачи(создание цветной графики и анимации), когда работа с цветом является непосредственной целью В большинстве цветовых моделей основных цветов три (RGB, CMY, LCH, HSV, Lab). Но есть модели и с большим количеством компонентов (CMYK). Цветовое изображение требует не менее трёх чисел на один пиксел для точной передачи его цвета. Метод, выбранный для представления яркости и цвета, называется цветовым пространством. Цветовое пространство- это цветовая модель сопровождающаяся указаниями и шкалой.
помощью «крутого» красного фильтра. Зелёный- 546,1 нм, линия е в спектре ртути. Синий-435,8нм, линия g в спектре ртути. В основе модели лежит декартова система координат. Цветовое пространство представляет собой куб (рис. 8.1.) .
Рис. 8.1 Цветовая модель RGB
8.1 Цветовая модель RGB Данное цветовое пространство наиболее широко используется в компьютерной графике. В RGB модели каждый цвет представляется красным, зелёным и синим первичными основными цветами. Красный- 700 нм, получен путём выделения излучения из спектра обычной лампы накаливания с
Точки, соответствующие красному, зелёному и синему цветам, расположены в трёх вершинах куба, лежащих на координатных осях. Голубой, пурпурный и жёлтый цвета расположены в трёх других вершинах куба. Чёрный цвет находится в начале координат, а белый- в наиболее удалённой от начала координат вершине. Оттенки серого цвета лежат на диагонали, соединяющей чёрную и белую вершины. Различные цвета представляют собой точки на поверхности или внутри куба и определяются вектором, проведённым в данную точку из начала координат. Представляемые в этой модели изображения состоят из трёх отдельных изображенийкомпонент, по одному для каждого первичного основного цвета. Такая модель является аддитивной. Однако, система RGB неудобна для практического использования из-за наличия отрицательных координат цвета в кривых сложения стандартного колориметрического наблюдателя [9]. RGB пространство не очень эффективно, когда речь идёт о реальных
155
156
изображениях, т.к. для сохранения цвета изображений необходимо знать и хранить все три компоненты RGB и потеря одной из них сильно исказит визуальное качество изображения. При обработке изображений в этом пространстве не всегда удобно бывает изменить только яркость или контрастность отдельного пиксела, т.к. в этом случае необходимо будет прочитать все три значения компонент RGB, пересчитать их до желаемой яркости и записать обратно. 8.2 Цветовая модель XYZ Для того, чтобы избежать отрицательных значений кривых сложения, они были подвергнуты линейному математическому преобразованию, в результате чего были получены новые кривые сложения: и известные как кривые сложения цветов стандартного колориметрического наблюдателя МКО 1931 года. Они были найдены путём перенесения системы цветовых координат, основанной на использовании трёх основных цветов RGB в систему координат, основанную на использовании трёх воображаемых, физически не существующих цветов XYZ. Эти цвета выполняют лишь вспомогательную математическую роль (рис. 8.2.).
Рис.8.2 Цветовая модель XYZ
155
В соответствии с рекомендациями МКО переход от RGB к XYZ осуществляется по мулам: (8.1.) Нередко вместо XYZ для обозначения только оттенка (без яркости) используют координаты x ,y и z, где: x = X/(X+Y+Z) y = Y/(X + Y + Z) (8.2.) z = Z/(X + Y + Z) x+y+z=1 Одним из существенных недостатков цветового пространства XYZ МКО является то обстоятельство, что одинаковым изменениям координат цвета не соответствуют равнозначные изменения цветовых ощущений. Разница между двумя цветами, находящимися в одной области графика, не так ощутима, как точно такая же разница между двумя соседними цветами, находящимися в другой области графика. 8.3 Цветовая модель CIELAB CIE разработал более однородные цветовые шкалы CIE и CIE Luv. Из этих двух моделей более широко применяется модель CIE Lab. Хорошо сбалансированная структура цветового пространства Lab основана на той теории, что цвет не может быть одновременно зеленым и красным или желтым и синим. В цветовом пространстве значение светлоты отделено от значения хроматической составляющей цвета (изме(тон, насыщенность). Светлота задана координатой няется от 0 до 100, то есть от самого темного до самого светлого), хроматическая составляющая - двумя полярными координатами . Первая обозначает положение цвета в диапазоне от зеленого - до пурпурного, вторая — от синего до определяются в этом пространстжелтого. Значения ве преобразованием координат цвета X, Y, Z:
156
;
( 8.3.)
; – нормированные цветовые координаты
Где белого света и 100 Для малых значений ходимо вводить поправки: если
та , перпендикулярная плоскости графика цветности и проходящая через точку пересечения осей, представляет равноконтрастную шкалу ахроматических цветов, для которой значения равны 0. При этом, координата описывает изменение цветности от зелёного (отрицательные значения) до красного (положительные значения), а координата описывает изменения цветности от синего (отрицательные значения) до жёлтого (положительные значения) (рис. 8.3).
в формулах (8.3.) необ-
, то ;
если
, то ;
если
( 8.4.)
, то ;
где и к=24389/27 Формулы для расчёта светлоты можно интерпретировать как показатель ощущения яркости, они используют кубический корень, что является хорошим аналитическим выражением для описания зависимости ощущения яркости от значения энергетической яркости. Координаты цвета наносятся на графики откладыванием значений на осях взаимно перпендикулярных координат. Центральная ось цветового пространства, координа155
Рис. 8.3. Цветовая модель CIELAB На рис.8.3 показан график цветностей цветового пространства МКО с нанесёнными на него границами цветового охвата: цветов с максимальным цветовым охватом (1), колориметра Райта (2), цветового пространства sRGB (3). Достоинством цветовой модели CIELAB является то, что она эффективно решила проблему представления величины цветовых различий в промышленности, а также то, что описание цвета в этой системе фактически моделирует процесс представления цвета зрительным анализатором. 8.4 Пространство YCbCr В алгоритмах кодирования изображений обычно используется цветовая модель YCbCr. Зрительный анализатор человека менее чувствителен к цвету, нежели к яркости изо-
156
бражения. В цветовом пространстве RGB все три компонента считаются одинаково важными, и они обычно сохраняются с одинаковым разрешением. Однако можно отобразить цветовое изображение более эффективно, отделив светимость от цветовой информации и представив её с большим разрешением, чем цвет. Поэтому цветовое пространство YCbCr и его вариации является популярным методом эффективного представления цветных изображений. Y в таких пространствах обозначает яркость, которая вычисляется как взвешенное усреднение компонент R, G и B по следующей формуле: R+ (8.5.)
ный эффект при сжатии цветных изображений. При этом алгоритмы сжатия сначала преобразуют исходное цветовое пространство из RGB в YCbCr, сжимают, а затем при восстановлении обратно преобразуют изображение в цветовое пространство RGB, т.к. оно используется в ЭВМ. При этом формулы для прямого и обратного преобразований выглядят следующим образом прямое преобразование:
(8.7.)
И обратное преобразование: Где k обозначает соответствующий весовой множитель. Остальные цветовые компоненты по существу определяются в виде разностей между светимостью Y и компонентами R, G и B: Cb=B-Y, Cr =R-Y, (8.6.) Cg=G-Y. При этом получаются четыре компоненты нового пространства вместо трех RGB. Однако число Cb+Cr+Cg является постоянным, поэтому только две из трех хроматических компонент необходимо хранить, а третью вычислять на основе них. Чаще всего в качестве две искомых цветовых компонент используют Cb и Cr. Преимущество пространства YCbCr по сравнению с RGB заключается в том, что Cb и Cr можно представлять с меньшим разрешением, чем Y, т.к. глаз человека менее чувствителен к цвету предметов, чем к их яркости. Это позволяет сократить объем информации, требуемый для представления хроматических компонент, без заметного ухудшения качества передачи цветовых оттенков изображения. Такой подход к преобразованию цветового пространства дает дополнитель-
155
(8.8.)
Отметим, что множитель kg получается из соотношения : , а величина компоненты G получается вычитанием суммы Cb и Cr из Y. Рекомендуются следующие коэффициенты: . Используя эти значения в данных уравнениях, получаем широко распространенные формулы: (8.9.)
156
(8.10.) Хроматические компоненты Cb и Cr могут быть представлены с меньшим разрешением, чем световая компонента Y. При этом на практике используют следующие форматы их взаимного представления. Самый очевидный формат это так называемый формат 4:4:4, который означает полную точность в передаче хроматических компонент, т.е. на каждые 4 световые отсчеты Y передаются по 4 отсчета компонент Cb и Cr (рис.8.4.,а).
(рис. 8.5., а). В другом случае выполняется интерполяция по двум вертикальным отсчетам (рис. 8.5, б). Благодаря экономичному представлению цветных сцен, формат 4:2:0 широко используется во многих потребительских приложениях, таких как видеоконференции, цифровое телевидение, DVD.
а)
а) б) Рис. 8.4. Расположение хроматических компонент Другой формат 4:2:2 (YUY2) предполагает, что на каждые 4 отсчета компоненты Y приходится по два отсчета хроматических компонент, расположение которых представлено на рис. 8.4., б. Наиболее популярный формат сэмплирования 4:2:0 (YV12) каждая компонента Cb и Cr имеет один отсчет на 4 отсчета Y (рис.8.5 а, б). Причем отсчеты компонент Cb и Cr, как правило, вычисляются двумя способами. В первом случае выполняется интерполяция по 4 ближайшим отсчетам компонент Cb и Cr для формирования одного отсчета для них
155
б) Рис.8.5. Представление формата 4:2:0 Поскольку хроматические компоненты отбираются в 4 раза реже компонент яркости, то пространство 4:2:0 YCbCr занимает в 2 раза меньше отсчетов по сравнению с форматом видео 4:4:4 RGB. 9. Сжатие изображений и форматы графических файлов 9.1 Избыточность данных Цветным цифровым изображениям соответствуют очень большие объёмы данных. Поэтому, для сокращения занимаемого места на носителе и уменьшения времени передачи и обработки данных, большое значение приобретает осо-
156
бый вид обработки изображений- их кодирование с целью сокращения объёма данных. Изображения занимают намного больше места в памяти, чем текст. Так, иллюстрация размером 500х800 точек занимает 1,2 Мб - столько же, сколько книга из 400 страниц. Эта особенность изображений определяет актуальность алгоритмов архивации графики. Особенностью изображений является то, что человеческое зрение при анализе изображения оперирует контурами, общим переходом цветов и сравнительно нечувствительно к малым изменениям в изображении. Таким образом, можно создать эффективные алгоритмы архивации изображений, в которых декомпрессионное изображение не будет совпадать с оригиналом, однако человек этого не заметит. Данная особенность человеческого зрения позволила создать специальные алгоритмы сжатия, ориентированные только на изображения. В отличие от текста изображения обладают избыточностью в 2 измерениях. Соседние точки как по горизонтали, так и по вертикали в изображении близки по цвету. Кроме того, можно использовать подобие между цветовыми плоскостями, что даёт возможность создать ещё более эффективные алгоритмы. Таким образом, при создании алгоритма компрессии графики используются особенности структуры изображения. Задачей кодирования является представить исходное изображение как можно меньшим числом байт по сравнению с исходным размером. Относительную избыточность двух наборов данных – число возможно рассчитать математически. Пусть элементов носителей информации (объёмы данных) в двух наборах данных, представляющих одну и ту же информацию. Относительная избыточность данных D первого набора по отношению ко второму будет равна:
где - коэффициент сжатия
(9.2.) Если = , то: ; и D=0, это значит, что первый способ представления информации не содержит избыточных данных по сравнению ко второму. , то будет стремиться к бесконечности, а D буЕсли дет стремиться к единице, что означает высокое сжатие и высокую избыточность данных первого набора по отношению ко второму. И если , то будет стремиться к нулю, а D будет стремиться к бесконечности, что означает, что второй объём содержит много избыточных данных по сравнению с первым. Различают три вида избыточности данных: кодовая избыточность, межэлементная избыточность, и визуальная избыточность. Кодовая избыточность возникает при кодировании значений яркости или других характеристик изображения. Если значения, например яркости, кодируются некоторым способом, требующим большего числа символов, чем это строго необходимо, то говорят, что изображения имеют кодовую избыточность. Это наличие дополнительных, не несущих информации о существе передаваемого сообщения, разрядов в кодовой комбинации. Предположим, что дискретная случайная переменная , распределённая в интервале от 0 до1, представляет значение появляется с яркости изображения, и что каждое значение вероятностью , тогда эта вероятность будет равна:
(9.1.)
,
(9.3.)
k=0;1;2…..,L-1
155
156
где L-количество уровней яркости, -количество пикселей имеющих значение яркости k, n- общее количество пикселей в изображении. Среднее количество битов, требуемое для представления значения одного элемента , будет равно: = , (9.4.) где - число битов, используемых для представления каждого из значений Средняя длина всех кодовых слов, присвоенных различным значениям яркостей равна сумме произведений числа битов, используемых для представления каждого из уровней яркостей, на вероятность появления этого уровня яркости. Из этого можно рассчитать общее число битов, требуемое для кодирования изображения размерами BхM, оно составит BM. И ещё один важный вывод: если при кодировании уровней яркости учитывать вероятность их появления, то возможно достичь определённого сжатия данных. То есть присваивать кодовые слова с меньшим числом битов более вероятным значениям яркости, а более длинные кодовые слова менее вероятным значениям. Этот подход называется неравномерным кодированием. Изображения обычно состоят из объектов, имеющих предсказуемую форму и отражательные свойства поверхности, причём размеры объектов на изображении намного превышают размеры пикселей. Поэтому на большинстве изображений определённые значения яркости оказываются более вероятными, чем другие. Распределение количества пикселей по уровням яркостей можно посмотреть по гистограмме изображения. Гистограммой цифрового изображения с уровнями яркости в диапазоне от 0 до L-1 называется дискретная
155
, где есть k-ый уровень яркости, функция h( )= а - число пикселей на изображении, имеющих яркость . Гистограммы являются основой для множества методов цифровой обработки изображения, так как они достаточно просты, как для программного вычисления, так и для аппаратной реализации. Межэлементная избыточность. Поскольку значение любого элемента изображения может быть предсказана по значениям его соседей, то информация, содержащаяся в отдельном элементе, оказывается относительно малой. Большая часть вклада отдельного элемента в изображение является избыточной, она может быть предсказана на основе значений соседних элементов. Для уменьшения межэлементной избыточности в изображении, двумерный массив пикселей должен быть преобразован в более рациональный формат. Например, для представления изображения может быть использована разность между соседними элементами. Преобразования, которые устраняют межэлементную избыточность классифицируются как отображения. Если из преобразованного набора данных может быть восстановлено исходное изображение, то говорят об обратимом отображении. Визуальная избыточность. Чувствительность зрительного анализатора по отношении к визуальной информации различна в разных условиях. При обычном визуальном восприятии часть информации оказывается менее важной, чем другая. Такую информацию называют визуально избыточной. Она может быть удалена без заметного ухудшения визуального качества изображения. При восприятии зрительной информации зрительный анализатор не в состоянии оценивать количество пикселей количественно. Глядя на изображение, наблюдатель
156
отыскивает на нём особенности и отличия, такие как контуры или текстурные области, и подсознательно объединяет их в узнаваемые группы. Затем мозг соотносит эти группы, с имеющимися априорными знаниями завершая тем самым процесс интерпретации изображения. В отличии от кодовой и межэлементной избыточности, визуальная избыточность связана с реальной и количественно измеряемой зрительной информацией. Её удаление возможно т.к. такая информация не является существенной и не воспринимается при обычном визуальном восприятии. Важнейшей операцией при оцифровке зрительной информации, основанной на визуальной избыточности, является квантование. Эта операция переводи широкий непрерывный диапазон входных значений в ограниченный дискретный набор выходных значений. Поскольку данная операция необратима, квантование является сжатием с потерями. Сжатие данных достигается, когда сокращается или устраняется избыточность одного или нескольких из видов избыточности. Численно определить степень избыточности в заданной цифровой последовательности возможно с помощью понятия энтропии. Она определяет минимальное количество бит, необходимое для представления заданной последовательности чисел с последующей возможностью полного восстановления информации. Вычисляется энтропия с помощью формулы Шеннона:
, (9.5.) где -вероятность появления i-го числа в последовательности; N-число уникальных чисел в последовательности.
Коэффициент сжатия. Относительную эффективность метода компрессии можно оценить с помощью коэффициента сжатия:
;
(9.6.) где и - объёмы данных соответственно до и после компрессии. Коэффициент сжатия характеризует эффективность метода в сравнении с некоторым «эталонным» или исходным способом цифрового представления данных. В качестве исходного для изображений чаще всего используется представление в виде матрицы отсчётов с известным форматом данных (например, байт на отсчёт). Существует ещё фактор сжатия: ; ( , (9.7.)
коэффициент меньше 1, а фактор сжатия больше 1. Обычно при сравнении алгоритмов сжатия используют фактор сжатия и говорят, например, что то или иное изображение сжато в 2 раза, и это означает, что фактор сжатия равен 2. Коэффициент эффективности. Абсолютную эффективность метода можно охарактеризовать коэффициентом эффективности:
9.2 .Показатели качества методов компрессии
155
(
156
; ( (9.8.) -минимально достижимый объём данных (соответствующий полному устранению избыточности). Показатель используется редко из-за сложности определения . Критерий среднеквадратичного отклонения. Эта величина является объективным критерием верности воспроизведения сжатого изображения.
. (9.9.) а величина полной ошибки (не соответствия) двух изображений равна:
, (9.10.) где M и N размеры изображений. Среднеквадратическое отИмеем два изображения:
-это оригинальное изображение клонение разности изображений
и
и
будет равно:
-изображение, полученное в результате сжатия ориги-
нала и его восстановления. Для любых х и у ошибка
каждого элемента изображений
155
и
для
определяется как:
. (9.11.) Достоинство среднеквадратичного критерия – его простота. При его использовании многие задачи анализа и оптимизации алгоритмов обработки изображений решаются относительно просто. Поэтому он часто применяется на практике. Данный критерий плохо согласуется с субъективным восприятием. Общепринятой величиной для оценки потерь при восстановлении изображений является метрика, называемая пиковое отношение сигнал/шум PSNR. Чем больше значение PSNR, тем меньше потерь при восстановлении и наоборот. Данный критерий определяется выражением:
156
изображение на входе
, (9.12.) где - значение яркости точки с координатами x и y; среднеквадратическое отклонение между исходным и восстановленным сигналами изображений. Величина PSNR безразмерна, но из-за использования логарифма можно сказать, что PSNR измеряется в дБ. Величина PSNR используется только для сравнения качества восстановления разных алгоритмов между собой. Обычно PSNR варьируется в пределах от 20 до 40. Величину PSNR можно легко и быстро вычислить, поэтому оно так популярно при оценивании качества изображения. Его постоянно используют при сравнивании сжатых и несжатых изображений и видеопоследовательностей. Однако, эта мера имеет ряд недостатков. Для вычисления PSNR необходимо иметь исходное, и преобразованное изображение, однако первое бывает не всегда доступно. Кроме того, не всегда легко проверить, что исходное изображение само имело совершенное качество. Величина PSNR плохо коррелирует с субъективными мерами качества. Однако определение качества изображения с помощью субъективного оценивания часто является предпочтительным, поскольку большинство восстановленных изображений рассматриваются человеком. Это может быть достигнуто путём показа восстановленного изображения группе экспертов и усреднения их оценок.
9.3. Система сжатия изображения Система сжатия изображения содержит два различных блока: кодер и декодер. Исходное изображение подаётся на кодер, который преобразует входные данные в набор символов. к о д е р
155
Кодер источника
кодер канала
канал
декодер канала
декодер источника
изображение на выходе
д е к о д е р Рис. 9.1. Система сжатия изображения Между кодером и декодером находится канал (рис 9.1.), по которому кодированные данные передаются на декодер. В декодере создаётся восстановленное изображение. Восстановленное изображение может быть точной копией исходного изображения (такая система кодирования называется системой кодирования без потерь), а может таковой и не быть (такая система называется системой кодирования с потерями). Кодер и декодер состоят из двух независимых блоков. Кодер содержит кодер источника, он устраняет избыточность источника, и кодер канала, он увеличивает помехоустойчивость сигнала на выходе кодера канала. Декодер содержит декодер канала, за которым следует декодер источника. Если в канале между кодером и декодером не возникает ошибок -такой канал называется каналом без помех. И в этом случае кодер канала и декодер канала могут отсутствовать. Кодер источника сокращает или устраняет кодовую, межэлементную и визуальную избыточности. Процедуру кодирования можно представить в виде последовательности из трёх независимых операций. Каждая из операций предназначена для сокращения одного из типов избыточности (рис.9.2.) К О Д Е Р изображение на входе
преобразователь
квантователь
156
Кодер символов
канал изображение на выходе
изображение на выходе
Рис. 9.2. Схема кодера Рис. 9.3. Схема декодера Преобразователь превращает входные данные изображения в формат, предназначенный для сокращения межэлементной избыточности входного изображения. Данная операция является обратимой, она может как уменьшать, так и увеличивать объём данных. Квантователь уменьшает точность выхода преобразователя в соответствии с некоторым предварительно заданным критерием верности. Здесь сокращается визуальная избыточность входного изображения. Операция является необратимой и должна быть исключена из алгоритма сжатия без потерь. Кодер символов генерирует равномерный или неравномерный код для представления выхода квантователя и формирует соответсвующий коду выход. Операция обратима. Декодер источника будет состоять из двух блоков: декодера символов и обратного преобразователя (рис.9.3.) Эти блоки представляют операции обратные тем, которые осуществлялись в кодере источника блоками кодера символов и преобразователя, в обратном порядке. Существуют алгоритмы сжатия без потерь информации и с потерями информации. В первом случае гарантируется точное соответствие между исходным и восстановленным изображением, но при этом достигается невысокая степень сжатия (в 2-10 раз). При сжатии с потерей качества удаётся получить компрессию изображений в 10 и более раз. Д Е К О Д Е Р канал
Кодер символов
155
Алгоритмы сжатия без потерь обычно состоят из двух независимых операций: разработка альтернативного представления изображения, в котором уменьшается межэлементная избыточность, и кодирование полученных данных для устранения кодовой избыточности. 9.4. Неравномерное кодирование Неравномерное кодирование относится к кодированию без потерь. В нём происходит уменьшение только кодовой избыточности. Она может быть устранена или уменьшена путём кодирования уровней яркости при условии минимизации среднего числа бит, необходимого для представления значения одного элемента. Для этого разрабатывается неравномерный код, который наиболее вероятным уровням яркости присваивает самые короткие кодовые комбинации. Представленные ниже методы кодирования: метод Шеннона- Фано, Метод Хаффмана и арифметическое кодирование относятся к статистическим или энтропийным методам сжатия без потерь, т.е. эти методы используют кодирование последовательности значений с возможностью однозначного восстановления с целью уменьшения объёма информации с помощью усреднения вероятностей появления элементов последовательности. 9.4.1. Метод Шеннона –Фано
Кодер символов
156
Один из первых алгоритмов сжатия, который впервые сформулировали американские учёные Шеннон и Фано. Код Шеннона- Фано является префиксным, то есть в таком коде ни одна комбинация не совпадает с началом более длинной комбинации, что позволяет обеспечить однозначное кодирование без введения разделительных символов. То есть- это код, в котором код одного символа не может быть началом кода другого символа. В таком коде не требуется указывать длину кода, но коды получаются несколько длиннее. Метод Шеннона – Фано заключается в том, что Входящие символы располагают в порядке убывания их вероятности, а затем последовательно делят на две части с приблизительно равными вероятностями, к коду первой части добавляют 0, а к коду второй- 1. 9.4.2. Кодирование Хаффмана Метод был предложен Девидом Хаффманом (США) в 1952 году, это наиболее известный способ уменьшения кодовой избыточности. За все эти годы со дня опубликования, код Хаффмана не потерял своей значимости и актуальности. Мы повседневно сталкиваемся с ним в той или иной форме, практически каждый раз, когда архивируем файлы, смотрим фотографии, фильмы, посылаем факс или слушаем музыку. Код Хаффмана редко используется отдельно, чаще он работает в связке с другими алгоритмами. Основная идея: кодировать символы, которые встречаются чаще, меньшим количеством бит, чем те, которые встречаются реже. Код Хаффмана является префиксным и двухпроходным. На первом проходе строится частотный словарь и генерируются коды. На втором происходит непосредственно кодирование. В начале, составляется список символов в порядке убывания вероятности их появления. Пусть имеется пять символов, расположим их в порядке убывания их вероятности:
155
с вероятностями соответственно: . Далее выбираются два символа с наименьшими вероятностями, они образуют два свободных узла дерева Хаффмана. Наименее вероятному символу присваивается битовый 0, а более вероятному- битовая 1. В нашем случае, это
. Символу
присваиваем 1, символу
при-
сваиваем 0. Далее символы
условно объеди-
няются в один символ «родитель»
его вероятность
будет равна сумме вероятностей = 0,2 (рис.9.4.)
1
0
156
. Вероятность
Условно объединяем все три символа, в символ
; с вероятностью появления и рассматриваем его со
Рис. 9.4. Схема образования узла «Родитель» добавляется в список свободных узлов, а двое его «детей» удаляются из этого списка. Затем берётся третий
следующим символом списка
, вероятность которого 0,2.
10 символ из упорядоченного списка- это символ
ностью 0,2. Код символа
00
с вероят-
будет начинаться с битовой 1, ;
а к кодам символов 9.5.).
дописывается битовый 0 (рис.
; 1
0
;
155
156
; Рис. 9.5. Схема образования узла
; Так как вероятность появления символа
меньше, 11
чем вероятности появления суммарного символа
, то ; р=0,2
; 0
код символа
1
будет начинаться с 0, а кодам символов
приписывается битовая единица (рис. 9.6.).
101
;
001 Рис. 9.6. Схема образования узла
155
01
156
0 И для последнего символа :
;
1011
, получаем (рис. 9.7.)
;
0011
;
Рис. 9.7. Схема образования узла Итоговое значения символов Таблица 9.1. Символ Присвоенное значение Код в обратном порядке 0 0
; 111
1
011
; р=0,2
01
10
111
111
1011
1101
;
01
11
;
;
155
156
0011
1100
В итоге получаем коды Хаффмана, но записанные в обратном порядке (табл.9.1.). Последовательности символов
будет соответствовать код 01011111011100. С 0 начинается только один код- код симво-
ла , поэтому он так и декодируется. Затем идёт код, начинающийся с битовой единицы. Таких кодов несколько, поэтому прочитывается следующий бит, который равен 0. Код
10- единственный, соответствующий символу
. После
этого идёт код 111- это однозначно говорит, что это . Последние два кода точно декодируют символы
. Среднее количество бит на символ можно посчитать по формуле: (9.13.) 155
где n- количество символов в коде, р- вероятность появления символа, i- количество символов. Для данного примера построенные таким образом однозначные коды будут тратить 2,2 бита на символ. Обычный двоичный код потребовал бы 3 бита на символ, т.е. в этом случае последовательность можно было бы сжать в 1,36 раза. Однако, данный алгоритм имеет ряд недостатков: для восстановления содержимого сообщения декодер должен знать таблицу частот, которой пользовался кодер. Длина сжатого сообщения увеличивается на длину таблицы вероятностей, которая должна посылаться впереди данных. Кроме этого, необходима полная вероятностная статистика перед началом кодирования, для этого необходимо делать два прохода по сообщению. Поэтому, на практике применяют другой метод формирования кодов переменной длины, который позволяет по мере кодирования данных уточнять коды Хаффмана адаптивное кодирование. 9.4.3. Адаптивное кодирование Хаффмана Адаптивное кодирование позволяет не передавать модель сообщения вместе с ним самим и ограничиться одним проходом по сообщению как при кодировании, так и при декодировании. Алгоритм называют адаптивным потому, что этот алгоритм при каждом сопоставлении символу кода, кроме того изменяет внутренний ход вычислений так, что в следующий раз этому же символу может быть сопоставлен другой код, т.е. происходит адаптация алгоритма к поступающим для кодирования символам. Компрессор и декомпрессор начинают работать с пустого дерева Хаффмана, а потом модифицируют его по мере чтения и обработки символов. Сначала кодер строит пустое дерево Хаффмана, не присваивая код никакому символу. Первый символ записывается в выходной поток в незакодированной форме (в 8 битной кодировке ASC2). Затем этот символ помещается в дерево и ему присваивается код,
156
например 0. Затем кодируется следующий символ во входном потоке, и если этот символ встретился впервые, то он также записывается в выходной поток в незакодированном виде, и помещается в дерево Хаффмана, где ему присваивается код в соответствии с его текущей частотой появления, равной 1. По мере того как поступают символы на вход кодера, происходит подсчёт числа их появления и их количества в соответствии с этой информацией выполняется перестройка дерева Хаффмана. Для того, чтобы отличить незакодированный символ от кода переменной длины применяется специальный esc (escape) символ, который показывает, что за ним следует незакодированный символ. Код самого esc символа должен находиться в дереве Хаффмана и будет меняться каждый раз по мере кодирования информации. Рассмотрим пример кодирования последовательности символов AFFAADB. Поскольку в начале кодирования дерево Хаффмана- пустое, в выходной поток записывается 8-ми битовый код символа A (01000001), который затем добавляется в дерево Хаффмана. (рис.9.8.)
Выходной поток 01000001 Счётчик А:1 1
0
ASC2 символа, но перед ним ставится ещё и esc символ (рис.9.9.) Выходной поток 01000001 1 01000110 Счётчик А:1 Счётчик F:1 1
A 1
0
Esc
F
Рис 9.9. Кодирование второго символа
Далее третий символ опять F , для него имеется код в дереве Хаффмана, поэтому этот код записывается в выходной поток, а счётчик для F увеличивается на 1. (рис.9.10.) Выходной поток 01000001 1 01000110 10 Счётчик А:1 Счётчик F:2 1
Esc
0
A
Рис.9.8. Кодирование первого символа Следующий символ F записывается в выходной поток как код
155
0
F 10
156
Esc A Рис.9.10. Кодирование третьего символа Четвёртый символ А входного потока, так же имеется в дереве, этот код записывается в выходной поток, а счётчик добавляет 1. (рис.9.11.) Выходной поток 01000001 1 01000110 10 10 Счётчик А:2 Счётчик F:2 1
Esc F Рис.9.12. Кодирование пятого символа Следующий символ D – новый, он записывается в выходной поток как ASC2 символ, перед которым esc (рис. 9.13.) Выходной поток 01000001 1 01000110 10 10 10 11 01000100 Счётчик А:3 Счётчик F:2 Счётчик D:1 1 0
0 A F 10
10 F Esc A Рис.9.11. Кодирование четвёртого символа
1
0 Esc
Аналогично для пятого символа, это опять А, и счётчик по А принимает значение 3. Выходной поток 01000001 1 01000110 10 10 10 Счётчик А:3 Счётчик F:2 1
0
A 10
155
D
Рис.9.13. Кодирование шестого символа В дереве Хаффмана появляется третий уровень, т.к. сумма счётчиков для esc символа и символа D равна 1 (счётчик esc всегда 0) и это меньше суммы значений счётчиков F и A. Последний символ В записывается в незакодированном виде в выходной поток и добавляется в дерево Хаффмана (рис. 9.14) . Выходной поток 01000001 1 01000110 10 10 10 11 01000100 111 0100001 Счётчик А:3
156
Счётчик F:2 Счётчик D:1 Счётчик B:1 1
0
A 1
0
F 1
0
D 1
0
Esc
B
Рис. 9.14. Кодирование последнего символа В результате выходной поток составил 44 бита, вместо 56, что соответствует сжатию в 1, 27 раза. Декодер, восстанавливая исходную последовательность, строит дерево Хаффмана по мере декодирования последовательности, что позволяет корректно определять исходные символы. Метод Хаффмана является эффективным только в том случае, когда вероятности появления символов равны числам
, где n- любое целое положительное число, Это
155
связано с тем, что код Хаффмана присваивает каждому символу алфавита код с целым числом бит. Из теории информации известно, что, например, при вероятности появления символа равной 0,4 ему следует поставить код длиной бит, но при построении кодов Хаффмана этого сделать нельзя, а только лишь в 1 или 2 бита, что приведёт к ухудшению сжатия данных. 9.4.4. Арифметическое кодирование В арифметическом кодировании не существует однозначного соответствия между символами и кодовыми словами. Здесь вся последовательность символов источника соотнесена с одним арифметическим кодовым словом. Кодовое слово задаёт интервал вещественных чисел между 0 и 1. При увеличении числа символов в сообщении, интервал, необходимый для их представления, уменьшается, а число битов для представления интервала увеличивается. Каждый символ в сообщении уменьшает размер интервала в соответствии с вероятностью своего появления. Поясним идею арифметического кодирования на простейшем примере. Пусть нам нужно закодировать текстовую строку: РАДИОВИЗИР. Пеpед началом pаботы кодера соответствующий кодируемому тексту исходный интеpвал составляет [0; 1). Алфавит кодируемого сообщения содержит следующие символы : { Р, А, Д, И, О, В, З }. Определим вероятность каждого из символов алфавита в сообщении и назначим каждому из них интервал, пропорциональный его вероятности. С учетом того, что в кодируемом слове всего 10 букв, получим табл. 9.2. Присвоение интервала символу Символ Вероятность Интервал А 0,1 0-0,1 Д 0,1 0,1-0,2 В 0,1 0,2-0,3
156
Таблица 9.2
После пpосмотpа пеpвого символа сообщения Р кодер сужает исходный интеpвал до нового - [0.8; 1), котоpый выделяется этому символу. После кодирования первой буквы результат кодирования будет находиться в интервале чисел [ 0.8 - 1). Следующим символом сообщения, поступающим в кодер, будет буква А. Если бы эта буква была первой в кодируемом сообщении, ей был бы отведен интервал [ 0 - 0.1 ), но она следует за Р и поэтому кодируется новым подинтервалом внутри уже выделенного для первой буквы, сужая его до величины [ 0.80 - 0.82 ). Интервал [ 0 - 0.1 ), выделенный для буквы А, располагается теперь внутри интервала, занимаемого предыдущим символом (начало и конец нового интервала определяются путем прибавления к началу предыдущего интервала произведения ширины предыдущего интервала на значения интервала, отведенные текущему символу). В pезультате получим новый pабочий интеpвал [0.80 - 0.82), т.к. пpедыдущий интеpвал имел шиpину в 0.2 единицы и одна десятая от него 0.02. Следующему символу Д соответствует выделенный интервал [0.1 - 0.2), что пpименительно к уже имеющемуся рабочему интервалу [0.80 - 0.82) сужает его до величины [0.802 - 0.804). Следующим символом, поступающим на вход кодера, будет буква И с выделенным для нее фиксированным интервалом [ 0,3 - 0,6). Применительно к уже имеющемуся рабочему интервалу получим [ 0,8026 - 0,8032 ). Пpодолжая, имеем: вначале [0.0 - 1.0) после пpосмотpа Р [0.8 - 1.0) А [0.80 - 0.82)
Д [0.802 - 0.804) И [0.8026 - 0.8032) О [0.80302 - 0.80308) В [0.803032 - 0.803038) И [0.8030338 - 0.8030356) З [0.80303488 - 0.80303506) И [0.803034934 - 0.803034988) Р [0.8030349772 - 0.8030349880) Результат кодирования: интервал [0,8030349772 0,8030349880]. На самом деле, для однозначного декодирования теперь достаточно знать только одну границу интервала нижнюю или верхнюю, то есть результатом кодирования может служить начало конечного интервала - 0,8030349772. Любое число, заключенное внутри этого интервала, однозначно декодируется в исходное сообщение. К примеру, это можно проверить с числом 0,80303498, удовлетворяющим этим условиям. При этом последнее число имеет меньшее число десятичных разрядов, чем числа, соответствующие нижней и верхней границам интервала, и, следовательно может быть представлено меньшим числом двоичных разрядов. Чем шире конечный интервал, тем меньшим числом разрядов он может быть представлен. Ширина же интервала зависит от распределения вероятностей кодируемых символов - более вероятные символы сужают интервал в меньшей степени и добавляют к результату кодирования меньше бит. Декодирование. Все что декодер знает о тексте, - это конечный интеpвал [0,8030349772 - 0,8030349880]. Декодеру, как и кодеру, известна также таблица распределения выделенных алфавиту интервалов. Сpазу же понятно, что пеpвый закодиpованный символ есть Р, так как результат кодирования целиком лежит в интеpвале [0.8 - 1), выделенном моделью символу Р согласно таблице . Тепеpь повтоpим действия кодера: вначале [0.0 - 1.0); после пpосмотpа [0.8 - 1.0). Исключим из результата кодирования влияние теперь уже из-
155
156
И З О Р
0,3 0,1 0,1 0,2
0,3-0,6 0,6-0,7 0,7-0,8 0,8-1
вестного первого символа Р, для этого вычтем из результата кодирования нижнюю границу диапазона, отведенного для Р, - 0,8030349772 - 0.8 = =0,0030349772 - и разделим полученный результат на ширину интервала, отведенного для Р, - 0.2. В результате получим 0,0030349772 / 0,2 = =0,015174886. Это число целиком вмещается в интервал, отведенный для буквы А, - [0 - 0,1) , следовательно, вторым символом декодированной последовательности будет А. Поскольку теперь мы знаем уже две декодированные буквы - РА, исключим из итогового интервала влияние буквы А. Для этого вычтем из остатка 0,015174886 нижнюю границу для буквы А 0,015174886 - 0.0 = =0,015174886 и разделим результат на ширину интервала, отведенного для буквы А, то есть на 0,1. В результате получим 0,015174886/0,1=0,15174886. Результаты кодирования Табл.9.3. Число на вы- Символ Интервал Вероятность ходе 0,8030349772 Р 0,8-1,0 0,2 0,015174886 А 0,0-0,1 0,1 0,15174886 Д 0,1-0,2 0,1 0,5174886 И 0,3-0,6 0,3 0,724962 О 0,7-0,8 0,1 0,24962 В 0,2-0,2 0,1 0,4962 И 0,3-0,6 0,3 0,654 З 0,6-0,7 0,1 0,54 И 0,3-0,6 0,3 0,8 Р 0,6-0,8 0,2 0,0 Конец кодирования Результат лежит в диапазоне, отведенном для буквы Д, следовательно, очередная буква будет Д. Исключим из результата кодирования влияние буквы Д. Получим (0,15174886 - 0,1)/0,1 = 0,5174886. Результат попадает в интервал, отведенный для буквы И, следовательно, очередной декодированный символ И, и так далее, пока не декодируем все символы табл.9.3.
При арифметическом кодировании значения среднее количество информации, приходящейся на один символ источника очень близко к энтропии источника. Поэтому арифметическое кодирование является весьма эффективным.
155
156
9.5. Равномерное кодирование 9.5.1. Алгоритм группового кодирования Алгоритм группового кодирования или кодирования переменной длины (RLE - run-length encoding),– это простейший метод сжатия, рассчитан на изображения с большими областями повторяющегося цвета. Основан на выделении специального кода-маркера, указывающего, сколько раз повторять следующий байт. Алгоритм группового кодирования выглядит следующим образом (рис. 2.3.): группа одинаковых байтов заменяется двумя: байтом-повторителем и повторяемым байтом. Сжатие выполняется для каждой строки пикселов отдельно. В байте-повторителе два старших разряда всегда единицы. Младшие шесть разрядов содержат число повторений, таким образом, максимальная длина повторяемой цепочки - 63 байта. Если же байт уникален (не повторяется), то он записывается так: если два старших разряда - нули, байт записывается без изменений; в противном случае значение байта пишется с байтом-повторителем, у которого количество повторений равно единице.
Рис. 9.15. Кодирование переменной длины. 9.5.2. Алгоритм сжатия LZW Название алгоритм получил по первым буквам фами-
лий его разработчиков - Lempel, Ziv и Welch (Лемпель, Зив и Велч). Кроме сокращения кодовой избыточности этот алгоритм направлен так же на сокращение межэлементной избыточности изображения. Метод отображает последовательности символов источника различной длины на равномерный код, причём не требует априорного знания вероятностей появления кодируемых символов. Сжатие в нем осуществляется за счет одинаковых цепочек байт. LZW реализован в форматах GIF, TIFF и PDF, он очень популярен, т.к. он простой и очень эффективный. Является однопроходным, то есть при кодировании и декодировании изображения не требуется предварительного анализа информации. Алгоритм основан на том, что второе и последующие вхождения некоторой последовательности символов в сообщении заменяются ссылками на её первое вхождение. В процессе кодирования строится кодовая книга «Словарь», содержащая кодируемые символы источника. Кодер последовательно анализирует значения пикселов источника, и при появлении отсутствующей в словаре серии, она помещается в следующую свободную позицию словаря. Если входящая серия пикселов уже есть в словаре, записывается лишь ссылка на соответствующую ячейку словаря.
9.6. Форматы файлов Формат файла - это способ сохранения данных. Каждому из существующих форматов соответствует уникальный способ представления информации или алгоритм архивации графики. Ниже представлена схема классификации графических файловых форматов рис.9.16.
Форматы графических файлов
155
Векторные
многослойные
Растровые
смешанные
однослойные
PSD
С индексированной палитрой
Без сжатия
gif
Со сжатием
BMP полноцветные с потерей качества
без потери качества
jpeg
tiff gif
Рис.9.16 Классификация форматов графических файлов Изображения занимают намного больше места в памяти, чем текст. Так, иллюстрация размером 500×800 точек занимает 1,2 Мб - столько же, сколько книга из 400 страниц. Эта особенность изображений определяет актуальность алгоритмов архивации графики. Второй особенностью изображений является то, что человеческое зрение при анализе изображения оперирует контурами, общим переходом цветов и сравнительно нечувствительно к малым изменениям в изображении. Таким образом, можно создать эффективные алгоритмы архивации изображений, в которых декомпрессионное
156
изображение не будет совпадать с оригиналом, однако человек этого не заметит. Данная особенность человеческого зрения позволила создать специальные алгоритмы сжатия, ориентированные только на изображения. В отличие от текста изображения обладают избыточностью в 2 измерениях. То есть, как правило, соседние точки как по горизонтали, так и по вертикали в изображении близки по цвету. Кроме того, можно использовать подобие между цветовыми плоскостями, что даёт возможность создать ещё более эффективные алгоритмы. Таким образом, при создании алгоритма компрессии графики используются особенности структуры изображения. 9.6.1. BMP (Windows Device Independent Bitmap) Формат ВМР является оригинальным форматом Windows, он поддерживается всеми графическими редакторами, работающими под ее управлением. Применяется для хранения растровых изображений, предназначенных для использования в Windows. Возможно применение сжатия по принципу RLE, но делать это не рекомендуется, так как очень многие программы такие файлы не понимают. Содержит информацию о каждом пикселе, что приводит к большим размерам файлов. 9.6.2. GIF (CompuServe Graphics Interchange Format) «Формат для обмена графической информацией». Разработанный фирмой CompuServe в 1987 году для передачи растровых изображений по сетям, формат GIF не зависит от аппаратного обеспечения. Он использует LZW-компрессию, что позволяет хорошо сжимать файлы, в которых много однородных заливок (логотипы, надписи, схемы). GIF-формат позволяет записывать изображение "через строчку", благодаря чему, имея только часть файла, можно увидеть изображение целиком, но с меньшим разрешением. Эта возможность широко применяется в Интернете. Сначала видна картинка с
155
малым разрешением, а по мере поступления новых данных качество изображения улучшается. Это достигается за счёт записи, а затем подгрузки, сначала 1,5,10 и т. д. строчек пикселов и растягивания данных между ними, вторым проходом следуют 2, 6, 11 строчки. Таким образом, задолго до окончания загрузки файла пользователь может понять, что внутри и решить, стоит ли ждать пока файл загрузится весь. В GIF можно назначить один или более цветов прозрачными, они станут невидимыми в интернетовских браузерах и некоторых других программах. Прозрачность обеспечивается за счет дополнительного Alpha-канала, сохраняемого вместе с файлом. Кроме того, файл GIF может содержать не одну, а несколько растровых картинок, которые интернетовские браузеры могут подгружать одну за другой с указанной в файле частотой. Это называется GIF-анимация. Основное ограничение формата GIF состоит в том, что цветное изображение может быть записано только в режиме 256 цветов. Для полиграфии этого недостаточно. 9.6.3. TIFF (Tagged Image File Format) Аппаратно независимый формат TIFF на сегодняшний день является одним из самых распространенных и надежных, его поддерживают практически все программы, так или иначе связанные с графикой. TIFF является лучшим при импорте растровой графики в векторные программы и издательские системы. Использует LZW-компрессию. Ряд программ не умеют читать такие файлы, кроме того, они могут дольше выводиться на устройства. Формат наиболее предпочтителен для полиграфии. Без проблем переносится между платформами и легко импортируется во все программы вёрстки. Принцип хранения данных основан на использовании специальных маркеров (тегов) в сочетании с битовыми последовательностями кусков растра.
156
9.6.4. PSD (Adobe Photoshop Document) PSD - формат популярного растрового редактора Photoshop. Он позволяет записывать изображение со многими слоями, их масками, дополнительными каналами, контурами и другой информацией - все, что может сделать Photoshop. Алгоритмы LZW и RLE обеспечивают возможность полного восстановления исходных данных. Но иногда для повышения степени сжатия можно отбрасывать часть исходной информации, то есть производить сжатие с потерями. Оно обычно происходит в два этапа. На первом исходная информация приводится (с потерями) к виду, в котором её можно эффективно сжимать алгоритмами второго этапа сжатия без потерь. Основная идея сжатия графической информации с потерями заключается в следующем. Каждая точка в изображении характеризуется тремя равноважными атрибутами: яркостью, цветом и насыщенностью. Но наш зрительный анализатор воспринимает эти атрибуты не как равные. Полностью воспринимается информация только о яркости и в гораздо меньшей степени о цвете и насыщенности, что позволяет отбрасывать часть информации о двух последних атрибутах без потери качества изображения. 9.6.5. Формат RAW Название RAW не является сокращением, а обозначает необработанные данные и состоит из прописных букв из аналогии с другими форматами файлов. Под термином RAW подразумевается не какой-то отдельный формат файлов, а общее обозначение различных форматов, используемых для хранения необработанных данных, зафиксированных датчиком изображения цифровой камеры , Для фиксации изображений каждый производитель цифровых камер разработал свой собственный формат RAW. Например, в устройствах компании Cenon используется формат CRAW, а в цифровой фотоаппаратуре компании Nicon - формат NEF. Данные в
155
этих форматах сохраняются в том исходном виде, в каком они были зафиксированы датчиком изображения. Поскольку такие форматы не являются стандартными, соответствующие файлы приходится преобразовывать перед правкой изображений. 9.6.6. JPEG (Joint Photographic Experts Group) Алгоритм разработан группой экспертов в области фотографии специально для сжатия 24-битных изображений. JPEG — Joint Photographic Expert Group — подразделение в рамках ISO — Международной организации по стандартизации. Формирование стандарта JPEG как международного стандарта было закончено в 1992 году. Использует алгоритм сжатия с потерями. Сжатие изображение в формате JPEG осуществляется в несколько этапов: 1.) преобразование цветового пространства; 2.) сегментация; 3.) дискретное косинусное преобразование; 4.) квантование; 5.) кодирование. Декодирование JPEG осуществляется в обратном порядке. Преобразование цветового пространства. Алгоритм сжатия JPEG способен кодировать изображения, основанные на любом типе цветового пространства (RGB, HSI или CMYK), но наилучшая степень сжатия достигается при использовании цветового пространства типа яркость - цветность, когда каждый пиксел изображения описывается тремя числами Y (яркость) и U, V (цветность). Упрощенно перевод из цветового пространства RGB в цветовое пространство Y U, V можно представить с помощью матрицы перехода:
156
(9.13.) Обратное преобразование осуществляется следующим образом:
и наименее значимые из них отбрасываются. От количества оставшихся гармоник зависит степень сжатия изображения. ДКП преобразует полученную на предыдущем этапе рабочую матрицу в матрицу частотных коэффициентов соответствующего размера.
(9.15.) (9.14.)
Сегментация изображения. Большая часть визуальной информации, воспринимаемой человеческим глазом, состоит из компонентов яркости Y, а к компонентам цветности U, V глаз менее чувствителен. Часть информации о цветности отбрасывается и тем самым сокращается объем информации. Исходное изображение разбивается на блоки 8х8 пикселов. Затем для Y, U, V формируются рабочие матрицы. Для компонента Y рабочая матрица составляется из значений яркости для каждого пиксела, входящего в блок. Для компонентов цветности матрицы формируются через ряд и через строку. На этом этапе теряется 3/4 информации о цветности, за счет чего объем изображения уменьшается в 2 раза. Дискретное косинусное преобразование (ДКП). Дискретное косинусное преобразование представляет собой разновидность преобразования Фурье и имеет обратное преобразование. В ДКП картинка рассматривается как совокупность пространственных волн, для которых оси X и Y проводятся параллельно продольной и поперечной осям картинки, а по оси Z откладывается значение цвета соответствующего пиксела изображения. С помощью ДКП алгоритм сжатия JPEG осуществляет переход в спектральную область. Каждая пространственная волна раскладывается на множество гармоник,
155
Где S(x,y) исходное значение амплитуды пиксела с координатами x и y внутри блока - значение элемента матрицы коэффициентов преобразования , а значения рассчитывается по формуле:
(9.16) В матрице коэффициентов высокочастотные элементы концентрируются в левом верхнем углу, а низкочастотные – в правом нижнем. Высокочастотные элементы получившейся матрицы отбрасываются. Эта процедура выполняется при квантовании. Квантование матрицы частотных коэффициентов. На этом шаге осуществляется управление степенью сжатия, и происходят самые большие потери. Матрица частотных коэффициентов поэлементно делится на матрицу квантования. Для каждого компонента Y, U, V задается своя матрица квантования. Она формируется таким образом, чтобы значения элементов в левом верхнем углу были небольшими, а коэф-
156
фициенты в правом нижнем углу, наоборот, имели большие значения. Это позволяет отбросить не воспринимаемую глазом высокочастотную информацию, которой соответствуют элементы из правого нижнего угла матрицы частотных коэффициентов. Далее, элементы результирующей матрицы округляются до ближайшего целого числа. В итоге в правом нижнем углу образуются нулевые значения, которые впоследствии отбрасываются. Задавая матрицу квантования с большими коэффициентами, мы получим больше нулей и, следовательно, большую степень сжатия. В стандарт JPEG включены рекомендованные матрицы квантования, построенные опытным путем. Матрицы для большего или меньшего коэффициентов сжатия получают путем умножения исходной матрицы на некоторое число gamma. С квантованием связаны и специфические эффекты алгоритма. При больших значениях коэффициента gamma потери в низких частотах могут быть настолько велики, что изображение распадется на квадраты 8х8. Потери в высоких частотах могут проявиться в так называемом “эффекте Гиббса”, когда вокруг контуров с резким переходом цвета образуется своеобразный “нимб”. Кодирование. Округленная матрица коэффициентов, полученная на этапе квантования, имеет определенное количество нулевых элементов. Для того чтобы объединить нулевые элементы в группы, производится зигзагообразное сканирование матрицы, начиная с левого верхнего угла (рис.9.17.).
155
Рис 9.17. Зигзаг – сканирование Таким образом, элементы матрицы записываются в цепочку. Полученный вектор сворачивается с помощью алгоритма RLE . Каждый ненулевой элемент вектора представляется в виде пары чисел, первое из которых равно количеству нулей перед этим числом, а второе – значению данного элемента вектора. Затем полученные пары чисел кодируются с помощью алгоритма Хаффмана с фиксированной таблицей. Для кодирования каждого сообщения может использоваться своя собственная таблица соответствий или же общая, фиксированная таблица. При кодировании пар чисел, осуществляемом в алгоритме сжатия JPEG, учитывается, что длинные последовательности нулей и большие значения коэффициентов встречаются реже, чем короткие последовательности нулей и маленькие значения коэффициентов. Полученный по алгоритму сжатия Хаффмана двоичный код готов к передаче по сети и хранению в памяти компьютера. Недостатком JPEG является «мозаичный эффект», являющийся следствием технологии сжатия видеоизображения. Картинка разбивается на блоки 8х8 пикселов, над которыми
156
выполняется дискретное косинусное преобразование, в результате которого цвета внутри блока уравниваются. При больших степенях сжатия мозаичный эффект становится заметен.К недостаткам так же можно отнести: невозможность достичь высоких степеней сжатия за счет ограничения на размер блока (только 8×8); блочность структуры на высоких степенях компрессии; закругление острых углов и размывание тонких элементов в изображении; поддерживаются только RGB-изображения (использовать JPEG для CMYKизображений можно только в формате EPS); изображение нельзя отобразить до тех пор, пока оно не загрузится полностью. 9.6.7. Стандарт JPEG2000 Работа по разработке нового стандарта сжатия группой экспертов в области фотографии JPEG шла с 1996 по 2000 год. При разработке к формату JPEG2000 предъявлялись следующие требования: достижение повышенной по сравнению с JPEG степени компрессии; поддержка монохромных изображений, что позволит применять его для компрессии изображений с текстом; возможность сжатия вообще без потерь; вывод изображений с постепенным улучшением детализации; использование в изображении приоритетных областей, для которых качество может устанавливаться выше, чем в остальной части изображения; декодирование в реальном режиме времени (без задержек). Стандарт основан на вейвлет-преобразовании. Вейвлет от английского слова wavelet (маленькая по продолжительности волна, всплеск). Оно упрощает сжатие, передачу и анализ изображений. В отличие от преобразования Фурье, базисными функциями которого являются гармонические функции, вейвлет преобразования основаны на разложении по малым волнам вейвлетам, изменяющейся частоты и ограниченным во времени (пространстве). Первое дискретное вейвлет преобра-
зование было придумано венгерским математиком Альфредом Хааром. Самый распространенный набор дискретных вейвлет-преобразований был сформулирован бельгийским математиком Ингрид Добеши в 1988 году. С конца 1980-х вейвлет- преобразование вошло в основу нового мощного метода обработки изображений, получившего название кратномасштабный анализ. В процессе краномасштабного анализа изображения представляются в различных масштабах, в различных разрешениях. Эти разные масштабы (разрешения) являются кратными по отношению друг к другу и связаны целой степенью некоторого масштабного фактора (в большинстве случаев это- 2). При таком подходе характерные детали, которые могут оставаться незаметными при одном разрешении, легко могут быть обнаружены при другом. При рассмотрении изображения мы видим связанные области одинаковой структуры и яркости, которые образуют объекты на изображении. Если эти объекты имеют низкий контраст или маленький размер, то мы изучаем их при высоком разрешении, если же они имеют высокий контраст или большой размер, то для восприятия их достаточно и поверхностного осмотра. Когда на изображении присутствуют и большие и маленькие объекты, низкоконтрастные и высококонтрастные области, то полезным будет анализировать такие изображения в разных масштабах (разрешениях). Исходя из этого и используется кратномасштабная обработка. Для предоставлении изображения в более чем одном масштабе используются масштабирующие функции, они строят последовательность приближений для изображения, причём каждое приближение отличается от соседнего масштабным фактором 2. Простой и мощной структурой для представления изображений в более чем одном масштабе является пирамида изображений (рис. ) Она представляет собой набор изображений в уменьшающемся масштабе, организованной в форме пирамиды. Основу пирамиды составляет подлежащее обработке изображение вы-
155
156
сокого разрешения; вершина пирамиды состоит из приближения низкого разрешения. По мере движения вверх по пирамиде размеры и разрешение уменьшаются. Если нижний уровень J имеет размеры или NхN, где , то промежуточный уровень j имеет размеры x Для кодирования изображения описывающей разность между соседними приближениями используются вейвлеты. Вейвлет-преобразование [11] одномерного сигнала – это его представление в виде обобщенного ряда или интеграла Фурье по системе базисных функций, образованных сдвигами и разномасштабными копиями функции-прототипа.
раций сдвига во времени ( b ) и изменения временного масштаба (a ) (рис.9.19.). Множитель 1/ a обеспечивает независимость нормы этих функций от масштабирующего числа a . Для заданных значений параметров a и b функция ψab(t) и есть вейвлет, порождаемый материнским вейвлетом ψ(t). На рис. 9.19. в качестве примера приведены: вейвлет «мексиканская шляпа» (а) и модуль его спектральной плотности (б). Малые значения а соответствуют мелкому масштабу ψab(t) или высоким частотам (ω ~1/ a ), большие параметры aкрупному масштабу ψab(t), т.е. растяжению материнского вейвлета ψ(t) и сжатию его спектра.
) (9.17)
Рис.9.19. Вейвлет «Мексиканская шляпа» Таким образом, в частотной области спектры вейвлетов похожи на всплески (волночки) с пиком на частоте и полосой ∆ω , т.е. имеют вид полосового фильтра; при этом и ∆ω уменьшаются с ростом параметра a . Cигналы можно представить в виде совокупности последовательных приближений грубой (аппроксимирующей) Aj(t) и уточненной (детализирующей) Dj(t) составляющих
Рис. 9.18
Пирамида изображений
Функция-прототип это материнский (исходный) вейвлет ψ(t), обладающий определенными свойствами за счет опе-
155
(9.18.) с последующим их уточнением итерационным методом. Каждый шаг уточнения соответствует определенному масштабу 156
Рис.9.20 Схема вейвлет-преобразования. В них вычисляется свертка (цифровая фильтрация) поданного сигнала и импульсной реакции фильтров. На выходе фильтров будут высокочастотные и низкочастотные
компоненты сигнала. Так как фильтры пропускают только половину всех частоных компонентов сигнала, то не попавшие в полосу прозрачности составляющие могут быть удалены. Поэтому во вторых блоках схемы выполняется децимация ↓2, т.е. прореживание в два раза. Фильтрованные выборки, которые образуются при вейвлет-преобразовании, называются вейвлет-коэффициентами. Вследствие процесса уменьшения размера изображения, общее количество вейвлеткоэффициентов то же самое как и число выборок исходного сигнала. Правая часть схемы рис.9.20. осуществляет вейвлетреконструкцию сигнала. Эта процедура использует операции интерполяции и фильтрации фильтрами реконструкции Lo_R и Hi _ R . Операция интерполяции ↑ 2 , обратная децимации ↓2, осуществляется путем увеличения в два раза числа составляющих добавлением нулевых компонентов вперемежку с имеющимися. При сложении сигналов ( и ), полученных на выходе фильтров синтеза Lo_R и Hi_R , будем иметь сигнал (k), близкий к исходному S(k), т.е. произойдет его реконструкция на начальном уровне. Прямое вейвлет преобразование изображения происходит следующим образом. Предположим, что имеем изображение размером N × N (рис. 9.21., а). Первоначально каждая из N строк изображения делится (фильтруется) на низкочастотную (НЧ) и высокочастотную (ВЧ) половины. В результате получается два изображения размером N×N/ 2 (рис.9.21., б). Далее каждый столбец делится точно также, в итоге получается четыре изображения размером N /2× N / 2 (рис.9.21, в): НЧ по горизонтали и вертикали (НЧНЧ1), ВЧ по горизонтали и вертикали (ВЧВЧ1), НЧ по горизонтали и ВЧ по вертикали (НЧВЧ1) и ВЧ по горизонтали и НЧ по вертикали (ВЧНЧ1). Первое из указанных выше изображений делится аналогичным образом на следующем шаге (уровне) преобразования (рис.9.21., г) и т.д. Рассмотрим алгоритм стандарта jpeg 2000:
155
156
(т.е. уровню j ) анализа (декомпозиции) и синтеза (реконструкции) сигнала. Такое представление каждой составляющей сигнала вейвлетами можно рассматривать как во временной, так и в частотной областях. Трактовка вейвлет- преобразования в частотной области на базе частотной фильтрации. В этом случае кратномасштабный анализ сигнала рассматривается как поэтапная процедура фильтрации. При этом частотный образ ψ&(ω) вейвлета ψ(t) можно разбить на низкочастотную и высокочастотную составляющие с частотой раздела, равной ωд / 2 , т.е. представить реализацией двух фильтров. Пара низкочастотных и высокочастотных фильтров известны как набор фильтров анализа (банк фильтров). Фильтр нижних частот сохраняет низкие частоты сигнала при уменьшении или устранении высокочастотных составляющих, таким образом это приводит к размытому варианту исходного сигнала. Наоборот, фильтр верхних частот сохраняет высокие частоты в сигнале такие как границы, текстура и детали, при удалении или уменьшении низкочастотных составляющих. Обратимся к схеме рис.9.20. Сигнал S подается на низкочастотный (нижняя часть схемы) и высокочастотный фильтры декомпозиции Lo_D и Hi_D .
Для выравнивания динамического диапазона происходит сдвиг значения среднего уровня яркости путём вычитания из неотрицательных значений отсчётов кодируемого изображения величины , где n- число битов в элементах изображения, что приводит к увеличению степени сжатия. Делается это независимо для трёх цветовых каналов RGB
Рис.9.21. Деление изображения по разрешениям Изображение из пространства RGB переводится в пространство YUV. Этот перевод делается аналогично алгоритму JPEG в случае сжатия с потерями. При сжатии без потерь пространство переводится с помощью выражения:
(9.18.)
сивы пикселов, и содержат одинаковую относительную долю всех компонент изображения. В процессе разбиения а области создаются компоненты тайла, которые могут выделяться и восстанавливаться независимо. Затем вычисляется одномерное дискретное вейвлет преобразование по строкам и по столбцам каждой компоненты тайла. В случае обратимого вейвлет-преобразования количество коэффицентов низкочастотного фильтра составляет 5, а количество коэффицентов высокочастотного фильтра составляет 3. При этом мы имеем вейвлет преобразование 53.Такой набор фильтров называют биортогональным. Это название основывается на том факте, что низкочастотный фильтр на входе и высокочастотный фильтр на выходе, а также высокочастотный фильтр на входе и низкочастотный на выходе являются ортогональными т.е. фильтры анализа и синтеза линейны (они удовлетворяют некоторым условиям симметрии) При необратимом преобразовании (с потерями) используются преобразование 9-7. При этом используется банк фильтров под названием- банк фильтров Дебаши. Обозначим низкочастотный вейвлетный фильтр, высокочастотный . При разложении сигнала сегмента изображения вначале выполняется разложение по строкам, а затем по столбцам. Результатом разложения являются 4 матрицы: , соответствующие фильтрации фильтром по строкам и по столбцам, фильтром по строкам и по столбцам, фильтром по строкам и по строкам и столбцам. по столбцам, фильтром (рис.9.22.) Далее производится децимация (прореживание) полученных матриц по строкам и столбцам с коэффициентом 2. Затем матрица подвергается дальнейшему вейвлетному разложению. Его результатом являются матри-
Далее изображение разбивается на непересекающиеся блоки-тайлы. Тайлы представляют собой прямоугольные мас155
156
цы: . Такое разложение повторяется v раз. Результатом разложения является набор из 3v+1 матриц уменьшающейся размерности. Для сжатия без потерь цикл обычно повторяется 3 раза, с потерями- разумным компромисом между размером, качеством и скоростью декомпрессии считается 10 повторений.
Рис 9.22 Вейвлетное разложение изображения В результате получается одно маленькое изображение
155
и набор картинок с мелкими деталями, последовательно и с определённой точностью восстанавливающий его до нормального размера. Очевидно, что наибольшая степень компрессии получается на крупных изображениях, поскольку можно установить большее количество циклов. При записи коэффициентов в файл можно использовать иерархическую структуру дискретного вейвлет- преобразования, помещая коэффициенты преобразований с большего уровня в начало файла. Это позволяет получить изображение для предварительного просмотра, прочитав небольшой участок из начала файла, не распаковывая весь файл. Финальными шагами процесса кодирования являются упаковка битов коэффициентов, арифметическое кодирование, формирование слоёв битового потока и образование пакетов. Каждая из матриц разложения делится на блоки, которые кодируются независимо друг от друга при помощи контекстного адаптивного двоичного арифметического кодера [8]. Коэффициенты матриц вейвлетного разложения представляются в двоичном виде. Все биты коэффициентов, относящихся к одному разряду, образуют битовую плоскость. Кодирование коэффициентов матриц разложения происходит на уровне битовых плоскостей. Кодирование битовых плоскостей это ещё один метод сокращения межэлементной избыточности, основан на концепции предварительного разложения многоградационного изображения на серию двоичных изображений и последующего кодирования каждого из них при помощи известных алгоритмов сжатия двоичных изображений. Каждая битовая плоскость кодируется с помощью арифметического кодера за три прохода. Каждый бит из битовой плоскости кодируется только на одном из трёх проходах, называемых распространение значащего разряда, уточнение значения и подчистка. Полученные результаты затем арифметически кодируются и группируются вместе с аналогичными
156
проходами других кодовых блоков того же тайла, формируя слои. Слой- объединение кодовых блоков тайла одного и того же уровня разложения. Разделение на слои позволяет по отдельности кодировать уровни разложения вейвлет преобразования, обеспечивая при декодировании необходимую масштабируемость по пространственному разрешению. Полученные слои делятся на пакеты, предоставляя дополнительную возможность выделения пространственных областей интереса из общего кодового потока. Пакеты являются основными единицами закодированного потока данных. 10. Редактирование в Adobe PhotoShop
мы редактирования, настройки инструментов и т.д. В каждой панели может быть вложено несколько палитр, их можно перетаскивать между панелями, можно добавлять или убирать. В верхней части экрана расположено меню, под которым находится панель настроек. С помощью этой панели можно установить различные параметры для выбранного инструмента. Внизу экрана находится строка состояния, на которой указано название выбранного инструмента и параметры изображения. В левом углу строки состояния располагаются поле масштабирования, в котором указывается относительный размер активного окна изображения, и информационное поле, показывающее объем памяти, занятой изображением.
В большом классе программ для обработки растровой графики особое место занимает пакет PhotoShop компании Adobe. На сегодняшний день эта программа является стандартом в компьютерной графике. PhotoShop – это редактор изображений профессионального уровня. Основные возможности, которые предоставляет Photoshop для работы с изображениями: - изменение режимов изображения; - корректировка цвета; - деформация, вращение, движение изображения; - работа со слоями; редактирование слоев по отдельности, создание между ними различных эффектов; - возможности выделения и работы с фрагментами; -огромное количество фильтров; - много инструментов для рисования; - наложение текста. Основные части экрана Photoshop На рабочем поле (рис. 10.1) открываются окна, в которых будут размещены редактируемые изображения. Обычно справа расположена панель инструментов. По экрану разбросаны панели с палитрами. Палитры помогают задавать режи-
155
156
Рис. 10.1 Вид экрана PhotoShop
инструментов на панели настроек. Если на кнопке есть внизу маленький треугольник, то это значит, что под кнопкой находится несколько разновидностей данного инструмента. Чтобы увидеть их нажмите на эту кнопку и некоторое время не отпускайте её. После этого откроется палитра - весь список инструментов (рис. 10.2). Верхняя левая кнопка – это выделения. Возможно выделение прямоугольных областей, эллиптических областей, а также выделение горизонтальных и вертикальных строк. Верхняя правая кнопка даёт возможность перетаскивать, перемещать выделенный фрагмент. Вторая кнопка сверху в левом ряду - это группа свободного выделения. Лассо выделяет всю обведенную область. Многоугольное лассо строит границу выделения мелкими шагами в виде прямых отрезков. Магнитное лассо строит выделение на основе цветовой разности. Контур выделения автоматически «прилипает» к границам соответствующего элемента управления. Далее в левом ряду расположена кнопка кадрирования. Она обрезает изображение до указанной области. Вторая кнопка сверху в правом ряду - Волшебная палочка - выделяет область пикселов по их цветовой схожести. Третья кнопка сверху в правом ряду - Фрагмент, применяется для разрезания изображения на куски. Далее идут инструменты для рисования и ретуширования.
Панель инструментов Панель инструментов является основным средством для работы с изображениями. Она состоит из набора кнопок, каждая из которых соответствует какому-то инструменту. Любой инструмент можно сделать активным, выбрав его с помощью мыши. После этого можно настроить параметры
155
156
Рис 10.2 Панель инструментов
Четвёртая кнопка слева это группа инструментов, предназначенных для ретуширования изображений. Лечащая кисть осуществляет текстурную коррекцию с учетом подложки. Заплатка сочетание произвольного выделения и заливки. Справа от нее Кисть прямое рисование активным цветом. Пятая кнопка сверху в левом ряду - группа инструментов, предназначенных для фотомонтажа. Штамп - незаменимый инструмент при фотомонтаже. Действуйте следующим образом: укажите мышью (с нажатой клавишей Alt), из какого места на изображении перерисовывать, затем просто водите кистью в том месте, где необходимо повторить выбранный фрагмент. Фигурный штамп - позволяет рисовать текстурой. Рядом со штампом находятся кисти: Кисть состояния - позволяет рисовать из любого места истории; Художественная восстанавливающая кисть - восстанавливает состояние изображения из снимка истории и позволяет применять различные художественные эффекты. Шестой сверху в левом ряду - Ластик, позволяет удалять кусочки изображения. Фоновый ластик - ластик, предназначенный для отделения объекта от фона. Волшебный ластик выделяет область, а затем удаляет ее. Справа от ластика - инструменты заливки. Градиент создает заливку с плавным переходом между двумя или несколькими цветами. Заливка заливает изображение цветом или текстурой. Седьмые сверху в левом ряду- инструменты для коррекции изображения. Размытие - инструмент для размытия участка изображения. Резкость увеличивает контрастность области. Палец создает эффект, похожий на размазывание пальцем еще не высохшей краски на полотне. Справа от них: Осветлитель - изменение яркости пик-
155
156
селов в сторону увеличения, что приводит к осветлению изображения; Затемнитель - изменение яркости пикселов в сторону уменьшения, что приводит к затемнению изображения; Губка изменяет насыщенность цвета в редактируемой области. Под ними, восьмые сверху в правом ряду, инструменты ввода текста: Type - Текст - горизонтальный текст, цвет которого определяется цветом переднего плана; Vertical Type Tool - текст в вертикальном направлении; Horizontal Type Mask Tool - писать выделением; Vertical Type Mask Tool - текст как выделение в вертикальном направлении. Слева от текста находятся: Перемещение фигур применяется для перемещения фигур; Модификация фигур - инструмент, при помощи которого можно менять вид фигуры путем воздействия на точки и линии контура, ограничивающего фигуру. Девятые сверху в левом ряду- инструменты создания контуров: Перо - инструмент, который создает контуры; Свободное перо - инструмент, ближайшим аналогом которого является Лассо, однако данный инструмент создает контур, а не выделение; Перо+ - добавить опорную точку контура; Перо- - удалить опорную точку; Угол - инструмент для модификации контура. Справа от них- инструменты создания двухмерных геометрических фигур: Прямоугольник, Скругленный прямоугольник, Эллипс, Многоугольник, Линия; Пользовательская фигура. В данном списке содержатся фигуры, созданные вручную. При помощи команды «Редактирование; определить новую фигуру» пользователь может сохранить любой контур как фигуру и использовать ее в дальнейшем. Ниже, под инструментами создания фигур, находятся измерительные инструменты: Пипетка - позволяет сделать цветом переднего плана цвет того пиксела, по которому поль-
Палитры Палитры – это вспомогательные окна, предназначенные для выполнения различных операций над изображениями. По умолчанию палитры расположены на четырех панелях вертикально вдоль правого края. На каждой панели видна только одна палитра. Корешок активной палитры выделен ярким цветом. Как и любое окно, панели можно передвигать по экрану в удобное место. Щелчок на кнопке в форме стрелки открывает меню команд данной палитры (рис. 10.4). С помощью этих команд можно манипулировать опциями палитры и задавать установки. На первой панели расположены палитры Навигатор и Инфо. Они используются для изменения масштаба демонстрации изображения, а также содержат информацию о пара-
155
156
зователь щелкает этим инструментом в данный момент. Выбор цветов - позволяет делать активными не один, а несколько цветов. Линейка - используется для измерения расстояний и углов. Рядом с пипетками, слева, находятся инструменты для вставки пометок: Пометка - инструмент, предназначенный для создания текстовых пометок в работах; Аудиозапись инструмент, предназначенный для создания звуковых пометок в работах. В нижней части панели инструментов находится кнопка, позволяющая выбрать основной и фоновый цвет щелчком мыши по соответствующему квадрату (рис. 10.3).
Рис. 10.3 Выбор цвета
метрах выбранного инструмента.
Рис. 10.4 Панель с палитрами Навигатор и Инфо На второй панели расположены палитры Цвет, Каталог и Стили. Первые две позволяют выбирать, создавать и редактировать цвета, а палитра Стили содержит образцы оформления текста. В следующую группу включены палитры Слои, Каналы, Пути, История, Действия. Они обеспечивают работу со слоями и каналами, содержат последовательность из последних 20 операций, а также позволяют записать под именем последовательность операций, которая многократно повторяется. Выделения изображений Выделение областей- очень частая и важная процедура. Инструментами для выделения служат Лассо, Многоугольное лассо, Магнитное Лассо и Волшебная палочка. Также прямоугольные области можно выделить с помощью инструментов Прямоугольник, Эллипс, Строка, Столбец. Если выделить какой-то фрагмент, то это выделение видно на экране в виде движущейся пунктирной линии. Бывают случаи, когда надо дополнить это выделение. Для этого следует взять любой инструмент выделения и обвести недостающий участок, но при этом держать нажатой клавишу Shift. Если надо откусить кусок от выделения, то следует удерживать клавишу Alt. Выделенный фрагмент можно передвинуть, трансформировать, можно провести коррекцию его цветов. Когда вы-
делен какой-то фрагмент, все действия, которые будут выполняться с рисунком, повлияют только на выделенный фрагмент. Выделенный фрагмент не обязан быть единым целым. Это могут быть несколько разных участков в разных частях экрана. Меню Выделение. Для работы с выделением есть команда меню «Выделение». Здесь собраны полезные функции для модификации выделения: - Все - выделить весь рисунок; - Убрать Выделение – отменить выделение; - Инвертировать – инверсия: (выделенное и невыделенное меняются местами); - Цветовой диапазон - выделение на основе диапазона цветов; - Перо - размытие границ; - Модифицировать - Граница - из границы выделения делает тонкую полоску выделения; - Модифицировать - Смазывать - сглаживает область выделения, убирает зазубрины; - Модифицировать - Раскрывать - расширение выделения; - Модифицировать - Контраст - сужение выделения; - Увеличить - расширяет выделение, захватывая соседние точки с похожими цветами; - Аналогичный - расширяет выделение за счет похожих участков; выделение может получиться из целого набора непересекающихся участков; - Трансформировать выделение - трансформирование выделения: можно растягивать или сужать выделенную область. Модификация выделенных областей. Выделив фрагмент, можно изменить его геометрический вид. Для этого служит меню Редактирование. Здесь можно вырезать фрагмент, скопировать его или вставить.
155
156
Очень удобный пункт меню Редактирование / Свободная Трансформация. Вокруг выделения появляются маркеры, с помощью которых можно изменять размеры по горизонтали и вертикали, передвигать, вращать и задавать центры вращения. В пункте Трансформация еще много подпунктов: - Масштаб - изменение размеров по горизонтали и вертикали; - Поворот – вращение; - Сдвиг - оттягивание одного из углов; - Искажение - оттягивание нескольких углов; - Перспектива - эффект перспективы; - Поворот 180 - поворот на 180 градусов; - Отразить горизонтально - разворот по горизонтали; - Отразить вертикально - разворот по вертикали. Применив несколько пунктов из этого меню, можно сделать многое, например, фотомонтаж. При помощи выделения и редактирования можно из нескольких фотографий взять разные предметы и людей и совместить их на одной. Тоновая коррекция. Средства регулировки цветовых оттенков позволяют превращать тусклые и плохо окрашенные изображения в яркие и красочные. Тона (оттенки цветов) изображения характеризуются яркостью пикселов. Эти яркости лежат в диапазоне от 0 до 255. Самому темному оттенку соответствует яркость 0, а самому светлому – 255. Диапазон яркостей пикселов изображения называется тоновым диапазоном изображений. Для каждого изображения PhotoShop показывает распределение яркостей пикселов в виде гистограммы (рис.10.5). Для этого используется команда «Изображение Гистограмма».
155
Рис. 10.5 Гистограмма изображения По горизонтальной оси располагаются значения яркостей: от 0 до 255, а по вертикальной – количество пикселов каждого уровня яркости. Тени – самая темная часть изображения с малым значением яркости. Светлые тона – самая светлая часть изображения с большим значением яркости. Между тенями и светлыми тонами находятся средние тона. Основная задача тоновой коррекции – обеспечить правильное распределение яркостей пикселов в изображении. Необходимость тоновой коррекции обусловлена тем, что у изображения, полученного с помощью сканера, тоновый диапазон сужается из-за особенностей этого устройства. Поэтому отсканированные фотографии выглядят тускло по сравнению с оригиналом. Невысокое качество фотографий может быть вызвано также непрофессиональной съемкой. В PhotoShop для тоновой коррекции используются команды меню Изображение - Настройки. 156
Команда «Яркость – Контраст» вызывает на экран две шкалы. Перемещение регулятора по шкале Яркость позволяет затемнить или осветлить изображение, а регулятор Контраст улучшает четкость изображения. Команда «Уровни» вызывает на экран гистограмму активного изображения и ряд инструментов для настройки тонового диапазона. Можно настроить светлые и темные тона с помощью треугольников-регуляторов, расположенных под гистограммой. Можно использовать пипетки, расположенные в нижнем правом углу. Они используются для захвата цвета пиксела изображения. Для регулировки следует выбрать нужную пипетку и перевести курсор на соответствующий участок изображения. (Например, выбрать белую пипетку и указать наиболее освещенный участок изображения). Команда «Кривые» вызывает на экран диалоговое окно для гамма- коррекции изображения (рис. 10.6).
Рис. 10.6 Кривые для гамма - коррекции тонового диапазона На графике вдоль горизонтальной оси расположены исходные значения яркостей пикселов, а по вертикальной оси – новые откорректированные значения. Линия под углом 45 градусов означает отсутствие коррекции. Левая нижняя точка 155
прямой – тени, центральная часть – средние тона, а верхняя правая точка – свет. Для усиления яркости темного изображения кривая должна принять выпуклую форму, изменения яркости светлого – вогнутую форму. При изменении формы кривой следует щелкнуть курсором в ее центре и переместить появившуюся точку. Также тоновую коррекцию можно делать с помощью инструментов Осветление и Ожег. Их работа эквивалентна ручной тоновой коррекции. С помощью инструмента Губка можно «вручную» изменить насыщенность участка изображения. Путём перемещения мыши с нажатой левой клавишей по соответствующим участкам. Коррекция цветового баланса Для настройки изображения есть меню Изображение. Рассмотрим некоторые его подпункты: Режим - позволяет определить режим, в котором находится редактируемая картинка. Если указать другой режим, то картинка преобразуется в него. Иногда конвертирование может ухудшить изображение. Настройка - здесь можно настроить тон и цвет рисунка. Если сделать выделение, то все действия будут происходить только с выделенным фрагментом. О некоторых пунктах меню Настройка: - Оттенки - Насыщение - позволяет как бы смещать цвета; - Цветовой Баланс – изменяет содержание основных цветов; - Заменить цвет - можно заменить какой-то определенный цвет в рисунке. Ретуширование изображений Ретуширование изображений включает в себя повышение резкости и устранение мелких дефектов. Для усиления резкости используются несколько фильтров из команды «Фильтр – Резкость». Команда «Рез-
156
кость» позволяет немного улучшить четкость изображения. Команда «Усилить Резкость» делает это немного сильнее. Фильтр Резкие края усиливает резкость контуров и не влияет на участки изображений с плавным переходом цвета. Устранить мелкие дефекты – это значит удалить с изображения загрязнения и царапины, убрать морщинки с портрета, отбелить зубы и т.п. Для устранения дефектов используется команда «Фильтр - Шум - Пыль и Царапины». В открывшемся диалоговом окне два поля. Поле Радиус определяет размер области, которая используется для усреднения цветов соседних пикселов. Чем меньше значение в поле Порог, тем меньше отличаются между собой цвета соседних пикселов. Работа со слоями Каждый создаваемый в Photoshop документ сначала состоит только из фона, который можно сравнить с холстом художника. Фоновый слой может быть белым, окрашенным в текущий цвет заднего плана или прозрачным. Эти параметры можно задавать каждый раз при создании нового изображения. На этот фон можно наложить несколько прозрачных слоев. Слои предоставляют пользователю возможность редактировать отдельные элементы изображения независимо друг от друга. Таким образом можно изменять и перемещать содержимое любого слоя, не затрагивая при этом объекты, расположенные на других слоях. По умолчанию прозрачные участки фонового слоя отображаются на экране с помощью клетчатого узора. При желании можно изменить размер и цвет ячеек этого узора.
155
Рис. 10.7 Палитра Слои Редактирование параметров слоёв осуществляется на палитре Слои (рис. 10.7.). Там перечислены все слои изображения, начиная с верхнего; слой Фон всегда расположен в самом конце таблицы. Если щелкнуть по значку «Создать новый слой», то Photoshop определит, сколько слоев уже задействовано в изображении, и автоматически присвоит новому слою следующий порядковый номер. Но такие названия слоев не всегда удобны. Если нужно быстро идентифицировать содержимое слоя, то лучше дать ему индивидуальное имя. Для этого нужно создавать новые слои несколько более длинным путем, а именно через меню палитры Слои, пункт Новый слой. Можно также переименовать уже созданный слой, щелкнув дважды по его заголовку на палитре Слои, что даст доступ к диалоговому окну Параметры слоя. Здесь можно ввести новое имя в поле Имя. Если при нажатой клавише Ctrl указать на любой участок многослойного изображения правой кнопкой мыши, то под курсором появится информация обо всех лежащих под ним слоях. Там же можно выбрать и активный слой. Для показа слоя следует указать курсором мыши на 156
"глаз", нарисованный напротив пиктограммы любого слоя. Если сделать это при нажатой клавише Alt, то все остальные слои, кроме отмеченного, станут невидимыми. Если при нажатой клавише Ctrl указать курсорам мыши на пиктограмму нужного слоя в палитре слоев, то в окне редактирования этот слой окажется полностью выделенным. На палитре Слои, слева от имени слоя изображена уменьшенная копия его содержимого. Эти миниатюры постоянно обновляются в процессе редактирования. В этой же строке могут отображаться значки включенного, связанного, редактируемого, текстового слоя, слоя с примененным эффектом. Все команды редактирования применяются только к активному в данный момент слою. При помощи команды «Слои /Объединить слои» вы можете объединить слои. До тех пор, пока вы не объедините слои, каждый из них будет оставаться независимым структурным элементом изображения. Изображение со слоями можно сохранить только в формате Adobe Photoshop. Пункт меню Слой / Стиль слоя позволяет задавать эффекты слоев, например такие, как тень, внутреннее свечение, внешнее свечение, скос и т.п. После выбора эффекта появится диалог с настройками эффекта. Каждый эффект можно включить или выключить. Можно включить несколько эффектов. Эффект не изменяет слой. Он не модифицирует ни одной точки. Он модифицирует только отображение на экране, а сам рисунок остается неизменным. Выделение с помощью режима быстрой маски Кроме обычных способов выделения различных областей и лассо есть еще один способ создания выделений. Это режим "быстрой маски". Переключиться в этот режим можно при помощи переключателя на панели инструментов (рис. 10.8).
155
Рис. 10.8 Переключатели на панели Если сделать какое-нибудь выделение, а затем переключиться в режим быстрой маски, то выделенная область останется нетронутой, а все остальное покраснеет. Так добавляется еще один временный слой с названием Quick Mask, который олицетворяет выделение. Можно редактировать это покраснение любыми инструментами, например карандашами, линиями, резинками. Добавление участков к выделенной области производится в результате закрашивания белым цветом, а для удаления какой-либо области из выделения нужно воспользоваться черной краской. Таким образом, закрашивание чёрным цветом расширяет полупрозрачную плёнку, сокращая тем самым выделенную область; а закрашивание белым стирает плёнку, в результате чего выделенная область увеличивается. Чёрный и белый — основной и фоновый цвета по умолчанию. Инструменты Карандаш и Кисть рисуют основным цветом, a Ластик — фоновым. Так добиваются выделения любой сложности с любыми границами. После того, как выделение закончено, следует вернуться в обычный режим. Работа с фильтрами Фильтры в Photoshop позволяют искажать, изменять, стилизировать и модифицировать изображения. В Photoshop входит очень большой набор фильтров. Чтобы их вызвать, нужно зайти в меню Фильтр, выбрать там группу фильтров, а затем выбрать сам фильтр. После выбора фильтр применится к рисунку или выделенному участку. У многих фильтров есть диалоги настроек. Часто можно производить настройку
156
фильтра и одновременно наблюдать результат. Рассмотрим основные группы фильтров и попытаемся их описать. - Художественные - имитация разных приемов рисования; - Затирание - размытие, размазывание; - Штрихи/Кисти - имитация работы кистью; - Искажение – деформация; - Шум - работа с шумом и дефектами, добавление и удаление; - Пикселизация - работа с пикселами, объединение пикселов по разным законам, стилизация; - Рендер - различные искусственные эффекты, блики, отсветки, облачка; - Резкость - делает изображение более резким; - Стиль - имитация всяких стилей и приемов; - Эскиз - тоже имитация различных стилей и приемов; - Текстурные - создание текстур.
155
ЛИТЕРАТУРА 1. Гудинов К.К., Двуреченский С.А. Цифровая фотоаппаратура: Методические указания по выполнению лабораторных работ. – СПб.: СПбГУКиТ, 2010. 2. Степаненко О.С. Сканеры и сканирование: Краткое руководство -М.:Изд. дом «Вильямс», 2004. 3. Шпунт Я.Б. Всё о сканерах. - М: АСТ: НТ Пресс, 2004. 4. Гонсалес Р., Вудс Р., Цифровая обработка изображений. М.: Техносфера, 2006. 5. Лидовский В.В., Теория информации: Учебное пособие: – М.: Спутник +, 2004. 6. Айсманн К., Дугган Ш., Грей Т., Цифровая фотография. Искусство фотосъёмки и обработки изображений Пер. с англ.- СПб.: ДиаСофтЮП, 2005. 7. Тайц А.М., Тайц А.А. Adobe Photoshop 7- СПб.: БХВ - Петербург, 2004. 8. Беляев Е.А., Тюрликов А.М., Уханова А.С. Адаптивное арифметическое кодирование в стандарте JPEG 2000. Информационно-управляющие системы №6, 2007. 9. Домасаев М.С., Гнатюк С.П., Цвет, управление цветом, цветовые расчёты и измерения.- СПб.: Питер, 2009.224с. 10. Стратонович Р.Л., Теория информации., Москва.,«Сов. радио» 1975, 424 стр. 11. Яковлев А.Н. Учебное пособие. Введение ввейвлет преобразование.- Новосибирск, 2003.-Издательство НГТУ, 2003, 104 с.
156
155
156