Рефераты

Дискретизация и квантование изображений

Дискретизация и квантование изображений

4.2.2. Дискретизация и квантование изображений

Сформированное и записанное изображение необходимо преобразовать в форму,

пригодную для цифровой обработки. Если изображения записываются

фотоэлектронным способом, то это обычно не составляет трудности, так как

из сканирующего фотоэлемента поступает электрический ток, пригодный для

дискретизации и квантования. Таким образом, данный случай можно

рассматривать как распространение соответствующих методов цифровой

обработки одномерных сигналов на двумерные сигналы. При этом ошибки

квантования можно учесть введением в блок-схему дополнительного .источника

шума [11]. Расстояние между отсчетами должно удовлетворять теореме

Найквиста для двумерных колебаний [1].

Устройства для дискретизации и квантования изображений основаны на

технике микроденситометрии. В подобных системах на пленку проектируется луч

света с интенсивностью I1. Интенсивность I2 света, прошедшего сквозь пленку

(или отраженного от нее), измеряется фотоумножителем. По коэффициенту

пропускания

Т=[pic]

(4.16)

с помощью соотношения (4.5) можно вычислить оптическую плотность. После

этого световое пятно на пленке можно сместить скачком и таким образом

получить отсчеты изображения. Математически этот процесс описывается

соотношением

g1(x, y) =[pic] (4.17)

где g - изображение на пленке; ha распределение яркости в сечении луча,

освещающего пленку; g1 эквивалентное изображение, из которого берутся

отсчеты (т.е. в дискретных точках x = j[pic]x, y = k[pic]y сканирующий

фотоприемник измеряет именно g1 ). Матрица отсчетов g1 ( j[pic]x, k[pic]y

) представляет собой дискретизованное, или цифровое, изображение.

Из равенства (4.17) (справедливого также для случая дискретизации

изображений, полученных фотоэлектронными средствами) видно, что в процессе

дискретизации записанное изображение подвергается искажениям. За счет

правильного выбора распределения ha и расстояния между отсчетами

изображение можно фильтровать в процессе дискретизации. Фильтрацию,

связанную с процессом дискретизации [согласно формуле (4.17)], можно

использовать для подавления эффектов наложения, возникающих из-за того, что

ширина спектра изображения обычно не ограничена (из-за шума зернистости

пленки и других высокочастотных составляющих) [12]. Дискретизация

коэффициента пропускания эквивалентна дискретизации яркостного изображения,

а дискретизация плотности эквивалентна дискретизации плотностного

изображения. Часто можно услышать, что предпочтительнее квантовать

плотность, так как логарифмическая зависимость приводит к уменьшению

динамического диапазона. Однако подобные упрощенные рассуждения могут

приводить к ошибкам [13].

4.2.3. Восстановление и демонстрация цифровых изображений

При цифровой обработке одномерных сигналов восстановление аналогового

сигнала из последовательности чисел достигается путем низкочастотной

фильтрации, что теоретически обосновывается теоремой об интерполяции

колебаниями с ограниченным спектром [11]. В идеальном случае для такой

интерполяции следует применять функцию вида sin [pic] . Однако данная

функция не имеет двумерного варианта, который можно было бы использовать

для восстановления аналоговых изображений, так как импульсный отклик

идеального фильтра нижних частот, имеющий вид sin[pic], принимает

отрицательные значения, а это выдвигает требование получения отрицательного

света, невыполнимое при восстановлении изображений.

Аналоговое изображение можно восстановить с помощью устройства, подобного

примененному при дискретизации изображения. На чистую пленку проектируется

луч света, а интенсивность этого записывающего луча модулируется в

соответствии с числовыми значениями изображения. В качестве источника

света, а также для непосредственной демонстрации изображений можно также

применять электронно-лучевые трубки (ЭЛТ). Световое пятно перемещается по

поверхности пленки согласно растровой сетке. Нетрудно увидеть, что процесс

восстановления изображения описывается соотношением

g2(x, y) =[pic] (4.18)

где hd - распределение яркости записывающего пятна, g1 - матрица отсчетов

функции (4.17), представленная здесь набором взвешенных [pic] - импульсов,

разнесенных на расстояния (x, y) друг от друга, а g2 -

восстановленное непрерывное изображение. Распределение яркости

записывающего пятна является импульсным откликом интерполирующего фильтра,

аналогичного применяемому при восстановлении одномерных аналоговых

сигналов. Практически во всех системах восстановления изображений

записывающее пятно имеет несложное распределение яркости (например,

гауссовское). По этой причине точно восстановить изображение не удается,

поскольку простые распределения не дают возможности полностью подавить

высокочастотные копии спектра изображения, возникающие при дискретизации. К

счастью, обычно это не создает существенных трудностей, и в простых

системах получается хорошее изображение.

Из вышеизложенного видно, что при дискретизации и демонстрации

изображений возникают искажения спектра. Подобные искажения можно

скорректировать в процессе цифровой фильтрации квантованных изображений

[12].

Восстановление непрерывных изображений связано с другой проблемой, а

именно с проблемой верности изображения. Если число, находящееся в памяти

машины, представляет значение оптической плотности изображения в конкретной

точке, то абсолютно верное воспроизведение получится, если пленка,

предназначенная для демонстрации, будет иметь точно такую оптическую

плотность, как записано в памяти ЭВМ. (Аналогичные требования можно

сформулировать для коэффициента пропускания пленки я для характеристики

фотоэлектронной системы ). Подобное устройство

[pic]

Рис. 4.4.

а - сквозные характеристики идеальной системы отображения; б - сквозные

характеристики типичной реальной системы отображения.

отображения должно иметь сквозные характеристики» совпадающие с

приведенными на рис. 4.4, а. Однако такие идеальные характеристики

встречаются редко. Характеристики реальных устройств отображения больше

напоминают приведенные на рис. 4.4, б, где наблюдается значительное

отклонение от идеальной прямой с наклоном 45°. Хорошее приближение к

идеальной характеристике можно получить путем линеаризации характеристики

устройства отображения. Для этого необходимо выполнить следующие действия:

1. Сформировать набор фиксированных значений коэффициента пропускания или

оптической плотности, подать их на устройство отображения и измерить

фактический его отклик на каждое из значений коэффициента пропускания или

оптической плотности.

2. Измерения, полученные на этапе 1, задают характеристику устройства

отображения d0 = f ( di ). Линеаризованная характеристика описывается

соотношением di = f- -1( d0 ). Это обратное преобразование можно найти

эмпирическим путем и представить в виде таблицы или полинома, вычисленного

методом наименьших квадратов.

3. Перед демонстрацией изображения числовые данные следует преобразовать

согласно функции f -1. В результате в них будут введены предыскажения и

значения яркостей, записанные в машине, будут воспроизведены на экране без

погрешностей.

Метод линеаризации характеристик устройств отображения успешно применялся

во многих исследовательских институтах. Точная линеаризация, конечно,

невозможна, так как форма нелинейной характеристики изменяется в

зависимости от особенностей проявления пленки, чистоты химикатов, старения

(или повреждения) люминофора ЭЛТ и т.п. Однако, приложив определенные

усилия, можно линеаризировать устройство отображения так, что отклонения от

линейности не будут превышать ±5% максимального значения. Следует отметить,

что линеаризация характеристики устройства отображения является операцией,

применяемой при восстановлении аналоговых изображений; при обработке

одномерных сигналов линейными электронными схемами она обычно не

используется.

4.2.4. Свойства системы зрения человека

Очень часто окончательную оценку изображения делает человек. Если бы

человеческое зрение было идеальным и отвечало на световое воздействие с

абсолютной точностью и совершенной линейностью, то его можно было бы и не

изучать. Однако система зрения человека обладает нелинейной

характеристикой, а ее отклик не является абсолютно верным. Важность этих

положений .для получения изображений признана довольно давно [13], однако

они не в полной мере использовались при обработке изображений.

Одной из характеристик системы зрения человека является способность

восприятия яркости света. Эксперименты по определению восприятия людьми

минимально различимых градаций яркости света, поступающего от

калиброванного источника, показали, что яркость света воспринимается глазом

нелинейно. Если начертить график зависимости величины этой минимально

различимой градации яркости от эталонной яркости, то при изменении яркости

в пределах нескольких порядком этот график имеет логарифмический характер

[14]. Такие субъективные экспериментальные результаты согласуются с

объективными данными, полученными в экспериментах на животных, в которых

было показано, что светочувствительные клетки сетчатки и оптический нерв

возбуждаются с частотой, пропорциональной логарифму интенсивности

подводимого к ним света [15]. По вполне понятным причинам подобные

объективные измерения на людях не проводились. Тем не менее объективные

данные для животных и субъективные показания для людей более чем

убедительно подтверждают вывод о том, что яркость света

[pic]

Рис. 4.5.

a - сечение (осеcимметричной) аппаратной функции глаза человека; б -

сечение (осесимметричной) частотной характеристики глаза человека.

воспринимается по логарифмическому закону. Это существенно нелинейный

закон.

Другой отличительной характеристикой системы зрения человека является ее

пространственночастотный отклик. Импульсный отклик глаза, рассматриваемого

в виде двумерной линейной системы (т.е. линейной после начального

логарифмического преобразования интенсивности наблюдаемого света), не

является [pic] - функцией Дирака. Реакция глаза на приходящее световое поле

описывается аппаратной функцией, сечение которой показано на рис. 4.5, а

[16]. Острый центральный пик и отрицательные боковые лепестки импульсного

отклика глаза показывают, что глаз обрабатывает пространственные частоты

так же, как фильтр верхних частот. Точная форма частотной характеристики

глаза исследовалась с помощью ряда психовизуальных экспериментов; было

показано, что глаз подавляет низкие и ослабляет высокие пространственные

частоты. В грубом приближении пространственно-частотный отклик глаза имеет

полосовой характер. Подобная характеристика ( рис. 4.5,б ), например, была

получена в ряде экспериментов, проведенных Манносом и Сакрисоном [17].

Наконец, особенностью зрения человека является способность к насыщению,

т.е. к ограничению отклика при очень больших или очень малых интенсивностях

наблюдаемого светового потока. Перечисленные свойства системы зрения можно

описать моделью, представленной в виде блок - схемы на рис. 4.6. Однако

данная модель совершенно не отражает других известных свойств системы

зрения. Например, есть сведения, что некоторые стороны процесса восприятия

изображения можно объяснить только наличием не одной, как на рис. 4.6, а

нескольких линейных систем, включенных параллельно, т.е. в рамках модели с

частотными каналами [18]. Другие визуальные явления (такие, как иллюзия

одновременного контраста) указывают, что логарифмическое преобразование,

введенное в блок-схеме рис. 4.6, является слишком большим упрощением. Но,

несмотря на известные недостатки, модель, представленная на рис. 4.6,

является полезной, поскольку она

1) объясняет ряд важных явлений, таких, как восприятие яркости света и

полосы Маха;

[pic]

Рис. 4.6. Блок-схема системы зрения человека.

2) указывает, что в системе зрения содержатся некоторые элементы системы

обработки информации. В частности система зрения человека, по-видимому,

выполняет некоторые операции гомоморфной обработки информации [19].

Полезно связать логарифмическое преобразование изображения, выполняемое

глазом, с рассмотренным ранее вопросом о плотностном (и яркостном

изображениях. Можно заметить, что поскольку яркость света воздействует на

глаз по логарифмическому закону, глаз воспринимает изображение как

плотностное, если даже оно представлено (с помощью устройства отображения)

в виде яркостного изображения.

Представляется логичным воспользоваться моделями системы зрения человека

при анализе возможных применений цифровой обработки изображений. Однако это

делать нужно осторожно, так как система зрения человека настолько сложна,

что необоснованное применение упрощенных моделей зрения может принести

больше вреда, чем пользы. Манное и Сакрисон [17] доказали применимость

модели зрения для исследования вопроса о сокращении избыточности

изображений. Однако пока еще не определены все области возможного

применения моделей зрения.

4. 3. Применение цифровой обработки для сокращения избыточности изображений

Сокращение избыточности изображений является первой областью применения

цифровой обработки изображений, которая будет здесь рассмотрена.

Интенсивное развитие цифровых методов повлияло на все отрасли техники

передачи и хранения информации в силу присущих цифровым системам

преимуществ в помехозащищенности, возможности исправления ошибок, гибкости

при коммутации сообщений, постоянно понижающейся стоимости и

увеличивающейся надежности. Одновременно с внедрением цифровой техники

расширялось использование изображений в различных областях науки и техники,

например в медицине, .экспериментальной физике, бесконтактной

дефектоскопии, исследовании природных ресурсов. Такая параллельность

развития цифровой техники и расширения области применения изображений

привела к естественному результату, а именно к интенсивным исследованиям в

области передачи ;и записи изображений цифровыми методами.

Типичное изображение содержит очень много избыточной информации, что

заметно даже при беглом взгляде на большинство изображений. Эта

избыточность приводит к экономическим потерям. Ширина полосы частот,

необходимая для передачи изображения в цифровой форме, зависит от числа

отсчетов изображения, разрядности отсчетов, времени, отведенного на

передачу, и от мощности передатчика. С расширением полосы увеличиваются

необходимая мощность передатчика и расходы. Деньги и энергия не являются

проблемой, но электромагнитный спектр предельно загружен. Поэтому

сокращение избыточности при передаче изображений является очень важной

задачей. Столь же важно оно и для хранения .изображений в цифровом виде.

Если бы требовалось хранить только одно изображение, то об этом можно было

бы не беспокоиться. Однако во многих существующих и проектируемых системах,

таких, как геологоразведочный спутник NASA ERTS (Earth Resources Technology

Satellite), получается большое количество изображений, которые

целесообразно получать и хранить в цифровой форме. Хотя цифровые

запоминающие устройства и становятся все дешевле, число получаемых

изображений настолько увеличивается, что сокращение их избыточности

является задачей первостепенной важности.

4.3.1. Некоторые замечания о сокращении избыточности изображений

Избыточность видеоинформации может быть описана функцией корреляции между

отсчетами изображений; она проявляется в высокой степени взаимной

статистической прогнозируемости близколежащих отсчетов, взятых из

изображения. Конечной целью операции сжатия видеоинформации является

устранение этой статистической прогнозируемости (т.е. необходимо в

максимально возможной степени уменьшить коррелированность отсчетов). На

блок-схеме рис. 4.7 показаны основные операции, выполняемые системой сжатия

видеоинформации. Сначала выполняется операция по максимальному уменьшению

коррелированности отсчетов изображения. Затем отсчеты должны быть

соответствующим образом квантованы. Квантованные отсчеты кодируются в

форму, благоприятную для передачи (при этом, конечно, может быть обеспечена

возможность обнаружения или исправления ошибок) .

Квантование и кодирование выполняются с учетом общих правил, не зависящих

от особенностей схемы декорреляции, выбранной для первого этапа обработки.

Поэтому системы сжатия видеоинформации различаются видом схемы, выполняющей

операции, относящиеся к первому этапу. В силу этого способам реализации

первого блока схемы рис. 4.7 здесь будет уделено больше внимания, чем

вопросам

[pic]

Рис. 4.7. Блок-схема системы сокращения избыточности

видеоинформации.

построения второго и третьего блоков. Такой подход полностью соответствует

замыслу данной книги, посвященной техническим применениям цифровой

обработки сигналов, т.е. задачам, в основном относящимся к первому блоку.

При разработке принципов реализаций первого блока схемы рис. 4.7 следует

учесть ряд соображений. Рассмотрим сначала статистические свойства

изображений. Если отсчеты изображения образуют сетку точек размером N[pic]N

и каждый отсчет представлен Р - разрядным двойным числом, то при записи и

передаче изображения с помощью обычной импульсно-кодовой модуляции (ИКМ)

потребуется N2P двоичных разрядов. Однако, как было отмечено выше, типичное

изображение имеет большую избыточность. Один из способов, позволяющих

измерить эту избыточность и сравнить ее с номинальным числом N2P разрядов,

заключается в построении гистограммы яркости изображения и вычислении

соответствующей энтропии. С помощью Р- разрядных чисел можно описать

квантованяе по 2p уровням. Для этого следует проанализировать все N2

отсчетов и подсчитать, сколько раз встречается каждый уровень квантования.

Затем следует построить гистограмму яркости изображения, т.е. для каждого

уровня квантования указать число его появлений в изображения. Разделив эти

числа на общее число точек N2 , можно получить аппроксимацию плотности

вероятности процесса, порождающего изображение. Если обозначить

нормированные частоты через pi ( i = 1, 2, ... , 2p ), то энтропия по

определению выражается суммой

h = __[pic][pic] (4.19)

и равна средней информации (измеряемой числом бит, приходящихся на элемент

изображения), содержащейся в каждом элементе изображения. Анализ

изображений показал, что типичное значение h гораздо меньше числа разрядов

Р, необходимого для стандартного представления с помощью ИКМ. В работе [20]

отмечалось, что энтропия имеет величину порядка 1 бит/точка. Это означает,

что разрядность массива, описывающего изображение, можно (хотя бы

теоретически) сократить без потерь информации в среднем до 1 бит/точка.

Энтропия служит мерой статистической избыточности, но не дает сведений о

ее происхождении. Источником избыточности, как подсказывает наблюдателю его

зрение, является высокая степень однородности изображения на малых

участках. Эту пространственную избыточность можно определить с помощью

ковариационной матрицы изображения. Сначала лексикотрафически преобразуют

матрицу из N[pic]N отсчетов изображения в N2 - компонентный вектор [т.е.

элементы первой строки (или столбца) матрицы g( j, k ) становятся

компонентами вектора с номерами от 1 до N, элементы второй строки (столбца)

— компонентами с номерами от N+1 до 2 N и т.д.]. Затем вычисляют

ковариационную матрицу изображения

[ Cg ] = E { (g - E(g))(g - E(g))T } ,

(4.20)

где Е - среднее значение но ансамблю, a g - вектор, построенный из отсчетов

изображения. На практике редко оказывается возможным проводить усреднение

по ансамблю и ковариационную матрицу получают с помощью оценки

пространственной корреляции [21].

Ковариационные структуры, такие, как матрица [ Cg ], не имеют взаимно -

однозначной связи с исходным изображением. Коул [21] показал, что многие

неодинаковые изображения могут оказаться весьма сходными в ковариационном

(или спектральном) смысле. Следовательно, имеются основания для замены

сложной матричной структуры типа [Cg ] более простой. В частности,

рассматривалось (см., например, работу [22] ) применение модели с

авторегрессионным марковским процессом п-го порядка, где п обычно невелико

(например, n = 3). Тот факт, что подобные модели оказываются корректными, и

применение их оправдано при анализе методов сжатия информации, таких, как

дифференциальная импульсно - кодовая модуляция (ДИКМ), указывает на

высокую степень взаимосвязи между соседними участками изображения.

При сжатии видеоинформации кроме статистических свойств изображения

весьма важно учитывать и особенности получателя изображений. Зрение

человека обладает ограниченными возможностями и характеризуется некоторыми

известными (отчасти) отличительными особенностями. Использование,

конкретных особенностей зрения для сокращения избыточности изображений

называется психофизической обработкой. Известно, например, что при

восприятии яркости света, попадающего в глаз, зрительная система ведет себя

как нелинейная система с логарифмической характеристикой. Кроме того,

система зрения человека не чувствительна к очень высоким или очень низким

пространственным частотам, а в области средних частот ведет себя почти как

полосовой фильтр, что обусловлено торможением нервных клеток сетчатки

глаза. Нелинейность и частотная зависимость чувствительности зрительной

системы позволили создать оптимальные системы сжатия видеоинформации. В

этих системах для достижения большей устойчивости к ошибкам, появляющимся

при кодировании и передаче, изображение обрабатывается примерно так же, как

и в зрительной системе человека. Впервые это предложение было сделано

Стокхэмом [23].

Сокращение избыточности информации математически строго обосновывается

положениями теории кодирования при заданном критерии точности [24]. Как

отмечали Маннос и Сакрисон [17], эффективные теоремы теории кодирования при

заданном критерии точности в задачах сжатия видеоинформации применить не

удалось. Основной причиной этого явилась сложность выбора критерия

допустимой величины ошибок, согласующегося со свойствами системы зрения

человека. Манное и Сакрисон смогли показать, что можно пользоваться

критерием, связанным с нелинейными и пространственно-частотными свойствами

зрения. Их работа имеет очень важное значение для дальнейшего развития

методов сокращения избыточности изображений. Введение подходящей

предварительной обработки во всех схемах, которые будут рассмотрены ниже,

может значительно улучшить качество работы систем сжатия видеоинформации.

4.3.2. Схемы сокращения избыточности изображений с обработкой в

пространственной области

В одном из возможных вариантов схемы сокращения избыточности

видеоинформации в первом блоке (схема рис. 4.7) выполняется операция

тождественности, т.е. исходная картинка никак не изменяется, а все сжатие

достигается за счет квантования и кодирования. Однако сжатие информации

невозможно выполнять без использования критериев, учитывающих особенности

наблюдателя и свойства передаваемых данных. Если, например, наблюдателю

нужна точность 1/1000 , то необходимое число уровней квантования получается

при использовании 10-разрядных двоичных чисел; если же допустима точность

1/8 , то достаточно взять 3-разрядные числа. Следовательно, квантование при

сжатии информации играет ограниченную роль. Однако сокращения избыточности

можно добиться при кодировании, и одной из основных задач после создания

Шенноном теории информации было построение кодов, оптимальных с точки

зрения сокращения избыточности информации. Шеннон доказал, что существует

код, для которого скорость передачи совпадает со скоростью создания

информации источником. Таким образом, для изображений с энтропией порядка 1

бит/точка существуют схемы кодирования, позволяющие построить коды со

средней длиной в 1 бит/точка. К сожалению, само по себе существование таких

кодов бесполезно, если отсутствуют алгоритмы их построения. Известны

алгоритмы построения кодов, приближающихся к оптимальным. Например,

кодирование по Хаффмену является эффективной процедурой для согласования

кода со статистикой источника информации и позволяет сократить длину

сигнала по сравнению со стандартной ИКМ. Однако подобные коды имеют

переменное число сим1волов (т.е. при передаче сообщений кодовые слова

состоят из различного числа символов); при кодировании и декодировании

требуются сложные алгоритмы, связанные с записью, синхронизацией и

вспомогательным накоплениям информации. Кроме того, вид подобных кодов

очень сильно зависит от вероятности создания символов источником, и любые

изменения вероятности могут привести к ухудшению характеристик кода (очень

значительному в некоторых случаях). Следовательно, кодирование с

квантованием может служить основным средством сжатия видеоинформации лишь в

ограниченном числе случаев, так что необходимо искать другие методы.

В качестве метода сжатия видеоинформации в плоскости пространственных

координат, выполняемого )в первом блоке схемы рис. 4.7, наиболее широко

применяется дифференциальная импульсно-кодовая модуляция (ДИКМ). По своей

структуре схемы ДИКМ совпадают со схемами кодирования методом линейного

предсказания (КЛП), применяемым при сжатии полосы речевых сигналов, и

поэтому схемы ДИКМ изображений иногда называют схемами сжатия методом

предсказания. Блок-схема ДИКМ приведена на рис. 4.8. В этом методе

используется статистическая взаимосвязь яркостей отдельных точек

изображения и для каждой точки формируется оценка яркости в виде линейной

комбинации яркостей предшествующих точек. Под предшествующими точками

подразумеваются точки, расположенные перед рассматриваемой точкой при

развертке изображения сверху вниз и слева направо (как в телевидении),

благодаря чему создается вполне определенный порядок следования точек

изображения. Подобная схема, конечно, будет применима и тогда, когда

изображение уже «развернуто» методом сканирования. Затем вычисляется и

квантуется разность между фактическим значением яркости и ее оценкой.

Квантованная разность подвергается кодированию и передается по каналу. На

приемном конце символы декодируются, а информация восстанавливается с

помощью схемы линейного предсказания n-го порядка (конечно, идентичной

соответствующей схеме на передатчике), в которой формируются оценки

яркости, добавляемые к разностям, полученным по каналу.

Схемы предсказания, изображенные на рис. 4.8, называются схемами с

предсказанием назад , поскольку квантование сигнала

[pic]

Рис. 4.8. Блок-схема системы сжатия методом ДИКМ с предсказывающим

устройством n-го порядка.

происходит внутри петли обратной связи, а при восстановлении сигнала

предсказанное значение подается по схеме назад. Можно спроектировать схемы

ДИКМ, в которых предсказанные значения сигнала подаются вперед, а также

создать схемы ДИКМ, где блок квантования расположен вне петли обратной

связи. Однако такие системы дают восстановленное изображение с большими

ошибками. Схема с предсказанием назад необходима в приемнике потому, что

символы поступают последовательно. При использовании в передатчике

аналогичной схемы предсказания назад в случае отсутствия ошибок, связанных

с квантованием, можно было бы восстановить изображение с абсолютной

точностью. Если схему квантования включить в петлю предсказывающей схемы

передатчика, то и в приемнике, и в передатчике предсказание будет

осуществляться на основе одинаковых квантованных отсчетов, что позволит

уменьшить ошибки восстановления.

Сжатие в схемах ДИКМ достигается за счет вычитания сигналов, поскольку

разности имеют значительно меньший динамический диапазон. Предположим,

например, что исходное изображение передается методом ИКМ и для

представления яркостей его точек нужны числа от 0 до 255. Тогда, если

допустимая ошибка равна единице младшего разряда, то необходимо квантование

в 8-разрядные числа. Однако значения разностей яркостей соседних точек

будут гораздо меньшими; если разности (в том же масштабе) будут изменяться

от 0 до 7, то для получения ошибки, равной единице младшего разряда,

достаточно квантования в 3-разрядные числа.

Поскольку идея ДИКМ достаточно проста, то, как следует из схем рис. 4.8,

характеристики системы сокращения избыточности изображений методом ДИКМ

определяются [порядком предсказывающего устройства п, значениями

коэффициентов прогнозирования аi, числом уровней квантования и их

расположением.

Порядок предсказывающего устройства зависит от статистических

характеристик изображения. Как правило, если последовательность отсчетов

может быть промоделирована авторегрессионным марковским процессом п-го

порядка, то разности, полученные с помощью оптимального предсказывающего

устройства п-го порядка, будут образовывать последовательность

некоррелированных чисел [20]. Изображения, очевидно, не являются

марковскими процессами п-го порядка, но опыт работы по сжатию изображений

показывает, что корреляционные свойства изображений можно описать

марковским процессом третьего порядка, а это приводит к предсказывающим

устройствам третьего порядка (п=3) [22]. Аналогично при моделировании

изображений было выяснено, что ДИКМ с предсказывающими устройствами более

высоких порядков не дает большего выигрыша в качестве изображения (как по

субъективным, так и по объективным данным).

Коэффициенты предсказания аi можно определить с помощыо анализа средних

квадратических ошибок. Пусть g(k) - отсчеты на строке развертки, a

[pic][pic](k) - предсказанные значения этих отсчетов. Необходимо, чтобы

средняя квадратическая ошибка была минимальна, т.е. нужно найти

min e = E { g(k) - [pic] }

(4.21)

по всем k, аi

Это известная задача, и если процесс g(k) стационарен, то ее решение имеет

вид [25]

[pic] , (4.22)

где

r ( j - i ) = E [ g ( k - j ) g (k -i ) ]

(4.23)

обычно называется автокорреляционной функцией процесса g. Коэффициенты ai

получаются решением системы уравнений (4.22).

Оптимальные значения коэффициентов предсказания зависят от взаимосвязей

точек изображения, описываемых автокорреляционной функцией. Из определения

(4.20) видно, что в случае стационарных данных автокорреляционная функция

отличается от вышерассмотренной функции на постоянную величину. При

нестационарных данных функция r (в уравнении (4.23) зависит от

пространственных переменных и оптимальные коэффициенты предсказания должны

изменяться в зависимости от пространственных координат. Это характерно для

изображений. К счастью, нестационарные статистические характеристики

изображений обычно можно достаточно хорошо аппроксимировать стационарными

функциями, так что неперестраивающееся линейное устройство предсказания

дает вполне хорошие результаты. При сжатии видеоинформации методом ДИКМ

ошибки обычно появляются на границах изображаемых предметов, где

предположение о стационарности удовлетворяется в наименьшей степени, и на

восстановленном изображении воспринимаются визуально как аномально -

светлые или темные точки.

Выбор числа уровней квантования и расположения порогов квантования

является задачей отчасти количественной и отчасти качественной.

Расположение порогов квантования можно найти количественными расчетами. В

работе Макса [26] впервые было рассмотрено неравномерное квантование,

зависящее от функции распределения квантуемого сигнала и сводящее к

минимуму среднее квадратическое значение ошибки, вызванной ограниченностью

числа уровней квантования. Алгоритм Макса позволяет найти оптимальное

расположение точек перехода для заданного числа уровней квантования. Однако

число уровней квантования выбирается исходя из субъективных качественных

соображений.

Минимальное число уровней квантования paвно двум (одноразрядные числа) и

соответствует такому квантованию изображений, при котором разность яркостей

принимает фиксированное (положительное или отрицательное) значение. Этот

способ обычно называют дельта - модуляцией, схему ДИКМ (рис. 4.8) можно

упростить заменой квантователя на ограничитель, а предсказывающего

устройства n-го порядка на интегратор. При сокращении избыточности

изображений методом дельта-модуляции наблюдаются те же недостатки, что и

при дельта-модуляции других сигналов, например речевых [27], а именно

затягивание фронтов и искажения дробления. Однако если частота

дискретизации изображения выбрана намного больше частоты Найквиста, то

сжатие методом дельта - модуляции приводит к малым (субъективно замечаемым)

ошибкам. Если частота дискретизации приближается к частоте Найквиста, то на

изображении в большей степени будут проявляться затягивания фронтов (на

контурах изображений) и искажения дробления (на участках с постоянной

яркостью). Как и при сжатии речи [27], адаптивная дельта-модуляция

позволяет уменьшить эти ошибки. Однако в целом при передаче изображений

дельта - модуляция оказалась менее эффективной, что при передаче речи.

Квантование с числом уровней, большим двух, позволяет при сокращении

избыточности получить изображения более высокого качества. Система сжатия

методом ДИКМ с 8-уровневым (З-разрядным) квантованием

при оптимальном размещении порогов дает изображения, качество которых такое

же, как в системе с ИКМ, имеющей разрядность от 6 до 8. Исключение

составляют ошибки вблизи линий резкого изменения яркости.

Сигнал с выхода устройства квантования, конечно, следует кодировать,

поскольку распределение вероятностей «квантованных разностей не является

равномерным. При удачном выборе кода (например, кода Шеннона — Фано или

Хаффмена) удается дополнительно понизить общую скорость создания

информации. Прэтт [28] указывает, что при использовании кода Хаффмена в

пределе удается понизить скорость создания информации до 2,5 бит/точка. Это

дополнительное понижение скорости требуется сопоставить с увеличением

стоимости и сложности запоминающего устройства, синхронизаторов и

вспомогательных регистров памяти, необходимых для работы с кодами Хаффмена.

Выше обсуждались вопросы сжатия изображений с помощью ДИКМ при выборе

элементов по строке (т.е. для прогноза брались точки, лежащие на текущей

строке развертки). В силу двумерного характера изображений возможно (и

целесообразно) расширить метод ДИКМ так, чтобы при прогнозе учитывались

яркости в точках, лежащих не только на текущей, но и на предшествующих

строках развертки. Схемы сжатия методом ДИКМ с таким двумерным

предсказанием основаны на тех же принципах, что при одномерном

предсказании. Поскольку для изображений характерно наличие двумерных

статистических взаимосвязей, можно надеяться, что двумерное предсказание

даст лучшие результаты по сжатию изображений, так как декорреляция

изображений с помощью операций предсказания и вычитания будет производиться

по двум координатам. Действительно, устройства с пространственным

предсказанием дают более качественные изображения. Хабиби [22] показал, что

с помощью двумерного предсказывающего устройства третьего порядка при 8 -

уровневом (3 - разрядном) квантовании получались изображения, которые

визуально не удавалось отличить от исходных фотографий, обработанных

методом ИКМ с 11- разрядными числами.

Для изображений, состоящих из последовательных кадров, например

телевизионных, идеи предсказания и вычитания, связанные с ДИКМ, можно

распространить на временную область. В подобных изображениях яркость многих

точек от кадра к кадру не изменяется или изменяется медленно.

Следовательно, можно построить систему сжатия методом ДИКМ, в которой

яркость очередной точки прогнозируется на основе яркостей двумерного набора

точек текущего кадра и соответствующих точек предшествующих кадров. На

практике порядок временного предсказания не может быть высоким, так как для

каждого временного слагаемого необходимо иметь запоминающее устройство, где

сохранялся бы весь кадр. Моделирование с предсказывающим устройством

третьего порядка, в котором для предсказания использовались точки,

расположенные в данном (и предшествующем кадрах слева от рассматриваемой

точки и вверх от нее, показало, что можно получить очень хорошие

изображения при средней разрядности 1 бит/точка [28].

4.3.3. Схемы сокращения избыточности изображений с обработкой в области

преобразований

Для пояснения основных операций, выполняемых системой сжатия

видеоинформации с обработкой в области преобразований, обратимся к

ковариационной матрице, определяемой соотношением (4.20). Матрица [Cg]

описывает корреляцию отсчетов изображения в плоскости (х, у), являющейся

координатной плоскостью изображения. Важным методом многомерного

статистического анализа служит исследование массива данных не только в их

естественных координатах, но и в системах координат с более удобными

свойствами. В частности, весьма полезными оказались системы координат,

основанные на собственных значениях и собственных векторах ковариационной

матрицы

[ Cg ] = [ Ф ] [[pic] ] [ Ф ]T = [pic] ,

(4.24)

где [Ф] - матрица, составленная из ортогональных собственных вектор -

столбцов Фi а [[pic]] - диагональная матрица собственных значений.

Преобразование координат, определяемое матрицей собственных векторов [Ф],

обладает тем свойством, что оно производит преобразование заданного массива

чисел в другой с некоррелированными элементами, причем получающиеся

компоненты имеют убывающие дисперсии. Пусть собственные значения матрицы

[Cg] расставлены в убывающем порядке и пронумерованы так, что

[pic], (4.25)

и пусть собственные векторы, связанные с ними, расставлены в том же

порядке. Тогда матрица собственных векторов [Ф] обладает тем свойством, что

умножение ее на вектор-изображение g (образованный лексикографической

расстановкой) дает вектор

G = [ Ф ]g ,

(4.26)

имеющий некоррелированные компоненты, причем компоненты вектора G

оказываются расставленными в порядке убывания их дисперсий [29], что

является свойством дискретного варианта разложения Карунена - Лоэва,

фактически описанного соотношениями (4.24) - (4.26).

Полезность преобразования Карунена — Лоэва ( КЛ, или ковариационного) для

сокращения избыточности изображений очевидна. Массив отсчетов изображения

заменяется набором переменных, имеющих различные статистические веса ).

Сжатие можно получить, отбрасывая переменные с малым статистическим весом и

сохраняя остальные. Если, например, оставить M и

выполнить восстановление изображения. Однако в формуле (4.59) теряется

фазовая информация, и восстановленное изображение равно обратному

преобразованию от квадратного корня из энергетического спектра исходного

изображения f(x, у).

Другой, но весьма близкий способ обработки состоит в вычислении

статистической автокорреляционной функции спектра изображения:

[pic]

[pic] (4.60)

Можно заметить, что при u1=v1=0 равенства (4.60) и (4.59) полностью

совпадают. Если, как и прежде, имеется точечный источник, то

[pic] (4.61)

поскольку с помощью точечного источника можно найти комплексную

автокорреляционную функцию усредненного по времени спектра аппаратной

функции. Рассмотрим результат деления обеих частей равенства (4.61) на их

модули:[pic]

[pic]

[pic] (4.62)

где Ф — фазовая характеристика спектра F - изображения, рассматриваемая на

двумерной плоскости фурье - преобразования. В правой части записано

двумерное разностное уравнение относительно фазовой характеристики, а слева

фигурируют только измеренные величины. Интегрирование этого разностного

уравнения по всей плоскости преобразования Фурье даст фазовую

характеристику, а в сочетании с модулем F, полученным из равенства (4.61),

—спектр восстановленного изображения.

Моделирование метода Нокса — Томпсона показало, что он может

значительно улучшить разрушение при наблюдениях сквозь турбулентную

атмосферу. На рис. 4.18 этот процесс иллюстрируется с помощью изображения

астероида, полученного моделированием на ЭВМ. На рис. 4.18, а приведен

оригинал, на рис. 4.18,6 показаны четыре отдельных снимка с атмосферными

искажениями, а на рис. 4.18, б—восстановленное изображение, причем фазовая

информация была получена в соответствии с формулой (4.62) путем обработки

100 снимков, подобных приведенным на рис. 4.18,6.

4.5. Воспроизведение изображений по проекциям

Открытие проникающей радиации (рентгеновских лучей, нейтронных пучков и

т.д.) дало возможность получать изображения объектов, ранее недоступных или

доступных только с помощью грубых и зачастую нежелательных средств;

примером такого объекта могут служить внутренние участки мозга. Подобные

изображения имеют очень важное значение для развития медицины. Усиление

контроля за качеством элементов больших конструкций обусловило важность

таких изображений для неразрушающих методов контроля. Однако изображения,

полученные путем просвечивания с помощью проникающего излучения, имеют

недостаток: они являются двумерными теневыми проекциями трехмерных

объектов. Важные особенности пространственного расположения внутренних

частей объекта в процессе проектирования в лучшем случае искажаются, а в

худшем — теряются вообще. При хирургических операциях (например, при

опухолях мозга) незнание внутренней структуры может оказаться, очевидно,

роковым обстоятельством.

Задаче воспроизведения внутренней структуры объекта по его проекциям в

последнее время уделяется большое внимание, и методы цифровой обработки

сигналов оказали заметное влияние на ее решение. Предложен ряд методов

воспроизведения изображения по проекциям; список литературы по этому

вопросу дан в статье Мерсеро и Оппенгейма [50]. Ниже будет рассмотрена

задача воспроизведения изображения по проекциям и дано ее решение методом,

характерным для цифровой обработки сигналов, а именно, с помощью

преобразования Фурье.

4.5.1. Образование проекций

Изображения, получаемые с помощью проникающей радиации, образуются за

счет ослабления луча в исследуемом веществе. Чем плотнее вещество, тем

слабее интенсивность луча, прошедшего через вещество. Таким образом,

изображение, наблюдаемое в проходящих лучах, определяется интегральным

влиянием некоторой характеристики вещества объекта на интенсивность луча.

Пусть f(x1, x2, x3) описывает распределение вещества в пространственных

координатах (х1, х2, x3). Допустим, что просвечивающий луч направлен вдоль

оси х1, как на рис. 4.19. Тогда распределение интенсивности проникающего

излучения в плоскости (x2, x3) пропорционально функции g, определяемой

соотношением

[pic] (4.63)

Важное свойство проекций, задаваемых формулами типа (4.63), можно заметить

при анализе преобразования Фурье от функции g (x2,x3):

[pic] (4.64)

Трехмерное преобразование Фурье от исходного распределения имеет вид

[pic] (4.65)

Сравнивая G и F, видим, что

[pic](4.66)

Таким образом, преобразование от проекции равно преобразованию Фурье от

распределения вещества в объекте при w1=0. Такую функцию называют сечением

преобразования Фурье, [pic]

Рис. 4.19. Геометрические соотношения при воспроизведении изображения

по проекциям.

12

поскольку она образуется сечением исходного трехмерного преобразования

вдоль двумерной плоскости.

Очевидно, что аналогичными свойствами обладают также проекции меньших

размерностей. Предположим, что проникающее излучение направлено в виде

плоского луча (т.е. луч имеет бесконечно малый размер вдоль оси x3 и

перпендикулярен ей, причем вдоль оси x2 его интенсивность одинакова, а

ширина больше размеров объекта). Луч с координатой x3 будет проектировать

все элементы внутреннего строения объекта, лежащего в сечении, совпадающем

с плоскостью луча. Если распределение вещества в сечении с координатой x3

описывается функцией f3( x1 , x2 ), то одномерная проекция двумерного

сечения имеет вид

[pic] (4.67)

и соотношение

[pic] (4.68)

как и прежде, описывает связь между преобразованиями проекции и оригинала.

Предположим теперь, что плоский луч проникающего излучения остается

перпендикулярным оси x3, а источник излучения вращается вокруг некоторого

центра, находящегося в объекте, так что угол между направлением луча и осью

x1 равен не нулю, а некоторой величине [pic] (см. рис. 4.20). Очевидно,

можно сделать преобразование координат так, чтобы ось и1 была параллельна

направлению проектирующего луча. Это преобразование имеет вид

[pic]

Равенства (4.67) и (4.68) остаются справедливыми и в новой системе

координат (u1, u2), что позволяет сформулировать следующую теорему о

проекции и сечении, одномерное преобразование Фурье от проекции под углом

[pic] равно преобразованию Фурье исходного двумерного распределения

вещества в двумерной плоскости спектральных переменных вдоль линии,

направленной под углом [pic], т.е. является сечением спектра под углом

[pic].

С помощью этой теоремы на основе проекций трехмерного тела можно

воспроизвести изображение внутренней структуры тела. Если источник плоского

луча расположить в точке с координатой х3, как показано на рис. 4.20, и

изменять угол [pic] в интервале 0<[pic]<[pic], то, как показано в следующем

разделе, из набора одномерных проекций можно воспроизвести структуру тела в

сечении с координатой x3. Затем координата х3 изменяется и тем же

[pic]

Рис. 4.20. Геометрические соотношения при вращении источника вокруг точки,

зафиксированной в объекте, и схема получения двумерных проекций.

способом получается новое сечение. Процесс продолжается до тех пор, пока не

будет получен полный набор сечений, показывающих внутреннюю структуру

объекта в трех измерениях.

Теоретически, конечно, можно воспроизвести структуру трехмерного объекта

по его двумерным проекциям без использования вспомогательных одномерных

проекций и связанных с ними сечений, как описано в предыдущем абзаце. На

практике, однако, выгоднее пользоваться методом плоских сечений, хотя и

связанным с повторением одинаковых операций, но зато не требующих такого

огромного числа вычислений, как прямое воспроизведение трехмерной

структуры. Поэтому задачу воспроизведения будем в основном рассматривать

как задачу выделения двумерной информации из одномерных проекций. Ниже

описываются методы цифровой обработки сигналов, позволяющие воспроизвести

изображение.

4.5.2. Методы воспроизведения изображений

Основная операция при воспроизведении изображения по проекциям следует из

теоремы о проекции и сечении. Преобразование Фурье от проекции дает

значения преобразования Фурье от исходного распределения вещества в

некотором его сечении. Если получить достаточно плотный набор таких

сечений, то все пространство спектров будет заполнено сечениями и с помощью

обратного преобразования Фурье можно завершить процесс воспроизведения

изображения.

[pic]

Рис. 4.21. Отсчеты в пространстве преобразований Фурье, полученные из

набора проекций.

Каждая точка представляет значение F(w1,w2), полученное вычислением ДПФ

проекции g(u) под углом [pic].

Эта операция достаточно просто описывается, но для фактического ее

выполнения необходимы весьма сложные и трудоемкие исследования. При

воспроизведении изображения на основе сечений спектра важными являются

следующие положения:

1. При вращении источника плоского луча для каждого из углов [pic]

получается своя проекция. Число проекций, необходимых для достаточно

полного заполнения пространства преобразований Фурье, очевидно, зависит от

формы преобразования Фурье воспроизводимого распределения. Однако чем

меньше шаг по углу, тем плотнее заполняется пространство спектров (см. рис.

4.21). На практике число проекций ограничивается двумя факторами: 1)

увеличением объема вычислений, связанным с обработкой дополнительных

проекций; 2) увеличением дозы облучения при получении дополнительных

проекций (что очень важно в медицинских приложениях метода).

2. Сечения спектрального пространства образуют равномерную сетку в той

системе координат, где на одной из осей откладывается угол поворота [pic].

Однако размещение отсчетов спектра в каждом из сечений не согласуется с

обычными двумерными преобразованиями. Двумерное ДПФ вычисляется на

прямоугольной сетке отсчетов, образующих строки и столбцы, а точки, в

которых известны ДПФ сечений, образуют полярный растр, показанный на рис.

4.21. Поэтому необходимо с помощью интерполяции перейти к прямоугольному

растру, что несложно с точки зрения теории, но нетривиально на практике,

поскольку каждый отсчет, находящийся на концентрической полярной сетке,

перед интерполяцией необходимо перевести в соответствующую прямоугольную

систему координат. Такое преобразование двумерных координат и интерполяцию

можно несколько упростить, пользуясь методом так называемого копцентрично -

прямоугольного растра, но зато при этом интервалы дискретизации будут не

одинаковыми [50].

3. Как видно из рис. 4.21, двумерное пространство преобразований Фурье

очень плотно заполняется в области низких частот, а высокие частоты

представлены гораздо реже. Поэтому для воспроизведения крупноструктурных

элементов, описываемых низкочастотным спектром, требуется небольшое число

проекций, например 20—30. Для достаточно четкого представления

высокочастотных составляющих необходимо большое число проекций (100 и

более). Если число проекций ограничено, то можно воспользоваться имеющимися

проекциями и более плотно заполнить пространство спектров путем

интерполяции. Это несколько улучшает результаты воспроизведения, но

возможности данного метода ограничены, поскольку результаты интерполяции

могут не соответствовать реальным значениям спектров. Качество и детали

изображения определяются именно теми спектральными составляющими, которые

нельзя предсказать путем интерполяции.

Другой метод воспроизведения изображений, в котором применяется цифровая

обработка сигналов, называется методом свертки или «размазывания». Для

пояснения метода рассмотрим две взаимно перпендикулярные проекции. Если

каждую из проекций «размазать» (т.е. образовать двумерную функцию, не

изменяющуюся по одной оси и совпадающую с исходной одномерной проекцией по

второй оси) и значения обеих функций сложить как ортогональные векторы, то

получится очень грубая аппроксимация исходного объекта. Читатель может

проверить это, взяв для примера квадрат и построив проекции в направлениях,

перпендикулярных его сторонам. В общем представляется возможным получить

изображение «размазывая» проекции (это можно сделать путем свертки с

подходящей функцией) и образуя сумму после соответствующего взвешивания

отдельных слагаемых. Такой метод можно реализовать с помощью цифровой

обработки, а также оптическими средствами. Однако данный метод крайне

чувствителен к помехам, поскольку операции свертки и взвешивания влияют на

обрабатываемые сигналы примерно так же, как дифференцирование.

Как образец результатов, получаемых при воспроизведении изображений

цифровыми методами, на рис. 4.22 показано сечение человеческого мозга,

полученное с помощью серийного рентгеновского аппарата для воспроизведения

изображений внутреннего строения головы.

Этот краткий обзор не исчерпывает всех вопросов, связанных с

воспроизведением изображений на основе проекций. С другими методами можно

познакомиться по работам, указанным в списке литературы, составленном

Мерсеро и Оппенгеймом [50].

4.6. Повышение качества изображений

Цель процесса повышения качества изображения состоит в том, чтобы снимок

«выглядел лучше». Неудивительно поэтому, что если цель намечена так

туманно, то и методы, применяемые для повышения качества изображений,

оказываются весьма разнообразными. Субъективные суждения о том, что

изображение «выглядит лучше», связаны также с критериями, зависящими от

предназначения изображения (изображение должно «выглядеть лучше»

применительно к определенной задаче). Если использование изображения

связано с точным анализом или количественными измерениями, то радикальные

операции, приводящие к значительному изменению пространственных или

яркостных соотношений в изображении, могут оказаться неприемлемыми. С

другой стороны если изображение применяется только для субъективных целей,

то допустимы операции, существенно изменяющие пространственные или

яркостные соотношения или же и те и другие, но в целом улучшающие

субъективное восприятие изображения. Следовательно, для повышения качества

изображения можно применять широкий круг методов; пригодность каждого из

них зависит от целей повышения качества данного изображения.

1. Повышение качества изображения путем пространственно-

частотной фильтрации

Для улучшения изображений часто используется пространственно-частотная

фильтрация. Если даже снимок не имеет явных дефектов, можно применить

фильтр с небольшим подъемом характеристики на верхних частотах, и снимок

будет выглядеть более резким. Столь же полезна режекция постоянной

составляющей, когда подавляются или ослабляются некоторые (или все)

составляющие, расположенные вблизи нулевой частоты. В результате снижается

насыщенность больших черных и белых пятен, а изменение масштабов яркости

улучшает различимость мелких деталей. На рис. 4.23, а и б приведен пример

повышения качества рентгенограммы тепловыделяющего элемента ядерного

реактора с помощью пространственно-частотной фильтрации. На улучшенном

снимке стало заметно гораздо больше деталей, а также видны ядерное топливо

и оболочка элемента.

Особенно интересный метод повышения качества основан на мультипликативной

модели формирования изображения в сочетании с гомоморфной фильтрацией [19].

Согласно законам поверхностного отражения, изображение образуется из двух

компонент:

[pic] (4.69)

где i’ - распределение освещающего пучка, а r - коэффициент отражения

освещаемого объекта. Как правило, освещающая компонента образуется из

низкочастотных пространственных составляющих, для которых коэффициент

отражения приближается к зеркальному и богат деталями. Если

прологарифмировать выражение (4.69):

[pic] (4.70)

то связь между коэффициентом отражения, освещением и изображением будет

выражаться не произведением, а суммой. При фильтрации логарифма изображения

режекторным фильтром, настроенным на нулевую частоту, освещающая компонента

будет подавлена, а связанный с этим подъем высоких частот улучшит

различимость мелкомасштабных элементов. При потенцировании сигнал

возвращается в пространство яркостей и образуется изображение, не

содержащее отрицательных яркостей. Заметим также, что логарифмирование

обусловливает фильтрацию в пространстве плотностей пленки; это является еще

одним доводом, дополняющим соображения о предпочтительности обработки в

пространстве плотностей, высказанные ранее в разделе о восстановлении

изображений.

На рис. 4.24, а, б приведен пример повышения качества изображения методом

гомоморфной обработки. Заметим, что изображение стало более резким и на нем

лучше различаются предметы, расположенные в тени под крышей.

4.6.2. Повышение качества изображений с помощью

точечных операций

Метод повышения качества изображений, основанный на пространственно-

частотной фильтрации, можно противопоставить другим методам, в которых

воздействие не распространяется на некоторую область (как для свертки), а

все операции являются точечными изображения преобразуются в точки нового

изображения независимо друг от друга. Точечные операции можно сгруппировать

следующим образом.

Преобразования контрастности. Улучшение изображения происходит за счет

изменения его контрастности, что достигается нелинейным преобразованием

яркостей. Если, например, корректируемое изображение содержит участки,

недодержанные при съемке, то можно воспользоваться преобразованием,

«растягивающим» область малых яркостей и переводящим ее в интервал

яркостей, более удобных для зрения. Наглядными примерами, в которых

требуется подобное преобразование, служат операции коррекции неправильно

экспонированных пленок, а так же линеаризации характеристик устройств

демонстрации изображения, рассмотренные в первом разделе.

Улучшение на основе статистических данных. Выбор закона преобразования

контрастности можно частично автоматизировать, воспользовавшись для подбора

его параметров статистическими характеристиками изображения (например,

средним значением или дисперсией яркости). Предельным случаем является

метод выравнивания гистограмм. В теории информации показано, что

равномерная гистограмма соответствует сообщению с максимальной информацией.

Поэтому, если гистограмма квантованного изображения (дающая число отсчетов,

попадающих на каждый из уровней квантования) после преобразования контраста

становится равномерной (т.е. все уровни квантования проявляются с равной

вероятностью), то изображение должно содержать максимальное количество

информации. Данный метод обычно дает наилучшие результаты при квантовании

яркостных изображений, гистограммы которых, как правило, отличаются

наибольшей неравномерностью [13]. В результате можно довольно просто

получить значительное улучшение изображения [51].

Оконтуривание (препарирование) изображений. При использовании всех

рассмотренных методов решается задача повышения качества

[pic]

Рис. 4.25. Блок-схема устройства отображения, обеспечивающего поточечное

улучшение изображении с непосредственным участием оператора.

изображения без существенного его изменения. Если же цель обработки состоит

в том, чтобы облегчить восприятие определенной информации, то очень часто

применяют методы оконтурирования, когда возможно заметное искажение

яркостных и (или) пространственных соотношений. Наиболее распространенным

является метод псевдоцвета, в котором различным яркостям произвольно

сопоставляются разные цвета. Демонстрируемое изображение будет содержать

отчетливые контуры, проходящие по границам цветных полос. В результате

может либо произойти четкое выделение важных деталей, либо получится

обманчивое смешение пятен, скрывающее изображение, либо может образоваться

забавная цветная картинка, ничего не выделяющая и ничего не скрывающая. В

другом методе производится оконтуривание границами черного и белого цвета

путем уменьшения числа уровней квантования (обычно до 10 и менее).

Отбрасывание от одного до трех старших разрядов также создает контуры,

причем картина, получаемая при выделении деталей таким образом, может

оказаться очень живописной.

Весьма интересными применительно к точечным операциям повышения качества

изображений являются последние образцы цифровых устройств отображения

информации (рис. 4.25), позволяющие оперативно корректировать изображение.

С помощью быстодействующих постоянных запоминающих устройств (ПЗУ) удается

изменять яркости точек изображения при передаче их из ЗУ на электронно-

лучевую трубку. Исходное же изображение, записанное на диски, при этом

остается неизменным. Таким образом, загрузив в ПЗУ различные функции,

описывающие закон изменения яркостей, можно очень быстро переходить от

одного способа преобразования яркости к другому. Нужно видеть такое

устройство, чтобы полностью оценить его гибкость в улучшении контрастности,

коррекции ошибок экспонирования, подстановке псевдоцвета и т.д. Подобные

цифровые устройства отображения превращают точечные операции в эффективное

и удобное средство улучшения изображений, обеспечивающее возможность

взаимодействия человека с машиной.

Автор хотел бы выразить признательность д-ру Томасу Г. Стокхему мл.,

который внимательно прочитал рукопись и сделал замечания. Автор также

глубоко благодарен всем, кто оказал любезность, предоставив приведенные

выше снимки: д-ру Вильяму К. Пратту из Университета штата Южная Каролина

(рис. 4.9 и 4.10 в разделе о сокращении избыточности изображений), д-ру Т.

М. Кэннону из Лос-Аламосской научной лаборатории (рис. 4.16, а, б и 4.22) д-

ру Т.Г. Стокхему (мл.) и д-ру Б. Бекстеру из Университета шт. Юта (рис.

4.23, а, б), а также д-ру Е. Баррету из фирмы ЕСЛ (рис. 4.18, а - в).


© 2010 Современные рефераты