способ автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости

Классы МПК:G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев
G06K9/36 предварительная обработка изображения, те обработка информации изображения без установления его идентичности
Автор(ы):, ,
Патентообладатель(и):Московский государственный университет инженерной экологии (RU)
Приоритеты:
подача заявки:
2006-05-19
публикация патента:

Изобретение относится к распознаванию растровых изображений и предназначено для увеличения эффективности определения пороговых значений яркости пикселов либо характеристик, производных от них для заданных матриц растровых изображений. Технический результат - увеличение эффективности определения пороговых значений яркости пикселов достигается тем, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой. Данный критерий позволяет эффективно выделять как оптимальное число N групп в гистограмме, так и состав групп в тех случаях, когда характер гистограммы позволяет сделать это. 3 ил. способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

Формула изобретения

Способ автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, заключающийся в том, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем вначале группы идет возрастание значений повторяемости, а в конце - их убывание, соотношение объема каждой группы к общему объему должно быть не менее 1/8 и число групп не должно быть больше 4, для каждой группы введен показатель качества, а для всего разбиения - обобщенный показатель качества, критерием оптимальности которого является минимум, отличающийся тем, что в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой, а обобщенный показатель качества всего разбиения на группы имеет вид:

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

где N - число групп уровней яркости пикселов,

s1, s2,...,s N, - группы уровней яркости пикселов,

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 - объем группы с номером u (u=1,...,N),

{h 1,...,hn} - повторяемости, соответствующие уровням яркости пикселов {s1,...,s n},

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 - показатель качества группы с номером u,

s u н, su к - начальное и конечное значения яркости в группе с номером u,

su м - медиана значений яркости в группе с номером u.

Описание изобретения к патенту

Изобретение относится к распознаванию растровых изображений и предназначено для увеличения эффективности определения пороговых значений яркости пикселов либо характеристик, производных от них для заданных матриц растровых изображений. При пороговых методах используется тот факт, что пикселы, формирующие изображения отдельных объектов изображения, имеют близкие уровни яркости и они занимают довольно большие участки общей площади изображения. Поэтому решение при отнесении пиксела к тому или иному объекту изображения может быть принято на основании сравнения анализа его яркости с некоторым пороговым значением.

Известны системы распознавания, например, при сканировании изображений, в которых пороги задаются вручную, например в системах сканирования фирмы EPSON [1]. Данные методы требуют обязательное участие человека в предварительном анализе изображения и не применимы в системах автоматического распознавания.

Наиболее близким по совокупности признаков является способ разбиения на группы (критерий развала на кучи), предложенный в работе [2]. Здесь рассмотрена некоторая числовая характеристика s, которая может принимать n различных значений si(i=1,...,n), имеющих значения повторяемости, задаваемые гистограммой Н={h1 ,...,hn}. Определен общий объем совокупности чисел

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

и ее дисперсия способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 При помощи порогов совокупность чисел s разбита на кучи {s1,...,sN} из подряд стоящих значений чисел. Для каждой кучи su рассмотрен объем Qu и дисперсия способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 u2. Показатель кучности задан формулой

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

В качестве лучшего принимается разбиение с наименьшим значением показателя способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 . При отсутствии ограничений для любой гистограммы Н глобальный минимум показателя способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 =0 будет достигаться на тривиальном разбиении на кучи, при котором каждая куча состоит только из одного числа s i. Однако такой глобальный минимум не дает конструктивной информации по разделению изображения. Поэтому предложено на область поиска наложить дополнительные ограничения: 1) вначале группы su н идет возрастание значений повторяемости, а в конце su к - их убывание, 2) объем каждой кучи не должен быть слишком малым (Qu/Qспособ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 1/8), 3) число куч не должно быть больше 4 (Nспособ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 4).

Предложенный способ обладает следующими недостатками.

1. При возрастании N величина критерия способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 как правило также возрастает. Это не позволяет сравнивать пороговые разбиения с различными значениями N. Данный критерий позволяет сравнивать между собой разбиения с одинаковыми количествами групп N.

2. В то же время для модельной гистограммы вида, показанного на Фиг.1, критерий способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 без введения порога (N=1) и с введением одного порога (N=2), дающего искомое разделение, равен нулю. Т.е. рассмотренный критерий не всегда позволяет сравнивать разбиения с одинаковым числом порогов.

Задачей изобретения является создание способа автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, который не будет иметь перечисленных выше недостатков.

Поставленная задача достигается тем, что предложен способ автоматизированного разбиения на группы уровней яркости пикселов растровых изображений по значениям их повторяемости, заключающийся в том, что для заданного растрового изображения, у которого есть ряд уровней яркости пикселов, имеющих значения повторяемости и общий объем, вводится разбиение на группы подряд стоящих уровней яркости, причем вначале группы идет возрастание значений повторяемости, а в конце - их убывание, соотношение объема каждой группы к общему объему должно быть не менее 1/8 и число групп не должно быть больше 4, для каждой группы введен показатель качества, а для всего разбиения - обобщенный показатель качества, критерием оптимальности которого является минимум, согласно изобретению в качестве показателя качества группы принимается момент инерции значений повторяемости относительно медианы группы, для которой суммы повторяемостей слева и справа равны между собой, а обобщенный показатель качества всего разбиения на группы имеет вид:

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

где N - число групп,

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 - объем группы с номером u (u=1, ..., N),

{h 1, ..., hn} - повторяемости, соответствующие уровням яркости пикселов {s1, ..., s n},

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 - показатель качества группы с номером u,

s u н, su к - начальное и конечное значения яркости в группе с номером u,

su м - медиана значений яркости в группе с номером u.

Рассмотрим для n уровней яркости пикселов si(i=1,...,n) гистограмму их повторяемости Н={h1,...,h n}. Как показали эксперименты, для фиксированной группы su частным критерием качества, наилучшим образом отражающим свойство "кучности", является не дисперсия, а момент инерции группы относительно ее медианы s u м: способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

Для того чтобы объединить выбранные частные критерии в один общий, рассмотрим в качестве модельного равномерное распределение характеристики интенсивности h с большим числом значений, равномерно распределенным в интервале [0,1] (Фиг.2). В данной гистограмме критерий не должен выделять пороги, поскольку на самом деле их не существует.

При отсутствии деления гистограммы на группы общий момент инерции относительно медианы равен способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

где Q=h·1 - общий объем гистограммы.

При произвольном разбиении данной гистограммы на N групп, которые по оси s занимают отрезки длиной s1, s 2,...,sN(s1 +s2+...+sN=1), их моменты инерции будут равны способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

Значение общего суммарного критерия останется неизменным (до и после разбиения) в том случае, когда каждый частный критерий f(gu) будет включен в общую сумму с весовым коэффициентом 1/(su 2 ).

Вводя в рассматриваемых задачах в коэффициенты вместо su величины объемов групп q u, получим обобщенный критерий следующего вида:

способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680

Данный критерий позволяет эффективно выделять как оптимальное число N групп в гистограмме, так и состав групп в тех случаях, когда характер гистограммы позволяет сделать это.

Для практической реализации предложенного способа может быть использован следующий алгоритм.

ИСХОДНЫЕ ДАННЫЕ.

Для некоторой числовой характеристики s задана гистограмма H, а также пороговое значение способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 предельно малого относительного объема групп. Необходимо выяснить возможность порогового разделения гистограммы для заданной гистограммы. Если возможно, то найти такое число N групп в гистограмме и их состав, при котором достигает минимума обобщенный критерий при условии, что относительный объем групп не превышает способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 и разделение групп производится в области локальных минимумов на гистограмме.

ПРЕДВАРИТЕЛЬНЫЕ ДЕЙСТВИЯ.

Вычисляется общий объем гистограммы Q и пороговое предельно малое значение объема группы Qпр=способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 ·Q.

Поскольку разделение должно происходить в области локальных минимумов на гистограмме, то работа алгоритма начинается с их поиска.

ШАГ 1. Предварительный просмотр гистограммы. Выделение всех локальных минимумов на ней. Данные минимумы бывают одиночные (когда в точке минимума s=s i выполняется условие hS(i-1)>h S i<hS(i+1)) и групповые, когда минимальное значение принимают несколько подряд стоящих значений гистрограммы. В обоих случаях возникает необходимость задания порогового значения относительно минимальных значений. Поскольку значение критерия меньше, когда состав групп более однороден по величине значений hS, то минимумы присоединяем к тем промежуточным группам значений, у которых более близкое среднее значение. В итоге создается линейный массив возможных порогов Р некоторой длины nm. Если локальных минимумов на гистограмме нет, то она считается неразделимой на группы. Выход из алгоритма с отрицательным ответом.

ШАГ 2. Расчет начального значения критерия при отсутствии порогов: Fнач=F(N=1). Это же значение присваиваем текущему минимальному значению критерия: Fmin =Fнач.

ШАГ 3. Перебор всех возможных вариантов порогов, вычисление значений критерия для них и выбор оптимального варианта.

3.1. Генерация возможных порогов. Поскольку для каждого возможного порога Рi есть две возможности - входить в набор или нет, то общее число нерассмотренных вариантов порогов равно способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 (один вариант, в котором в набор не вошел ни один порог, рассмотрен на ШАГЕ 2). Кодируя каждый из вариантов числом от 1 до способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 , вхождение каждого из порогов в выбранном варианте i находим, разлагая это число в двоичной системе в вектор длины n m. Те позиции j, на которых стоит 1, задают вхождение j-го порога в набор. Если стоит 0, то порог не входит в набор.

3.2. Проверка набора порогов по предельно малому объему группы Qпр. Каждый конкретный набор порогов задает на гистограмме некоторый набор групп. Объемы всех групп Q u проверяются на выполнение условия Qu >Qпр. Если хотя бы для одной из групп условие не выполнено, весь набор исключается из дальнейшего анализа.

3.3. Вычисление критерия. Проверка оптимальности пороговых порогов. Для выбранного набора групп s1 , s2,...,sN вычисляется значение критерия F(s1, s 2,...,sN). Если выполняется условие F(s1, s2,...,s N)<Fmin, то найдено более оптимальное разбиение на группы. В этом случае выполняем присваивание F min=F(s1, s2 ,...,sN) и запоминаем соответствующее пороговое разделение.

ШАГ 4. Итоговая проверка. Если после окончания перебора всех вариантов порогов выяснилось, что F min=Fнач, то это свидетельствует, что гистограмма плохо разделима на группы и введение порогов на ней нецелесообразно. Выход из алгоритма с отрицательным ответом.

Если Fmin<Fнач , то получено искомое оптимальное число групп N и разбиение множества значений на группы {s}.

Пример.

ИСХОДНЫЕ ДАННЫЕ. Для двухцветного растрового 16-цветного изображения (n=16) размером 20×80 получена гистограмма, показанная на Фиг.3, у которой

h0=14; h1=9; h 2=9; h3=14; h4 =13; h5=8; h6=11; h7=9; h8=12; h 9=7; h10=7; h11 =7; h12=10; h13=8; h14=10; h15=12.

Пороговое значение предельно малого относительного объема групп способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 =0,15.

Необходимо выяснить возможность порогового разделения гистограммы для заданной гистограммы. Если возможно, то найти такое число N групп в гистограмме и их состав, при котором достигает минимума обобщенный критерий при условии, что относительный объем групп не превышает способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 и разделение групп производится в области локальных минимумов на гистограмме.

ПРЕДВАРИТЕЛЬНЫЕ ДЕЙСТВИЯ.

Вычисляется: 1) общий объем гистограммы: Q=160, 2) пороговое предельно малое значение объема группы Qпр=способ автоматизированного разбиения на группы уровней яркости   пикселов растровых изображений по значениям их повторяемости, патент № 2311680 ·Q=0,15·160=24.

ШАГ 1. Выделены внутренние локальные минимумы гистограммы, которые задают начало возможных групп: 1, 6, 9, 13. Общее число их равно 4.

ШАГ 2. Начальное значение критерия при отсутствии порогов: Fнач =F(N=1)=0,141392. Это же значение присваиваем текущему минимальному значению критерия: Fmin=F нач.

ШАГ 3. Перебор всех возможных вариантов порогов, вычисление значений критерия для них и выбор оптимального варианта.

Вариант 1000, значение критерия: F=0,146384>F min.

Вариант 0100, значение критерия: F=0,144421>F min.

Вариант 1100, значение критерия: F=0,14888>F min.

Вариант 0010, значение критерия: F=0,131995<F min, Fmin=0,131995.

Вариант 1010, значение критерия: F=0,134505>Fmin .

Вариант 0110, значение критерия: F=0,128107<F min, Fmin=0,128107.

Вариант 0001, значение критерия: F=0,133057>Fmin .

Вариант 1001, значение критерия: F=0,132206>F min.

Вариант 0101, значение критерия: F=0,140083>F min.

Вариант 1101, значение критерия: F=0,144533>F min.

У вариантов 0011, 1011, 0111, 1111 есть группы с объемом, меньшим Qпр, поэтому они не анализируются.

В итоге оптимальным принят вариант 0110 со значением критерия F=0,128107. Пороговые значения 5,5 и 11,5. При этом N=3, s1={0,1,2,3,4,5}, s 2={6,7,8,9,10,11}, s3={12,13,14,15}.

Класс G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев

способ и оптическое устройство для анализа метки на светопроницаемой или прозрачной криволинейной стенке -  патент 2528150 (10.09.2014)
cпособ автоматического распознавания объектов на изображении -  патент 2528140 (10.09.2014)
устройство обработки бумажных листов и способ обработки бумажных листов -  патент 2527203 (27.08.2014)
система и способ для автоматического планирования двухмерных видов в объемных медицинских изображениях -  патент 2526752 (27.08.2014)
записывающее устройство, способ записи, устройство воспроизведения, способ воспроизведения, носитель записи и программа -  патент 2525483 (20.08.2014)
способ и устройство временного декодера -  патент 2525441 (10.08.2014)
система и способ сжатия мультитипотокового видео с использованием множества форматов кодирования -  патент 2524845 (10.08.2014)
информационный процессор, способ обработки и программа -  патент 2524836 (10.08.2014)
устройство и способ обработки информации и система обработки информации -  патент 2524677 (10.08.2014)
способ комплексного контроля людей на пунктах пропуска -  патент 2524561 (27.07.2014)

Класс G06K9/36 предварительная обработка изображения, те обработка информации изображения без установления его идентичности

записывающее устройство, способ записи, устройство воспроизведения, способ воспроизведения, носитель записи и программа -  патент 2525483 (20.08.2014)
способ и устройство временного декодера -  патент 2525441 (10.08.2014)
система и способ сжатия мультитипотокового видео с использованием множества форматов кодирования -  патент 2524845 (10.08.2014)
устройство фильтрации динамических цифровых изображений в условиях ограниченного объема априорных данных -  патент 2522043 (10.07.2014)
способ алфавитного представления изображения -  патент 2519445 (10.06.2014)
способ и устройство распознавания рельефности изображения лица -  патент 2518939 (10.06.2014)
способ расчета движения с коррекцией окклюзий -  патент 2517727 (27.05.2014)
способ и устройство для кодирования видеоинформации посредством предсказания движения с использованием произвольной области, а также устройство и способ декодирования видеоинформации посредством предсказания движения с использованием произвольной области -  патент 2517253 (27.05.2014)
способ для изменения опорного блока в опорном изображении, способ для кодирования или декодирования блока изображения с помощью опорного блока и устройство для этого, и носитель информации, переносящий блок, кодированный с помощью измененного опорного блока -  патент 2517247 (27.05.2014)
способ и устройство для кодирования видеоинформации посредством предсказания движения с использованием произвольной области, а также устройство и способ декодирования видеоинформации посредством предсказания движения с использованием произвольной области -  патент 2515226 (10.05.2014)
Наверх