способ распознавания кодированных изображений

Классы МПК:	G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев H04N7/24 системы для передачи телевизионных сигналов с использованием импульсно-кодовой модуляции H04N7/28 с использованием векторного кодирования
Автор(ы):	Лысенко В.Л.
Патентообладатель(и):	Войсковая часть 25714
Приоритеты:	подача заявки: 1995-05-22 публикация патента: 20.02.1999

Изобретение относится к автоматике и вычислительной технике и может быть использовано для обработки кодированных факсимильных изображений. Цель изобретения - повышение точности распознавания кодированных текстовых и графических факсимильных изображений. Способ основан на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров N_i этих участков. Новым является введение операций выделения кодированных строчных участков, выделения r-х групп последовательных участков соседних "белых строк" минимального размера, выделения р-х групп последовательных участков соседних "небелых" строк, оценки наличия квазипериодичности следования групп последовательных участков "белых" строк и величины квазипериода Q_r, вычисления отношений d_p максимальных способ распознавания кодированных изображений, патент № 2126552

_dip _макс и минимальных способ распознавания кодированных изображений, патент № 2126552

_ip _мин абсолютных значений разностей размеров соседних кодированных "небелых" строк, сравнения их с порогом D и вынесения соответствующего решения. Способ позволяет выделить признаки, обеспечивающие повышение точности распознавания кодированных факсимильных изображений. 1 ил.

Рисунок 1

Формула изобретения

Способ разпознавания кодированных изображений, основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N_i этих участков, отличающийся тем, что выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из M последовательных участков соседних "белых" строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N₀ и выделяют p-е группы, состоящие из L последовательных "небелых" кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N₁, оценивают наличие квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, определяют среднюю величину квазипериода Q_r, оценивают абсолютные величины способ распознавания кодированных изображений, патент № 2126552

_ip разностей размеров соседних кодированных "небелых" строк, вычисляют отношения d_p максимальных и минимальных значений разностей способ распознавания кодированных изображений, патент № 2126552

_ip, сравнивают полученные величины отношений d_p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Описание изобретения к патенту

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции кодированных документальных сообщений при обработке факсимальной информации.

Известен способ распознавания графической и текстовой информации [1], основанный на построчном сканировании изображения, преобразовании его в последовательность импульсов и формировании информационных импульсов и опорного временного интервала от окончания минимального временного интервала до окончания максимального временного интервала, преобразовании опорного временного интервала в последовательность зонных интервалов равной длительности, а затем в выделении в каждом зонном временном интервале группы импульсов с временными интервалами между соседними импульсами, меньшими или равными суммарной длительности строки и зонного интервала и вынесении решения по числу выделенных групп в каждом зонном интервале.

Существенным недостатком этого способа является низкая точность распознавания кодированных сигналов факсимильных изображений.

Известен способ распознавания факсимильных изображений [2], основанный на построчном сканировании изображения документа, последовательном выделении каждого локального графического образа в сканируемой строке изображения, определении координат и параметров выделенного локального образа, формировании набора пронумерованных эталонов образов в пределах сканируемой строки, формировании набора пронумерованных эталонов образов в пределах всего изображения, сравнении очередного выделенного образа с каждым из эталонов набора сканируемой строки, введении выделенного образа при несовпадении его ни с одним из эталонов в наборе сканируемой строки в этот набор с одновременным определением области несовпадения этого символа с каждым символом из набора эталонов всего изображения и последующем принятии решения путем поэлементной весовой оценки.

Недостатком этого способа является его большая вычислительная сложность и необходимость наличия большого объема памяти для хранения эталонных образцов кодированных символов факсимильных изображений.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания факсимильных изображений [3], основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценке размеров этих участков, кроме того, в способе производятся операции выделения участков, содержащих непрерывную информацию, по размеру которых определяют, какие участки содержат символьную информацию, а какие - линейную, в соответствии с чем выполняют отдельную обработку каждого участка.

Основным недостатком этого способа является низкая точность распознавания кодированных текстовых и графических факсимильных сообщений друг от друга.

Известно [4], что наиболее целесообразно осуществлять хранение факсимильных изображений в факсимильных базах данных в форме, использующей кодирование модифицированным кодом Хаффмана (МХ-код), так как это требует меньше места для размещения информации, чем использование других форматов (например, РСХ).

В этой связи распределения серий "нулей" и "единиц" в кодированном факсимильном изображении могут не соответствовать распределениям "нулей" и "единиц" (участков "белого" и "черного" соответственно) в некодированном факсимильном изображении, представленном в двоичной форме, что является причиной низкой точности распознавания кодированных МХ-кодом текстовых и графических изображений в способе-прототипа [3].

Целью изобретения является повышение точности распознавания кодированных текстовых и графических факсимильных изображений.

Указанная цель достигается тем, что в способ распознавания факсимильных изображений, основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров N_i этих участков, введены операции выделения кодированных строчных участков электрических сигналов, заключенных между двумя соседними кодовыми словами конца строки развертки изображения, удаления служебных битов в выделенных строчных участках, различения и выделения r-х групп (r = 1,2,...,R) последовательных участков соседних "белых" строк минимальной размерности N_(i+1)r, N_(i+2)r, . . ., N_(i+m)r, ..., N_(i+M)r (M - априорно заданное число соседних белых строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N_o (N_(i+m)r способ распознавания кодированных изображений, патент № 2126552

N_o), выделения p-х групп (p = 1, 2, . . . , P) последовательных "небелых" кодированных строк размерности N_(i+1)p, N_(i+2)p, . .., N_(i+l)p, ..., N_(i+L)p (L - априорно заданное число соседних "небелых" строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N₁ (N_(i+l)p способ распознавания кодированных изображений, патент № 2126552

N₁, оценки наличия квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, оценки средней величины квазипериода способ распознавания кодированных изображений, патент № 2126552

оценки абсолютных величин способ распознавания кодированных изображений, патент № 2126552

_ip разностей размеров соседних кодированных "небелых" строк способ распознавания кодированных изображений, патент № 2126552

вычисления отношений d_p= способ распознавания кодированных изображений, патент № 2126552

_ip _макс/ способ распознавания кодированных изображений, патент № 2126552

_ip _мин максимальных и минимальных значений разностей способ распознавания кодированных изображений, патент № 2126552

_ip, сравнения полученных значений d_p с априорно заданной пороговой величиной D и вынесения соответствующего решения о принадлежности кодированного факсимильного изображения или его фрагмента графической или текстовой форме.

Как известно [5] кодированная МХ-кодом строка развертки факсимильного изображения состоит из информационных битов, служебных битов заполнения (FILL) и следующего за ними кодового слова конца строки (EOL). Известно также [5], что наименьшее число информационных битов содержится в кодированной "белой" строке развертки факсимильного изображения и, кроме того, среднее число информационных бит, содержащихся в кодированной строке развертки графического изображения, существенно меньше (в 2 - 3 раза), чем среднее число бит в кодированной строке текстового изображения.

В этой связи признаками кодированного текстового сообщения (или его фрагмента) является наличие: 1) групп минимальных значений чисел, меньших порогового значения h_мин = N₀; 2) групп чисел максимального значения, превышающих пороговую величину h_макс = N₁; 3) квазипериодичности чередования групп минимальных и максимальных чисел.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается использованием для распознавания кодированных факсимильных изображений принципиально новых операций: определения наличия групп "минимальных" и "максимальных" чисел битов в кодированных строках развертки, наличия квазипериодичности чередования групп минимальных чисел в кодированных строках развертки, вычисления отношения максимального значения разности соседних чисел к минимальному значению их разности в группе из максимальных чисел битов в кодированных строках развертки и сравнения величины этого отношения с заданной пороговой величиной.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Сравнение заявляемого способа с другими способами распознавания изображений показывает, что введение операций выделения групп минимальных, а также максимальных чисел битов в кодированных строках развертки, определения наличия квазипериодичности в порядке их чередования и сравнения величины квазипериода с заданной, вычисления отношения среднего числа битов в группах из максимального числа битов в кодированных строках развертки к среднему числу битов в группе из минимальных чисел битов позволяет выделить признаки для принятия решения о структуре факсимильного изображения по его кодированным сигналам, что обеспечивает (в сравнении с другими способами) повышение точности распознавания текстовых и графических факсимильных изображений.

Таким образом, предлагаемый способ распознавания кодированных изображений для специалиста явным образом не следует из уровня техники и соответствует критерию "изобретательский уровень".

Изобретение может быть использовано в различных областях промышленности, а именно, связанных с техникой передачи и обработки изображений, с вычислительной техникой, а также в других областях народного хозяйства, поэтому соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Способ осуществления следующим образом.

Последовательность двоичных кодированных электрических сигналов факсимильного изображения объема J (бит) после удаления служебных битов (битов-вставок, битов заполнения типа "FILL", а также кодовых слов (EOL) конца строки развертки [5], разделяется на i-е участки, состоящие из битов кодированных строк развертки изображения. Затем производится оценка размеров N_i (где N_i - случайные величины, определяемые структурой изображения) выделенных i-х участков двоичной последовательности, выделение r-х групп (r = 1, 2, ..., R) последовательных минимальных значений размеров кодированных участков соседних строк N_(i+1)r, ..., N_(i+m)r, ..., N_(i+M)r, где M способ распознавания кодированных изображений, патент № 2126552

M_o - минимально возможное число "белых" строк в промежутках между соседними текстовыми строками - в случае текстовых изображений, N_(i+m)r способ распознавания кодированных изображений, патент № 2126552

N_o, N_o - максимально допустимый размер кодированной "белой" строки развертки).

В случае отсутствия (необнаружения) участков с такими значениями их размеров выносится решение о принадлежности данной последовательности кодированных сигналов графическому изображению.

При обнаружении r-х групп, соответствующих "кодированным" белым строкам развертки изображения, производится выделение p-х групп "небелых" кодированных строк размера N_(i+1)p, ..., N_(i+l)p, ..., N_(i+L)p (p=1,2,..., P) путем сравнения с соответствующей пороговой величиной N_(i+l)p способ распознавания кодированных изображений, патент № 2126552

N₁ (при этом N₁ выбирается таким образом, чтобы разность N₁ - N₀ = способ распознавания кодированных изображений, патент № 2126552

N превышала величину погрешности способ распознавания кодированных изображений, патент № 2126552

h, обусловленной наличием "точечных" дефектов на "белых" участках некодированного изображения способ распознавания кодированных изображений, патент № 2126552

h, величина L способ распознавания кодированных изображений, патент № 2126552

L₀, где L₀ - максимальное число строк развертки, содержащихся в строке печатного текста с заданной гарнитурой).

После выполнения указанных выше операций производится обнаружение начала квазипериодичности следования участков, соответствующих кодированным белым строкам, и оценка соответствия величины Q_r квазипериода (в случае его обнаружения) заданным нижней q_мин и верхней q_макс границам интервала значений Q_r. При этом значения q_мин, q_макс определяются возможными типами используемых шрифтов в текстовом изображении, а также разрешающей способностью по вертикали конкретной системы развертки изображения.

В случае обнаружения квазипериодичности групп участков, соответствующих "белым" строкам и соответствия величины квазипериода Q_r заданному интервалу значений производится принятие решения о принадлежности кодированных сигналов текстовому изображению. В противном случае производится оценка абсолютных величин способ распознавания кодированных изображений, патент № 2126552

_ip разностей значений размеров соседних кодированных "небелых" строк способ распознавания кодированных изображений, патент № 2126552

и вычисление отношений d_p= способ распознавания кодированных изображений, патент № 2126552

_ip _макс/ способ распознавания кодированных изображений, патент № 2126552

_ip _мин максимальных и минимальных значений указанных выше разностей для каждой p-й группы "небелых" строк, которое затем сравнивается с априорно выбранным порогом D, при превышении которого выносится решение о принадлежности данной p-й группы "небелых" строк графическому изображению, а иначе - текстовому (при этом величина порога D выбирается порядка D = 40 - 60).

Способ реализуется на базе использования однокристальной микро-ЭВМ или ПЭВМ типа IBM РС 386/386 (обеспечивающих ввод данных кодированного факсимального изображения объема 0,5 - 1 кбайт в память ОЭВМ/ПЭВМ и последующую соответствующую арифметико-логическую обработку этих данных).

Таким образом, введение операций выделения r-х групп последовательных минимальных значений размеров кодированных "белых" участков соседних строк развертки изображения, оценки квазипериодичности следования этих r-х групп, выделения p-х групп последовательных значений размеров кодированных "небелых" участков соседних строк, оценки абсолютного значения разностей размеров кодированных "небелых" участков соседних строк внутри каждой p-й группы, вычисления отношения максимальных и минимальных значений этих разностей для каждой p-й группы и сравнения с априорно заданным пороговым значением D обеспечивает повышение точности распознавания кодированных графических и текстовых изображений между собой.

Источники информации:

1. Авторское свидетельство СССР N 1348870, G06K 9/00, 30.10.87.

2. Авторское свидетельство СССР N 1809449, G06K 9/62, H03M 7/42.

3. Патент Японии МКИ по заявке N 61-56554 G06K 9/00, 03.12.86.

4. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, Сер.Информатика. - 1993, N 3, с.6.

5. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т.VII, вып.VII.3. - 1988, с.17.

Класс G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев

способ и оптическое устройство для анализа метки на светопроницаемой или прозрачной криволинейной стенке - патент 2528150 (10.09.2014)
cпособ автоматического распознавания объектов на изображении - патент 2528140 (10.09.2014)

устройство обработки бумажных листов и способ обработки бумажных листов - патент 2527203 (27.08.2014)
система и способ для автоматического планирования двухмерных видов в объемных медицинских изображениях - патент 2526752 (27.08.2014)
записывающее устройство, способ записи, устройство воспроизведения, способ воспроизведения, носитель записи и программа - патент 2525483 (20.08.2014)
способ и устройство временного декодера - патент 2525441 (10.08.2014)
система и способ сжатия мультитипотокового видео с использованием множества форматов кодирования - патент 2524845 (10.08.2014)
информационный процессор, способ обработки и программа - патент 2524836 (10.08.2014)
устройство и способ обработки информации и система обработки информации - патент 2524677 (10.08.2014)
способ комплексного контроля людей на пунктах пропуска - патент 2524561 (27.07.2014)

Класс H04N7/24 системы для передачи телевизионных сигналов с использованием импульсно-кодовой модуляции

схема передачи данных с текстовой информацией - патент 2527733 (10.09.2014)
способ кодирования с предсказанием вектора движения, способ декодирования с предсказанием вектора движения, устройство кодирования фильма, устройство декодирования фильма и их программы - патент 2520377 (27.06.2014)
уменьшенное рассогласование коэффициентов усиления постоянной состовляющей (dc) и dc-утечки при обработке преобразования с перекрытием - патент 2518932 (10.06.2014)
способ и устройство для кодирования и декодирования блока кодирования границы картинки - патент 2518635 (10.06.2014)
сервер распространения, способ распространения данных и программа - патент 2518497 (10.06.2014)
устройство для передачи и приема сигнала и способ передачи и приема сигнала - патент 2518410 (10.06.2014)
способ и устройство для переупорядочивания и мультиплексирования мультимедийных пакетов из мультимедийных потоков, принадлежащих взаимосвязанным сеансам - патент 2518383 (10.06.2014)
способ и устройство для кодирования и декодирования вектора движения - патент 2514929 (10.05.2014)
способ и устройство для кодирования и декодирования вектора движения - патент 2513707 (20.04.2014)
способ и устройство для кодирования и декодирования блока кодирования границы картинки - патент 2509436 (10.03.2014)

Класс H04N7/28 с использованием векторного кодирования

способ нахождения векторов движения деталей в динамических изображениях и устройство для его реализации - патент 2408160 (27.12.2010)
устройство кодирования движущихся изображений, способ и программа управления этим устройством - патент 2335859 (10.10.2008)
способ и устройство для масштабируемого по цветовому пространству видеокодирования и декодирования - патент 2316909 (10.02.2008)
способ совместного использования векторного квантования и фрактального кодирования изображений - патент 2316908 (10.02.2008)
устройство для отслеживания перемещения мобильного робота и способ для этого - патент 2305914 (10.09.2007)
способ и устройство сжатия видеоинформации - патент 2209527 (27.07.2003)
способ кодирования видеосигнала для сужения его полосы частот - патент 2110900 (10.05.1998)