способ распознавания кодированных изображений

Классы МПК:G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев
H04N7/24 системы для передачи телевизионных сигналов с использованием импульсно-кодовой модуляции
H04N7/28 с использованием векторного кодирования
Автор(ы):
Патентообладатель(и):Войсковая часть 25714
Приоритеты:
подача заявки:
1995-05-22
публикация патента:

Изобретение относится к автоматике и вычислительной технике и может быть использовано для обработки кодированных факсимильных изображений. Цель изобретения - повышение точности распознавания кодированных текстовых и графических факсимильных изображений. Способ основан на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров Ni этих участков. Новым является введение операций выделения кодированных строчных участков, выделения r-х групп последовательных участков соседних "белых строк" минимального размера, выделения р-х групп последовательных участков соседних "небелых" строк, оценки наличия квазипериодичности следования групп последовательных участков "белых" строк и величины квазипериода Qr, вычисления отношений dp максимальных способ распознавания кодированных изображений, патент № 2126552dip макс и минимальных способ распознавания кодированных изображений, патент № 2126552ip мин абсолютных значений разностей размеров соседних кодированных "небелых" строк, сравнения их с порогом D и вынесения соответствующего решения. Способ позволяет выделить признаки, обеспечивающие повышение точности распознавания кодированных факсимильных изображений. 1 ил.
Рисунок 1

Формула изобретения

Способ разпознавания кодированных изображений, основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, отличающийся тем, что выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из M последовательных участков соседних "белых" строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют p-е группы, состоящие из L последовательных "небелых" кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины способ распознавания кодированных изображений, патент № 2126552ip разностей размеров соседних кодированных "небелых" строк, вычисляют отношения dp максимальных и минимальных значений разностей способ распознавания кодированных изображений, патент № 2126552ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Описание изобретения к патенту

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции кодированных документальных сообщений при обработке факсимальной информации.

Известен способ распознавания графической и текстовой информации [1], основанный на построчном сканировании изображения, преобразовании его в последовательность импульсов и формировании информационных импульсов и опорного временного интервала от окончания минимального временного интервала до окончания максимального временного интервала, преобразовании опорного временного интервала в последовательность зонных интервалов равной длительности, а затем в выделении в каждом зонном временном интервале группы импульсов с временными интервалами между соседними импульсами, меньшими или равными суммарной длительности строки и зонного интервала и вынесении решения по числу выделенных групп в каждом зонном интервале.

Существенным недостатком этого способа является низкая точность распознавания кодированных сигналов факсимильных изображений.

Известен способ распознавания факсимильных изображений [2], основанный на построчном сканировании изображения документа, последовательном выделении каждого локального графического образа в сканируемой строке изображения, определении координат и параметров выделенного локального образа, формировании набора пронумерованных эталонов образов в пределах сканируемой строки, формировании набора пронумерованных эталонов образов в пределах всего изображения, сравнении очередного выделенного образа с каждым из эталонов набора сканируемой строки, введении выделенного образа при несовпадении его ни с одним из эталонов в наборе сканируемой строки в этот набор с одновременным определением области несовпадения этого символа с каждым символом из набора эталонов всего изображения и последующем принятии решения путем поэлементной весовой оценки.

Недостатком этого способа является его большая вычислительная сложность и необходимость наличия большого объема памяти для хранения эталонных образцов кодированных символов факсимильных изображений.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания факсимильных изображений [3], основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценке размеров этих участков, кроме того, в способе производятся операции выделения участков, содержащих непрерывную информацию, по размеру которых определяют, какие участки содержат символьную информацию, а какие - линейную, в соответствии с чем выполняют отдельную обработку каждого участка.

Основным недостатком этого способа является низкая точность распознавания кодированных текстовых и графических факсимильных сообщений друг от друга.

Известно [4], что наиболее целесообразно осуществлять хранение факсимильных изображений в факсимильных базах данных в форме, использующей кодирование модифицированным кодом Хаффмана (МХ-код), так как это требует меньше места для размещения информации, чем использование других форматов (например, РСХ).

В этой связи распределения серий "нулей" и "единиц" в кодированном факсимильном изображении могут не соответствовать распределениям "нулей" и "единиц" (участков "белого" и "черного" соответственно) в некодированном факсимильном изображении, представленном в двоичной форме, что является причиной низкой точности распознавания кодированных МХ-кодом текстовых и графических изображений в способе-прототипа [3].

Целью изобретения является повышение точности распознавания кодированных текстовых и графических факсимильных изображений.

Указанная цель достигается тем, что в способ распознавания факсимильных изображений, основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров Ni этих участков, введены операции выделения кодированных строчных участков электрических сигналов, заключенных между двумя соседними кодовыми словами конца строки развертки изображения, удаления служебных битов в выделенных строчных участках, различения и выделения r-х групп (r = 1,2,...,R) последовательных участков соседних "белых" строк минимальной размерности N(i+1)r, N(i+2)r, . . ., N(i+m)r, ..., N(i+M)r (M - априорно заданное число соседних белых строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной No (N(i+m)r способ распознавания кодированных изображений, патент № 2126552 No), выделения p-х групп (p = 1, 2, . . . , P) последовательных "небелых" кодированных строк размерности N(i+1)p, N(i+2)p, . .., N(i+l)p, ..., N(i+L)p (L - априорно заданное число соседних "небелых" строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N1 (N(i+l)p способ распознавания кодированных изображений, патент № 2126552 N1, оценки наличия квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, оценки средней величины квазипериода способ распознавания кодированных изображений, патент № 2126552 оценки абсолютных величин способ распознавания кодированных изображений, патент № 2126552ip разностей размеров соседних кодированных "небелых" строк способ распознавания кодированных изображений, патент № 2126552 вычисления отношений dp= способ распознавания кодированных изображений, патент № 2126552ip макс/способ распознавания кодированных изображений, патент № 2126552ip мин максимальных и минимальных значений разностей способ распознавания кодированных изображений, патент № 2126552ip, сравнения полученных значений dp с априорно заданной пороговой величиной D и вынесения соответствующего решения о принадлежности кодированного факсимильного изображения или его фрагмента графической или текстовой форме.

Как известно [5] кодированная МХ-кодом строка развертки факсимильного изображения состоит из информационных битов, служебных битов заполнения (FILL) и следующего за ними кодового слова конца строки (EOL). Известно также [5], что наименьшее число информационных битов содержится в кодированной "белой" строке развертки факсимильного изображения и, кроме того, среднее число информационных бит, содержащихся в кодированной строке развертки графического изображения, существенно меньше (в 2 - 3 раза), чем среднее число бит в кодированной строке текстового изображения.

В этой связи признаками кодированного текстового сообщения (или его фрагмента) является наличие: 1) групп минимальных значений чисел, меньших порогового значения hмин = N0; 2) групп чисел максимального значения, превышающих пороговую величину hмакс = N1; 3) квазипериодичности чередования групп минимальных и максимальных чисел.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается использованием для распознавания кодированных факсимильных изображений принципиально новых операций: определения наличия групп "минимальных" и "максимальных" чисел битов в кодированных строках развертки, наличия квазипериодичности чередования групп минимальных чисел в кодированных строках развертки, вычисления отношения максимального значения разности соседних чисел к минимальному значению их разности в группе из максимальных чисел битов в кодированных строках развертки и сравнения величины этого отношения с заданной пороговой величиной.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Сравнение заявляемого способа с другими способами распознавания изображений показывает, что введение операций выделения групп минимальных, а также максимальных чисел битов в кодированных строках развертки, определения наличия квазипериодичности в порядке их чередования и сравнения величины квазипериода с заданной, вычисления отношения среднего числа битов в группах из максимального числа битов в кодированных строках развертки к среднему числу битов в группе из минимальных чисел битов позволяет выделить признаки для принятия решения о структуре факсимильного изображения по его кодированным сигналам, что обеспечивает (в сравнении с другими способами) повышение точности распознавания текстовых и графических факсимильных изображений.

Таким образом, предлагаемый способ распознавания кодированных изображений для специалиста явным образом не следует из уровня техники и соответствует критерию "изобретательский уровень".

Изобретение может быть использовано в различных областях промышленности, а именно, связанных с техникой передачи и обработки изображений, с вычислительной техникой, а также в других областях народного хозяйства, поэтому соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Способ осуществления следующим образом.

Последовательность двоичных кодированных электрических сигналов факсимильного изображения объема J (бит) после удаления служебных битов (битов-вставок, битов заполнения типа "FILL", а также кодовых слов (EOL) конца строки развертки [5], разделяется на i-е участки, состоящие из битов кодированных строк развертки изображения. Затем производится оценка размеров Ni (где Ni - случайные величины, определяемые структурой изображения) выделенных i-х участков двоичной последовательности, выделение r-х групп (r = 1, 2, ..., R) последовательных минимальных значений размеров кодированных участков соседних строк N(i+1)r, ..., N(i+m)r, ..., N(i+M)r, где M способ распознавания кодированных изображений, патент № 2126552 Mo - минимально возможное число "белых" строк в промежутках между соседними текстовыми строками - в случае текстовых изображений, N(i+m)r способ распознавания кодированных изображений, патент № 2126552 No, No - максимально допустимый размер кодированной "белой" строки развертки).

В случае отсутствия (необнаружения) участков с такими значениями их размеров выносится решение о принадлежности данной последовательности кодированных сигналов графическому изображению.

При обнаружении r-х групп, соответствующих "кодированным" белым строкам развертки изображения, производится выделение p-х групп "небелых" кодированных строк размера N(i+1)p, ..., N(i+l)p, ..., N(i+L)p (p=1,2,..., P) путем сравнения с соответствующей пороговой величиной N(i+l)p способ распознавания кодированных изображений, патент № 2126552 N1 (при этом N1 выбирается таким образом, чтобы разность N1 - N0 = способ распознавания кодированных изображений, патент № 2126552N превышала величину погрешности способ распознавания кодированных изображений, патент № 2126552h, обусловленной наличием "точечных" дефектов на "белых" участках некодированного изображения способ распознавания кодированных изображений, патент № 2126552N способ распознавания кодированных изображений, патент № 2126552 способ распознавания кодированных изображений, патент № 2126552h, величина L способ распознавания кодированных изображений, патент № 2126552 L0, где L0 - максимальное число строк развертки, содержащихся в строке печатного текста с заданной гарнитурой).

После выполнения указанных выше операций производится обнаружение начала квазипериодичности следования участков, соответствующих кодированным белым строкам, и оценка соответствия величины Qr квазипериода (в случае его обнаружения) заданным нижней qмин и верхней qмакс границам интервала значений Qr. При этом значения qмин, qмакс определяются возможными типами используемых шрифтов в текстовом изображении, а также разрешающей способностью по вертикали конкретной системы развертки изображения.

В случае обнаружения квазипериодичности групп участков, соответствующих "белым" строкам и соответствия величины квазипериода Qr заданному интервалу значений производится принятие решения о принадлежности кодированных сигналов текстовому изображению. В противном случае производится оценка абсолютных величин способ распознавания кодированных изображений, патент № 2126552ip разностей значений размеров соседних кодированных "небелых" строк способ распознавания кодированных изображений, патент № 2126552 и вычисление отношений dp= способ распознавания кодированных изображений, патент № 2126552ip макс/способ распознавания кодированных изображений, патент № 2126552ip мин максимальных и минимальных значений указанных выше разностей для каждой p-й группы "небелых" строк, которое затем сравнивается с априорно выбранным порогом D, при превышении которого выносится решение о принадлежности данной p-й группы "небелых" строк графическому изображению, а иначе - текстовому (при этом величина порога D выбирается порядка D = 40 - 60).

Способ реализуется на базе использования однокристальной микро-ЭВМ или ПЭВМ типа IBM РС 386/386 (обеспечивающих ввод данных кодированного факсимального изображения объема 0,5 - 1 кбайт в память ОЭВМ/ПЭВМ и последующую соответствующую арифметико-логическую обработку этих данных).

Таким образом, введение операций выделения r-х групп последовательных минимальных значений размеров кодированных "белых" участков соседних строк развертки изображения, оценки квазипериодичности следования этих r-х групп, выделения p-х групп последовательных значений размеров кодированных "небелых" участков соседних строк, оценки абсолютного значения разностей размеров кодированных "небелых" участков соседних строк внутри каждой p-й группы, вычисления отношения максимальных и минимальных значений этих разностей для каждой p-й группы и сравнения с априорно заданным пороговым значением D обеспечивает повышение точности распознавания кодированных графических и текстовых изображений между собой.

Источники информации:

1. Авторское свидетельство СССР N 1348870, G06K 9/00, 30.10.87.

2. Авторское свидетельство СССР N 1809449, G06K 9/62, H03M 7/42.

3. Патент Японии МКИ по заявке N 61-56554 G06K 9/00, 03.12.86.

4. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, Сер.Информатика. - 1993, N 3, с.6.

5. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т.VII, вып.VII.3. - 1988, с.17.

Класс G06K9/00 Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев

способ и оптическое устройство для анализа метки на светопроницаемой или прозрачной криволинейной стенке -  патент 2528150 (10.09.2014)
cпособ автоматического распознавания объектов на изображении -  патент 2528140 (10.09.2014)
устройство обработки бумажных листов и способ обработки бумажных листов -  патент 2527203 (27.08.2014)
система и способ для автоматического планирования двухмерных видов в объемных медицинских изображениях -  патент 2526752 (27.08.2014)
записывающее устройство, способ записи, устройство воспроизведения, способ воспроизведения, носитель записи и программа -  патент 2525483 (20.08.2014)
способ и устройство временного декодера -  патент 2525441 (10.08.2014)
система и способ сжатия мультитипотокового видео с использованием множества форматов кодирования -  патент 2524845 (10.08.2014)
информационный процессор, способ обработки и программа -  патент 2524836 (10.08.2014)
устройство и способ обработки информации и система обработки информации -  патент 2524677 (10.08.2014)
способ комплексного контроля людей на пунктах пропуска -  патент 2524561 (27.07.2014)

Класс H04N7/24 системы для передачи телевизионных сигналов с использованием импульсно-кодовой модуляции

схема передачи данных с текстовой информацией -  патент 2527733 (10.09.2014)
способ кодирования с предсказанием вектора движения, способ декодирования с предсказанием вектора движения, устройство кодирования фильма, устройство декодирования фильма и их программы -  патент 2520377 (27.06.2014)
уменьшенное рассогласование коэффициентов усиления постоянной состовляющей (dc) и dc-утечки при обработке преобразования с перекрытием -  патент 2518932 (10.06.2014)
способ и устройство для кодирования и декодирования блока кодирования границы картинки -  патент 2518635 (10.06.2014)
сервер распространения, способ распространения данных и программа -  патент 2518497 (10.06.2014)
устройство для передачи и приема сигнала и способ передачи и приема сигнала -  патент 2518410 (10.06.2014)
способ и устройство для переупорядочивания и мультиплексирования мультимедийных пакетов из мультимедийных потоков, принадлежащих взаимосвязанным сеансам -  патент 2518383 (10.06.2014)
способ и устройство для кодирования и декодирования вектора движения -  патент 2514929 (10.05.2014)
способ и устройство для кодирования и декодирования вектора движения -  патент 2513707 (20.04.2014)
способ и устройство для кодирования и декодирования блока кодирования границы картинки -  патент 2509436 (10.03.2014)

Класс H04N7/28 с использованием векторного кодирования

Наверх