система управления идентификацией и конвертацией форматов объектов текстовых документов

Классы МПК:G06K9/36 предварительная обработка изображения, те обработка информации изображения без установления его идентичности
Автор(ы):, ,
Патентообладатель(и):ООО Когнитивные технологии (RU)
Приоритеты:
подача заявки:
2003-03-13
публикация патента:

Изобретение относится к вычислительной технике, в частности к системам управления идентификацией и конвертацией форматов представления объектов текстовых документов в информационной сети Государственной автоматизированной системы (ГАС) “Выборы”. Его использование позволяет получить технический результат в виде повышения быстродействия системы путем селекции признаков объектов текстовых документов в процессе их идентификации и конвертации формата их представления. Технический результат достигается за счет того, что система содержит первый, второй, третий, четвертый, пятый, шестой и седьмой регистры, первый, второй и третий дешифраторы, первый и второй блоки памяти, первый и второй триггеры, первую, вторую, третью, четвертую, пятую и шестую группы элементов И, первый, второй, третий, четвертый, пятый и шестой элементы И, первый, второй, третий, четвертый, пятый и шестой элементы ИЛИ, первый, второй, третий, четвертый, пятый, шестой, седьмой, восьмой элементы задержки. 1 ил.

Рисунок 1

Формула изобретения

Система управления идентификацией и конвертацией форматов объектов текстовых документов, содержащая первую и вторую группы элементов И, одни входы которых являются первым и вторым информационными входами системы соответственно, а выходы соединены с соответствующими информационными входами первого и второго регистров, выходы которых являются первым и вторым информационными выходами системы, третий регистр, информационный вход которого является третьим информационным входом системы, синхронизирующий вход - первым синхронизирующим входом системы, а выход является третьим информационным выходом системы, первый элемент задержки, вход которого подключен к первому синхронизирующему входу системы, а выход соединен с одними входами первого и второго элементов И, второй элемент задержки, вход которого подключен к выходу первого элемента И, а выход соединен с синхронизирующими входами первого и второго регистров, установочные входы которых подключены к выходу первого элемента ИЛИ, второй элемент ИЛИ, выход которого соединен с установочным входом третьего регистра, третья и четвертая группы элементов И, одни входы которых являются третьим и четвертым информационными входами системы, а выходы соединены с информационными входами четвертого и пятого регистров соответственно, шестой и седьмой регистры, информационные входы которых подключены к выходам первого и второго блоков памяти соответственно, а выходы являются четвертым и пятым информационными выходами системы, третий элемент ИЛИ, выход которого соединен с установочным входом четвертого регистра, третий, четвертый, пятый и шестой элементы задержки, отличающаяся тем, что содержит первый дешифратор, вход которого соединен с выходом третьего регистра, а выходы подключены к другим входам первого и второго элементов И, первый триггер, единичный вход которого соединен с выходом первого элемента И, установочный вход подключен к выходу первого элемента ИЛИ, а прямой выход соединен с другими входами элементов И первой, второй и третьей групп, третий элемент И, один вход которого является вторым синхронизирующим входом системы, другой вход подключен к прямому выходу первого триггера, а выход соединен с синхронизирующим входом четвертого регистра и с третьим элементом задержки, пятую группу элементов И, одни входы которых подключены к выходу третьего элемента задержки, а выходы соединены с входами считывания первого блока памяти, четвертый элемент И, один вход которого подключен к выходу третьего элемента задержки, а выход соединен с одними входами первого, второго и третьего элементов ИЛИ, второй дешифратор, входы которого подключены к выходам четвертого регистра, а выходы подключены к другим входам элементов И пятой группы и четвертого элемента И соответственно, четвертый элемент ИЛИ, входы которого соединены с входами соответствующих элементов И пятой группы, а выход соединен с входом четвертого элемента задержки, выход которого подключен к синхронизирующему входу шестого регистра, пятый элемент ИЛИ, выход которого подключен к установочному входу шестого регистра и к другим входам первого и второго элементов ИЛИ, второй триггер, единичный вход которого соединен с выходом четвертого элемента ИЛИ, установочный вход подключен к выходу пятого элемента ИЛИ, а прямой выход подключен к другим входам элементов И четвертой группы, пятый элемент И, один вход которого является третьим синхронизирующим входом системы, другой подключен к прямому выходу второго триггера, а выход соединен с синхронизирующим входом пятого регистра и с входом пятого элемента задержки, шестую группу элементов И, одни входы которых подключены к выходу пятого элемента задержки, а выходы соединены с входами считывания второго блока памяти, шестой элемент И, один вход которого подключен к выходу пятого элемента задержки, а выход соединен с другим входом третьего и одним входом пятого элементов ИЛИ, третий дешифратор, входы которого подключены к выходам пятого регистра, а выходы подключены к другим входам элементов И шестой группы и шестого элемента И соответственно, шестой элемент ИЛИ, входы которого соединены с выходами соответствующих элементов И шестой группы, а выход соединен с входом шестого элемента задержки, выход которого подключен к синхронизирующему входу седьмого регистра, седьмой элемент задержки, вход которого соединен с выходом шестого элемента задержки, а выход является сигнальным выходом системы, и восьмой элемент задержки, вход которого подключен к выходу седьмого элемента задержки, а выход соединен с установочными входами пятого и седьмого регистров и с другими входами третьего и пятого элементов ИЛИ, при этом выход второго элемента И соединен с третьим входом второго элемента ИЛИ и является первым синхронизирующим выходом системы, а выход четвертого элемента И является вторым синхронизирующим выходом системы.

Описание изобретения к патенту

Изобретение относится к технической кибернетике, в частности к системам управления идентификацией и конвертацией форматов объектов текстовых документов, используемых в государственной автоматизированной системе “Выборы”.

Особенность решаемой технической задачи состоит в том, что объекты текстовых документов, передаваемых (в электронном виде) по информационной сети ГАС “Выборы” от избирательных комиссий различного уровня иерархии в центральную избирательную комиссию, должны иметь установленный формат представления, не допускающий различного толкования их содержания.

К числу таких объектов, например, могут быть отнесены словосочетания типа “дата, месяц, год”, которые независимо от формы представления в исходном текстовом документе должны иметь стандартный вид, например, такой как 09.07.03, вместо исходной записи 9 июля 2003 года.

Действительно, неточность в текстовом представлении месяца в одной букве может привести к грубой ошибке, когда вместо июЛя месяца будет зафиксирован июНь месяц. В связи с этим возникает задача идентификации в текстах документов текстового представления подобных объектов и их конвертации в стандартный цифровой формат прямо в процессе их поступления в ГАС “Выборы” от различных источников.

Известны системы, которые могли бы быть использованы для решения поставленной задачи [1, 2].

Первая из известных систем содержит блок словаря для регистрации частичных форм символьных изображений данных, определяющих направление штрихов, блок словаря для регистрации символов изображений, состоящих из частичных форм символов, блок ввода штрихов символьного изображения, подлежащего распознаванию, блок поиска символов в словаре и блок выдачи найденного символа [1].

Существенный недостаток данной системы состоит в невысокой надежности распознавания символов, форма начертания символов которых отлична от формы шрифтов эталонных символов.

Известна и другая система, содержащая интерактивную обрабатывающую схему для приема и преобразования видеоинформации первого типа для представления текста на документе, устройство для определения изменения расстояния между центрами символов конкретного слова, схему для определения различия в способах расположения символов в данном слове и схему для пошагового распознавания [2].

Последнее из перечисленных выше технических решений наиболее близко к описываемому.

Его недостаток заключается в невысоком быстродействии, обусловленном тем, что выделение признаков объектов в процессе решения задачи распознавания текстовых документов возможно лишь при повторных циклах распознавания, число которых определяется количеством таких признаков на одном листе распознаваемого текстового документа.

Цель изобретения - повышение быстродействия системы путем селекции признаков объектов текстовых документов в процессе их идентификации и конвертации формата их представления.

Поставленная цель достигается тем, что в систему, содержащую первую и вторую группы элементов И, одни входы которых являются первым и вторым информационными входами системы соответственно, а выходы соединены с соответствующими информационными входами первого и второго регистров, выходы которых являются первым и вторым информационными выходами системы, третий регистр, информационный вход которого является третьим информационным входом системы, синхронизирующий вход - первым синхронизирующим входом системы, а выход является третьим информационным выходом системы, первый элемент задержки, вход которого подключен к первому синхронизирующему входу системы, а выход соединен с одними входами первого и второго элементов И, второй элемент задержки, вход которого подключен к выходу первого элемента И, а выход соединен с синхронизирующими входами первого и второго регистров, установочные входы которых подключены к выходу первого элемента ИЛИ, второй элемент ИЛИ, выход которого соединен с установочным входом третьего регистра, третья и четвертая группы элементов И, одни входы которых являются третьим и четвертым информационными входами системы, а выходы соединены с информационными входами четвертого и пятого регистров соответственно, шестой и седьмой регистры, информационные входы которых подключены к выходам первого и второго блоков памяти соответственно, а выходы являются четвертым и пятым информационными выходами системы, третий элемент ИЛИ, выход которого соединен с установочным входом четвертого регистра, третий, четвертый, пятый и шестой элементы задержки, введены первый дешифратор, вход которого соединен с выходом третьего регистра, а выходы подключены к другим входам первого и второго элементов И, первый триггер, единичный вход которого соединен с выходом первого элемента И, установочный вход подключен к выходу первого элемента ИЛИ, а прямой выход соединен с другими входами элементов И первой, второй и третьей групп, третий элемент И, один вход которого является вторым синхронизирующим входом системы, другой вход подключен к прямому выходу первого триггера, а выход соединен с синхронизирующим входом четвертого регистра и с третьим элементом задержки, пятую группу элементов И, одни входы которых подключены к выходу третьего элемента задержки, а выходы соединены с входами считывания первого блока памяти, четвертый элемент И, один вход которого подключен к выходу третьего элемента задержки, а выход соединен с одними входами первого, второго и третьего элементов ИЛИ, второй дешифратор, входы которого подключены к выходам четвертого регистра, а выходы подключены к другим входам элементов И пятой группы и четвертого элемента И соответственно, четвертый элемент ИЛИ, входы которого соединены с входами соответствующих элементов И пятой группы, а выход соединен с входом четвертого элемента задержки, выход которого подключен к синхронизирующему входу шестого регистра, пятый элемент ИЛИ, выход которого подключен к установочному входу шестого регистра и к другим входам первого и второго элементов ИЛИ, второй триггер, единичный вход которого соединен с выходом четвертого элемента ИЛИ, установочный вход подключен к выходу пятого элемента ИЛИ, а прямой выход подключен к другим входам элементов И четвертой группы, пятый элемент И, один вход которого является третьим синхронизирующим входом системы, другой подключен к прямому выходу второго триггера, а выход соединен с синхронизирующим входом пятого регистра и с входом пятого элемента задержки, шестую группу элементов И, одни входы которых подключены к выходу пятого элемента задержки, а выходы соединены с входами считывания второго блока памяти, шестой элемент И, один вход которого подключен к выходу пятого элемента задержки, а выход соединен с другим входом третьего и одним входом пятого элементов ИЛИ, третий дешифратор, входы которого подключены к выходам пятого регистра, а выходы подключены к другим входам элементов И шестой группы и шестого элемента И соответственно, шестой элемент ИЛИ, входы которого соединены с выходами соответствующих элементов И шестой группы, а выход соединен с входом шестого элемента задержки, выход которого подключен к синхронизирующему входу седьмого регистра, седьмой элемент задержки, вход которого соединен с выходом шестого элемента задержки, а выход является сигнальным выходом системы, и восьмой элемент задержки, вход которого подключен к выходу седьмого элемента задержки, а выход соединен с установочными входами пятого и седьмого регистров и с другими входами третьего и пятого элементов ИЛИ, при этом выход второго элемента И соединен с третьим входом второго элемента ИЛИ и является первым синхронизирующим выходом системы, а выход четвертого элемента И является вторым синхронизирующим выходом системы.

Сущность изобретения поясняется чертежом, на котором представлена структурная схема системы.

Система (см. чертеж) содержит первый 1, второй 2, третий 3, четвертый 4, пятый 5, шестой 6 и седьмой 7 регистры, первый 8, второй 9 и третий 10 дешифраторы, первый 11 и второй 12 блоки памяти, выполненные в виде постоянного запоминающего устройства, первый 13 и второй 14 триггеры, первую 15, вторую 16, третью 17, четвертую 18, пятую 19-20 и шестую 21-22 группы элементов И, первый 23, второй 24, третий 25, четвертый 26, пятый 27 и шестой 28 элементы И, первый 29, второй 30, третий 31, четвертый 32, пятый 33 и шестой 34 элементы ИЛИ, первый 35, второй 36, третий 37, четвертый 38, пятый 39, шестой 40, седьмой 41, восьмой 42 элементы задержки.

На чертеже также показаны первый 43, второй 44, третий 45, четвертый 46 и пятый 47 информационные входы системы, первый 48, второй 49 и третий 50 синхронизирующие входы системы, первый 51, второй 52, третий 53, четвертый 54 и пятый 55 информационные выходы системы, сигнальный 56 и синхронизирующие 57, 58 выходы системы.

Все узлы и элементы системы выполнены на стандартных потенциально-импульсных элементах.

Система работает следующим образом.

Идентификация объектов текстовых документов осуществляется сразу же в процессе ввода текстового документа в информационную сеть Государственной автоматизированной системы “Выборы” на любом из объектов системы.

В процессе построчного ввода символов текстовых документов на входы регистров 3, 4 и 5 последовательно, начиная с первого, поступают кодовые слова.

Первое кодовое слово с информационного входа 45 поступает на информационный вход регистра 3, куда и заносится синхроимпульсом с входа 48. К выходам регистра 3 подключен дешифратор 8, фиксирующий на своем первом выходе высокий потенциал, если входное кодовое слово представляет собой код чисел от 1 до 31. Если же входное кодовое слово будет любым другим, дешифратор выдаст высокий потенциал на своем втором выходе.

Другими словами, если входная кодовая комбинация будет соответствовать признаку даты (с 1 по 31 число месяца), то высоким потенциалом дешифратора 8 будет открыт элемент 23 И, на другой вход которого поступает тот же синхроимпульс с входа 48, задержанный элементом 35 на время записи кода в регистр 3. Синхроимпульс проходит через элемент 23 И на единичный вход триггера 13, фиксируя факт наличия признака даты.

Триггер 13, переходя в единичное состояние, открывает высоким потенциалом элементы 15 и 16 первой и второй групп, через которые к информационным входам регистров 1 и 2 подключаются входы 43 и 44 системы, на которые подаются текущие координаты Х и Y кодового слова, соответствующего числовой дате. Текущие координаты Х и Y даты заносятся в регистры 1, 2 синхроимпульсом с выхода элемента 23 И, задержанным элементом 36 на время срабатывания триггера 13.

Кроме того, триггер 13 высоким потенциалом с единичного выхода открывает по одному входу элементы 17 и 25 И, разрешая занесение второго кодового слова в регистр 4.

Если же дешифратор 8 зафиксирует факт отсутствия признака даты в регистре 3, то высоким потенциалом с другого выхода откроет элемент 24 И, через который проходит синхроимпульс с выхода элемента 35 задержки. Этот синхроимпульс проходит далее через элемент 30 ИЛИ на установочный вход регистра 3 и возвращает его в исходное состояние. Триггер 13, который в этом случае останется в исходном состоянии, низким потенциалом с единичного выхода заблокирует прием второго и третьего кодовых слов регистрами 4 и 5.

Кроме того, импульс с выхода элемента 24 И поступает на выход 57 системы в качестве синхронизирующего сигнала о готовности регистра 3 к приему следующего кодового слова.

Допустим, что первым кодовым словом был признак даты (с 1 по 31 число). Тогда триггер 13 открывает элементы 17 и 25 И, обеспечивая прием и занесение кода в регистр 4 с входа 46. К выходам регистра 4 подключен дешифратор 9, фиксирующий факт наличия в кодовом слове буквенных признаков одного из 12 месяцев (января, февраля, марта, апреля, мая, июня, июля, августа, сентября, октября, ноября, декабря). Дешифратор имеет 12 выходов, соответствующих определенным месяцам, и один выход, на котором фиксируется факт отсутствия в кодовом слове признаков месяца.

Если буквенных признаков какого-либо из месяцев в кодовом слове нет, тогда дешифратор открывает элемент 26 И, через который проходит синхроимпульс с выхода элемента задержки 37. Этот импульс через элемент 30 ИЛИ сбрасывает в исходное состояние регистр 3, через элемент 29 ИЛИ сбрасывает в исходное состояние регистры 1, 2 и триггер 13. Кроме того, этот же импульс выдается на выход 58 системы в качестве синхронизирующего сигнала о подаче следующего кодового слова на вход регистра 3.

Если же буквенные признаки месяца в кодовом слове есть, тогда дешифратор выдает высокий потенциал на одном из своих 12 выходов и открывает, например, элемент 20 И, на другой вход которого поступает синхроимпульс с выхода элемента 37 задержки. Этот импульс с выхода элемента 20 И поступает на вход считывания фиксированной ячейки постоянного запоминающего устройства 11, где записан цифровой номер месяца, например, января - 01, который поступает на вход регистра 6.

Одновременно с этим, тот же импульс с выхода элемента 20 И, пройдя элемент 32 ИЛИ и элемент 38 задержки, задерживающий импульс на время считывания кода из блока памяти 11, поступает на синхронизирующий вход регистра 6 и заносит в него код номера месяца. Кроме того, импульс с выхода элемента 32 ИЛИ поступает на единичный вход триггера 14, устанавливая его в единичное состояние, при котором он высоким потенциалом с единичного входа открывает элементы 18 и 27 И, разрешая тем самым прием в регистр 5 третьего кодового слова.

С поступлением в регистр 5 третьего кодового слова с входа 47, оно заносится в регистр синхроимпульсом с входа 50, поступающим на синхронизирующий вход регистра 5 через элемент через элемент 27 И.

К выходам регистра 5 подключен дешифратор 10, фиксирующий на одном из своих выходов факт наличия числового кода, соответствующего признаку года, например 2001.

Если такого признака в регистре 5 нет, то дешифратор выдает высокий потенциал на один вход элемента 28 И, на другой вход которого поступает синхронизирующий импульс с выхода элемента задержки 39, задерживающего синхронизирующий импульс на время занесения кода в регистр 5 и срабатывания дешифратора 10. Этот импульс с выхода элемента 28 И через элемент 31 ИЛИ устанавливает регистр 4 в исходное состояние, через элемент 33 ИЛИ устанавливает регистр 6 и триггер 14 в исходное состояние, через элементы 29 и 30 ИЛИ устанавливает в исходное состояние регистр 3, регистры 1, 2 и триггер 13 соответственно.

Если же числовой признак года зафиксирован дешифратором 10, то на одном из своих выходов он выдаст высокий потенциал и откроет тем самым, например, элемент 21 И, через который импульс с выхода элемента задержки 39 проходит на вход считывания фиксированной ячейки постоянного запоминающего устройства, где хранится стандартное цифровое обозначение соответствующего года, например для года 2001 - 01.

Содержимое фиксированной ячейки считывается в регистр 7, куда оно заносится синхронизирующим импульсом с выхода элемента 21 И, прошедшим элемент 34 ИЛИ и элемент задержки 40, задерживающий этот импульс на время считывания кода из блока памяти 12.

После занесения кода года в регистр 7 тот же импульс, задержанный на время занесения кода в регистр 7 элементом 41, выдается на выход 56 в качестве сигнала готовности стандартного обозначения выделенных признаков. По этому сигналу сервер считывает с выхода 53 дату, с выхода 54 - цифровое обозначение месяца, с выхода 55 - сокращенное цифровое обозначение года, а с выходов 51 и 52 - координаты расположения указанных признаков в выходном текстовом документе.

Таким образом, введение новых конструктивных признаков позволило реализовать процедуру идентификации объектов текстовых документов и конвертации форматов их представления в информационной сети подсистемы автоматизации избирательных процессов ГАС “Выборы”, выполняемую в процессе построчного ввода текстовых документов в ГАС “Выборы”, в результате которой выходной текстовый документ после ввода в информационную сеть ГАС “Выборы” будет иметь единое обозначение даты во всех разделах текстового документа.

Источники информации

1. Патент ЕПВ № 0542566, М. кл. G 06 К 9/46, 9/80, 1993 г.

2. Патент США № 4887301, М. кл. G 06 К 9/34, 1991 (прототип).

Класс G06K9/36 предварительная обработка изображения, те обработка информации изображения без установления его идентичности

записывающее устройство, способ записи, устройство воспроизведения, способ воспроизведения, носитель записи и программа -  патент 2525483 (20.08.2014)
способ и устройство временного декодера -  патент 2525441 (10.08.2014)
система и способ сжатия мультитипотокового видео с использованием множества форматов кодирования -  патент 2524845 (10.08.2014)
устройство фильтрации динамических цифровых изображений в условиях ограниченного объема априорных данных -  патент 2522043 (10.07.2014)
способ алфавитного представления изображения -  патент 2519445 (10.06.2014)
способ и устройство распознавания рельефности изображения лица -  патент 2518939 (10.06.2014)
способ расчета движения с коррекцией окклюзий -  патент 2517727 (27.05.2014)
способ и устройство для кодирования видеоинформации посредством предсказания движения с использованием произвольной области, а также устройство и способ декодирования видеоинформации посредством предсказания движения с использованием произвольной области -  патент 2517253 (27.05.2014)
способ для изменения опорного блока в опорном изображении, способ для кодирования или декодирования блока изображения с помощью опорного блока и устройство для этого, и носитель информации, переносящий блок, кодированный с помощью измененного опорного блока -  патент 2517247 (27.05.2014)
способ и устройство для кодирования видеоинформации посредством предсказания движения с использованием произвольной области, а также устройство и способ декодирования видеоинформации посредством предсказания движения с использованием произвольной области -  патент 2515226 (10.05.2014)
Наверх