Распознавание речи: .создание эталонных шаблонов, обучение систем распознавания речи, например по характеристикам голоса говорящего – G10L 15/06

МПКРаздел GG10G10LG10L 15/00G10L 15/06
Раздел G ФИЗИКА
G10 Музыкальные инструменты; акустика
G10L Анализирование или синтезирование речи; распознавание речи
G10L 15/00 Распознавание речи
G10L 15/06 .создание эталонных шаблонов; обучение систем распознавания речи, например по характеристикам голоса говорящего

Патенты в данной категории

ДЕТЕКТИРОВАНИЕ АВТООТВЕТЧИКА ПУТЕМ РАСПОЗНАВАНИЯ РЕЧИ

Изобретение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком. Техническим результатом является повышение точности детектирования автоответчика. Указанный результат достигается тем, что способ содержит посредством процессора прием звукового ответа от получателя вызова и обработку звукового ответа посредством распознавателя речи, имеющего языковую модель для преобразования звукового ответа в вывод, указывающий распознанную речь в текстовой форме; и обработку вывода, указывающего распознанную речь, в текстовой форме со статистическим классификатором, настроенным по словесным фразам, обычно используемым реальными персонами и автоматическими системами, наряду с установлением несловесных особенностей, ассоциированных со звуковым ответом для предоставления вывода, указывающего, является ли получатель вызова реальной персоной или автоответчиком. Классификатор является отдельным от языковой модели. Обработка является основанной на статистическом анализе вывода, указывающего распознанную речь в текстовой форме наряду с несловесными особенностями. Статистический анализ проверяет содержимое вывода, указывающего распознанную речь, и, на основании этой проверки, определяет, является ли вывод, указывающий распознанную речь, более статистически согласуемым со словесными фразами, обычно используемыми реальными людьми или автоматическими системами. 3 н. и 15 з.п. ф-лы, 6 ил.

2439716
патент выдан:
опубликован: 10.01.2012
СПОСОБ ОРГАНИЗАЦИИ СИНХРОННОГО ПЕРЕВОДА УСТНОЙ РЕЧИ С ОДНОГО ЯЗЫКА НА ДРУГОЙ ПОСРЕДСТВОМ ЭЛЕКТРОННОЙ ПРИЕМОПЕРЕДАЮЩЕЙ СИСТЕМЫ

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй. Техническим результатом является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти. Технический результат достигается за счет следующего. Процесс электронного перевода кодовой формы текста (КФТ) на входном языке в КФТ на выходном языке организуют в два этапа. На первом этапе обеспечивают преобразования КФТ на входном языке в КФТ на промежуточном языке. На втором этапе обеспечивают преобразования КФТ на промежуточном языке в КФТ на выходном языке. При этом перевод текста в текст организуют как машинный поиск отдельных словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящихся в мобильной сети, например, «Интернет». Базу данных переводов мобильной сети постоянно пополняют посредством того, что текстовые формы, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляют в открытый доступ и предлагают для перевода, например, на коммерческой основе профессиональным переводчикам. Кроме того, перед началом использования терминала связи на нем однократно осуществляют верификацию речи владельца терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. 5 з.п. ф-лы, 4 ил.

2419142
патент выдан:
опубликован: 20.05.2011
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ

Изобретение относится к области анализа и распознавания речевых сигналов. Техническим результатом является повышение точности распознавания слов речи, достигаемый тем, что в процессе обучения системы распознаванию формируются эталонные биспектральные признаки фонем - положения максимумов модуля биспектра (ММБ) звукового сигнала и амплитуды ММБ звукового сигнала, а также эталонные признаки слов, представляющие собой совокупности усредненных временных отрезков от начала слова до начала и окончания всех фонем и пауз в слове, а в процессе распознавания речевой сигнал, соответствующий интервалу слова, разбивается на сегменты, в которых формируются биспектральные признаки - положения ММБ звукового сигнала и амплитуды ММБ звукового сигнала, сравниваемые с эталонными биспектральными признаками фонем в соответствии с первым и вторым критериями принятия решения. Из принятых в процессе сравнения решений о распознанных фонемах на всех сегментах формируются две последовательности решений о распознанных фонемах, из которых выделяются наиболее часто встречающиеся решения (буквенные коды фонем), формирующие набор буквенных кодов фонем распознаваемого слова. При сравнении набора буквенных кодов фонем распознаваемого слова с наборами буквенных кодов фонем всех слов словаря с учетом эталонных признаков слов формируется массив значений показателей распознавания, равных количеству совпадающих буквенных кодов фонем и кодов пауз и решение о распознавании слова принимается в пользу того слова словаря, при сравнении с которым получен максимальный показатель распознавания. 8 ил.

2296376
патент выдан:
опубликован: 27.03.2007
СПОСОБ РАСПОЗНАВАНИЯ ФОНЕМ РЕЧИ И УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ СПОСОБА

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. Техническим результатом является повышение точности распознавания фонем речи, достигающийся тем, что формирование признаков фонем для распознавания фонем речи основано на применении биспектрального анализа, базирующегося на преобразовании цифровых последовательностей кодов, соответствующих речевым сигналам, в биспектральную область, характеризующую взаимодействия между значениями компонентов Фурье на разных частотах в диапазоне речи, таким образом, обеспечивается выделение дополнительной, существенно новой информации из речевых сигналов, что повышает точность при распознавании фонем, а устройство, реализующее заявленный способ распознавания фонем речи, содержит: вычислительную систему, включающую тактовый генератор, контроллер, оперативное запоминающее устройство, процессор, предназначенный для формирования биспектральных признаков и распознавания на их основе фонем речи, цифроаналоговый преобразователь, долговременное запоминающее устройство, видеоконтроллер и аналого-цифровой преобразователь, а также клавиатуру, дисплей, наушники, микрофон. 2 н.п. ф-лы, 5 ил.

2268504
патент выдан:
опубликован: 20.01.2006
СПОСОБ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ЧЕЛОВЕКА С ИСПОЛЬЗОВАНИЕМ АКУСТИЧЕСКИХ СИГНАЛОВ, СНИМАЕМЫХ С ТЕЛА ЧЕЛОВЕКА

Изобретение относится к области автоматического распознавания человека по его голосовым характеристикам и может быть использовано для ограничения и разграничения доступа (в том числе удаленного) к устройствам и системам, к средствам электронно-вычислительной техники, к конфиденциальной информации, к услугам (например, телекоммуникационным, информационным, банковским), а также к охраняемым зонам и помещениям. Технический результат заключается в повышении устойчивости голосовых биометрических систем к акустическим помехам и уменьшении возможности фальсификации голосового сигнала. По предлагаемому способу акустический сигнал, наблюдаемый в точке тела человека, неизвестной неуполномоченным (в том числе злоумышленным) лицам, вводят в электронно-вычислительное устройство, определяют значения параметров акустического сигнала, определяют значения оценок статистических характеристик параметров акустического сигнала и формируют на их основе эталон(ы), определяют степень различия между акустическим сигналом и эталоном(ами), на основании степени различия принимают решение о принадлежности акустического сигнала человеку, чьи значения статистических характеристик были использованы при формировании эталона(ов). 6 ил.

2263358
патент выдан:
опубликован: 27.10.2005
СПОСОБ АВТОМАТИЧЕСКОЙ ИДЕНТИФИКАЦИИ ЛИЧНОСТИ

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах. Техническим результатом является повышение надежности идентификации личности. Изобретение основано на том, что в вокализованных зонах речевого сигнала выделяют временные интервалы с определенной длительностью и определяют оценки коэффициентов корреляции параметров речевого сигнала. 2 з.п.ф-лы, 4 ил.
2161826
патент выдан:
опубликован: 10.01.2001
Наверх