Распознавание речи: ..с использованием измерения расстояний или искажений между неизвестным речевым и эталонным шаблонами – G10L 15/10

МПКРаздел GG10G10LG10L 15/00G10L 15/10
Раздел G ФИЗИКА
G10 Музыкальные инструменты; акустика
G10L Анализирование или синтезирование речи; распознавание речи
G10L 15/00 Распознавание речи
G10L 15/10 ..с использованием измерения расстояний или искажений между неизвестным речевым и эталонным шаблонами

Патенты в данной категории

СПОСОБ РАСПОЗНАВАНИЯ КЛЮЧЕВЫХ СЛОВ В СЛИТНОЙ РЕЧИ

Изобретение относится к системам обработки информации и управления, в частности к способам построения систем распознавания речи. Техническим результатом является обеспечение возможности распознавания ключевых слов в потоке слитной речи и повышение быстродействия системы. Указанный технический результат достигается тем, что проводят вейвлет-преобразование акустического сигнала с вычислением вейвлет-коэффициентов, которые затем разбивают на сегменты фиксированной длительности, с применением быстрого преобразования Фурье находят Фурье-спектр каждого из сегментов вейвлет-коэффициентов, вычисляют его энергию и определяют границы между гласными и согласными фонемами речевого сигнала, а отбор наиболее вероятных кандидатов слов для анализируемого сигнала производят путем сравнения фонем сигнала с фонемами слова в словаре. 4 ил.

2403628
патент выдан:
опубликован: 10.11.2010
СПОСОБ ДИКТОРОНЕЗАВИСИМОГО РАСПОЗНАВАНИЯ КЛЮЧЕВЫХ СЛОВ В СЛИТНОЙ РЕЧИ

Изобретение относится к системам обработки информации и управления, а именно к способам построения систем распознавания речи. Достигаемый технический результат - обеспечение возможности распознавания ключевых слов в потоке слитной речи и повышение быстродействия системы. Согласно способу поток слитной речи сегментируют, выделенные отдельные слова подают поочередно на двухуровневую обработку речевого сигнала. Выбирают на первом уровне наиболее вероятные кандидаты эталонов для анализируемого слова, выбирают на втором уровне наиболее вероятную альтернативу из отобранных кандидатов. Выполняют анализ результатов распознавания речевого сигнала с принятием решения. Анализ и обработка речевого сигнала проводятся в частотно-временной области, представленной с помощью вейвлет-преобразования. 2 з.п. ф-лы, 2 ил.

2294024
патент выдан:
опубликован: 20.02.2007
Наверх