Определение или обнаружение характеристик речи, не отнесенные к группам  ,15/00: .определение пика речевых сигналов – G10L 11/04

МПКРаздел GG10G10LG10L 11/00G10L 11/04
Раздел G ФИЗИКА
G10 Музыкальные инструменты; акустика
G10L Анализирование или синтезирование речи; распознавание речи
G10L 11/00 Определение или обнаружение характеристик речи, не отнесенные к группам  15/00
G10L 11/04 .определение пика речевых сигналов

Патенты в данной категории

ОЦЕНКА ПЕРИОДА ОСНОВНОГО ТОНА

Изобретение относится к оценке периода основного тона в аудиосигналах. Автокорреляционные величины определяют как основу для оценки периода основного тона в сегменте аудиосигнала. Первый рассматриваемый диапазон задержки для автокорреляционных вычислений делят на первый набор секций, и первые автокорреляционные величины определяют для задержек в множестве секций этого первого набора секций. Второй рассматриваемый диапазон задержки для автокорреляционных вычислений делят на второй набор секций таким образом, что секции первого набора и секции второго набора перекрываются. Вторые автокорреляционные величины определяют для задержек в множестве секций этого второго набора секций. Технический результат - обеспечение эффективности оценки основного тона аудиосигнала. 5 н. и 26 з.п. ф-лы, 6 ил.

2421826
патент выдан:
опубликован: 20.06.2011
АНАЛИЗАТОР РЕЧИ, ОБНАРУЖИВАЮЩИЙ ЧАСТОТУ ОСНОВНОГО ТОНА, СПОСОБ АНАЛИЗА РЕЧИ И ПРОГРАММА АНАЛИЗА РЕЧИ

Изобретение относится к методу анализа речи, обнаруживающему частоту основного тона голоса, а также к методу обнаружения эмоций, оценивающему эмоцию на основании частоты основного тона голоса. Технический результат - повышение точного и уверенного обнаружения голосовой частоты и повышение точности оценки эмоций. Анализатор речи включает в себя блок поступления голосового сигнала, блок частотного преобразования, автокорреляционный блок и блок обнаружения основного тона. Блок частотного преобразования преобразует голосовой сигнал, полученный в блоке поступления голосового сигнала, в частотный спектр. Автокорреляционный блок вычисляет автокорреляционное колебание при сдвиге частотного спектра на частотной оси. Блок обнаружения основного тона вычисляет частоту на основе локального интервала между гребнями или впадинами автокорреляционного колебания. 3 н. и 6 з.п. ф-лы, 5 ил.

2403626
патент выдан:
опубликован: 10.11.2010
КВАНТОВАНИЕ ОСНОВНОГО ТОНА ДЛЯ РАСПРЕДЕЛЕННОГО РАСПОЗНАВАНИЯ РЕЧИ

Изобретение касается области систем распределенного распознавания речи, где раскрыты система, способ и пригодная для чтения компьютером среда для квантования информации об основном тоне звука. Способ включает в себя захват звука, представляющего пронумерованный кадр из множества пронумерованных кадров. Способ дополнительно включает в себя вычисление класса кадра, в котором класс представляет собой любой из вокализированного или невокализированного класса. Если кадр представляет собой вокализированный класс, для кадра рассчитывается основной тон (903). Если кадр представляет собой кадр с четным номером и вокализированный класс, рассчитывается ключевое слово первой длины посредством абсолютного квантования основного тона кадра (910). Если кадр представляет собой кадр с нечетным номером и вокализированный класс и доступен достоверный кадр, рассчитывается ключевое слово второй длины посредством дифференциального квантования основного тона кадра (905). Если нет доступного достоверного кадра, рассчитывается ключевое слово второй длины посредством абсолютного квантования основного тона кадра. Технический результат - компактное представление информации о классе и основном тоне для сохранения низкой скорости передачи в битах без потери точности и устойчивости против ошибок канала связи. 4 н. и 20 з.п. ф-лы, 10 ил., 2 табл.

2331932
патент выдан:
опубликован: 20.08.2008
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ

Изобретение относится к области анализа и распознавания речевых сигналов. Техническим результатом является повышение точности распознавания слов речи, достигаемый тем, что в процессе обучения системы распознаванию формируются эталонные биспектральные признаки фонем - положения максимумов модуля биспектра (ММБ) звукового сигнала и амплитуды ММБ звукового сигнала, а также эталонные признаки слов, представляющие собой совокупности усредненных временных отрезков от начала слова до начала и окончания всех фонем и пауз в слове, а в процессе распознавания речевой сигнал, соответствующий интервалу слова, разбивается на сегменты, в которых формируются биспектральные признаки - положения ММБ звукового сигнала и амплитуды ММБ звукового сигнала, сравниваемые с эталонными биспектральными признаками фонем в соответствии с первым и вторым критериями принятия решения. Из принятых в процессе сравнения решений о распознанных фонемах на всех сегментах формируются две последовательности решений о распознанных фонемах, из которых выделяются наиболее часто встречающиеся решения (буквенные коды фонем), формирующие набор буквенных кодов фонем распознаваемого слова. При сравнении набора буквенных кодов фонем распознаваемого слова с наборами буквенных кодов фонем всех слов словаря с учетом эталонных признаков слов формируется массив значений показателей распознавания, равных количеству совпадающих буквенных кодов фонем и кодов пауз и решение о распознавании слова принимается в пользу того слова словаря, при сравнении с которым получен максимальный показатель распознавания. 8 ил.

2296376
патент выдан:
опубликован: 27.03.2007
СПОСОБ РАСПОЗНАВАНИЯ ФОНЕМ РЕЧИ И УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ СПОСОБА

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи. Техническим результатом является повышение точности распознавания фонем речи, достигающийся тем, что формирование признаков фонем для распознавания фонем речи основано на применении биспектрального анализа, базирующегося на преобразовании цифровых последовательностей кодов, соответствующих речевым сигналам, в биспектральную область, характеризующую взаимодействия между значениями компонентов Фурье на разных частотах в диапазоне речи, таким образом, обеспечивается выделение дополнительной, существенно новой информации из речевых сигналов, что повышает точность при распознавании фонем, а устройство, реализующее заявленный способ распознавания фонем речи, содержит: вычислительную систему, включающую тактовый генератор, контроллер, оперативное запоминающее устройство, процессор, предназначенный для формирования биспектральных признаков и распознавания на их основе фонем речи, цифроаналоговый преобразователь, долговременное запоминающее устройство, видеоконтроллер и аналого-цифровой преобразователь, а также клавиатуру, дисплей, наушники, микрофон. 2 н.п. ф-лы, 5 ил.

2268504
патент выдан:
опубликован: 20.01.2006
СПОСОБ АВТОМАТИЧЕСКОЙ ИДЕНТИФИКАЦИИ ЛИЧНОСТИ

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах. Техническим результатом является повышение надежности идентификации личности. Изобретение основано на том, что в вокализованных зонах речевого сигнала выделяют временные интервалы с определенной длительностью и определяют оценки коэффициентов корреляции параметров речевого сигнала. 2 з.п.ф-лы, 4 ил.
2161826
патент выдан:
опубликован: 10.01.2001
Наверх