Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах , кодирование или декодирование речи: ..определение или кодирование функций возбуждения, определение или кодирование параметров долгосрочных прогнозов – G10L 19/08

МПКРаздел GG10G10LG10L 19/00G10L 19/08
Раздел G ФИЗИКА
G10 Музыкальные инструменты; акустика
G10L Анализирование или синтезирование речи; распознавание речи
G10L 19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи
G10L 19/08 ..определение или кодирование функций возбуждения; определение или кодирование параметров долгосрочных прогнозов

Патенты в данной категории

СПОСОБ КОДИРОВАНИЯ, СПОСОБ ДЕКОДИРОВАНИЯ, УСТРОЙСТВО КОДЕРА, УСТРОЙСТВО ДЕКОДЕРА, ПРОГРАММА И НОСИТЕЛЬ ЗАПИСИ

Изобретение относится к способу кодирования и более конкретно к способу кодирования периода основного тона. Технический результат заключается в повышении эффективности компрессии периодов основного тона. В ходе кодирования вычисляются периоды основного тона для сигналов временной последовательности в заранее заданном временном интервале и выводится код, соответствующий таковым. В этом кодировании разрешающие способности для выражения периодов основного тона и/или режима кодирования периода основного тона переключаются в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности сигналов временной последовательности, условию, указывающему высокую или низкую периодичность и/или стационарность. В этом декодировании в соответствии с тем, удовлетворяет ли индекс, указывающий уровень периодичности и/или стационарности, индекс, включаемый во входной код или получаемый исходя из входного кода, соответствующего заранее заданному временному интервалу, условию, указывающему высокую периодичность и/или стационарность, режим декодирования для кода, включенного во входной код, соответствующего периодам основного тона, переключается для декодирования кода, соответствующего периодам основного тона, чтобы получать периоды основного тона, соответствующие заранее заданному временному интервалу. 14 н. и 18 з.п. ф-лы, 28 ил., 9 табл.

2510974
патент выдан:
опубликован: 10.04.2014
СПОСОБ СНИЖЕНИЯ СКОРОСТИ ПЕРЕДАЧИ НИЗКОСКОРОСТНЫХ ВОКОДЕРОВ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом предлагаемого способа является уменьшение скорости передачи данных по каналам связи при эффективном кодировании речевых сигналов с сохранением качественных показателей синтезированного сигнала. Поставленная цель в вокодере с линейным предсказанием достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения. Сигнал возбуждения идентифицируют непосредственно на приеме по данным о параметрах синтезирующей модели при помощи нейронной сети. По каналу связи передают информацию о коэффициентах формирующей модели, коэффициенте усиления, параметрах, характеризующих кодируемый речевой сигнал, которые рассчитывают на каждом квазистационарном сегменте анализа речевого сигнала. 3 ил.

2495504
патент выдан:
опубликован: 10.10.2013
СПОСОБ КОДИРОВАНИЯ СИГНАЛА И СПОСОБ ДЕКОДИРОВАНИЯ СИГНАЛА

Изобретение относится к способу, устройству и системе для кодирования и декодирования сигналов. Способ кодирования включает в себя этапы, на которых: преобразуют сигнал первой области в сигнал второй области; выполняют обработку Линейного Предсказания (Linear Predictive, LP) и обработку Долгосрочного Предсказания (Long-Term Prediction, LTP) для упомянутого сигнала второй области; получают долгосрочный флаг согласно критериям решения; получают сигнал вклада второй области в соответствии с результатом обработки LP и результатом обработки LTP, когда долгосрочный флаг являет собой первый флаг; получают сигнал вклада второй области в соответствии с результатом обработки LP, когда долгосрочный флаг являет собой второй флаг; преобразуют сигнал вклада второй области в сигнал вклада первой области и вычисляют остаточный сигнал предсказания первой области; и выводят битовой поток, который включает в себя упомянутый остаточный сигнал предсказания первой области. Последующий процесс кодирования или декодирования выполняется адаптивным образом согласно долгосрочному флагу. Технический результат - повышение эффективности сжатия кодека. 5 н. и 20 з.п. ф-лы, 10 ил.

2486610
патент выдан:
опубликован: 27.06.2013
УСТРОЙСТВО ДЛЯ МИКШИРОВАНИЯ МНОЖЕСТВА ВХОДНЫХ ДАННЫХ

Изобретение относится к устройствам для микширования множества входных потоков данных для получения потока данных, которые могут применяться, например, в области систем конференц-связи, включая системы видео- и телеконференций. Техническим результатом является уменьшение сложности вычислений при микшировании кодированных с помощью SBR-кодера аудиосигналов. Указанный результат достигается тем, что устройство (500) для микширования первого фрейма (540-1) первого входного потока данных (510-1) и второго фрейма (540-2) второго входного потока данных (510-2) содержит блок обработки (520), предназначенный для формирования выходного фрейма (550), где выходной фрейм (550) содержит выходные спектральные данные, характеризующие нижнюю часть выходного спектра до выходной частоты перехода, и где выходной фрейм содержит выходные SBR-данные, характеризующие верхнюю часть выходного спектра выше выходной частоты перехода посредством значений энергии в выходном разрешении временно-частотной сетки; процессорный блок (520) функционирует таким образом, что выходные спектральные данные, соответствующие частотам ниже минимального значения частот перехода первого фрейма, второго фрейма и выходной частоты перехода, формируются в спектральной области, а выходные SBR-данные, соответствующие частотам выше максимального значения частот перехода первого и второго фреймов и выходной частоты перехода, обрабатываются в SBR-области. 4 н. и 12 з.п. ф-лы, 15 ил.

2473140
патент выдан:
опубликован: 20.01.2013
КОДИРУЮЩЕЕ УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ

Изобретение относятся к кодированию речевых и звуковых сигналов. Техническим результатом является обеспечение достаточно хорошего качества звука, предпочтительного для слухового восприятия, даже если количество информационных разрядов небольшое. Кодирующее устройство включает в себя модуль (111) квантования формы, содержащий модуль (121) поиска участка, который ищет импульс для каждой из полос, на которые разделяется предопределенный участок поиска; и модуль (122) полного поиска, который выполняет поиск импульса по всему участку поиска. Форма входного спектра квантуется по небольшому количеству положений импульсов и полярностям. Модуль (112) квантования усиления вычисляет усиление импульса, который ищется модулем (111) квантования формы, и квантует усиление для каждой из полос. 3 н. и 3 з.п. ф-лы, 8 ил.

2463674
патент выдан:
опубликован: 10.10.2012
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ КАДРОВ ПЕРЕХОДА В РЕЧЕВЫХ СИГНАЛАХ

Изобретение относится к способу цифрового кодирования звукового сигнала, например речевого или аудиосигнала, в частности к способу и устройству кодирования кадров перехода и кадров, следующих за переходом в звуковом сигнале. Техническим результатом является повышение эффективности кодирования. Указанный результат достигается тем, что устройство режима перехода для использования в кодеке звукового сигнала с предсказанием для создания возбуждения режима перехода, заменяющего возбуждение адаптивной кодовой книги в кадре перехода и/или по меньшей мере одном кадре, следующем за переходом в звуковом сигнале, содержит вход для приема индекса кодовой книги и кодовую книгу режима перехода для генерирования набора кодовых векторов, не зависимых от прошлого возбуждения, причем кодовая книга режима перехода является реагирующей на индекс кодовой книги для генерирования, в кадре перехода и/или в по меньшей мере одном кадре, следующем за переходом, одного из кодовых векторов набора, соответствующего упомянутому возбуждению режима перехода; причем кодовая книга режима перехода содержит кодовую книгу форм глоттальных импульсов. 6 н. и 54 з.п. ф-лы, 27 ил., 10 табл.

2462769
патент выдан:
опубликован: 27.09.2012
УСТРОЙСТВО КОДИРОВАНИЯ АУДИО И СПОСОБ КОДИРОВАНИЯ АУДИО

Изобретение относится к устройству и способу кодирования речи, в частности к устройству и способу кодирования речи для выполнения поиска фиксированной кодовой книги. Техническим результатом является улучшение эффективности кодирования при выполнении поиска разделения над алгебраической кодовой книгой в кодировании аудио. Указанный результат достигается тем, что устройство кодирования речи содержит секцию вычисления, которая вычисляет значения корреляции в предполагаемых положениях импульсов с использованием целевого сигнала и множества импульсов, формирующих фиксированную кодовую книгу, и вычисляет на базисе на основе импульса репрезентативные значения импульсов с использованием максимальных значений корреляции; секцию сортировки, которая сортирует репрезентативные значения, полученные на базисе на основе импульса, группирует импульсы, соответствующие отсортированным репрезентативным значениям, в множество предопределенных поднаборов и определяет первый поднабор, подлежащий поиску первым, среди множества поднаборов; и секцию поиска, которая осуществляет поиск фиксированной кодовой книги с использованием первого поднабора и получает показывающие код позиции и полярности множества импульсов для минимизации искажения кодирования. 2 н. и 7 з.п. ф-лы, 9 ил.

2458413
патент выдан:
опубликован: 10.08.2012
УСТРОЙСТВО ПОИСКА ФИКСИРОВАННЫХ ТАБЛИЦ КОДИРОВАНИЯ И СПОСОБ ПОИСКА ФИКСИРОВАННЫХ ТАБЛИЦ КОДИРОВАНИЯ

Изобретение относится к устройству поиска в фиксированной таблице кодирования, которое немного сдерживает увеличение объема операций, даже если фильтр, применяемый к импульсу возбуждения, имеет характеристику, которая не может быть представлена посредством нижней треугольной матрицы, и реализует квазиоптимальный поиск в фиксированной таблице кодирования. Устройство поиска в фиксированной таблице кодирования оснащено алгебраической таблицей кодирования (101), которая формирует вектор импульсного возбуждения; модуль (151) операции свертки, который выполняет свертку в отношении импульсной характеристики слухового взвешенного синтетического фильтра в вектор импульсной характеристики, который имеет значение в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет значение во вторые отрицательные моменты времени; модуль (152) формирования матрицы, который формирует матрицу свертки типа Теплитца посредством второго вектора импульсной характеристики; и модуль (153) операции свертки, который выполняет свертку в отношении матрицы, сформированной модулем (152) формирования матрицы, в вектор импульсного возбуждения, сформированной посредством алгебраической таблицы (101) кодирования. Технический результат - минимизирование повышения вычислительной нагрузки путем реализации квазиоптимального поиска фиксированной таблицы кодирования. 3 з.п. ф-лы, 3 ил.

2458412
патент выдан:
опубликован: 10.08.2012
СПОСОБ УЛУЧШЕНИЯ ВОСПРИЯТИЯ СИНТЕЗИРОВАННОЙ РЕЧИ ПРИ РЕАЛИЗАЦИИ ПРОЦЕДУРЫ АНАЛИЗА ЧЕРЕЗ СИНТЕЗ В ВОКОДЕРАХ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является улучшение восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием. Указанный результат достигается тем, что в способе улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием на передающей стороне итерационно синтезируют речевой сигнал на длительности участка квазистационарности речи, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания для вычисления наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием. Вводят итерационный расчет критерия модифицированного искажения спектра барков, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания. Далее вычисляют минимальное перцептуальное искажение, при этом параметры кодека, соответствующие данной итерации, считают наилучшими и используют для синтеза речевого сигнала на длительности участка квазистационарности речи на приемной стороне. 2 ил.

2445719
патент выдан:
опубликован: 20.03.2012
УСТРОЙСТВО ПОИСКА В ФИКСИРОВАННЫХ ТАБЛИЦАХ КОДИРОВАНИЯ И СПОСОБ ПОИСКА В ФИКСИРОВАННЫХ ТАБЛИЦАХ КОДИРОВАНИЯ

Изобретение относится к устройству и способу формирования перцепционно взвешенного синтетического сигнала при поиске фиксированной таблицы кодирования. Это устройство оснащено модулем формирования вектора возбуждения, который формирует вектор импульсного возбуждения посредством алгебраической таблицы (101) кодирования; модуль (151) первой операции свертки, который выполняет свертку в отношении импульсной характеристики перцепционно взвешенного синтетического фильтра в вектор импульсной характеристики, который имеет значение в отрицательные моменты времени, чтобы сформировать второй вектор импульсной характеристики, который имеет значение во вторые отрицательные моменты времени; модуль (152) формирования матрицы, который формирует матрицу свертки посредством второго вектора импульсной характеристики сформированного модулем первой операции свертки, так чтобы матрица свертки представляла собой нижнюю треугольную матрицу Теплитца; и модуль (153) второй операции свертки, который выполняет обработку по свертке в отношении вектора импульсного возбуждения, сформированного модулем формирования вектора импульсного возбуждения, с помощью матрицы, сформированной модулем (152) формирования матрицы. Технический результат - минимизация повышения вычислительной нагрузки при малом влиянии на качество кодирования. 2 н. и 5 з.п. ф-лы, 3 ил.

2425428
патент выдан:
опубликован: 27.07.2011
СПОСОБ ФОРМИРОВАНИЯ СИГНАЛА ВОЗБУЖДЕНИЯ В НИЗКОСКОРОСТНЫХ ВОКОДЕРАХ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является уменьшение скорости передачи данных по каналам связи за счет эффективного кодирования речевых сигналов на основе линейного предсказания. Указанный технический результат достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения, который синтезируют непосредственно на приеме по данным о параметрах синтезирующей модели. По каналу связи передают информацию о параметрах синтезирующего фильтра, содержащих информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения. На приеме по данным параметрам рассчитывают амплитудно-частотную характеристику синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения. Сигнал возбуждения формируют на основе данных о спектрах его амплитуд и фаз и коэффициенте усиления. 2 ил.

2400832
патент выдан:
опубликован: 27.09.2010
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СИГНАЛОВ ДЛЯ СИСТЕМ КОДИРОВАНИЯ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является снижение требуемой пропускной способности каналов связи для вокодеров с линейным предсказанием в классе систем с переменной скоростью передачи. Указанный технический результат достигается исключением из кадра передачи информации о параметрах формирующей модели вокодера с линейным предсказанием при кодировании следующих друг за другом вокализованных сегментов. Информацию о данных параметрах передают только для первого из последовательности вокализованных сегментов, а для остальных сохраняют неизменной, число таких сегментов не должно превышать четырех, для пятого подряд следующего вокализованного сегмента параметры формирующей модели рассчитывают заново. При кодировании шумоподобных и переходных сегментов вычисление параметров синтезирующей системы осуществляют на каждом сегменте квазистационарности речевого сигнала. В установившемся режиме следования вокализованных сегментов квазистационарности речевого сигнала при кодировании по каналу связи передают информационный сигнал подтверждения о принадлежности сегмента к вокализованному типу, сигнал возбуждения, вычисленный на основе процедуры анализа через синтез, и коэффициент его усиления, управляющий мощностью речевого сигнала на выходе синтезирующего фильтра. 4 ил.

2394284
патент выдан:
опубликован: 10.07.2010
КОДИРОВАНИЕ АУДИОСИГНАЛА С НИЗКОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ

Изобретение относится к кодированию и декодированию широкополосных сигналов, таких как отдельные аудиосигналы. В аудиокодере оценивают количество синусоид на один аудиосегмент. Синусоиду представляют частотой, амплитудой и фазой. Обычно фазу квантуют независимо от частоты. В изобретении частота используется независимо от квантования фазы, и, в частности, низкие частоты квантуют с использованием меньших интервалов квантования, чем более высокие частоты. Таким образом, развернутые фазы более низких частот квантуют более точно, возможно с меньшим диапазоном квантования, чем фазы более высоких частот. Технический результат - значительно повышается качество декодированного сигнала, особенно для квантователей с низкой скоростью передачи битов. 5 н. и 12 з.п. ф-лы, 3 табл., 9 ил.

2368018
патент выдан:
опубликован: 20.09.2009
АУДИОКОДИРОВАНИЕ

Изобретение относится к кодированию и декодированию аудиосигналов. Изобретение раскрывает кодирование аудиосигнала, представленного соответствующим набором значений выборок сигнала для каждого из множества последовательных сегментов. Значения выборок сигнала анализируют для определения одного или нескольких синусоидальных компонентов для каждого из множества последовательных сегментов. Синусоидальные компоненты стыкуют для множества последовательных сегментов для обеспечения синусоидальных треков. Для каждого синусоидального трека определяют фазу, содержащую практически монотонно изменяющееся значение, и генерируют кодированный аудиопоток, включающий в себя синусоидальные коды, представляющие указанную фазу. Технический результат - повышение точности декодирования данных. 7 н. и 9 з.п. ф-лы, 6 ил.

2353980
патент выдан:
опубликован: 27.04.2009
СПОСОБ И УСТРОЙСТВО ДЛЯ КВАНТОВАНИЯ УСИЛЕНИЯ В ШИРОКОПОЛОСНОМ РЕЧЕВОМ КОДИРОВАНИИ С ПЕРЕМЕННОЙ БИТОВОЙ СКОРОСТЬЮ ПЕРЕДАЧИ

Изобретение относится к способу и устройству квантования усиления для воплощения в методе кодирования дискретизированного звукового сигнала, обработанного в процессе кодирования последовательными кадрами из L выборок, где каждый кадр делится на некоторое число подкадров и каждый подкадр содержит некоторое число N выборок, где N<L. В способе и устройстве квантования усиления вычисляется начальное усиление основного тона на основании некоторого числа f подкадров, часть кодовой книги квантования усиления выбирается по отношению к начальному усилению основного тона, а усиления основного тона и фиксированной кодовой книги совместно квантуются. Это совместное квантование усилений основного тона и фиксированной кодовой книги содержит для некоторого числа f подкадров поиск в кодовой книге квантования усиления во взаимосвязи с критерием поиска. Поиск в кодовой книге ограничивается выбранной частью кодовой книги квантования усиления и индексом выбранной части кодовой книги квантования усиления, наилучшим образом отвечающим найденному критерию поиска. Технический результат - повышение пропускной способности системы. 8 н. и 45. з.п. ф-лы, 3 табл., 4 ил.

2316059
патент выдан:
опубликован: 27.01.2008
ПОИСК В ГЛУБИНУ ПО АЛГЕБРАИЧЕСКОЙ ШИФРОВАЛЬНОЙ КНИГЕ ДЛЯ БЫСТРОГО КОДИРОВАНИЯ РЕЧИ

При кодировании звукового сигнала поиск по шифровальной книге, которая состоит из комплекта кодовых векторов, каждый из которых состоит из 40 позиций и содержит N импульсов ненулевой амплитуды, которые присваивают заранее определенным действительным позициям, для уменьшения сложности поиска используют поиск в глубину, который предлагает древовидную структуру с уровнями, расположенными в порядке от 1 до М. На нижнем уровне производят операцию построения маршрута, в результате чего маршрут-кандидат от предыдущего уровня продолжают путем отбора заранее определенного числа новых импульсов и выбора действительных позиций для указанных новых импульсов в соответствии с данным правилом задания импульсов и данного критерия выбора. Маршрут, происшедший на первом уровне и продолженный операциями построения маршрута последующих уровней, определяет соответствующие позиции N импульсов ненулевой амплитуды кодового вектора-кандидата. Использование оценки вероятности позиции импульса, исходя из сигнала во время первых нескольких уровней, позволяет осуществлять первоначальный просмотр импульсов для начала поиска благоприятных условий. Критерий выбора, основанный на максимизировании отношения, используют для оценки результативности и для отбора наиболее оптимального кодового вектора из числа контролирующих кодовых векторов-кандидатов, что позволяет снизить сложность поиска, в чем состоит технический результат, достигаемый при реализации группы изобретений. 7 с. и 54 з.п. ф-лы, 7 ил., 8 табл.
2175454
патент выдан:
опубликован: 27.10.2001
Наверх