устройство и способ генерирования сигнала с расширенной полосой пропускания

Классы МПК:G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала
Автор(ы):, , , , , , ,
Патентообладатель(и):Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен Форшунг Е.Ф. (DE)
Приоритеты:
подача заявки:
2009-06-25
публикация патента:

Изобретение относится к устройствам обработки звукового сигнала. Технический результат заключается в расширении полосы пропускания звукового сигнала. Входной сигнал представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение. Генератор заплат генерирует первую заплату от первой полосы входного сигнала согласно первому алгоритму создания «заплат» и генерирует вторую заплату от первой полосы входного сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Объединитель объединяет первую заплату, вторую заплату и первую полосу входного сигнала для получения сигнала с расширенной полосой пропускания. Устройство для генерирования сигнала с расширенной полосой пропускания масштабирует входной сигнал согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или масштабирует первую заплату и вторую заплату так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра. 7 н. и 11 з.п. ф-лы, 19 ил. устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090

устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090 устройство и способ генерирования сигнала с расширенной полосой   пропускания, патент № 2512090

Формула изобретения

1. Устройство (100; 300; 400; 700; 800; 900) для генерирования сигнала с расширенной полосой пропускания (122) от входного сигнала (102), где входной сигнал представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение; включающее генератор заплат (110), сконфигурированный, чтобы генерировать первую заплату (112) от первой полосы входного сигнала (102) согласно первому алгоритму создания «заплат», и вторую заплату (114) от первой полосы входного сигнала (102) согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты (114), генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты (112), генерированной согласно первому алгоритму создания «заплат»; и объединитель (120), сконфигурированный, чтобы объединить первую заплату (112), вторую заплату (114) и первую полосу входного сигнала (102), чтобы получить сигнал с расширенной полосой пропускания (122), где устройство для генерирования сигнала с расширенной полосой пропускания выполнено с возможностью масштабировать входной сигнал (102) согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или масштабирования первой заплаты (112) и второй заплата (114) так, чтобы сигнал с расширенной полосой пропускания удовлетворял (122) критерию огибающей спектра.

2. Устройство по п.1, где первый алгоритм создания «заплат» является гармоническим алгоритмом создания «заплат», и генератор заплат (110) выполнен с возможностью генерировать первую заплату (112) так, чтобы только частоты, которые являются целыми кратными частот первой полосы входного сигнала (102), содержались в первой заплате (112).

3. Устройство по п.1, где второй алгоритм создания «заплат» является смешивающим алгоритмом создания «заплат», и генератор заплат (110) выполнен с возможностью генерировать вторую заплату (114) так, чтобы вторая заплата (114) содержала частоты, которые являются целыми кратными частот первой полосы входного сигнала (102), и содержала частоты, которые не являются целыми кратными частот первой полосы входного сигнала (102).

4. Устройство по п.1, где подавленная НЧ-составляющая первой заплаты (112) равна подавленной НЧ-составляющей второй заплаты (114), и где подавленная ВЧ-составляющая первого заплаты(112) равна подавленной ВЧ-составляющей второй заплаты (114).

5. Устройство по п.1, включает фазовый вокодер (310), выполненный с возможностью генерировать первую заплату (112) согласно первому алгоритму создания «заплат».

6. Устройство по п.1, включает ограничитель амплитуды (320), выполненный с возможностью генерировать вторую заплату (114) согласно второму алгоритму создания «заплат» посредством ограничения первой полосы входного сигнала (102).

7. Устройство по п.1, включает селектор спектральных линий (410), выполненный с возможностью выбрать множество частотных линий второй заплаты (114) для получения измененной второй заплаты (414), где частотная линия выбирается, если частотная линия, соответствующая выбранной частотной линии, не включена в первую заплату (112) как сгенерированная генератором заплат (110), где объединитель (120) формируется, чтобы объединить первую заплату (112), измененную вторую заплату (414) и первую полосу входного сигнала (102).

8. Устройство по п.1, включает регулятор мощности (710), выполненный с возможностью управлять масштабированием входного сигнала (102) согласно первому и второму алгоритму создания «заплат» или управлять масштабированием первой заплаты (112) и второй заплаты (114), где регулятор мощности 710 управляет масштабированием, основанным на данных огибающей спектра, содержавшихся во входном сигнале (102), и основанном, по крайней мере, на одном сохраненном параметре управления масштабированием заплаты или управляющих данных масштабирования заплаты, содержащихся во входном сигнале (102).

9. Устройство по п.8, включает первое устройство регулирования мощности (720), выполненное с возможностью масштабировать входной сигнал (102) согласно первому алгоритму создания «заплат» или чтобы масштабировать первую заплату (112), и включает второе устройство регулирования мощности (730), выполненное с возможностью масштабировать входной сигнал (102) согласно второму алгоритму создания «заплат» или чтобы масштабировать вторую заплату (114), где регулятор мощности (710) выполнен с возможностью управлять первым устройством регулирования мощности (720) и вторым устройством регулирования мощности (730).

10. Устройство по п.8, включает сумматор шума (910) и сумматор недостающих гармоник (920), где сумматор шума (910) выполнен с возможностью генерировать шумовую заплату (912), основанную на шумовых данных, содержавшихся во входном сигнале, где сумматор недостающих гармоник (920) выполнен с возможностью генерировать недостающую гармоническую заплату (922), основанную на данных недостающей гармоники, содержавшихся во входном сигнале (102), где регулятор мощности (710) выполнен с возможностью управлять масштабированием шумовой заплаты (912) и недостающей гармонической заплаты (922), основанной на данных огибающей спектра, и где объединитель (120) выполнен с возможностью объединять первую заплату (112), вторую заплату (114), первую полосу входного сигнала (102), шумовую заплату (912) и недостающую гармоническую заплату (922), чтобы получить сигнал с расширенной полосой пропускания (122), где регулятор мощности 710 управляет масштабированием первой заплаты (112), второй заплаты (114), шумовой заплаты (912) и недостающей гармонической заплаты (922), основанной на данных огибающей спектра так, чтобы удовлетворялся критерий огибающей спектра.

11. Устройство (1000) для предоставления сигнала с уменьшенной полосой пропускания (1032), основанного на входном сигнале (1002), включающее определитель данных огибающей спектра (1010), выполнен с возможностью определять данные огибающей спектра (1012), основанные на высокочастотной полосе входного сигнала (1002); генератор управляющих данных масштабирования заплаты (1020) выполнен с возможностью генерировать управляющие данные масштабирования заплаты (1022) для масштабирования сигнала с уменьшенной полосой пропускания (1032) в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра, где критерий огибающей спектра основывается на данных огибающей спектра (1012), где первая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания (1032) согласно первому алгоритму создания «заплат», и вторая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания (1032) согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат»; выходной интерфейс (1030) выполнен с возможностью объединить низкочастотную полосу входного сигнала (1002), данные огибающей спектра (1012) и управляющие данные масштабирования заплаты (1022), чтобы получить сигнал с уменьшенной полосой пропускания (1032) и формируемый, чтобы обеспечить сигнал с уменьшенной полосой пропускания (1032) для передачи или хранения.

12. Устройство по п.11, где генератор управляющих данных масштабирования заплаты включает генератор заплат, выполнен с возможностью генерировать первую заплату от низкочастотной полосы входного сигнала (1002) согласно первому алгоритму создания «заплат» и генерировать вторую заплату от низкочастотной полосы входного сигнала (1002) согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первым алгоритмам создания «заплат»; и компаратор, выполнен с возможностью сравнить первую заплату, вторую заплату и высокочастотную полосу входного сигнала (1002) для получения управляющих данных масштабирования заплаты (1022).

13. Устройство по п.11, включающее память параметра управления масштабированием заплаты, выполнена с возможностью сохранить и обеспечить множество параметров управления масштабированием заплаты, где генератор управляющих данных масштабирования заплаты (1020) выполнен с возможностью проанализировать входной сигнал (1002) и генерировать управляющие данные масштабирования заплаты (1022), основанные на сохраненных параметрах управления масштабированием заплаты, отобранных, основываясь на анализе входного сигнала (1002).

14. Машиночитаемый носитель информации с сохраненным на нем звуковым сигналом, включающим первую полосу, представленную данными первого разрешения; и вторую полосу, представленную данными второго разрешения, где второе разрешение ниже, чем первое разрешение, где данные второго разрешения основываются на данных огибающей спектра второй полосы и основываются на управляющих данных масштабирования заплаты второй полосы для масштабирования звукового сигнала в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра, где критерий огибающей спектра основывается на данных огибающей спектра, где первая заплата генерируется от первой полосы звукового сигнала согласно первому алгоритму создания «заплат», а вторая заплата генерируется от первой полосы звукового сигнала согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат».

15. Способ (1100) генерирования сигнала с расширенной полосой пропускания от входного сигнала, где входной сигнал представлен для первой полосы данными первого разрешения, а для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение; включающий генерирование (1110) первой заплаты от первой полосы входного сигнала согласно первому алгоритму создания «заплат»; генерирование (1120) второй заплаты от первой полосы входного сигнала согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат»; масштабирование (1130) входного сигнала согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат», или масштабирование (1130) первой заплаты и второй заплаты так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра; и объединение (1140) первой заплаты, второй заплаты и первой полосы входного сигнала для получения сигнала с расширенной полосой пропускания.

16. Способ (1200) предоставления сигнала с уменьшенной полосой пропускания, основанного на входном сигнале, включающий определение (1210) данных огибающей спектра, основанных на высокочастотной полосе входного сигнала; генерирование (1220) управляющих данных масштабирования заплаты для масштабирования сигнала с уменьшенной полосой пропускания в декодере или масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра, где критерий огибающей спектра основывается на данных огибающей спектра, где первая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания согласно первому алгоритму создания «заплат», и вторая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания согласно второму алгоритму создания «заплат», где спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат»; объединение (1230) низкочастотной полосы входного сигнала, данных огибающей спектра и управляющих данных масштабирования заплаты, чтобы получить сигнал с уменьшенной полосой пропускания; обеспечение (1240) сигнала с уменьшенной полосой пропускания для передачи или хранения.

17. Машиночитаемый носитель информации с сохраненной на нем компьютерной программой с программным кодом для выполнения способа по п.15, когда компьютерная программа запущена на компьютере или микроконтроллере.

18. Машиночитаемый носитель информации с сохраненной на нем компьютерной программой с программным кодом для выполнения способа по п.16, когда компьютерная программа запущена на компьютере или микроконтроллере.

Описание изобретения к патенту

Осуществления согласно изобретению касаются обработки звукового сигнала и, в частности, устройства и способа генерирования сигнала с расширенной полосой пропускания от входного сигнала, устройства и способа получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале и звуковом сигнале.

Перцепционно адаптированное кодирование звуковых сигналов, обеспечивающее существенное уменьшение скорости передачи данных для эффективного хранения и передачи этих сигналов, получило широкое применение во многих областях. Известно много кодирующих алгоритмов, например MPEG 1/2 Слой 3 ("МР3") или MPEG 4 ААС (Перспективное звуковое кодирование). Однако используемое для этого кодирование, в особенности при работе на самых низких скоростях передачи битов, может привести к ухудшению субъективного звукового качества, которое часто вызывается, главным образом, вынужденным ограничением полосы пропускания звукового сигнала, подлежащего передаче, на стороне кодирующего устройства.

Как известно из WO 9857436, чтобы подвергнуть звуковой сигнал ограничению полосы в такой ситуации на стороне кодирующего устройства и закодировать только нижнюю полосу звукового сигнала, используется высококачественное звуковое кодирующее устройство («основное кодирующее устройство»). Верхняя полоса, однако, характеризуется только очень грубо, то есть рядом параметров, которые воспроизводят огибающую спектра верхней полосы. Тогда на стороне декодера синтезируется верхняя полоса. С этой целью предлагается гармоническое перемещение, где нижняя полоса декодированного звукового сигнала подается на гребенку фильтров. Каналы гребенки фильтров нижней полосы соединены с каналами гребенки фильтров верхней полосы или «заплатаны», и каждый заплатанный сигнал с ограниченной полосой частот подвергается регулированию огибающей. Синтезирующая гребенка фильтров, принадлежащая гребенке фильтров для специального анализа, получает сигналы с ограниченной полосой частот звукового сигнала в нижней полосе и сигналы с ограниченной полосой частот, подвергшиеся регулированию огибающей, нижней полосы, которые гармонически вставляются в верхнюю полосу. Выходной сигнал синтезирующей гребенки фильтров является звуковым сигналом, расширенным относительно его оригинальной полосы пропускания, который передается со стороны кодирующего устройства на сторону декодера посредством основного кодирующего устройства, работающего на очень низкой скорости передачи данных. В частности, вычисления гребенки фильтров и вставка заплаты в области гребенки фильтров могут оказаться очень трудоемкими.

Упрощенные способы расширения полосы пропускания звуковых сигналов с ограниченной полосой вместо этого используют функцию копирования низкочастотных частей сигнала (LF-H4) в высокочастотный диапазон (НР-ВЧ), чтобы аппроксимировать информацию, которая отсутствует из-за ограничения полосы. Такие способы описаны в работе М.Дитца, Л.Лильерида, К.Кьерлинга и О.Кунца, «Репликация спектральной полосы, новый подход к звуковому кодированию», на 112-ом Съезде AES (Общество инженеров-звукотехников), Мюнхен, май 2002 г.; в работе С.Мелтцера, Р.Бема и Ф.Хенна, «Улучшенные звуковые кодер-декодеры с SBR (РБП - регистр буферной памяти) для цифрового радиовещания, такие как «Всемирное цифровое Радио» (DRM)», на 112-ом Съезде AES, Мюнхен, май 2002 г.; в работе Т.Циглера, А.Эрета, П.Экстранда и М.Лутцкого, «Улучшение тр3 посредством SBR: Характеристики и возможности нового mp3PRO алгоритма», на 112-ом Съезде AES, Мюнхен, май 2002 г.; Международный Стандартный ISO/IEC 14496-3:2001/FPDAM 1, «Расширение полосы пропускания», ISO/IEC, 2002, или «Способ и устройство для расширения полосы пропускания речи», Васу Айенгар и др. Патент США № 5455888.

В этих способах гармоническое перемещение не выполняется, но последовательные сигналы с ограниченной полосой частот нижней полосы вводятся в последовательные каналы гребенки фильтров верхней полосы. Таким образом, достигается грубая аппроксимация верхней полосы звукового сигнала. На следующем этапе эта грубая аппроксимация сигнала ассимилируется относительно оригинала посредством постобработки, используя управляющую информацию, полученную от оригинального сигнала. Здесь, например, масштабные коэффициенты служат для адаптации огибающей спектра, для обратной фильтрации и для добавления минимального уровня шума для адаптации тональности, и дополнения синусоидальных частей сигнала для недостающих гармоник, как это также описано в стандарте MPEG-4 Высокоэффективное улучшенное звуковое кодирование (НЕ-ААС).

Кроме этого, дальнейшие способы используют фазовый вокодер для расширения полосы пропускания. При использовании фазового вокодера для спектрального расширения частотные линии перемещаются все дальше друг от друга. Если в спектре существуют промежутки, например, в результате квантизации, то они даже увеличиваются при расширении. При адаптации энергии остающиеся линии в спектре получают слишком много энергии по сравнению с соответствующими линиями в оригинальном сигнале.

Фиг.13 показывает схематическую иллюстрацию расширения полосы пропускания 1300 посредством использования фазового вокодера. В этом примере две заплаты 1312, 1314 добавлены к низкочастотной полосе 1302 сигнала. Подавленная ВЧ-составляющая 1320 сигнала, также называемая частотой разделения (Xover), является частотой низкого уровня соседней заплаты 1312, и двойная частота разделения (x-over частота) является подавленной ВЧ-составляющей соседней заплаты 1312 и подавленной НЧ-составляющей следующей заплаты 1314. Фазовый вокодер удваивает частоту частотных линий низкочастотной полосы 1302 сигнала, чтобы получить соседнюю заплату 1312, и утраивает частоты частотных линий низкочастотной полосы 1302 сигнала, чтобы получить следующую заплату 1314. Поэтому спектральная плотность соседней заплаты 1312 - только половина спектральной плотности низкочастотной полосы 1302 сигнала, а спектральная плотность следующей заплаты 1314 является только одной третьей спектральной плотности низкочастотной полосы 1302 сигнала.

Концентрация энергии в полосах (заплатах) только до нескольких частотных линий приводит к существенному изменению тембра, который отличается от оригинала. Энергия прежнего большего количества полос (частотных линии) суммируется на меньшем количестве остающихся.

Некоторые примеры фазовых вокодеров и их применений представлены в работе Фредерика Нагеля и Саши Диша «Способ гармонического расширения полосы пропускания для звуковых кодер-декодеров," ICASSP '09 и в работе М. Пукетта «Вокодер с фазовой синхронизацией». IEEE ASSP Конференция по Применению обработки звуковых и акустических сигналов, Мохонк 1995", в работе Ребеля, А.: «Переходное обнаружение и сохранение в фазовом вокодере»; citeseer.ist.psu.edu/679246.html, в работе Лароша Л., Долсона М.: «Улучшенная модификация временной шкалы звука, полученная посредством фазового вокодера», IEEE. Транс, обработка речи и звука, издание 7, № 3, стр.323-332 и Патент США 6549884.

Один из подходов к заполнению промежутков показан в WO 00/45379. Он содержит способ и устройство для расширения исходных кодирующих систем, использующих высокочастотное восстановление. Это применение решает проблему недостаточного шумового содержания в восстановленном высоком диапазоне посредством адаптивного добавления минимального уровня шума. Добавление шума может заполнить промежутки, но качество звука или субъективное качество могут значительно не улучшиться.

Задача данного изобретения - обеспечить концепцию расширения полосы пропускания звуковых сигналов, которая улучшает субъективное качество сигналов с расширенной полосой пропускания.

Это достигается посредством использования устройства согласно пунктам 1 и 11 патентной формулы, звукового сигнала согласно пункту 14 и способа согласно пунктам 15 и 16.

Осуществление изобретения обеспечивает устройство для генерирования сигнала с расширенной полосой пропускания от входного сигнала. Входной сигнал предоставляется для первой полосы посредством данных первого разрешения и для второй полосы посредством данных второго разрешения; второе разрешение ниже, чем первое разрешение. Устройство включает генератор заплат и объединитель. Генератор заплат формируется, чтобы генерировать первую заплату от первой полосы входного сигнала согласно первому алгоритму создания «заплат», и формируется, чтобы генерировать вторую заплату от первой полосы входного сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Объединитель формируется, чтобы объединить первую заплату, вторую заплату и первую полосу входного сигнала, чтобы получить сигнал с расширенной полосой пропускания. Устройство для генерирования сигнала с расширенной полосой пропускания формируется, чтобы масштабировать входной сигнал согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или чтобы масштабировать первую заплату и вторую заплату так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра.

Осуществления согласно данному изобретению основаны на центральной идее о том, что заплата с низкой спектральной плотностью (что означает, например, что заплата включает промежутки по сравнению с низкочастотной полосой входного сигнала) объединяется с заплатой с высокой спектральной плотностью (что означает, например, что заплата включает только несколько промежутков или не включает промежутки совсем по сравнению с низкочастотной полосой входного сигнала) для расширения полосы пропускания входного сигнала. Так как обе заплаты генерируются, основываясь на входном сигнале, высокочастотное расширение полосы пропускания низкочастотной полосы входного сигнала может обеспечить хорошую аппроксимацию оригинального звукового сигнала. Дополнительно, первая и вторая заплаты могут быть масштабированы до (посредством масштабирования входного сигнала) или после генерирования, чтобы удовлетворять критерию огибающей спектра, так как огибающая спектра оригинального звукового сигнала должна учитываться при восстановлении высокочастотной полосы входного сигнала. Таким образом, субъективное качество или звуковое качество сигнала с расширенной полосой пропускания может быть значительно улучшено.

В некоторых осуществлениях согласно изобретению первый алгоритм создания «заплат» является гармоническим алгоритмом создания «заплат». Другими словами, первая заплата генерируется так, чтобы только частоты, которые являются целыми кратными частот первой полосы входного сигнала, содержались в первой заплате. Кроме того, второй алгоритм создания «заплат» может быть смешивающим алгоритмом создания «заплат». Это означает, например, что вторая заплата может генерироваться так, чтобы вторая заплата содержала частоты, которые являются целыми кратными частот первой полосы входного сигнала и частот, которые не являются целыми кратными частот первой полосы входного сигнала. Поэтому спектральная плотность второй заплаты выше, чем спектральная плотность первой заплаты. Посредством комбинирования первой заплаты и второй заплаты недостающие частотные линии первой заплаты могут быть заполнены частотными линиями второй заплаты. Таким образом, промежутки гармонического расширения полосы пропускания согласно первому алгоритму создания «заплат» могут быть заполнены второй заплатой, и звуковое качество сигнала с расширенной полосой пропускания может быть значительно улучшено.

Некоторые осуществления согласно изобретению касаются устройства для получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале. Устройство включает определитель данных огибающей спектра, генератор управляющих данных масштабирования заплаты и выходной интерфейс. Определитель данных огибающей спектра формируется, чтобы определить данные огибающей спектра, основанные на высокочастотной полосе входного сигнала. Генератор управляющих данных масштабирования заплаты формируется, чтобы генерировать управляющие данные масштабирования заплаты для масштабирования сигнала с уменьшенной полосой пропускания в декодере, или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно первому алгоритму создания «заплат», и вторая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированная согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Выходной интерфейс формируется, чтобы объединить низкочастотную полосу входного сигнала, данные огибающей спектра и управляющие данные масштабирования мощности для получения сигнала с уменьшенной полосой пропускания. Далее, выходной интерфейс формируется, чтобы получить сигнал с уменьшенной полосой пропускания для передачи или хранения.

Некоторые дальнейшие осуществления согласно изобретению касаются звукового сигнала, включающего первую полосу и вторую полосу. Первая полоса представлена данными первого разрешения, и вторая полоса представлена данными второго разрешения. Второе разрешение ниже, чем первое разрешение. Данные второго разрешения основываются на данных огибающей спектра второй полосы и управляющих данных масштабирования заплаты второй полосы для масштабирования звукового сигнала в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от первой полосы звукового сигнала согласно первому алгоритму создания «заплат», и вторая заплата генерируется от первой полосы звукового сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат».

Осуществления согласно изобретению будут впоследствии рассмотрены более детально со ссылкой на приложенные рисунки, в которых:

Фиг.1 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.2а - схематическая иллюстрация генерированной первой заплаты;

Фиг.2b - схематическая иллюстрация генерированной первой и второй заплаты;

Фиг.3а - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.3b - схематическая иллюстрация синусоидального входного сигнала с ограниченным уровнем;

Фиг.3с - схематическая иллюстрация полуволнового выпрямленного синусоидального входного сигнала;

Фиг.3d - схематическая иллюстрация волнового выпрямленного синусоидального входного сигнала с ограниченным уровнем;

Фиг.4 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.5а - схематическая иллюстрация выполнения гребенки фильтров фазового вокодера;

Фиг.5b - детальная иллюстрация фильтра фиг.5а;

Фиг.5с - схематическая иллюстрация манипулирования сигналом с амплитудным кодированием и сигналом с частотным кодированием в канале фильтра фиг.5а;

Фиг.6 - схематическая иллюстрация выполнения преобразования фазового вокодера;

Фиг.7 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.8 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.9 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.10 - блок-схема устройства для получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале;

Фиг.11 - блок-схема способа генерирования сигнала с расширенной полосой пропускания от входного сигнала;

Фиг.12 - блок-схема способа получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале;

Фиг.13 - схематическая иллюстрация известного алгоритма расширения полосы пропускания.

В дальнейшем те же самые номера ссылки частично используются для объектов и функциональных узлов, имеющих те же самые или подобные функциональные свойства, и их описание относительно номера должно применяться также к другим номерам, чтобы уменьшить избыточность в описании осуществлений.

Фиг.1 показывает блок-схему устройства 100 для генерирования сигнала с расширенной полосой пропускания 122 для входного сигнала 102 согласно осуществлению изобретения. Входной сигнал 102 представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение. Устройство 100 включает генератор заплат 110, соединенный с объединителем 120. Генератор заплат 120 генерирует первую заплату 112 от первой полосы входного сигнала 102 согласно первому алгоритму создания «заплат» и генерирует вторую заплату 114 от первой полосы входного сигнала 102 согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты 114, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты 112, генерированной согласно первому алгоритму создания «заплат». Объединитель 120 объединяет первую заплату 112, вторую заплату 114 и первую полосу входного сигнала 102, чтобы получить сигнал с расширенной полосой пропускания 122. Далее, устройство 100 для генерирования сигнала с расширенной полосой пропускания 122 масштабирует входной сигнал 102 согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или масштабирует первую заплату 112 и вторую заплату 114 так, чтобы сигнал с расширенной полосой пропускания 122 удовлетворял критерию огибающей спектра.

Спектральная плотность означает, например, плотность различных частот или частотных линий в пределах частотного диапазона. Например, частотный диапазон от 0 Гц до 10 кГц, включающий частотные части с частотами 4 кГц и 8 кГц, имеет более низкую спектральную плотность, чем тот же самый частотный диапазон, включающий частотные части с частотами 2 кГц, 4 кГц, 6 кГц, 8 кГц и 10 кГц. Так как спектральная плотность первой заплаты 112 ниже, чем спектральная плотность второй заплаты 114, первая заплата 112 включает промежутки по сравнению со второй заплатой 114. Поэтому вторая заплата 114 может использоваться для заполнения этих промежутков. Так как обе заплаты основываются на первой полосе входного сигнала 102, обе заплаты связаны с характеристикой оригинального сигнала, соответствующего входному сигналу 102. Поэтому сигнал с расширенной полосой пропускания 122 может быть хорошей аппроксимацией оригинального сигнала, и субъективное качество или звуковое качество сигнала с расширенной полосой пропускания 122 может быть значительно улучшено при использовании описанной концепции. Таким образом, больше энергии может быть распределено между остающимися линиями и, например, можно избежать неестественного звука.

Например, первый алгоритм создания «заплат» может быть гармоническим алгоритмом создания «заплат». Поэтому генератор заплат 110 может генерировать первую заплату 112, включающую только частоты, которые являются целыми кратными частот первой полосы входного сигнала 102. Гармоническое расширение полосы пропускания может обеспечить хорошую аппроксимацию тональной структуры оригинального сигнала, но этот алгоритм создания «заплат» оставит промежутки между гармоническими частотами. Эти промежутки могут быть заполнены второй заплатой. Например, второй алгоритм создания «заплат» может быть смешивающим алгоритмом создания «заплат», что означает, что генератор заплат 110 может генерировать вторую заплату 114, включающую целые кратные частот первой полосы входного сигнала 102 (гармонические частоты) и частоты, которые не являются целыми кратными частот первой полосы входного сигнала 102 (негармонические частоты). Негармонические частоты могут использоваться для заполнения промежутков первой заплаты 112. Можно также объединить целую вторую заплату 114 (включая гармонические частоты) с первой заплатой 112. В этом примере усиление гармонических частот в результате соединения гармонических частотных частей первой заплаты 112 и второй заплаты 114 может приниматься во внимание соответствующим масштабированием первой заплаты 112 и/или второй заплаты 114.

Первая заплата 112 и вторая заплата 114 включают, по крайней мере, частично тот же самый частотный диапазон. Например, первая заплата 112 включает частотный диапазон от 4 кГц до 8 кГц, а вторая заплата 114 включает частотный диапазон от 6 кГц до 10 кГц. В некоторых осуществлениях согласно изобретению подавленная НЧ-составляющая частоты первой заплаты равна подавленной НЧ-составляющей частоты второй заплаты, а подавленная ВЧ-составляющая частоты первой заплаты 112 равна подавленной ВЧ-составляющей частоты второй заплаты 114. Например, обе заплаты включают частотный диапазон от 4 кГц до 8 кГц.

Фиг.2а и 2b показывают пример первой заплаты 112 согласно первому алгоритму создания «заплат» 212 и второй заплаты 114 согласно второму алгоритму создания «заплат» 214. Для лучшей иллюстрации фиг.2а показывает только первые заплаты 112, и фиг.2b показывает первые заплаты 112 и соответствующие вторые заплаты 114. Фиг.2а иллюстрирует пример 200 для первой полосы 202 входного сигнала 102 и двух первых заплат 112, генерированных согласно первому алгоритму создания «заплат» 212. В этом примере заплата включает ту же самую полосу пропускания, что и первая полоса 202 входного сигнала 102. Полоса пропускания может также быть различной. Подавленная ВЧ-составляющая 220 первой полосы 202 входного сигнала 102 обозначена частотой «Xover» (частота разделения). В примере, показанном на фиг.2а, заплаты начинаются на частоте, равной кратному частоты разделения Xover 220. Частотные линии в пределах первых заплат 112 являются целыми кратными частотных линий первой полосы 202 входного сигнала 102 и могут, например, генерироваться фазовым вокодером. Эти первые заплаты 112 включают промежутки в показателях недостающих частотных линий по сравнению с первой полосой 202 входного сигнала 102.

Фиг.2b дополнительно показывает пример 250 двух соответствующих вторых заплат 114. Эти заплаты генерируются согласно второму алгоритму создания «заплат» 214 и включают гармонические и негармонические частоты. Негармонические частотные линии могут использоваться для заполнения промежутков первых заплат 112. Частотные линии вторых заплат 114 могут генерироваться, например, нелинейным искажением.

Таким образом, промежутки могут заполняться не произвольно как, например, при заполнении промежутков шумом. Промежутки заполняются, основываясь на данных первого разрешения первой полосы входного сигнала и, следовательно, основываясь на оригинальном сигнале.

Первая полоса входного сигнала 102 может представлять, например, низкочастотную полосу оригинального звукового сигнала, кодируемого с высоким разрешением. Вторая полоса входного сигнала 102 может представлять, например, высокочастотную полосу оригинального звукового сигнала и может квантоваться одним или несколькими параметрами как, например, данные огибающей спектра, данные о шуме и/или недостающие гармонические данные с низким разрешением. Оригинальный звуковой сигнал может быть, например, звуковым сигналом, зарегистрированным микрофоном до обработки или кодирования.

Масштабирование входного сигнала согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» означает, например, что входной сигнал масштабируется один раз согласно первому алгоритму создания «заплат» прежде, чем генерируется первая заплата, и затем первая заплата генерируется, основываясь на масштабированном входном сигнале, и что входной сигнал масштабируется один раз согласно второму алгоритму создания «заплат» прежде, чем генерируется вторая заплата, и затем вторая заплата генерируется, основываясь на масштабированном входном сигнале, так, чтобы после объединения первой заплаты, второй заплаты и первой полосы входного сигнала сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра. Альтернативно, первая заплата и вторая заплата масштабируются после их генерирования так, что сигнал с расширенной полосой пропускания также удовлетворяет критерию огибающей спектра. Также возможно масштабирование входного сигнала согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» вместе с масштабированием первой заплаты и второй заплаты.

Объединитель 120 может быть, например, сумматором, а сигнал с расширенной полосой пропускания 122 может быть взвешенной суммой первой заплаты 112, второй заплаты 114 и первой полосы входного сигнала 102.

Удовлетворение критерию огибающей спектра означает, например, что огибающая спектра сигнала с расширенной полосой пропускания основывается на данных огибающей спектра, содержащихся во входном сигнале. Данные огибающей спектра могут генерироваться кодирующим устройством и могут представлять вторую полосу оригинального сигнала. Таким образом, огибающая спектра сигнала с расширенной полосой пропускания может быть хорошей аппроксимацией огибающей спектра оригинального сигнала.

Устройство 100 может также включать основной декодер для декодирования первой полосы входного сигнала 102.

Генератор заплат 110 и объединитель 120 могут быть, например, специально разработанными аппаратными средствами или частью процессора или микроконтроллера, или могут быть компьютерной программой, формируемой для запуска на компьютере или микроконтроллере. Устройство 100 может быть частью декодера или звукового декодера.

Фиг.3а показывает блок-схему устройства 300 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. В этом примере генератор заплат 110 включает фазовый вокодер 310 для генерирования первой заплаты и ограничитель амплитуды 320 для того, чтобы генерировать вторую заплату 114. Фазовый вокодер 310 и ограничитель амплитуды 320 соединены с объединителем 120. Фазовый вокодер 310 может расширять первую полосу входного звукового сигнала 102 для генерирования первой заплаты 112, включающей гармонические частоты. На этапе нелинейной обработки ограничитель амплитуды 320 может ограничивать входной сигнал 102, чтобы генерировать вторую заплату 114, включающую гармонические и негармонические частоты. Альтернативно ограничителю амплитуды 320 также полуволновый выпрямитель, волновой выпрямитель, микшер или диод, используемые в квадратной области характеристической кривой, могут использоваться для генерирования негармонических частот, основанных на входном сигнале 102, на стадии нелинейной обработки.

Фиг.3b, 3с и 3d показывают примеры сигнала с ограничением уровня и/или выпрямленного входного сигнала 102 для генерирования негармонических частот. Фиг.3b показывает схематическую иллюстрацию 350 синусоидального входного сигнала с ограничением уровня 102. При ограничении сигнала появляются точки разрыва в форме резких изменений наклона сигнала 380, и генерируются гармонические и негармонические части с более высокими частотами.

Альтернативно, фиг.3с показывает схематическую иллюстрацию 360 полуволнового выпрямленного синусоидального входного сигнала 102, также вызывающего точки разрыва 380.

Далее, возможна комбинация ограничения и выпрямления. Фиг.3d показывает схематическую иллюстрацию 370 сигнала с ограничением уровня и волнового выпрямленного синусоидального входного сигнала 102, вызывающего различные точки разрыва 380.

При ограничении и/или выпрямлении или применении других способов нелинейной обработки производящей точки разрыва 380 может генерироваться широкий спектр различных частот. Поэтому заплата, генерированная согласно такому алгоритму создания «заплат», может иметь высокую спектральную плотность.

Фиг.4 показывает блок-схему устройства 400 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. Устройство 400 подобно устройству, показанному на фиг.3а, но дополнительно включает селектор спектральных линий 410. Фазовый вокодер 310 и ограничитель амплитуды 320 соединены с селектором спектральных линий 410, а селектор спектральных линий 410 соединен с объединителем 120. Селектор спектральных линий 410 может выбрать множество частотных линий второй заплаты 114, чтобы получить измененную вторую заплату 414, которая может быть дополнительной к первой заплате. Частотная линия второй заплаты 114 может быть выбрана, если отсутствует соответствующая частотная линия первой заплаты 112. Другими словами, селектор спектральных линий 410 выбирает частотные линии второй заплаты 114 для заполнения промежутков первой заплаты 112 и может игнорировать частоты второй заплаты 114, уже содержащиеся в первой заплате 112. Таким образом, измененная вторая заплата 414 может включать промежутки в частотах, уже содержащихся в первой заплате 112.

В этом примере объединитель 120 объединяет первую заплату 112, измененную вторую заплату 414 и первую полосу входного сигнала 102.

Селектор спектральных линий 410 может быть, например, частью генератора заплат 110 (как показано на фиг.4) или отдельным узлом.

В дальнейшем со ссылкой на Фиг.5 и 6 показаны возможные исполнения фазового вокодера 310 согласно данному изобретению. Фиг.5а показывает исполнение гребенки фильтров фазового вокодера, где звуковой сигнал подается на вход 500 и получается на выходе 510. В частности, каждый канал схематической гребенки фильтров, проиллюстрированной на фиг.5а, включает полосовой фильтр 501 и последующий осциллятор 502. Выходные сигналы всех осцилляторов из каждого канала объединяются объединителем, который, например, исполняется как сумматор и обозначается цифрой 503, чтобы получить выходной сигнал. Каждый фильтр 501 осуществляется таким образом, что он обеспечивает сигнал с амплитудным кодированием с одной стороны и сигнал с частотным кодированием с другой стороны. Сигнал с амплитудным кодированием и сигнал с частотным кодированием - сигналы времени, иллюстрирующие увеличение амплитуды в фильтре 501 с течением времени, в то время как сигнал с частотным кодированием представляет увеличение частоты сигнала, отфильтрованного фильтром 501.

Схематическое устройство фильтра 501 проиллюстрировано на фиг.5b. Каждый фильтр 501 фиг.5а может быть расположен как на фиг.5b, где, однако, только частоты fi, подаваемые двум входным микшерам 551 и сумматору 552, отличаются от канала к каналу. Микшированные выходные сигналы микшеров 551 оба отфильтрованы фильтрами нижних частот 553, где сигналы нижних частот различны, поскольку они были генерированы частотами местного осциллятора (частоты LO), которые не совпадают по фазе на 90°. Верхний фильтр нижних частот 553 обеспечивает квадратурный сигнал 554, в то время как нижний фильтр 553 обеспечивает совпадающий по фазе сигнал 555. Эти два сигнала, то есть Q и I, поставляются координатному преобразователю 556, который генерирует амплитудно-фазовое представление от прямоугольного представления. Магнитудный сигнал или амплитудный сигнал соответственно фиг.5а с течением времени выводится на выходе 557. Фазовый сигнал поставляется устройству для развертывания фазы 558. На выходе элемента 558 больше нет никакого фазового значения, которое всегда находится между 0 и 360°, но имеется фазовое значение, которое линейно увеличивается. Это «развернутое» фазовое значение поставляется фазовому/частотному преобразователю 559, который может, например, быть исполнен как простой калькулятор разности фаз, который вычитает фазу предыдущей точки во времени из фазы в данной точке во времени, чтобы получить частотное значение для данной точки во времени, или любые другие средства для получения аппроксимации фазовой производной. Это частотное значение добавляется к постоянному частотному значению fi канала фильтра i, чтобы получить изменяющееся во времени частотное значение на выходе 560. Частотное значение на выходе 560 имеет постоянную составляющую, равную fi , и переменную составляющую, равную девиации частоты, на которую данная частота сигнала в канале фильтра отклоняется от средней частоты fi.

Таким образом, как проиллюстрировано на Фиг.5а и 5b, фазовый вокодер достигает разделения спектральной информации и временной информации. Спектральная информация содержится в специальном канале или в частоте fi, которая обеспечивает прямую часть частоты для каждого канала, в то время как временная информация содержится в девиации частоты или в эволюции магнитуды с течением времени соответственно.

Фиг.5с показывает манипуляцию, как она выполняется, для генерирования первой заплаты согласно изобретению, в частности посредством использования фазового вокодера 310 и, более подробно, вставленного там, где расположены пунктирные линии проиллюстрированной схемы на фиг.5а.

Для масштабирования времени, например, амплитудные сигналы A(t) в каждом канале или частоте сигналов f(t) в каждом канале могут быть уменьшены в 10 раз или интерполированы. В целях перемещения, поскольку это полезно для данного изобретения, выполняется интерполяция, то есть временное расширение или распространение сигналов A(t) и f(t), чтобы получить сигналы распространения A'(t) и f(t), где интерполяция регулируется фактором распространения 598. Фактор распространения может быть отобран, например, так, чтобы фазовый вокодер генерировал гармонические частоты. Посредством интерполирования фазового изменения, то есть значения перед дополнением постоянной частоты сумматором 552, частота каждого индивидуального осциллятора 502 на фиг.5а не меняется. Временное изменение полного звукового сигнала замедляется, однако, фактором 2. В результате получается распространенный во времени тон, имеющий оригинальный основной тон, то есть оригинальную основную волну с ее гармониками.

Посредством выполнения обработки сигнала, проиллюстрированной на фиг.5с, звуковой сигнал может быть сокращен до его оригинальной длительности, например, посредством децимации фактора 2, в то время как все частоты одновременно удваиваются. Это приводит к перемещению основного тона фактором 2, где, однако, получается звуковой сигнал, который имеет ту же самую длину, что и оригинальный звуковой сигнал, то есть то же самое число сэмплов.

В качестве альтернативы выполнению гребенки фильтров, проиллюстрированной на фиг.5а, может также выполняться преобразование фазового вокодера, как изображено на фиг.6. Здесь, звуковой сигнал 698 подается в процессор FFT, или более широко, в процессор кратковременного преобразования Фурье (STFT) 600 в качестве последовательности временных выборок. Процессор FFT 600 осуществляется, чтобы выполнить временную обработку звукового сигнала методом окна, чтобы затем посредством последующего FFT вычислить магнитудный спектр и также фазовый спектр, где это вычисление выполняется для последовательных спектров, которые соединены с блоками звукового сигнала, которые сильно перекрываются.

В крайнем случае для каждого нового сэмпла звукового сигнала может быть вычислен новый спектр, где новый спектр также может быть вычислен, например, только для каждого двадцатого нового сэмпла. Это расстояние 'а' в сэмплах между двумя спектрами предпочтительно производится контроллером 602. Контроллер 602 далее осуществляется, чтобы снабжать процессор IFFT (быстрое обратное преобразование Фурье) 604, который осуществляется, чтобы выполнять операцию наложения - добавления. В частности, процессор IFFT 604 осуществляется таким образом, что он выполняет обратное кратковременное преобразование Фурье посредством выполнения одного IFFT на спектр, основанный на магнитудном спектре и фазовом спектре, чтобы затем выполнить операцию наложения - добавления, чтобы получить результирующий временной сигнал. Операция наложения - добавления выполняется, чтобы устранить блокирующее действие, введенное окном анализа.

Временное распространение сигнала времени достигается расстоянием 'b' между двумя спектрами, поскольку они обрабатываются процессором IFFT 604, которое больше, чем расстояние 'а' между спектрами, используемыми при генерировании спектров FFT. Основная идея состоит в том, чтобы распространить звуковой сигнал посредством простого размещения обратных FFT дальше друг от друга, чем анализирующих FFTs. В результате спектральные изменения в синтезируемом звуковом сигнале происходят более медленно, чем в оригинальном звуковом сигнале.

Без изменения фазового масштаба в блоке 606 это, однако, приведет к возникновению частотных артефактов. Когда, например, рассматривается один единственный элемент разрешения по частоте, для которого выполняются последовательные фазовые значения в 45°, это подразумевает, что сигнал в пределах этой гребенки фильтров увеличивается по фазе со скоростью 1/8 цикла, то есть 45° на временной интервал, где временной интервал является временным интервалом между последовательными FFTs. Если теперь обратные FFTs располагаются дальше друг от друга, это означает, что 45° увеличение фазы происходит на более длинном временном интервале. Это означает, что частота этой части сигнала была непреднамеренно изменена. Чтобы устранить этот артефакт, изменяется масштаб фазы посредством того же самого фактора, которым звуковой сигнал распространялся во времени. Фаза каждого спектрального значения FFT, таким образом, увеличивается на фактор b/а так, чтобы устранить эту непреднамеренную модификацию частоты.

В то время, как в осуществлении, проиллюстрированном на фиг.5с, распространение посредством интерполяции управляющих сигналов амплитуды/частоты было достигнуто для одного осциллятора сигналов в выполнении гребенки фильтров фиг.5а, распространение на фиг.6 достигается расстоянием между двумя спектрами IFFT, которое больше, чем расстояние между двумя спектрами FFT, то есть 'b' больше, чем 'а', где, однако, для предотвращения появления артефакта выполняется изменение масштаба фазы согласно отношению 'b/а'. Расстояние 'b' может быть выбрано, например, так, чтобы фазовый вокодер генерировал гармонические частоты.

Фиг.7 показывает блок-схему устройства 700 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. Устройство 700 подобно устройству, показанному на фиг.1, но включает регулятор мощности 710, первое устройство регулирования мощности 720 и второе устройство регулирования мощности 730. Регулятор мощности 710 соединен с первым устройством регулирования мощности 720 и со вторым устройством регулирования мощности 730. Первое устройство регулирования мощности 720 и второе устройство регулирования мощности 730 соединены с генератором заплат 110. Регулятор мощности 710 может управлять масштабированием входного сигнала согласно первому и второму алгоритму создания «заплат», основанному на данных огибающей спектра, содержащихся во входном сигнале, и основанному на управляющих данных масштабирования заплат, содержащихся во входном сигнале. Альтернативно, вместо управляющих данных масштабирования заплаты, содержащихся во входном сигнале, может использоваться, по крайней мере, один сохраненный параметр управления масштабированием заплаты. Параметр управления масштабированием заплаты может сохраняться в памяти параметра управления масштабированием заплаты, которая может быть частью регулятора мощности 710 или отдельным узлом. Первое устройство регулирования мощности 720 может масштабировать входной сигнал 102 согласно первому алгоритму создания «заплат», и второе устройство регулирования мощности 730 может масштабировать входной сигнал 102 согласно второму алгоритму создания «заплат». Другими словами, входной сигнал 102 может быть предварительно обработан так, чтобы могла быть генерирована первая и вторая заплата так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра. Для этого данные огибающей спектра могут определять огибающую спектра сигнала с расширенной полосой пропускания 122, а управляющие данные масштабирования заплаты или параметр управления масштабированием заплаты могут установить соотношение между первой заплатой 112 и второй заплатой 114 или могут установить абсолютные значения первой заплаты 112 и/или второй заплаты 114. Первое устройство регулирования мощности 720 и второе устройство регулирования мощности 730 могут быть частью регулятора мощности 710 или отдельными узлами, как показано на фиг.7. Регулятор мощности 710 может быть частью генератора заплаты 110 или отдельным узлом, как также показано на фиг.7. Устройства регулирования мощности 720, 730 могут быть, например, усилителями или фильтрами, управляемыми регулятором мощности 710.

Альтернативно, масштабирование выполняется после генерирования заплат. Соответственно фиг.8 показывает блок-схему устройства 800 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. Устройство 800 подобно устройству, показанному на фиг.7, но устройства регулирования мощности 720, 730 расположены между генератором заплат 110 и объединителем 120. В этом примере генератор заплат 110 соединен с первым устройством регулирования мощности 720 и соединен со вторым устройством регулирования мощности 730. Первое устройство регулирования мощности 720 и второе устройство регулирования мощности 730 соединены с объединителем 120. Таким образом, первая заплата 112 может быть масштабирована первым устройством регулирования мощности 720 согласно первому алгоритму создания «заплат», и вторая заплата 114 может быть масштабирована вторым устройством регулирования мощности 730 согласно второму алгоритму создания «заплат». Устройства регулирования мощности, управляемые регулятором мощности 710, снова основываются на данных огибающей спектра и на управляющих данных масштабирования заплаты или параметре управления масштабированием заплаты, как описано выше.

Альтернативно, возможно также масштабирование или регулирование мощности только одной из двух заплат, сопровождаемое объединением заплат посредством объединителя 120 и масштабированием объединенных заплат до объединения объединенных заплат с первым диапазоном входного сигнала 102. Другими словами, сначала одна заплата может быть масштабирована, чтобы реализовать предварительно определенное соотношение (например, основанное на управляющих данных масштабирования заплаты) между двумя заплатами, а затем объединенные заплаты масштабируются (например, основанное на данных огибающей спектра), чтобы удовлетворять критерию огибающей спектра.

Управляющие данные масштабирования заплаты могут включать, например, простой фактор или множество параметров для масштабирования распределения мощности. Управляющие данные масштабирования заплаты могут указывать, например, соотношение мощностей между первой заплатой и второй заплатой на полной второй полосе или полной высокочастотной полосе или абсолютное значение мощности первой заплаты и/или второй заплаты на полной второй полосе или полной высокочастотной полосе, и могут быть представлены, по крайней мере, одним параметром. Альтернативно, данные масштабирования заплаты включают фактор для каждого множества поддиапазонов, составляющих вторую полосу или высокочастотную полосу, например, подобные данным огибающей спектра на поддиапазон при применении репликации спектральной полосы пропускания. Альтернативно, данные масштабирования заплаты могут также показывать передаточную функцию фильтра. Например, параметры передаточной функции фильтра для масштабирования первой заплаты и/или параметры передаточной функции фильтра для масштабирования второй заплаты могут содержаться во входном сигнале. Таким образом, параметры могут представлять функцию частоты. Другой альтернативой могут быть параметры управления масштабированием заплаты, представляющие дифференциальную функцию первой заплаты и второй заплаты. Согласно этим примерам масштабирование входного сигнала или масштабирование первой заплаты и второй заплаты может основываться на управляющих данных масштабирования заплаты, включающих, по крайней мере, один параметр.

Фиг.9 показывает блок-схему устройства 900 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. Устройство 900 подобно устройству, показанному на фиг.8, но включает, дополнительно, сумматор шума 910, сумматор недостающих гармоник 920, устройство регулирования мощности шума 940 и устройство регулирования мощности недостающих гармоник 950. Сумматор шума 910 соединен с устройством регулирования мощности шума 940, который соединен с объединителем 120. Сумматор недостающих гармоник 920 соединен с устройством регулирования мощности недостающих гармоник 950, которое соединено с объединителем 120. Далее, регулятор мощности 710 соединен с устройством регулирования мощности шума 940 и устройством регулирования мощности недостающих гармоник 950. Сумматор шума 910 может генерировать шумовую заплату 912, основанную на шумовых данных, содержащихся во входном сигнале 102.

Шумовая заплата 912 может масштабироваться устройством регулирования мощности шума 940. Регулятор мощности 710 может управлять устройством регулирования мощности шума 940, основанного на данных огибающей спектра и/или данных масштабирования шума, содержащихся во входном сигнале 102. Таким образом, шум оригинального сигнала может быть аппроксимирован, чтобы улучшить звуковое качество сигнала с расширенной полосой пропускания.

Сумматор недостающих гармоник 920 может генерировать заплату недостающих гармоник 922, основанную на данных недостающих гармоник, содержащихся во входном сигнале. Заплата недостающих гармоник 922 может содержать гармонические частоты, которые могут появиться только в высокочастотной полосе оригинального сигнала и поэтому не могут быть воспроизведены, если доступна только информация низкочастотной полосы оригинального сигнала в показателях первой полосы входного сигнала 102. Данные недостающих гармоник могут предоставлять информацию об этих недостающих гармониках. Заплата недостающих гармоник 922 может масштабироваться устройством регулирования мощности недостающих гармоник 950. Регулятор мощности 710 может управлять устройством регулирования мощности недостающих гармоник 950, основанных на данных огибающей спектра или основанных на данных масштабирования недостающих гармоник, содержащихся во входном сигнале 102.

Объединитель 120 может объединять первую заплату 112, вторую заплату 114, первую полосу входного сигнала 102, шумовую заплату 912 и заплату недостающей гармоники 922, чтобы получить сигнал с расширенной полосой пропускания 122. Регулятор мощности 710 в комбинации с устройством регулирования мощности может масштабировать первую заплату 112, вторую заплату 114, шумовую заплату 912 и заплату недостающей гармоники 922, основанные на данных огибающей спектра, так, чтобы удовлетворять критерию огибающей спектра.

Фиг.10 показывает блок-схему устройства 1000 для получения сигнала с уменьшенной полосой пропускания 1032, основанного на входном сигнале 1002 согласно осуществлению изобретения. Устройство 1000 включает определитель данных огибающей спектра 1010, генератор управляющих данных масштабирования заплаты 1020 и выходной интерфейс 1030. Определитель данных огибающей спектра 1010 и генератор управляющих данных масштабирования заплаты 1020 соединены с выходным интерфейсом 1030. Определитель данных огибающей спектра 1010 может определять данные огибающей спектра 1012, основанные на высокочастотной полосе входного сигнала 1002. Генератор управляющих данных масштабирования заплаты 1020 может генерировать управляющие данные масштабирования заплаты 1022 для масштабирования сигнала с уменьшенной полосой пропускания 1032 в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, произведенный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания 1032 согласно первому алгоритму создания «заплат», и вторая заплата генерируется от первой полосы сигнала с уменьшенной полосой пропускания 1032 согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Выходной интерфейс 1030 объединяет низкочастотную полосу входного сигнала 1002, данные огибающей спектра 1012 и управляющие данные масштабирования заплаты 1022, чтобы получить сигнал с уменьшенной полосой пропускания 1032. Далее, выходной интерфейс 1030 обеспечивает сигнал с уменьшенной полосой пропускания 1032 для передачи или хранения.

Устройство 1000 может также включать основное кодирующее устройство для кодирования низкочастотной полосы входного сигнала. Основное кодирующее устройство может быть, например, дифференциальным кодирующим устройством, энтропийным кодирующим устройством или перцепционным звуковым кодирующим устройством.

Устройство 1000 может быть частью кодирующего устройства, формируемого, чтобы обеспечить сигнал для декодера, описанного выше. Управляющие данные масштабирования заплаты 1022 могут включать, например, простой фактор или множество параметров для масштабирования распределения мощности. Управляющие данные масштабирования заплаты могут показывать, например, соотношение мощностей между первой заплатой и второй заплатой на полной высокочастотной полосе или абсолютную величину мощности первой заплаты и/или второй заплаты на полной высокочастотной полосе и могут быть представлены, по крайней мере, одним параметром. Альтернативно, данные масштабирования заплаты включают фактор, определенный для каждого множества поддиапазонов, образующих высокочастотную полосу, например, подобной данным огибающей спектра на поддиапазон при применении репликации спектральной полосы пропускания. Альтернативно, данные масштабирования заплаты могут также показать передаточную функцию фильтра. Например, параметры передаточной функции фильтра для масштабирования первой заплаты и/или параметры передаточной функции фильтра для масштабирования второй заплаты могут быть определены для того, чтобы генерировать управляющие данные масштабирования заплаты. Таким образом, параметры могут быть генерированы, основываясь на функции частоты. Другая альтернатива может генерироваться параметрами управления масштабированием заплаты, представляющими дифференциальную функцию первой заплаты и второй заплаты.

Управляющие данные масштабирования заплаты 1022 могут быть генерированы посредством анализа входного сигнала 1002 и выбора параметров управления масштабированием заплаты, хранящихся в памяти параметра управления масштабированием заплаты, основанного на анализе входного сигнала 1002, чтобы получить управляющие данные масштабирования заплаты 1022.

Альтернативно, генерирование управляющих данных масштабирования заплаты 1022 может быть реализовано способом анализа через синтез. Для этого генератор управляющих данных масштабирования заплаты 1020 может включать, дополнительно, генератор заплат (как описано для декодера) и компаратор. Генератор заплат может генерировать первую заплату от низкочастотной полосы входного сигнала 1002 согласно первому алгоритму создания «заплат», и вторую заплату от низкочастотной полосы входного сигнала 1002 согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», может быть выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Компаратор может сравнивать первую заплату, вторую заплату и высокочастотную полосу входного сигнала, чтобы получить управляющие данные масштабирования заплаты 1022. Другими словами, концепция, описанная выше, также применима к устройству 1000. Таким образом, устройство 1000 может извлечь управляющие данные масштабирования заплаты 1022 посредством сравнения заплат или объединения заплат с входным сигналом, который может, например, быть оригинальным звуковым сигналом. Дополнительно, устройство 1000 может также включать селектор спектральных линий, регулятор мощности, сумматор шума и/или сумматор недостающих гармоник, как описано выше. Таким образом, также шумовые данные, управляющие данные масштабирования шумовой заплаты, недостающие гармонические данные и/или управляющие данные масштабирования недостающих гармонических заплат могут быть извлечены способом анализа через синтез.

Некоторые осуществления согласно изобретению касаются звукового сигнала, включающего первую полосу и вторую полосу. Первая полоса представлена данными первого разрешения, а вторая полоса представлена данными второго разрешения, где второе разрешение ниже, чем первое разрешение. Данные второго разрешения основываются на данных огибающей спектра второй полосы и управляющих данных масштабирования заплаты второй полосы для масштабирования звукового сигнала в декодере или для масштабирования первой заплаты и второй заплаты декодером, так, чтобы сигнал с расширенной полосой пропускания, произведенный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от первой полосы звукового сигнала согласно первому алгоритму создания «заплат», а вторая заплата генерируется от первой полосы звукового сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат».

Звуковой сигнал может быть, например, сигналом с уменьшенной полосой пропускания, основанным на оригинальном звуковом сигнале. Первая полоса звукового сигнала может представлять низкочастотную полосу оригинального звукового сигнала, кодированного с высоким разрешением. Вторая полоса звукового сигнала может представлять высокочастотную полосу оригинального звукового сигнала и может квантоваться, по крайней мере, двумя параметрами: параметр огибающей спектра, представленный данными огибающей спектра, и параметр управления масштабированием заплаты, представленный управляющими данными масштабирования заплаты. Основанный на таком звуковом сигнале декодер согласно концепции, описанной выше, может генерировать сигнал с расширенной полосой пропускания, обеспечивающий хорошую аппроксимацию оригинального звукового сигнала с улучшенным звуковым качеством, по сравнению с известными концепциями.

Фиг.11 показывает блок-схему способа 1100 для генерирования сигнала с расширенной полосой пропускания от входного сигнала согласно осуществлению изобретения. Входной сигнал представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения, второе разрешение ниже, чем первое разрешение. Способ 1100 включает генерирование 1110 первой заплаты, генерирование 1120 второй заплаты, масштабирование 1130 входного сигнала или масштабирование 1130 первой заплаты и второй заплаты и объединение 1140 первой заплаты, второй заплаты и первой полосы входного сигнала, чтобы получить сигнал с расширенной полосой пропускания. Первая заплата генерируется 1110 от первой полосы входного сигнала согласно первому алгоритму создания «заплат», а вторая полоса генерируется 1120 от первой полосы входного сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной 1120 согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной 1110 согласно первому алгоритму создания «заплат». Входной сигнал может быть масштабирован 1130 согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат», или первая заплата и вторая заплата могут быть масштабированы 1130 так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра.

Далее, способ 1100 может быть расширен шагами согласно концепции, описанной выше. Способ 1100 может быть, например, реализован как компьютерная программа для запуска на компьютере или микроконтроллере.

Фиг.12 показывает блок-схему способа 1200 для предоставления сигнала с уменьшенной полосой пропускания, основанного на входном сигнале согласно осуществлению изобретения. Способ 1200 включает определение 1210 данных огибающей спектра, основанных на высокочастотной полосе входного сигнала, генерирование 1220 управляющих данных масштабирования заплаты, объединение 1230 низкочастотной полосы входного сигнала, данных огибающей спектра и управляющих данных масштабирования заплаты, чтобы получить сигнал с уменьшенной полосой пропускания, и обеспечение 1240 сигнала с уменьшенной полосой пропускания для передачи или хранения. Управляющие данные масштабирования заплаты генерируются 1220 для масштабирования сигнала с уменьшенной полосой пропускания в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно первому алгоритму создания «заплат», а вторая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат».

Далее, способ 1200 может быть расширен шагами согласно концепции, описанной выше. Способ 1200 может быть, например, реализован как компьютерная программа для запуска на компьютере или микроконтроллере.

Некоторые осуществления согласно изобретению касаются устройства для генерирования сигнала с расширенной полосой пропускания посредством использования фазового вокодера для расширения полосы пропускания, объединенного с нелинейным искажением или шумовым заполнением для получения более плотного спектра. При применении фазового вокодера для спектрального распространения частотные линии перемещаются дальше друг от друга. Если в спектре существуют промежутки, например, в результате квантизации, они даже увеличиваются при распространении. При адаптации энергии остающиеся линии в спектре получают слишком много энергии. Это предотвращается посредством заполнения промежутков или шумом, или далее гармониками, которые могут быть получены нелинейным искажением сигнала. Таким образом, больше энергии может быть распределено между остающимися линиями. При концентрации энергии в полосах только на нескольких частотных линиях возникает неестественный или металлический звук. Энергия ранее существовавшего большего количества полос собирается на остающихся.

Если в спектре нет никаких промежутков, но, по крайней мере, присутствует шум, часть энергии остается на минимальном уровне шума. При применении нелинейного искажения спектр может быть снова уплотнен, с одной стороны, шумом, произведенным искажением, с другой стороны, дальнейшими гармоническими частями, управляемыми соответствующим выбором части сигнала, подлежащей искажению.

Сигнал с расширенной полосой пропускания тогда может быть, например, взвешенной суммой фильтрованного искаженного сигнала и сигналом, который был генерирован при помощи фазового вокодера. Другими словами, сигнал с расширенной полосой пропускания может быть взвешенной суммой первой заплаты, второй заплаты и первой полосы входного сигнала.

Некоторые осуществления согласно изобретению касаются концепции, подходящей для всех звуковых применений, где полная полоса пропускания недоступна. Например, для передачи по радио звукового содержания при помощи цифровых радио-услуг, Интернет-потока или других звуковых коммуникационных применений может использоваться описанная концепция.

При описании этого изобретения в терминах нескольких осуществлений существуют изменения, перестановки и эквиваленты, которые находятся в пределах области этого изобретения. Следует также заметить, что имеется много альтернативных методов осуществления способов и структур данного изобретения. Поэтому предполагается, что приложенные ниже пункты патентной формулы интерпретируются как включающие все такие изменения, перестановки и эквиваленты, которые находятся в пределах истинной сущности и объема данного изобретения.

В частности, указано, что в зависимости от условий изобретательная схема может также быть осуществлена в программном обеспечении. Выполнение может быть на цифровом носителе данных, в частности на дискете или компакт-диске, с электронно-считываемыми управляющими сигналами, способными взаимодействовать с программируемой компьютерной системой так, чтобы соответствующий способ был реализован. Обычно изобретение также состоит из компьютерного программного продукта с управляющей программой, сохраненной на машиночитаемом носителе для выполнения изобретательного способа, когда компьютерный программный продукт выполнен на компьютере. Другими словами, изобретение может также быть реализовано как компьютерная программа с управляющей программой для выполнения способа, когда компьютерный программный продукт выполнен на компьютере.

Класс G10L21/02 усиление речи, например подавление шума, нейтрализация эхо-сигнала

устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы -  патент 2527735 (10.09.2014)
низведение параметров последовательности битов sbr -  патент 2526745 (27.08.2014)
аудио кодер и декодер, увеличивающий полосу частот -  патент 2523035 (20.07.2014)
способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала -  патент 2520420 (27.06.2014)
устройство подавления акустического эха и фронтальное устройство конференцсвязи -  патент 2520359 (20.06.2014)
усовершенствованное гармоническое преобразование на основе блока поддиапазонов -  патент 2518682 (10.06.2014)
устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик -  патент 2507608 (20.02.2014)
устройство и способ формирования синтезированного аудиосигнала и кодирования аудиосигнала -  патент 2501097 (10.12.2013)
устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи -  патент 2498422 (10.11.2013)
устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи -  патент 2498421 (10.11.2013)
Наверх