манипулирование зоной наилучшего восприятия для многоканального сигнала

Классы МПК:H04S7/00 Индикаторные устройства; устройства управления, например уравновешенного (балансного) управления
Автор(ы):,
Патентообладатель(и):КОНИНКЛЕЙКЕ ФИЛИПС ЭЛЕКТРОНИКС Н.В. (NL)
Приоритеты:
подача заявки:
2007-09-10
публикация патента:

Изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала, в частности, для многоканального сигнала MPEG системы «окружающего звука». Техническим результатом является возможность осуществлять манипулирования уменьшенной сложности зоной наилучшего восприятия. Указанный результат достигается тем, что устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала содержит приемник (201) для приема N-канального аудиосигнала, N<M, параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования. 7 н. и 13 з.п. ф-лы, 5 ил., 2 табл. манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Формула изобретения

1. Устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем упомянутое устройство содержит:

- приемник (201) для приема N-канального аудиосигнала, N<M;

- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;

- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

2. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации передне-заднего баланса посредством модификации первого пространственного параметра повышающего микширования, указывающего разность интенсивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

3. Устройство по п.2, в котором первым пространственным параметром повышающего микширования является межканальная разность интенсивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

4. Устройство по п.3, в котором модифицирующее средство (207) выполнено с возможностью модификации показателя квантования межканальной разности интенсивностей.

5. Устройство по п.2, в котором модифицирующее средство (207) дополнительно выполнено с возможностью масштабирования по меньшей мере одного переднего канала таким образом, что вариация отношения энергии переднего бокового канала к энергии центрального канала для пространственного М-канального аудиосигнала, вызванное модификацией первого параметра, уменьшается.

6. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации дисперсии центра посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между центральным каналом и по меньшей мере одним боковым каналом.

7. Устройство по п.6, в котором первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

8. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации лево-правого баланса посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между по меньшей мере одним правым боковым каналом и по меньшей мере одним левым боковым каналом.

9. Устройство по п.8, в котором первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

10. Устройство по п.1, в котором модифицирующее средство (207) выполнено с возможностью модификации передне-задней дисперсии посредством модификации первого пространственного параметра повышающего микширования, указывающего относительную корреляцию между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

11. Устройство по п.10, в котором первым пространственным параметром повышающего микширования является коэффициент межканальной корреляции между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

12. Устройство по п.1, в котором N-канальный аудиосигнал соответствует понижающему микшированию пространственного М-канального аудиосигнала, и приемник (201) выполнен с возможностью принятия пространственных параметров повышающего микширования кодера, связывающих низведенный N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, и параметрическое средство (203) выполнено с возможностью определения пространственных параметров повышающего микширования из пространственных параметров повышающего микширования кодера.

13. Устройство по п.1, в котором параметрическое средство (203) выполнено с возможностью определения пространственных параметров повышающего микширования из характеристик сигналов каналов N-канального аудиосигнала.

14. Устройство по п.1, в котором N-канальным аудиосигналом является сигнал окружающего звука MPEG.

15. Приемник (103) для принятия пространственного М-канального аудиосигнала, причем упомянутый приемник (103) содержит:

- приемник (201) для принятия N-канального аудиосигнала, N<M;

- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;

- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

16. Система (100) передачи для передачи аудиосигнала, причем упомянутая система передачи содержит:

- передатчик (101), выполненный с возможностью передачи N-канального аудиосигнала; и приемник (103), содержащий:

- приемник (201) для принятия N-канального аудиосигнала,

- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M,

- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования,

- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

17. Устройство (103) воспроизведения звука для воспроизведения пространственного М-канального аудиосигнала, причем упомянутое устройство воспроизведения звука содержит:

- приемник (201) для принятия N-канального аудиосигнала, N<M;

- параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;

- модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

18. Способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем упомянутый способ предусматривает:

- прием (501) N-канального аудиосигнала, N<M;

- определение (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;

- модификацию (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- генерацию (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

19. Способ принятия пространственного М-канального аудиосигнала, причем упомянутый способ предусматривает:

- принятие (501) N-канального аудиосигнала, N<M;

- определение (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом;

- модификацию (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- генерацию (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

20. Способ передачи и приема аудиосигнала, причем упомянутый способ предусматривает:

- передатчик (101), передающий N-канальный аудиосигнал; и

- приемник (103), выполняющий стадии:

- приема (501) N-канального аудиосигнала;

- определения (503) пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M;

- модификации (505) зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования;

- генерации (507) пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Описание изобретения к патенту

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Данное изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала и, в частности, но не исключительно, к манипулированию зоной наилучшего восприятия для многоканального сигнала MPEG системы «окружающего звука».

УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Цифровое кодирование сигналов из различных источников становилось все более важным на протяжении последних десятилетий, по мере того как цифровое представление и передача сигналов все более заменяло аналоговое представление и передачу. Например, распространение мультимедийного контента, такого как видео и музыка, все более основывается на цифровом кодировании контента.

Кроме того, в последнее десятилетие наблюдается тенденция к многоканальному звуку и, в частности, к пространственному звуку, простирающемуся за пределы стандартных стереосигналов. Например, традиционные стереозаписи содержат только два канала, тогда как современные продвинутые аудиосистемы обычно используют пять или шесть каналов, как в популярных системах окружающего звука 5.1. Это обеспечивает опыт более включенного прослушивания, когда пользователь может быть окружен источниками звука.

Были разработаны различные способы и стандарты для передачи таких многоканальных сигналов. Например, шесть дискретных каналов, представляющих систему окружающего звука 5.1, могут передаваться в соответствии с такими стандартами, как продвинутое кодирование звука (AAC) или Dolby Digital.

Однако для обеспечения обратной совместимости, как известно, необходимо уменьшить большее число каналов до меньшего числа каналов, т.е. осуществить понижающее микширование, и, в частности, это часто используется для понижающего микширования сигнала окружающего звука 5.1 до стереосигнала, что позволяет воспроизводить стереосигнал обычными (стерео)декодерами, а 5.1 сигнал - декодерами окружающего звука.

Одним примером является способ обратно совместимого кодирования MPEG2. Многоканальный сигнал низводится в стереосигнал. Дополнительные сигналы кодируются во вспомогательный участок данных, позволяющий многоканальному MPEG2 декодеру генерировать представление многоканального сигнала. MPEG1 декодер проигнорирует эти вспомогательные данные и, таким образом, декодирует только стереопонижение. Основной недостаток этого способа кодирования, применяемого в MPEG2, состоит в том, что скорость передачи дополнительных данных, требуемая для дополнительных данных, имеет тот же самый порядок величины, что и скорость передачи данных, требуемая для кодирования стереосигнала. Дополнительная скорость передачи битов для расширения стерео до многоканального аудио, следовательно, является значительной.

Другие существующие способы обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут быть охарактеризованы как матричные способы системы окружающего звука. Примеры матричного кодирования окружающего звука включают в себя такие способы, как Dolby Prologic II и Logic-7. Общий принцип этих способов состоит в том, что они матрично умножают множественные каналы входного сигнала посредством подходящей неквадратичной матрицы, тем самым генерируя выходной сигнал с меньшим числом каналов. В частности, матричный кодер обычно применяет фазовые сдвиги к каналам окружения перед микшированием их с передним и центральным каналами.

Другой причиной преобразования каналов является эффективность кодирования. Было обнаружено, что, например, сигналы окружающего звука могут быть кодированы как аудиосигналы стереоканалов, комбинированные с параметрическим потоком битов, описывающим пространственные свойства аудиосигнала. Этот декодер может воспроизводить звуковые стереосигналы с очень удовлетворительной степенью точности. Таким образом, может быть получена существенная экономия скорости передачи битов.

Таким образом, в (параметрических) пространственных аудиокодерах параметры извлекаются из первоначального аудиосигнала таким образом, чтобы сформировать аудиосигнал, имеющий уменьшенное число каналов, например только один канал, плюс множество параметров, описывающих пространственные свойства первоначального аудиосигнала. В (параметрических) пространственных аудиокодерах пространственные свойства, описываемые переданными пространственными параметрами, используются для воссоздания первоначального пространственного многоканального сигнала. Имеется несколько параметров, которые могут использоваться для описания пространственных свойств аудиосигналов. Одним таким параметром является межканальная кросс-корреляция, как, например, кросс-корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощностей этих каналов.

Конкретным примером такого способа является подход MPEG Surround (окружающего звука) для эффективного кодирования многоканальных аудиосигналов.

MPEG Surround кодер низводит М-канальный входной сигнал к N-канальному сигналу понижающего микширования, где N<M, и извлекает пространственные параметры. Сигнал понижающего микширования обычно кодируется с использованием обычного кодера, такого как, например, MP3 или AAC кодер. Пространственные параметры кодируются и встраиваются в поток битов обратно совместимым образом таким образом, что обычные декодеры все же могут декодировать лежащий в основе сигнал понижающего микширования.

В MPEG Surround кодере сигнал понижающего микширования сначала декодируется с использованием обычного декодера. Многоканальный сигнал затем восстанавливается посредством пространственных параметров, которые извлекаются из потока битов.

Кроме типичного многоканального кодирования, описанного выше, MPEG Surround предлагает богатый набор дополнительных характеристик, например:

- Неуправляемое декодирование - MPEG Surround декодер способен создавать многоканальное повышающее микширование стереосигналов, когда пространственная боковая информация является недоступной. В этом режиме декодер вычисляет отношение мощностей и корреляцию стереосигнала, и эти характеристики используются для получения требуемых пространственных параметров посредством просмотра таблицы.

- Матричная совместимость - MPEG Surround кодер способен генерировать понижающее микширование, которое может быть декодировано с использованием схем матричного декодирования. Матричное понижающее микширование окружающего звука создается таким образом, что оно может быть инвертировано MPEG Surround декодером без уступок восприятия для работы декодера. Кроме того, матричное понижающее микширование окружающего звука улучшает работу неуправляемого режима.

- Бинауральное (стереофоническое) декодирование - MPEG Surround декодер способен трансформировать моно- или стереосигнал понижающего микширования непосредственно в трехмерный бинауральный стереосигнал с использованием пространственных параметров вместо вычисления многоканального сигнала в качестве промежуточной стадии.

- Высокопрофессиональное понижающее микширование - MPEG Surround дает возможность передавать созданное вручную понижающее микширование вместо автоматизированного MPEG Surround понижающего микширования.

- Произвольные деревья - MPEG Surround битовый поток поддерживает определение произвольных структур повышающего микширования, позволяющее иметь произвольное число выходных каналов.

MPEG Surround кодер нацелен на представление первоначального многоканального сигнала так точно, насколько это возможно для заданной настройки громкоговорителей, такой как, например, настройки 5.1. Однако он не позволяет иметь какую-либо гибкость по отношению к различным позициям прослушивания и окружениям, таким, которые обычно присутствуют дома или в транспортном средстве.

Воспроизведение для альтернативных позиций и окружений прослушивания может быть усовершенствовано посредством манипулирования зоной наилучшего восприятия (например, перемещения и/или расширения). Однако, хотя манипулирование зоной наилучшего восприятия является известным, стандартные подходы являются неоптимальными и обычно применяются как стадия окончательной обработки, требующая обработки высокой сложности индивидуальных выходных каналов.

Следовательно, усовершенствованная система для манипулирования зоной наилучшего восприятия была бы выгодной, и в частности, была бы выгодна система, обладающая увеличенной гибкостью, улучшенным качеством, улучшенным опытом прослушивания, уменьшенной сложностью, облегченной обработкой и/или улучшенной производительностью.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Соответственно, данное изобретение предпочтительно стремится к ослаблению, смягчению или устранению одного или нескольких вышеупомянутых недостатков по одному или в любой комбинации.

Согласно первому аспекту изобретения обеспечено устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем это устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Данное изобретение может обеспечить улучшенный опыт прослушивания. Данное изобретение может дать возможность осуществлять манипулирование уменьшенной сложности зоной наилучшего восприятия посредством прямой модификации пространственных параметров как части процесса декодирования. Может быть достигнута облегченная обработка уменьшенной вычислительной сложности. Этим устройством может быть, в частности, декодер. Изобретение может позволить осуществить улучшенную производительность посредством интеграции декодирования и манипулирования зоной наилучшего восприятия выгодным образом.

N-канальным сигналом может быть, в частности, моно- или стереосигнал, а М-канальным сигналом может быть, в частности, сигнал окружающего звука 5.1, 6.1 или 7.1. Пространственными параметрами могут быть, в частности, параметры, отличающиеся временем и частотой, связывающие характеристики различных каналов пространственного М-канального аудиосигнала с сигналами N-канального сигнала (или наоборот). Например, пространственные параметры могут включать в себя параметры уровня и/или корреляции для индивидуальных временных частотных блоков. Повышающим микшированием N-канального аудиосигнала в пространственный М-канальный аудиосигнал может быть каскадное (последовательное) повышающее микширование.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса переднего канала с задним каналом посредством модификации первого пространственного параметра повышающего микширования, указывающего разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать улучшенный опыт прослушивания для (передних/задних) нецентральных позиций посредством простой и несложной обработки.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является межканальная разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра повышающего микширования, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации показателя квантования межканальной разности интенсивностей.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию и может, в частности, дать возможность осуществить облегченное и более дружественное пользователю манипулирование при отражении восприятия звука человеком. Показатель квантования может быть модифицирован перед декодированием.

Согласно возможной особенности изобретения, модифицирующее средство дополнительно выполнено с возможностью масштабирования по меньшей мере одного переднего канала таким образом, что вариация отношения энергии переднего бокового канала к энергии центрального канала для пространственного М-канального аудиосигнала, вызванная модификацией первого параметра, уменьшена.

Это может дать возможность осуществить улучшенный опыт прослушивания и может во многих случаях дать возможность осуществить манипулируемую зону наилучшего восприятия с минимальным искажением восприятия. Модифицирующее средство может, в частности, по существу поддерживать то же самое отношение энергии переднего бокового канала к энергии центрального канала после модификации параметров, что и перед модификацией. Модифицирующее средство может, в частности, масштабировать центральный канал или может, например, масштабировать боковые каналы по существу равным образом относительно центрального канала и/или может масштабировать боковые каналы по-разному.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала n-канального аудиосигнала между центральным каналом и по меньшей мере одним боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

В некоторых вариантах осуществления модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра, указывающего величину масштабирования между по меньшей мере одним каналом N-канального аудиосигнала и по меньшей мере одним передним каналом пространственного М-канального аудиосигнала.

Повышающее микширование N-канального аудиосигнала может, в частности, включать в себя повышающее микширование N-канального аудиосигнала в К-канальный сигнал (N<K<=M) посредством (К, N) матричного умножения повышающего микширования значений сигналов для N-канальных сигналов, и первым пространственным параметром повышающего микширования может быть матричный коэффициент матрицы повышающего микширования.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, обычно уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса левого с правым посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между по меньшей мере одним правым боковым каналом и по меньшей мере одним левым боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания для (левых/правых) нецентральных позиций прослушивания посредством простой обработки низкой сложности.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации дисперсии спереди назад посредством модификации первого пространственного параметра повышающего микширования, указывающего относительную корреляцию между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент межканальной корреляции между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, N-канальный аудиосигнал соответствует понижающему микшированию пространственного М-канального аудиосигнала, и приемник выполнен с возможностью принятия пространственных параметров повышающего микширования кодера, связывающих низведенный N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, и параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из пространственных параметров повышающего микширования кодера.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, содержащей параметрический кодер, генерирующий N-канальный аудиосигнал.

Этот кодер может генерировать данные пространственных параметров при понижающем микшировании пространственного М-канального аудиосигнала в N-канальный аудиосигнал. Эти данные пространственных параметров могут быть переданы к устройству, и зона наилучшего восприятия может быть модифицирована посредством модификации этих данных. Пространственные параметры могут, в частности, содержать пространственные параметры кодера. N-канальным аудиосигналом может, в частности, быть MPEG Surround сигнал, содержащий параметрические данные.

Согласно возможной особенности изобретения, параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из характеристик сигналов каналов N-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, не использующей явные параметрические кодеры, которые не передают параметрические данные для пространственного М-канального аудиосигнала. N-канальным аудиосигналом может быть, в частности, неуправляемый MPEG Surround сигнал, такой как матричный совместимый сигнал понижающего микширования. N-канальным аудиосигналом может также быть обычный стереосигнал, например стерео MP3 декодированный сигнал, или стерео FM сигнал.

Согласно другому аспекту изобретения, обеспечен приемник для принятия пространственного М-канального аудиосигнала, причем этот приемник содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечена система передачи для передачи аудиосигнала, причем эта система содержит: передатчик, выполненный с возможностью передачи N-канального аудиосигнала; и приемник, содержащий: приемник для принятия N-канального аудиосигнала; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечено воспроизводящее звук устройство для воспроизведения пространственного М-канального аудиосигнала, причем это воспроизводящее звук устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ принятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ передачи и приема аудиосигнала, причем этот способ содержит: передатчик, передающий N-канальный аудиосигнал; и приемник, выполняющий стадии: принятия N-канального аудиосигнала; определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Эти и другие аспекты, особенности и преимущества изобретения явствуют и разъясняются со ссылкой на вариант (варианты) осуществления, описываемые далее.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления изобретения будут описаны только посредством примера, со ссылкой на чертежи, в которых:

Фиг. 1 является иллюстрацией системы передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 2 является иллюстрацией декодера, способного модифицировать зону наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 3 является иллюстрацией настройки громкоговорителей для MPEG системы окружающего звука;

Фиг. 4 является иллюстрацией структуры MPEG Surround декодера; и

Фиг. 5 является иллюстрацией способа модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения.

ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Следующее описание фокусируется на вариантах осуществления изобретения, применимых к MPEG аудиосистеме окружающего звука. Однако будет ясно, что изобретение не ограничено этим применением, а может быть применено ко многим другим многоканальным аудиосистемам и стандартам.

Фиг. 1 иллюстрирует систему 100 передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения. Система 100 передачи содержит передатчик 101, который подключен к приемнику 103 через сеть 105, которой, в частности, может быть Интернет.

В этом конкретном примере передатчиком 101 является устройство записи сигналов, а приемником 103 является устройство воспроизведения сигналов, но будет ясно, что в других вариантах осуществления передатчик и приемник могут использоваться в других приложениях и с другими целями. Например, передатчик 101 и/или приемник 103 могут быть частью функциональности транскодирования и могут, например, обеспечивать сопряжение с другими источниками или назначениями сигналов.

В этом конкретном примере, когда поддерживается функция записи сигналов, передатчик 101 содержит дискретизатор 107, который принимает аналоговый многоканальный сигнал, который преобразуется в цифровой PCM (модулированный импульсным кодом) сигнал посредством дискретизации и аналого-цифрового преобразования.

Дискретизатор 107 подключен к кодеру 109 фиг. 1, который кодирует PCM сигнал в соответствии с алгоритмом кодирования. В этом примере кодером 109 является MPEG Surround кодер, который кодирует М-канальный сигнал как N-канальный сигнал, где M>N. MPEG Surround декодер, таким образом, генерирует N-канальный сигнал, а также пространственные параметрические данные, которые позволяют декодеру генерировать М-канальный сигнал. Кодер 109 может, например, кодировать 5.1, 6.1 или 7.1 сигнал окружающего звука как стереосигнал плюс пространственные параметрические данные. Следующее описание будет фокусироваться на сценарии, в котором 5.1 стереосигнал кодируется как стереосигнал плюс пространственные параметрические данные.

Кодер 109 подключен к сетевому передатчику 111, который принимает кодированный сигнал и сопрягается с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал к приемнику 103 через Интернет 105.

Приемник 103 содержит сетевой приемник 113, который сопрягается с Интернетом 105 и который выполнен с возможностью принятия кодированного сигнала от передатчика 101.

Сетевой приемник 113 подключен к декодеру 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования. В этом примере декодер декодирует М-канальный сигнал из N-канального сигнала с использованием принятых параметрических данных после того, как они были модифицированы для того, чтобы модифицировать зону наилучшего восприятия первоначального сигнала. Зоной наилучшего восприятия пространственного многоканального сигнала является область/местоположения, в которой пространственное восприятие не отклоняется значительно от заданного пространственного восприятия, например заданного студийными инженерами для стандартизованной настройки многоканальных громкоговорителей.

В частности, в этом примере декодером 115 является MPEG Surround декодер, работающий в управляемом режиме, когда декодирование основано на пространственных параметрических данных, генерируемых кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметрические данные могут генерироваться самим декодером и что декодером 115 может, в частности, быть MPEG Surround декодер, работающий в неуправляемом режиме.

В этом конкретном примере, когда поддерживается функция воспроизведения сигналов, приемник 103 дополнительно содержит проигрыватель 117 сигналов, который принимает декодированный аудиосигнал от декодера 115 и предоставляет его пользователю. В частности, проигрыватель 117 сигналов может содержать цифро-аналоговый преобразователь, усилители и громкоговорители, требуемые для выдачи декодированного аудиосигнала.

Фиг. 2 иллюстрирует декодер 115 более подробно.

Декодер 115 содержит блок 201 приемника, который принимает битовый поток от сетевого приемника 113. Этот приемник содержит как кодированный стереосигнал, так и параметрические данные.

Блок 201 приемника подключен к параметрическому блоку 203, который определяет пространственные параметры, которые должны быть использованы для генерации окружающего сигнала из стереосигнала. Этими пространственными параметрами являются, таким образом, параметрические данные, которые описывают характеристику канального сигнала М-канального сигнала относительно характеристики канального сигнала N-канального сигнала. Пространственные параметры могут, в частности, указывать, как N-канальный сигнал должен быть обработан для генерации М-канального сигнала.

В этом основном примере пространственные параметры просто генерируются посредством извлечения этих параметров из принимаемого битового потока, т.е. используются пространственные параметры, генерируемые кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметры могут, например, определяться самим декодером, например, посредством оценки этих параметров из принимаемого сигнала. В частности, декодер 115 может быть MPEG Surround декодером, работающим в неуправляемом режиме, и может соответственно генерировать пространственные параметры из некоторых характеристик N-канального сигнала, таких как разность интенсивностей каналов и характеристики корреляции принимаемого стереосигнала.

Блок 201 приемника также подключен к декодирующему блоку 205, который декодирует стереосигнал и увеличивает число его каналов для генерации 5.1 канального окружающего сигнала. Повышающее микширование в этом примере выполняется в соответствии со стандартом MPEG Surround и основывается на определенных пространственных параметрах. Однако пространственные параметры не используются непосредственно, а декодер 115 содержит модифицирующий блок 207, который подключен к параметрическому блоку 203 и декодирующему блоку 205 и который изменяет один или несколько пространственных параметров для того, чтобы модифицировать зону наилучшего восприятия генерируемого окружающего сигнала.

Таким образом, декодер 115 фиг. 2 позволяет осуществить простое, эффективное, высокопроизводительное и несложное манипулирование зоной наилучшего восприятия выходного сигнала окружающего звука посредством модификации одного или нескольких пространственных параметров, используемых в процессе декодирования/повышающего микширования. Таким образом, путем интеграции манипулирования и декодирования/повышающего микширования может быть достигнута по существу облегченная и улучшенная работа.

Этот подход может использоваться для эффективной модификации формы и местоположения зоны наилучшего восприятия. Это особенно полезно для домашнего применения и применения в автомобиле, когда позиция слушателя отличается от первоначальной позиции зоны наилучшего восприятия. Это может быть также полезно для создания схожих восприятий звукового образа для множественных слушателей с различными позициями. Таким образом, этот подход позволяет осуществить легкое манипулирование наиболее желательными особенностями для управления звуковой сценой, включающими в себя:

- Управление передне-задним балансом может быть применено для постепенного акцентирования пространственного образа к передней части или к задней части.

- Управление центральной дисперсией может быть применено для создания менее (или более) направленного восприятия центрального канала.

- Управление лево-правым балансом может быть применено для обеспечения постепенного сдвига акцента влево или вправо.

- Управление корреляцией или передне-задней дисперсией может быть применено для осуществления управления передне-задней корреляцией, которая дает вклад в воспринимаемую ширину звука.

Этот подход приводит к очень не сложным решениям для манипулирования зоной наилучшего восприятия, и является выгодным то, что этот подход может применяться во всех рабочих режимах MPEG Surround. Кроме того, как будет описано далее, можно также улучшить пространственный образ при декодировании сигналов понижающего микширования ограниченного качества, таких как сигналы в FM и AM радиопередачах.

Далее более подробный пример различных манипуляций зоной наилучшего восприятия будет описан со ссылкой на 5.1 MPEG Surround систему.

Фиг. 3 иллюстрирует настройку громкоговорителей, на которой основаны 6-канальные выходные конфигурации MPEG Surround алгоритма.

Фиг. 4 иллюстрирует MPEG Surround структуру повышающего микширования для генерации 5.1 сигнала окружающего звука из принимаемого стереосигнала и пространственных параметров. В MPEG Surround повышающее микширование выполняется в каскадном процессе, где первоначально два коэффициента предсказания каналов (CPC) используются для создания левого, центрального и правого сигнала (L, C и R) в первой стадии повышающего микширования с использованием матрицы (3х2) предварительного усиления, заданной следующим образом:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 .

Каждый из этих трех промежуточных каналов затем преобразуется в два дополнительных канала. В частности, промежуточный центральный канал разделяется на центральный канал и канал улучшения низких частот (LFE) с использованием пространственного параметра межканальной разности интенсивностей (IID). Кроме того, два IID и два коэффициента межканальной корреляции (ICC) используются для расщепления каждого из промежуточных левого и правого сигналов на передний и окружающий канал (Lf, Rf и Ls, Rs) посредством матрицы микширования 5×5 (где декоррелированные сигналы используются для введения уровня корреляции, указываемого посредством ICC).

В некоторых вариантах осуществления модифицирующий блок 207 может модифицировать передне-задний баланс посредством модификации пространственного параметра, который указывает относительную разность интесивностей между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала. В частности, модифицирующий блок может модифицировать один или несколько параметров IID.

Следующее описывает то, как простой параметр настройки может быть установлен для постепенного перемещения акцента пространственного образа (зоны наилучшего восприятия) назад и вперед между передней частью и задней частью. Таким образом, простой параметр настройки может использоваться для перемещения местоположения/области, где в позиции слушателя воспринимается оптимальный эффект окружения. Это особенно полезно в ситуациях, когда слушатель расположен либо спереди, либо сзади от центральной позиции громкоговорителей, как это обычно имеет место в домашнем применении и в применении в автомобиле.

В вариантах осуществления фиг. 2 управление передне-задним балансом достигается посредством модификации параметров IID для достижения желаемого эффекта. Параметры IID обычно выражаются на логарифмической шкале дБ и указывают относительное распределение энергии между передним и окружающим каналом.

В следующем конкретном примере параметры ICC и IID будут для краткости и ясности считаться равными для левой и правой сторон. Это обычно имеет место для MPEG Surround неуправляемых режимов. Для MPEG Surround управляемого режима, параметры ICC и IID обычно различны для левой и правой сторон, и будет ясно, что описанный подход может быть легко распространен на такие ситуации. В частности, описанный подход может быть независимо применен к обеим сторонам с использованием одного и того же параметра настройки, SFB.

В описанном подходе параметр IID используется для изменения передне-заднего распределения сигналов. В частности, увеличение IID подает больше энергии в передние боковые каналы, тогда как уменьшение IID подает больше энергии в окружающие каналы.

IID, который выражается в дБ, может быть обновлен посредством добавления величины смещения.

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Эта величина смещения манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 FB может быть определена из параметра S FB простой настройки, который может быть, например, установлен вручную пользователем или оператором. Например, воспроизводящее устройство 103, содержащее декодер 115, может содержать ввод для выбора между различными настройками эмуляции звукового окружения, причем каждая настройка имеет некоторое количество связанных с ней заданных параметров настройки зоны наилучшего восприятия.

Слуховая система человека имеет уменьшающуюся чувствительность к изменениям в IID для увеличивающихся эталонных значений (как положительных, так и отрицательных). Например, следующая таблица иллюстрирует едва заметные различия (JND) для вариаций IID:

Эталонный IID (дБ) JND(дБ)
0 0,5-1
9 1,2
151,5-2

Для достижения подобного эффекта акцентирования для целого диапазона IID этот нелинейный эффект может быть включен в обновление IID:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Поскольку нелинейное поведение слуховой системы также отражается в векторе квантования IID, используемом в MPEG Surround для преобразования значений этого показателя в параметры IID, модификация IID может быть реализована посредством линейного обновления в области показателей. Пусть I IID,org - показатель, соответствующий IIDorg , тогда IID может быть обновлен посредством вычисления нового IID, который соответствует показателю, заданному следующим образом:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Таким образом, параметр S FB простой настройки, имеющий линейную связь со смещением передне-заднего баланса, может быть установлен для модификации передне-заднего баланса зоны наилучшего восприятия сигнала окружающего звука.

Если непосредственное использование показателя IID является непрактичным (например, так как он недоступен для модифицирующего блока), можно переключаться на область показателей и обратно посредством приближения полиномом второго порядка для (неотрицательной части) MPEG Surround вектора квантования для IID:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

где

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Таким образом, IID может быть преобразован обратно в область показателей посредством:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Этот новый показатель может быть затем определен путем добавления параметра SFB, и, таким образом, параметр IID может быть определен как:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Альтернативно для определения модифицированного IID может быть использована интерполяция, основанная на векторе квантования.

Уменьшение значения IID приводит к смещению энергии от передних каналов к окружающим каналам при поддержании когерентности и полной энергии. Однако эта модификация не изменяет энергию центрального (и LFE) каналов и, следовательно, может в некоторой степени деформировать пространственный образ. Увеличение значения IID может подобным же образом деформировать пространственный образ.

Для уменьшения этого эффекта предпочтительно сохраняется отношение энергий между передними боковыми каналами и центральным каналом. Микширование энергии центрального канала в боковые каналы или наоборот могло бы вызвать непреднамеренную утечку контента (например, голосов) к боковым каналам и, следовательно, изменение пространственного образа. Следующее описывает способ, который по существу сохраняет отношение энергий передних боковых каналов к центральному и препятствует утечке центрального контента в боковые каналы посредством масштабирования центрального канала.

В этом подходе передние каналы масштабируются при ограничении, что отношение энергий между передними боковыми каналами и центральным каналом сохраняется:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Масштабирование центрального сигнала имеет последствия для полной энергии и, следовательно, левый и правый боковые сигналы должны быть масштабированы одновременно для компенсации потери энергии. Таким образом, общая энергия предпочтительно должна также сохраняться:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

где масштабирование представлено следующим образом:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 .

В этом примере левый и правый каналы масштабированы посредством одного и того же коэффициента, так как предполагается, что пространственные параметры для двух боковых каналов равны (что соответствует MPEG Surround неуправляемому режиму), и, таким образом, они оба далее обрабатываются посредством одних и тех же пространственных параметров. Коэффициенты µ и манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 масштабирования могут быть вычислены путем вставки равенств масштабирования в требования сохранения энергии. Это дает:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

что приводит к равенству:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

и

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Переписывание дает:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

и таким образом,

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

где

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Таким образом, выражения для µ и манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 следующие:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Компенсация распределения энергии для поддержания общего пространственного образа может быть выполнена посредством обработки относительно низкой сложности. В частности, MPEG Surround алгоритм повышающего микширования обновляет параметры с некоторой скоростью Т обновления. Таким образом, каждые Т выборок вычисляются новые матрицы повышающего микширования, и они интерполируются для выборок между ними. Масштабирование сигналов повышающего микширования может быть интегрировано с матрицей предварительного усиления, и, соответственно, значения масштабирования должны определяться только один раз на Т выборок.

С диапазоном параметров:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

образ может быть смещен полностью назад (-30) и полностью вперед (+30) в смысле восприятия и с приблизительно линейной связью между значением параметра настройки и воспринимаемым смещением в передне-заднем балансе.

Кроме того, значения масштабирования определяются из величины Eratio, которая представляет собой отношение энергий промежуточных сигналов L, R и C. По причине стабильности, эти энергии могут быть сглажены (отфильтрованы фильтром нижних частот). Однако для MPEG Surround неуправляемого режима такие отфильтрованные фильтром нижних частот энергии сигналов Ldmx и R dmx понижающего микширования являются уже доступными, так как они используются для определения параметров IIDи ICC для сигнала понижающего микширования. Они могут быть использованы в комбинации с матрицей предварительного усиления, которая определяется следующим образом:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Таким образом, Eratio может быть записана в виде:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

что устраняет необходимость в повыборочных вычислениях для управления передне-задним балансом.

Дополнительное уменьшение сложности может быть получено, например, путем использования справочных таблиц для различных равенств или путем использования функций приближений низкой сложности.

В этом примерном варианте осуществления декодер 115 может, кроме того, настраивать центральную дисперсию, тем самым увеличивая зону наилучшего восприятия. В частности, параметр настройки центральной дисперсии используется для рассредоточения образа центрального канала в стороны для получения менее направленного центра. Таким образом, этот подход позволяет осуществить увеличение воспринимаемой ширины центра путем настройки пространственных параметров, и, таким образом, пространственные параметры используются для манипулирования размером зоны наилучшего восприятия.

В MPEG Surround первая стадия повышающего микширования создает три промежуточных сигнала L, C и R с использованием матрицы предварительного усиления (см., например, фиг. 4):

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 .

Для увеличения ширины центра часть центрального сигнала С может быть микширована в боковые каналы L и R. В частности, пространственными параметрами CPC1 и CPC2 этой первой стадии повышающего микширования можно манипулировать таким образом, что центральный сигнал микшируется (смешивается) с левым и правым сигналами. Как можно видеть из матрицы предварительного усиления, CPC параметры указывают относительное распределение энергии каждого из стереосигналов в каждый из промежуточных каналов. Таким образом, настройка CPC параметров дает возможность осуществить постепенное смещение энергии от центрального канала (или к нему) к боковым каналам (или от них). При изменении центральной дисперсии модификация обычно выполняется симметрично, и, таким образом, значения CPC изменяются идентично.

Как следует из матрицы предварительного усиления, если оба CPC параметра равны 1, то нижний ряд содержит только нули, и следовательно, центральный сигнал не генерируется. Также для этой настройки коэффициенты усиления (матричные коэффициенты) для левого и правого сигналов увеличиваются и, таким образом, весь центральный сигнал полностью рассредотачивается в левый и правый каналы. Наоборот, при уменьшении CPC центральная энергия увеличивается, тогда как энергия левого и правого сигналов уменьшается.

Таким образом, дисперсия центра может быть увеличена путем увеличения значений CPC параметров по направлению к 1. Таким образом, центральный сигнал (частично) микшируется в боковые каналы, что приводит к более широкому пространственному образу для сигнала центрального канала.

В частности, новые значения CPC могут быть определены из параметра SCD настройки согласно:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 .

Для отрицательных значений S CD значения CPC перемещаются по направлению к -1, тем самым сужая ширину восприятия окружающего сигнала. Диапазон параметра SCD настройки может быть предпочтительно установлен на [-1, 1].

В этом примерном варианте осуществления декодер 115 может дополнительно смещать пространственный звуковой образ влево или вправо, тем самым позволяя зоне наилучшего восприятия перемещаться соответственно. Это может быть особенно важно, когда слушатель помещен слева или справа от первоначальной зоны наилучшего восприятия.

Лево-правое распределение энергии сигнала получается в первой стадии повышающего микширования, когда сигналы L, C и R генерируются с использованием параметров предсказания CPC1 и CPC2. Управление балансом использует эти параметры предсказания для достижения манипулирования низкой сложности местоположением зоны наилучшего восприятия.

В частности, поскольку параметр CPC1 управляет вкладом левого канала понижающего микширования, а параметр CPC2 управляет вкладом правого канала понижающего микширования, баланс может быть смещен влево или вправо путем уменьшения параметров относительно друг друга. Таким образом, уменьшение CPC1 смещает баланс вправо, тогда как уменьшение CPC2 смещает его влево.

В частности, настройка CPC параметров для управления балансом может быть выполнена подобно настройке, используемой для уменьшения ширины центра посредством параметра управления дисперсией центра. Эти параметры либо смещаются по направлению к значению CPC от -1, либо остаются немодифицированными в зависимости от знака параметра SLR настройки управления балансом:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Диапазон параметров:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

обеспечивает разумную величину управления балансом без отрицательного влияния на эффекты восприятия, связанные с энергией центра.

Оценивание матрицы предварительного усиления иллюстрирует, что невозможно создать шкалу абсолютного баланса без увеличения энергии центрального сигнала просто посредством модификации CPC параметров. Однако уменьшенное управление балансом в общем является достаточным, так как наиболее типичные местоположения зоны наилучшего восприятия только относительно немного отклоняются от центральной позиции прослушивания.

В этом примерном варианте осуществления декодер 115 может, кроме того, модифицировать дисперсию спереди назад, тем самым позволяя управлять воспринимаемой шириной звука и, таким образом, увеличивать зону наилучшего восприятия.

В частности, ICC параметры, используемые во второй стадии повышающего микширования для генерации передних и окружающих каналов левой и правой стороны, модифицируются для увеличения или уменьшения корреляции, тем самым оказывается влияние на передне-заднюю дисперсию.

В частности, настройка параметра ICC подобна настройкам CPC параметров для управления дисперсией центра за исключением того, что настраиваемый параметр ICC ограничен диапазоном от 0 до 1. Таким образом, с использованием параметра SCR настройки передне-задней дисперсии новые корреляционные параметры могут быть определены как:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

где:

манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

Следующая таблица обеспечивает обзор конкретных пространственных параметров, которые модифицируются для достижения различных манипуляций зоной наилучшего восприятия:

Параметр настройки Влияющие пространственные параметрыПараметр настройкиДиапазон параметров
Передне-задняя дисперсия манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825
Дисперсия центра манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825
Управление лево-правым балансом манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825
Управление передне-задним балансом манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825 манипулирование зоной наилучшего восприятия для многоканального   сигнала, патент № 2454825

В этом конкретном примере все параметры настройки используются одновременно. Однако порядок, в котором применяются модификации, может влиять на достигнутое качество.

В частности, дисперсия центра и управление лево-правым балансом влияют друг на друга, так как они используют одни и те же пространственные параметры. Управление балансом поддерживает некоторую энергию в центральном канале, тогда как настройка дисперсии центра микширует (часть) энергии центра как влево, так и вправо. Следовательно, много энергии заканчивается в боковом канале, что должно быть смягчено управлением балансом при выполнении дисперсии центра после управления балансом. Следовательно, настройки дисперсии центра могут быть выполнены сначала, что позволяет управлению балансом правильно работать.

Управление передне-задним балансом использует CPC параметры в вычислении коэффициентов масштабирования. Обычно в этом вычислении должны использоваться действительные параметры, которые будут использоваться в процессе повышающего микширования. Следовательно, вычисления для управления передне-задним балансом может быть выполнено после вычислений для дисперсии центра и управления лево-правым балансом.

На вычисления для настройки передне-задней дисперсии не влияют никакие другие представленные параметры настройки. Настройка корреляции также не влияет на другие параметры настройки. Поэтому модификация этого параметра может быть расположена в произвольном порядке среди других вычислений.

Будет ясно, что описываемые принципы могут применяться в MPEG Surround декодерах, работающих как в управляемом режиме так и в неуправляемом режиме. При работе в неуправляемом режиме пространственные параметры определяются самим декодером на основе характеристик принимаемого стереосигнала, тогда как в управляемом режиме пространственные параметры генерируются и принимаются от кодера.

Конкретный пример, в котором описанный подход может обеспечить улучшенный опыт прослушивания в связи с неуправляемым режимом работы, состоит в том, что принимается стереосигнал (например, стандартный стереосигнал), который не имеет очень отчетливых левого и правого каналов. Для оптимизации опыта окружения для этого типа сигналов посредством этого алгоритма может быть обеспечена специфическая настройка или режим прослушивания.

Обычно плохой прием радиостанции может привести к двум видам эффектов для двухканального выхода приемника (комбинация обоих также является обычной):

- Звук с помехами.

- Отсутствие воспроизведения стереозвучания или переключения между стерео и моно.

Эксперименты показали, что стереосигнал со статическими помехами не влияет значительно на пространственный образ. Эти помехи прекращаются во всех выходах, как и для стереовыхода.

Однако более динамические помехи влияют на пространственные характеристики выхода приемника более ясно. В основном, этот вид помех приводит к быстрому переключению между стерео- и моновоспроизведением в радиоприемнике. Со стандартным MPEG Surround неуправляемым алгоритмом такой сигнал приводит к пространственной нестабильности, когда полный звук разрушается в центральный канал при переключении входа на моно.

Это также является недостатком для основанных на моно FM станций и всех AM станций, так как моносигнал (Ldmx=Rdmx) не имеет межканальной разности интенсивностей, и полная корреляция и, следовательно, пространственные параметры будут постоянными. Результирующие значения для CPC параметров помещают основную массу энергии сигнала в центральный канал, и обеспечивается плохой опыт окружающего звука.

Кроме того, из-за способа, которым передаются FM стереосигналы (моносигнал (суммарный сигнал) и дифференциальный сигнал), пространственные свойства понижающего микширования могут быть уменьшены, так как дифференциальный сигнал первым ухудшается для плохого приема. Следовательно, пространственное восстановление посредством MPEG Surround неуправляемого алгоритма гораздо больше имеет тенденцию к ориентации на центральный сигнал, а не на стандартные стереосигналы.

Таким образом, основным недостатком радиосигналов как источника неуправляемых MPEG Surround систем является высокая вероятность того, что пространственные характеристики, которые управляют этим алгоритмом, могут быть потеряны, что приводит к концентрации сигнала в переднем центральном громкоговорителе.

Однако описанный декодер обеспечивает манипулирование зоной наилучшего восприятия низкой сложности, что может улучшить обеспечиваемый опыт окружающего звука. В частности, решение низкой сложности, достигающее удовлетворительного пространственного образа для моносигналов, может использовать параметр настройки дисперсии центра. Установка этого параметра, например, на 0,5 вызывает дисперсию части энергии, которая была бы помещена в центральный сигнал, к боковым сигналам L и R. Для моносигналов IID в 0 дБ приводит к равномерному распределению между передними и задними громкоговорителями.

В результате, даже для моновхода, алгоритм может эффективно распределять сигнал по всем выходным каналам. Для стереосигналов расширение создает улучшенный пространственный образ.

Фиг. 5 иллюстрирует способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала. Этот способ начинается на стадии 501, на которой принимается N-канальный аудиосигнал с N<M.

За стадией 501 следует стадия 503, на которой определяются пространственные параметры, связывающие N-канальный аудиосигнал с пространственным М-канальным аудиосигналом.

За стадией 503 следует стадия 505, на которой зона наилучшего восприятия пространственного М-канального аудиосигнала модифицируется посредством модификации по меньшей мере одного из пространственных параметров.

За стадией 505 следует стадия 507, на которой пространственный М-канальный аудиосигнал генерируется посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра.

Будет ясно, что вышеприведенное описание для ясности описало варианты осуществления изобретения со ссылкой на различные функциональные блоки и процессоры. Однако будет очевидно, что любое подходящее распределение функциональности между различными функциональными блоками или процессорами может использоваться не выходя за рамки изобретения. Например, функциональность, иллюстрированная как подлежащая выполнению отдельными процессорами или контроллерами, может выполняться тем же самым процессором или контроллерами. Следовательно, ссылки на конкретные функциональные блоки должны рассматриваться только как ссылки на подходящие средства обеспечения описанной функциональности, а не как указания на строгую логическую или физическую структуру или организацию.

Данное изобретение может быть реализовано в любой подходящей форме, включающей в себя аппаратное обеспечение, программное обеспечение, программно-аппаратные средства или любую их комбинацию. Изобретение может быть реализовано по меньшей мере частично как компьютерное программное обеспечение, прогоняемое на одном или нескольких процессорах данных и/или процессорах цифровых сигналов. Элементы и компоненты некоторого варианта осуществления изобретения могут быть физически, функционально и логически реализованы любым подходящим способом. Фактически, эта функциональность может быть реализована в единственном блоке, в множестве блоков или как часть других функциональных блоков. Как таковое, изобретение может быть реализовано в единственном блоке или может быть физически и функционально распределено между различными блоками и процессорами.

Хотя данное изобретение было описано в связи с некоторыми вариантами осуществления, оно не предназначено для ограничения конкретной формой, изложенной здесь. Скорее, объем данного изобретения ограничен только сопутствующей формулой изобретения. Кроме того, хотя может оказаться, что некоторая особенность описана в связи с конкретными вариантами осуществления, специалисту в данной области техники будет ясно, что различные особенности описанных вариантов осуществления могут быть скомбинированы в соответствии с изобретением. В формуле изобретения термин «содержащий» не исключает присутствия других элементов или стадий.

Кроме того, несмотря на индивидуальное перечисление, множество средств, элементов или стадий способа может быть реализовано посредством единственного блока или процессора. Кроме того, хотя индивидуальные особенности могут быть включены в различные пункты формулы изобретения, они могут быть выгодным образом скомбинированы, и включение в различные пункты формулы изобретения не означает, что некоторая комбинация особенностей не является возможной и/или выгодной. Также включение некоторой особенности в одну категорию пунктов формулы изобретения не подразумевает ограничение этой категорией, а скорее указывает, что эта особенность равным образом применима и к другим категориям пунктов формулы изобретения подходящим образом. Кроме того, порядок особенностей в пунктах формулы изобретения не подразумевает какого-либо конкретного порядка, в котором эти особенности должны работать, и, в частности, порядок индивидуальных стадий в пункте способа не подразумевает, что эти стадии должны выполняться в этом порядке. Скорее, эти стадии могут выполняться в любом подходящем порядке. Кроме того, одиночные ссылки не исключают множественности. Таким образом, ссылки на «некоторый», «один», «первый», «второй» и т.д. не препятствуют множеству. Ссылочные позиции в формуле изобретения обеспечены только в качестве проясняющего примера и не должны толковаться как ограничивающие объем изобретения каким-либо образом.

Класс H04S7/00 Индикаторные устройства; устройства управления, например уравновешенного (балансного) управления

устройство для формирования выходного пространственного многоканального аудио сигнала -  патент 2523215 (20.07.2014)
бинауральная визуализация мультиканального звукового сигнала -  патент 2512124 (10.04.2014)
способ и аппарат для обеспечения четкого воспринимаемого расположения для аудиоисточника в аудиокомпозиции -  патент 2482618 (20.05.2013)
способ и устройство для генерации стереосигнала с усовершенствованным перцепционным качеством -  патент 2444154 (27.02.2012)
способ и система для выравнивания громкоговорителя в комнате -  патент 2421936 (20.06.2011)
способ и устройство для улучшения воспроизведения звука -  патент 2416172 (10.04.2011)
Наверх