управление дозами аудио

Классы МПК:	H03G5/16 с автоматическим управлением
Автор(ы):	ЛАВДЖОЙ Ким (US)
Патентообладатель(и):	БОМОН ФРАЙДМАН Э КО. (CH)
Приоритеты:	подача заявки: 2006-09-15 публикация патента: 27.05.2011

Изобретение относится к управлению дозами предоставления аудиоматериалов, например, для управления аудиовыходом громкоговорителей на публичных концертах или подачей аудио на наушники в персональных устройствах воспроизведения музыки. Сущность изобретения состоит в том, что способ ослабления составного

аудиосигнала содержит этапы дискретизации составного аудиосигнала; преобразования дискретизированного аудиосигнала с использованием алгоритма быстрого преобразования Фурье, чтобы сформировать сигнал, представляющий амплитуду частотных составляющих аудиосигнала; сравнения преобразованного аудиосигнала с заранее заданным профилем пороговых величин управления импульсов, представляющим целевую максимальную амплитуду для каждой частотной составляющей для профиля пороговых величин аудиосигнала, чтобы создать сигнал конфигурирования, представляющий разность между вещательным сигналом и профилем; использования сигнала конфигурирования, чтобы автоматически настраивать в реальном времени фильтр с конечной импульсной характеристикой (КИХ) с тем, чтобы он ослаблял амплитуду преобразованного аудиосигнала в полосах частот с центром на частотах, в которых превышена целевая пороговая величина; и вывода ослабленного аудиосигнала для предоставления потребителю. Технический результат - повышение качества звука путем компенсации уровня шумов фона. 3 н. и 23 з.п. ф-лы, 9 ил.

управление дозами аудио, патент № 2419964

Формула изобретения

1. Способ ослабления составного аудиосигнала, содержащий этапы, на которых:

дискретизируют составной аудиосигнал;

преобразовывают дискретизированный аудиосигнал с использованием алгоритма быстрого преобразования Фурье, чтобы сформировать сигнал, представляющий амплитуду частотных составляющих аудиосигнала;

сравнивают преобразованный аудиосигнал с заранее заданным профилем пороговых величин амплитуды, представляющим целевую максимальную амплитуду для каждой частотной составляющей аудиосигнала, чтобы создать сигнал конфигурирования, представляющий амплитудную разность между преобразованным сигналом и упомянутым профилем;

фильтруют в режиме реального времени преобразованный сигнал в соответствии с сигналом конфигурирования посредством фильтра с конечной импульсной характеристикой (КИХ) с тем, чтобы он ослаблял амплитуду преобразованного аудиосигнала в полосах частот с центром на частотах, на которых превышена целевая пороговая величина, и тем самым формируют ослабленный аудиосигнал; и

выводят ослабленный аудиосигнал.

2. Способ по п.1, дополнительно содержащий этап, на котором используют цифровой процессор сигналов для определения конфигурации КИХ-фильтра.

3. Способ по п.1, дополнительно содержащий этап, на котором идентифицируют частотные составляющие аудиосигнала, которые имеют амплитуду, превышающую соответствующую целевую пороговую величину.

4. Способ по п.2, дополнительно содержащий этап, на котором устанавливают период времени для алгоритма преобразования Фурье так, чтобы он был, по существу, тем же, что и нижний период ширины полосы составного сигнала.

5. Способ по п.1, в котором профиль пороговых величин амплитуды, по меньшей мере, частично определяется посредством заданного по умолчанию профиля, определенного согласно предопределенным значениям аудио для каждой частоты, как рекомендовано регулятивным органом.

6. Способ по п.1, в котором профиль пороговых величин амплитуды, по меньшей мере, частично определяется вручную оператором, устанавливающим профиль пороговых величин в соответствии с требуемым выходным сигналом.

7. Способ по п.1, в котором профиль пороговых величин амплитуды, по меньшей мере, частично определяется согласно этапам широковещания аудиофрагмента для требуемого профиля, контроля вещательного аудиофрагмента и конфигурирования компьютера для настройки аудиофрагмента.

8. Способ по п.1, дополнительно содержащий этап, на котором оператору предоставляется возможность переопределить ослабление амплитуды выходного сигнала на одной или более частотах.

9. Способ по п.8, содержащий этап, на котором компенсируют любое ручное переопределение оператора любой частоты путем автоматического ослабления амплитуды, по меньшей мере, одной другой частоты.

10. Способ по п.1, дополнительно содержащий этап, на котором формируют матрицу предварительной калибровки выходного сигнала в зависимости от входной амплитуды для каждой частоты без ослабления.

11. Способ по п.1, содержащий этап, на котором определяют профиль, чтобы определить максимальную дозу уровня аудио в течение заранее заданного промежутка времени.

12. Способ по п.1, в котором частоты ниже приблизительно 100 Гц исключают из этапов преобразования, сравнения, конфигурирования и ослабления и добавляют к ослабленному аудиосигналу.

13. Способ повторной записи в цифровой форме предварительно записанного фрагмента аудиосигнала, содержащий этапы, на которых:

фильтруют фрагмент, используя фильтры с конечной импульсной характеристикой (КИХ), установленные в заранее заданных конфигурациях;

записывают фильтрованный аудиофрагмент;

повторно воспроизводят записанный аудиофрагмент;

определяют целевой профиль пороговых величин амплитуды частотных составляющих аудиосигнала как целевую максимальную амплитуду для каждой частотной составляющей аудиосигнала; и

регулируют частотные составляющие воспроизводимого фрагмента на основании определенного целевого профиля.

14. Способ по п.13, в котором целевой профиль пороговых величин определяется как максимальная доза уровня аудио за заранее заданный промежуток времени.

15. Способ по п.13 или 14, в котором определенный целевой профиль используют, чтобы модифицировать средство для управления уровнем громкости в записанном фрагменте.

16. Способ по п.15, в котором целевой профиль применяется к элементам управления громкостью в программных файлах звукозаписи.

17. Способ по п.15, в котором целевой профиль применяется к элементам управления громкостью в аудиопроигрывателе.

18. Система для ослабления составного аудиосигнала, содержащая:

средство для дискретизации составного аудиосигнала;

средство для выполнения алгоритма быстрого преобразования Фурье над дискретизированным сигналом для его преобразования в сигнал, представляющий амплитуду частотных составляющих аудиосигнала;

средство для сравнения преобразованного аудиосигнала с заранее заданным профилем пороговых величин амплитуды, представляющим целевую амплитуду для каждой частотной составляющей аудиосигнала, и создания сигнала конфигурирования, представляющего амплитудную разность между преобразованным сигналом и упомянутым профилем;

средство для фильтрации в режиме реального времени преобразованного сигнала посредством фильтра с конечной импульсной характеристикой (КИХ) в соответствии с сигналом конфигурирования так, чтобы фильтр ослаблял амплитуду преобразованного аудиосигнала в полосах частот с центром на частотах, в которых превышена целевая пороговая величина, тем самым формируя ослабленный аудиосигнал; и

средство для вывода ослабленного аудиосигнала.

19. Система по п.18, дополнительно содержащая средство для измерения нижнего периода ширины полосы составного аудиосигнала.

20. Система по п.19, дополнительно содержащая средство для установки периода времени для осуществления алгоритма преобразования Фурье, чтобы он был, по существу, тем же, что упомянутый нижний период.

21. Система по п.18, в которой средство для определения профиля пороговых величин амплитуды аудиосигнала определяет его, по меньшей мере, частично в качестве заданного по умолчанию профиля, определенного в соответствии с предварительными значениями для каждой частоты, как рекомендовано регулятивным органом.

22. Система по п.18, в которой средство для определения профиля пороговых величин амплитуды аудиосигнала содержит средство, позволяющее оператору вручную устанавливать профиль пороговых величин в соответствии с требуемым выходным аудиосигналом.

23. Система по п.18, в которой средство для определения профиля пороговых величин амплитуды аудиосигнала содержит средство для широковещания аудиофрагмента требуемого профиля, средство для контроля вещательного аудиофрагмента и средство для конфигурирования компьютера для настройки аудиофрагмента.

24. Система по п.18, дополнительно содержащая средство для предоставления оператору возможности переопределения ослабления амплитуды выходного сигнала на одной или более частотах.

25. Система по п.24, содержащая средство для компенсации любого ручного переопределения ослабления для любой частоты путем автоматического ослабления амплитуды, по меньшей мере, одной другой частоты.

26. Система по п.18, дополнительно содержащая цифровой процессор сигналов для сохранения целевых профилей.

Описание изобретения к патенту

Настоящее изобретение относится к управлению дозами предоставления аудиоматериалов, например, для управления аудиовыходом громкоговорителей на публичных концертах или подачей аудио на наушники в персональных устройствах воспроизведения музыки.

ОБЛАСТЬ ТЕХНИКИ

Исполнители на публичных музыкальных концертах обычно используют мощные усилительные системы, которые выводят очень высокие уровни шума. Это может вызывать повреждение слуха у участников аудитории, а также у звукооператоров и другого персонала, которые регулярно присутствуют на таких концертах по рабочей обязанности. Повреждение слуха может включать в себя потерю чувствительности на некоторых частотах, или в целом по всему полному спектру аудиочастот (от 20 Гц до 20000 Гц), или может вызывать расстройство слуха, например шум в ушах. Часто такое повреждение не воспринимается потерпевшим вовремя и будет происходить дополнительное повреждение, поскольку потерпевший и дальше будет прослушивать аудиосигналы с повышенной громкостью, чтобы компенсировать уже понесенную потерю слуха. Повреждение является особенно острым на более высокочастотной части спектра слышимых частот, а такие более высокие частоты являются весьма обычными на концертах рок-музыки.

Следовательно, имеется потребность в способах и устройствах, которые могут управлять выводом дозы аудио для систем общественного вещания, используемых на концертах, и для других систем вывода аудио.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Известные системы для управления дозами аудио включают в себя описанные в документах US 2 338 551, US 4 254 303 и US 4 306 115, которые автоматически регулируют выходную громкость громкоговорителей, чтобы компенсировать уровни шумов фона.

В документе US 4 583 245 описана система для защиты динамика от повреждения путем наложения дополнительных частот, чтобы управлять отклонениями диафрагмы динамика.

Документ EP 0 529 158 описывает способ ослабления амплитуды аудиосигнала в полосах частот, в которых либо мгновенные интенсивности, либо совокупная доза звука превышают заранее заданные пороговые величины. В нем используется группа из аналоговых полосно-заграждающих режекторных неперестраиваемых фильтров в одну треть октавы, запускаемых на основе обратной связи от микрофонов, которые контролируют вещательный аудиосигнал и сравнивают его с целевым профилем. При использовании этого известного способа возникает проблема в том, что уменьшается амплитуда всех звуковых составляющих в пределах конкретного частотного диапазона (а не только составляющей, превышающей пороговую величину) и это ведет к ухудшению качества полного звука. Кроме того, имеется переменная задержка времени для фильтрованного звука в зависимости от количества фильтров и их полосы частот ослабления. Эта устойчивая задержка времени создает нежелательные аудио эффекты, такие как тональные сдвиги, ухудшающие качество звука. Также фильтрация происходит после начальной генерации звука, и нефильтрованный всплеск высокой амплитуды проходит перед коррекцией.

Кроме того, поскольку коэффициент ослабления определяется в соответствии с пиком в пределах полосы частот, фактическое применяемое ослабление может быть больше или меньше идеального требуемого уровня, и вновь имеется тенденция появления ненужного ухудшения качества полного звука.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Согласно первому аспекту настоящего изобретения обеспечивается способ управления предоставлением потребителю дозы аудио для составного аудиосигнала, причем способ содержит этапы дискретизации составного аудиосигнала; преобразования дискретизированного аудиосигнала с использованием алгоритма быстрого преобразования Фурье, чтобы создавать сигнал, представляющие амплитуды частот составляющих аудиосигнала; сравнения преобразованного

аудиосигнала с заранее заданным профилем пороговых величин управления импульсами, представляющим целевую максимальную амплитуду для каждой частотной составляющей для профиля пороговых величин аудиосигнала, чтобы создать сигнал конфигурирования, представляющий разность между вещательным сигналом и профилем; использования сигнала конфигурирования, чтобы автоматически конфигурировать в реальном времени фильтр (КИХ) с конечной импульсной характеристикой с тем, чтобы он уменьшал амплитуду преобразованного

аудиосигнала в полосах частот с центром на частотах, в которых превышена целевая пороговая величина; и вывода ослабленного аудиосигнала для предоставления потребителю.

Этот способ имеет преимущество связывания процедур преобразования Фурье, отслеживающих аудиосигнал, и построения фильтра во время исполнения. Использование КИХ-фильтра (с конечной импульсной характеристикой) является особенно выгодным. Они являются внутренне устойчивыми цифровыми фильтрами, реализованными в виде программного обеспечения, обычно исполняющегося в цифровом процессоре (DSP) сигналов. Программное обеспечение выполняет алгоритмы математического моделирования, такие как определенные согласно известной программе MATLAB (зарегистрированный товарный знак), либо чтобы определять характеристику фильтра исходя из данных входных коэффициентов, либо чтобы определять коэффициенты исходя из данной требуемой характеристики. КИХ-фильтр может быть конфигурирован, чтобы эмулировать со значительной точностью очень большое число весьма узкополосных заграждающих фильтров.

Фактически требуемая характеристика КИХ-фильтра по изобретению определяется согласно результату сравнения между дискретизированным составным

аудиосигналом, например, со сцены, и желательно целевого профиля. Желательная характеристика фильтра затем используется, чтобы вычислять коэффициенты фильтра для конкретной частоты, и эти коэффициенты используются для обработки последующих сигналов этой частоты: в данном случае, чтобы подавлять или ослаблять сигнал конкретной частоты для уменьшения значения амплитуды на этой частоте. Фильтрация вводится в действие немедленно, то есть прежде пропускания дискретизированного аудиосигнала на устройство вывода, такое как динамик для вещания или наушники или подобное, предназначенное для персонального потребления, в персональном устройстве воспроизведения музыки.

Предпочтительно используются четыре или большее число подполос для каждой полосы частот. Это может быть выполнено по логарифмической шкале.

Предпочтительно согласно второму аспекту изобретения преобразованные

аудиосигналы, которые превышают заданный профиль пороговых величин, масштабируются, что поясняется более подробно ниже, и для простоты ссылки будет называться "коэффициент усиления элемента дискретизации для способа калибровки".

Поскольку для проектирования кривой характеристики КИХ-фильтра

аудиосигналы прямого эфира используются в реальном времени, то фильтрация более точно приспособлена к требованиям, чем было возможно в известных способах. Это имеет существенные преимущества, поскольку подлежащие ослаблению частотные составляющие могут быть идентифицированы намного более точно, чем ранее, и ослабление более точно задано. Изобретение может значительно уменьшить случаи нежелательного ослабления составляющих, например, таковых, которые близки к целевой частоте. Рабочая характеристика, таким образом, намного превосходит известные системы, использующие неперестраиваемые фильтры, которые имеют неравное ослабление по всему их диапазону частот. Это применяется и к аналоговым, и к цифровым фильтрам, и ошибка становится в большей степени экстремальной на границах диапазона частот. Эту ошибку обычно называют "боковыми лепестками". Однако центральная частота КИХ-фильтра, конфигурированного согласно изобретению, более точно соответствует частотной составляющей, подлежащей ослаблению, и таким образом такие ошибки значительно уменьшаются.

Согласно второму аспекту изобретения обеспечивается система для управления предоставлением потребителю дозы аудио для составного аудиосигнала, причем система содержит: средство для дискретизации составного аудиосигнала; средство для выполнения алгоритма быстрого преобразования Фурье над дискретизированным сигналом, чтобы преобразовывать его в сигнал, представительный для амплитуды частотных составляющих аудиосигнала; средство для сравнения преобразованного аудиосигнала с заранее заданным профилем пороговых величин управления импульсов, представляющим целевую амплитуду для каждой частоты для вещательного аудиосигнала, и создания сигнала конфигурирования, представляющего разность между вещательным сигналом и профилем; средство для автоматического конфигурирования в реальном времени фильтра (КИХ) с конечной импульсной характеристикой в соответствии с сигналом конфигурирования с тем, чтобы фильтр уменьшал амплитуду преобразованного аудиосигнала в полосах частот с центром на частотах, на которых превышена целевая пороговая величина; и средство для вывода ослабленного аудиосигнала для предоставления потребителю.

Один или несколько профилей пороговых величин управления импульсов могут определяться как этап предварительной калибровки в способе согласно первому аспекту изобретения, и они могут сохраняться в быстродействующем цифровом процессоре (DSP) сигналов.

Такие профили могут формироваться полностью или частично с использованием заданных по умолчанию значений, таких как значения, рекомендуемые регулятивными органами. Они также могут быть сформированы вручную. В качестве альтернативы они могут быть сформированы автоматически.

В одном варианте осуществления выполняется вещание записанного заранее сэмпла (аудиофрагмента) и записывается и используется, чтобы сформировать профиль, который если используется в способе по первому аспекту, вызовет то, что уровни ослабления будут отрегулированы, чтобы соответствовать сэмплу.

В другом варианте осуществления профиль создается автоматически путем применения множества различных частот и амплитуд, дискретизации соответствующих выходных сигналов и использования этого, чтобы составить таблицу калибровочных данных для формирования профиля.

Таким образом, согласно третьему аспекту изобретения обеспечивается способ определения профиля пороговых величин управления импульсами, содержащий этапы вещания множества частотных сигналов, включающих в себя множество уровней амплитуд сигнала на каждой частоте; дискретизации вещательных сигналов на каждой частоте и амплитуде и использования дискретизированных сигналов, чтобы составить таблицу калибровочных данных для определения профиля.

Способ по третьему аспекту может использоваться, чтобы определять один или более профилей, используемых в первом и/или втором аспектах изобретения.

Предпочтительно на этот третий аспект влияет размещение двух микрофонов и соответствующих предварительных усилителей в самой близкой позиции, которую слушатель будет занимать относительно громкоговорителей аудиоканала, причем микрофоны разделены в боковом направлении под средним углом размаха относительно угла распространения сигнала громкоговорителя. Этот угол распространения задается в технических описаниях изготовителей.

Соответствующая система также представлена.

Каждый микрофон предпочтительно выполнен с возможностью заранее заданного усиления, то есть калиброван, чтобы обеспечивать заранее заданный выходной сигнал в сравнении с входным сигналом акустического уровня.

Может использоваться генератор синусоидальных импульсов с программируемыми амплитудой и частотой, чтобы свипировать по частоте и амплитуде по всему спектру аудиочастот от 20 Гц до 20000 Гц, и циклируется по амплитуде в каждой контрольной точке частоты. Полученная таблица калибровочных данных может использоваться, чтобы определять профиль пороговых величин регулировки импульсов, подлежащий сравнению с фактическими выборками в течение работы. Эта таблица калибровки усиления для элемента дискретизации для каждой полосы частот элемента дискретизации FFT представляет функцию уровней акустических шумов для уровней электрических входных сигналов на каждой частоте элемента дискретизации по диапазону амплитуд.

Этот способ предварительной калибровки может повысить точность управления импульсами, поскольку он использует фактические измеренные выходные сигналы аудиоканала. Обратная связь в течение работы или события затем не является необходимой для мгновенного управления дозой аудио. Однако обратная связь будет еще использоваться, где все еще является вопросом защита по общей дозе и управление кривой ослабления.

Профиль также может создаваться вручную с использованием навыков звукооператоров и звукоинженеров в микшировании аудиосигналов, например, элементов голоса, инструментальных и специальных эффектов (синтезированных), чтобы получать художественные эффекты в окончательном вещании, обеспечивая полезную системную свободу относительно изменяемого пользователем выбора профилей.

Профили ослабления могут создаваться путем назначения вручную значений допусков для частотных поддиапазонов или элементов дискретизации обычно в диапазоне от нуля до 8,0 дБ.

Заданные по умолчанию границы ослабления предпочтительно выполняются пропорциональными стандартной шкале, взвешенной согласно децибелам (дБА) относительно контрольного уровня шумов. Однако оператор может предпочтительно регулировать эти границы. Например, в зависимости от характера аудиовещания и эффекта, который должен достигаться, он может пожелать увеличить пороговые величины для ослабления некоторых подполос и тогда будет уменьшать пороговые величины для других, чтобы выполнить компенсацию и остаться в границах заранее заданной общей целевой пороговой величины дозы. Эта целевая величина будет вычислена максимальной суммарной дозой уровня звука для события, т.е. целевой средний уровень звука, умноженный на длину совокупности элементарных событий. Это является известным как эквивалентный уровень звука или Leq. Такая максимальная звуковая доза может быть установлена органом стандартизации, таким как Управление безопасности и здравоохранения США (OSHA), и уровень Leq (эквивалентный уровень звука за одну секунду) может сравниваться с таковыми, чтобы обеспечивать выраженную в процентах дозу. OSHA в настоящее время рекомендует максимальное значение 90 дБА, усредненное по продолжительности в 8 часов. Более высокие уровни могут более легко допускаться в течение более коротких промежутков времени.

В качестве альтернативы профили могут быть определены путем осуществления записи составного сигнала в течение заранее заданного промежутка времени, например промежутка времени желательного повышения, затем назначая уровни шума в соответствии со степенью желательного повышения.

Согласно четвертому аспекту изобретения обеспечивается способ повторной записи предварительно записанных аудиосигналов. Способ по этому четвертому аспекту содержит этапы воспроизведения на аудиопроигрывателе аудиофрагмента, например, дорожки звукозаписи, содержащей коммерческую форму записи, такую как запись музыки или голоса; фильтрации воспроизведенного аудиофрагмента с использованием множества фильтров (КИХ) с конечной импульсной характеристикой, установленных в заранее заданных конфигурациях; записи фильтрованного

аудиофрагмента; повторного воспроизведения записанного аудиофрагмента; использования его для определения целевого профиля пороговых величин регулировки импульсов; и применения определенного профиля к средству для управления громкостью воспроизводимого фрагмента.

Профиль может быть целевой предельной дозой по продолжительности заранее заданного промежутка времени, например целевым средним уровнем громкости в течение длительности аудиофрагмента, которой может быть длительность

аудиодорожки или обычный промежуток времени прослушивания. Профиль затем применяется по отношению к средству, определяющему громкость, с которой

аудиофрагмент воспроизводится впоследствии.

Данный аспект изобретения имеет конкретное применение в персональных портативных аудиопроигрывателях, которые традиционно прослушиваются через наушники, иногда на повреждающих слух уровнях громкости. Современными популярными примерами таких проигрывателей являются твердотельные и с миниатюрным жестким диском проигрыватели, записывающие аудиосигналы в сжатых форматах, таких как известный формат MP3. Однако он может использоваться вместе с различными способами сжатия и форматами проигрывателей без существенной модификации.

В таких проигрывателях регулировки громкости управляются посредством процедур программного обеспечения, таких как файлы кодека (кодера-декодера), которые в настоящее время используются, чтобы балансировать уровни громкости между форматами сжатия, например между форматами CD (компакт-диска) и MP3. Определенный целевой профиль может применяться к элементам управления громкостью в CODEC-файлах сжатой записи, чтобы гарантировать, что вещательный аудиофрагмент соответствует профилю, то есть что соблюдается целевой средний уровень громкости.

Этот способ может применяться к сжатой звукозаписи или может применяться непосредственно по отношению к аудиопроигрывателю. На коммерческом уровне, когда устройство записи и/или воспроизведения аудио оснащено, чтобы задействовать данный способ, это может быть подтверждено с помощью символа идентификации. Таким образом лица, которые обеспокоены неосторожным превышением рекомендуемых уровней аудио, будут повторно заверяться, что полный рекомендуемый предельный уровень не превышается.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - график, иллюстрирующий рекомендуемые максимальные дозы аудио для различных частот;

Фиг.2 - график, иллюстрирующий один способ возможного применения настоящего изобретения;

Фиг.3 - схематическое изображение, иллюстрирующее настоящее изобретение в использовании на концерте;

Фиг.4 - блок-схема, иллюстрирующая систему по изобретению;

Фиг.5 - график, иллюстрирующий второй способ возможного применения настоящего изобретения;

Фиг.6 - иллюстрация разновидности второго варианта осуществления;

Фиг.7 - иллюстрация управляющего экранного отображения для использования вместе с изобретением;

Фиг.8 - иллюстрация способа согласно второму варианту осуществления изобретения; и

Фиг.9 - упрощенная временная диаграмма, иллюстрирующая последовательность обработки программного обеспечения для способа, проиллюстрированного на Фиг.8.

ПОДРОБНОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Правительственные и распорядительные органы, такие как Закон о занятости, безопасности и здравоохранении (OSHA, США), опубликовали рекомендуемые допустимые уровни шумов. Диаграмма OSHA показана на Фиг.1, на которой по горизонтали нанесена частота в герцах (Гц) в логарифмическом масштабе в зависимости от громкости в децибелах (дБ) на левой стороне вертикальной оси, и указано рекомендуемое максимальное время экспозиции в минутах на правой стороне вертикальной оси для каждой комбинации частоты и громкости.

Более низкие значения частоты, слева от графика, представляют звуки с более низким основным тоном, а более высокие значения частоты, т.е. с более высокой основой тона, находятся справа. Например, колебания минимального уровня составляют приблизительно 20 герц, звуки гитары, и звуки вокала будут иметь приблизительно 1000 Гц. Частоты выше 10000 Гц будут звучать подобно визжанию. Шкала амплитуды или громкости звука изменяется от 30 дБ (уровень аудиодавления, SPL), представляющих «шепот», через «обычный разговор» приблизительно в 45 дБ (SPL), через «крик» приблизительно в 80 дБ (SPL) до верхних уровней допустимого для организма человека, включая в них звук реактивного самолета, отбирающего приблизительно 120 дБ (SPL), и общепринятой пороговой величины болевого ощущения на верхнем конце шкалы в 140 дБ (SPL).

Видно, что рекомендуемые уровни изменяются значительно. Более низкие частоты могут допускаться на более высоких уровнях в течение более длительного времени, чем более высокие частоты, особенно на высоких уровнях. Так, например, рекомендуемая максимальная доза звука на 300 Гц изменяется приблизительно от 480 минут при 90 дБ (SPL) до только 7 минут при 130 дБ (SPL). При 120 дБ (SPL) частота 100 Гц может допускаться в течение 60 минут, но более высокая частота 3000 Гц может допускаться в течение только 1,5 минут. Конечно, безопасные уровни будут изменятся между индивидуальными участниками аудитории, и эти рекомендации предназначены только для общего руководства.

Такие рекомендации регулятивных органов могут использоваться в качестве основы для определения заранее заданных профилей пороговых величин, подлежащих использованию в данном изобретении.

Фиг.2 является моментальным снимком обычного аудиоспектра в одной конкретной точке во времени в виде графика амплитуды (уровня громкости) в децибелах по вертикальной оси в зависимости от частоты (высоты основного тона) в герцах, представленных на графике по горизонтали на логарифмической шкале.

В верхней части графика показан набор кривых, представляющих профили пороговых величин, которые могут применяться системой по настоящему изобретению, чтобы устанавливать уровни ослабления для контролируемого сигнала, подлежащего вещанию. Эти кривые основаны в целом на кривых OSHA, показанных на Фиг.1. Таким образом, например, если кривая 43 применяется в качестве профиля пороговых величин, то частотные составляющие, показанные в позициях 50, 51, 52 и 53, будут ослаблены на указанные величины, чтобы привести их в линию с кривой 43. Таким образом, частота 51 является наиболее ослабляемой, частота 50 ослабляется следующей за наибольшей, и частоты 52 и 53 ослабляются только на небольшую величину.

Посредством задания целевых отдельных частотных составляющих и использования тщательно заданного профиля настоящее изобретение способно ослаблять наиболее опасные частоты только на необходимую величину, чтобы воспроизводить звук безопасно. Из Фиг.2 может быть видно, что нет необходимости ослаблять большинство частот. Следовательно, общий эффект заявленного способа не представляет значимого сокращения громкости по отношению к аудитории, но значительно снижает риск повреждения слуха.

Уровень кривой профиля может выбираться и изменяться в течение работы в зависимости от мгновенной вычисленной общей дозы аудио. Таким образом, если система вычисляет, что общая доза аудио по всей планируемой длительности концерта будет, вероятно, превышать рекомендуемое значение, то кривая профиля будет перемещена "вниз", то есть к одной из кривых 41 или 42 в примере по Фиг.2. Если общая вычисленная доза ниже общего рекомендуемого значения, то будет использоваться "более высокая" кривая, то есть одна из кривых 44-49.

Суммарная планируемая доза в течение всего концерта вычисляется в виде процента от целевой суммарной и известна как эквивалентная доза LEQ в процентах. Ее можно отображать звукоинженерам постоянно, например, в виде отображения типа «указателя уровня бензина» со стрелкой, указывающей, сколько из суммарной целевой дозы было использовано, и/или в виде графического отображения мгновенного аудиовыхода, или такового в течение предыдущих пяти минут в сравнении со средним значением для концерта в целом.

На Фиг.3 иллюстрируется использование данного изобретения на концерте. Обычно ансамбль 1 играет на сцене перед аудиторией 2. Ансамбль 1 исполняет пение и игру на инструментах и таким образом создает различные инструментальные и вокальные выходные сигналы, которые снимаются адаптерами микрофонов и электронных инструментов. Соответствующие электронные аудиосигналы подаются по проводам 3 на устройство 4 смешения (микшерное устройство), затем обычно на усилители 5 и затем на динамики 6, чтобы транслировать микшированный и усиленный звук ансамбля 1 на аудиторию 2.

Устройство 4 смешения может быть аналоговым или цифровым устройством и обычно управляется опытными звукооператорами, которые изменяют сравнительные интенсивности различных составляющих контролируемого звука ансамбля 1 так, чтобы вещательный сигнал был приемлем для аудитории: например частоты вокала могут быть усилены, чтобы были слышны ясно поверх некоторых из инструментальных звуков. В качестве альтернативы, для некоторых видов музыки, могут быть усилены басовые звуки.

Устройство 4 смешения соединено с набором пост-смесителей, которые действуют в качестве устройств 7 управления, каждому из усилителей соответствует одно устройство управления пост-смесителя 5, и все устройства управления соединены с центральным устройством 8 интеграции, которое соединено с вычислительным устройством, таким как портативный компьютер 9. Кроме того, комплект микрофонов 10 обратной связи помещается посреди аудитории 2, предпочтительно с интервалами вдоль границы 11 аудитории 2, ближайшей к динамикам 11, так чтобы дискретизировать наивысший уровень звука, слышимый аудитории 2. Микрофоны 10 обратной связи предпочтительно реализуют беспроводную связь и передают сигналы, представляющие уровни звука на границе 11, обратно на соответствующие устройства 7 управления и на устройство 8 интеграции. Конечно, микрофоны могут быть аппаратно-реализованными или осуществлять передачу другим средством. Они могут быть подвесными над границей 11, например, с потолка, если доступно, или с портальных рам, которые могут монтироваться вертикально, чтобы поддерживать осветительное оборудование. В качестве альтернативы они могут быть помещены в ограждение от толпы.

Устройство 8 интеграции обрабатывает сигналы от микрофонов 10 обратной связи и вычисляет прогнозные оценки накопленной дозы подачи аудиоматериала в реальном времени через равные промежутки времени, например одну минуту. Портативный компьютер 9 поставляет информацию звукооператорам о текущих дозах звука и хранит также профили целевых пороговых величин и вычисляет прогнозные оценки.

Устройства 7 управления фактически сравнивают аудиосигналы, принятые от устройства 4 смешения, с заранее заданным целевым профилем пороговых величин и ослабляют элементы звуковых сигналов, которые превышают профиль пороговых величин. Их действие будет понято более полно из рассмотрения диаграммы последовательности по Фиг.4.

Входные сигналы на устройства 7 управления обычно будут цифровыми сигналами, но любые аналоговые сигналы будут в любом случае оцифрованы.

На Фиг.4 микрофоны и устройства съема сигнала на сцене представлены в прямоугольнике 20, и поставляют электронные сигналы на устройство 4 смешения, который поставляет сигнал T временной области на устройство 7 управления. Устройство 7 управления включает в себя микропрограммное обеспечение 21, которое выполняет операцию быстрого преобразования Фурье (FFT) над сигналом T временной области, чтобы преобразовать его в сигнал F частотной области, то есть чтобы обеспечить спектр, указывающий амплитуду спектра значений частот, например, как показано на Фиг.5, которая описана далее.

Устройство 7 управления включает в себя компаратор 22, который сравнивает спектр частот, сформированный посредством операции быстрого преобразования Фурье, с профилем P пороговых величин, поданным от портативной ЭВМ 9. Компаратор 22 идентифицирует те частоты, для которых мгновенная амплитуда превышает определенную посредством пороговой величины, и выводит сигнал C конфигурации, характерный для этих частот. Этот сигнал C конфигурации применяется по отношению к настраиваемому фильтру 23, который предпочтительно содержит фильтр (КИХ) с конечной импульсной характеристикой. КИХ-фильтры являются конфигурируемыми в реальном масштабе времени, с тем чтобы ослаблять амплитуду сигнала, занимающего полосу частот с центром на точной частоте составляющей, которая превышает пороговую величину. Конфигурированный КИХ-фильтр 23 затем используется, чтобы ослабить амплитуду сигнала T временной области, и выполняется вещание фильтрованного сигнала через усилители 5 и динамики 6.

На Фиг.4 также иллюстрируется один способ формирования конкретного профиля P пороговых величин. Транслируемый от динамика 6 звук контролируется, по меньшей мере, одним микрофоном 10 обратной связи, который предпочтительно помещен на границу аудитории, ближайшую к динамику или динамикам, как показано на Фиг.3. Сигнал от микрофона или микрофонов 10 обратной связи подается через интегратор 8 на портативный компьютер 9, где он анализируется, чтобы определить типовой аудиопрофиль для конкретного выполняемого действия. Он может быть таким, например, как показано на Фиг.6, которая описана далее. Типовой профиль затем может быть добавлен к заранее заданной кривой ослабления, например, как проиллюстрировано на Фиг.2, чтобы создать составной профиль P, который применяется для компаратора 22 в блоке управления 7.

В документе EP 0 529 158A иллюстрируется аналоговый пример, в котором слышимые частоты разделяются на 16 частотных полос, и выдаются сигналы, представляющие среднюю амплитуду для каждой полосы. Настоящее изобретение использует цифровую технологию и способно эффективно обеспечивать намного более точное представление слышимого спектра (частот), и амплитуду каждой частотной составляющей.

Изобретение также может обеспечивать способ, которым звукоинженер может подстраивать профиль пороговых величин, используемый в ослаблении, чтобы допускать некоторые привилегии. Например, может быть желательно выделить ведущий вокал или ведущую гитару по сравнению с заданным по умолчанию профилем. С этой целью компьютер 9 может быть установлен так, чтобы допускать, чтобы некоторые конкретные полосы частот достигали более высоких уровней амплитуды, чем в ином случае разрешал бы заданный по умолчанию профиль пороговых величин. Это показано на Фиг.5, где кривые 42-44 пороговых величин модифицированы в подполосах частот от 60-65. Это может быть, например, чтобы передавать «взрыв» ведущей гитары в 60, чтобы выделить ведущий вокал в 61, чтобы выделить второй вокал в 62, чтобы отменить выделение обратной связи в 63, передать звук «тарелок» в 64 и чтобы отменить выделение обратной связи на более высокой частоте в 65. Обычно модификация была бы в диапазоне +8 дБ, допуская более «громкие» уровни на частоте до -12 дБ, снижая уровень громкости. Конечно это является только одним примером в известной мере предварительной конфигурации, которую допускает настоящее изобретение.

Профиль привилегий может быть вручную введен опытным звукоинженером, но более предпочтительно он формируется автоматически, исходя из предварительно записанного или мгновенно дискретизированного элемента концертной программы. Например, конкретный вокалист может иметь отличительный профиль голоса, который желательно не изменять ослаблением. Таким образом, аудиофрагмент представления вокалиста может быть принят и подан в портативный компьютер 9, который будет использовать его, чтобы наложить на кривую заданного по умолчанию профиля пороговых величин. Это проиллюстрировано на Фиг.6, где

аудиофрагмент вокала певицы 71 показан в виде графика в 72 зависимости от частоты от амплитуды, и показан наложенным на выбранную кривую пороговой величины, например, 43 по Фиг.2, чтобы сформировать составной профиль 73.

Профиль 72 может формироваться в течение концерта в соответствии с выборками, полученными от микрофонов обратной связи 10.

На Фиг.7 показан пример экранного отображения на портативном компьютере 9, указывающий выбор профилей ослабления, доступных звукоинженеру в течение концерта, чтобы позволять тщательную координацию профилей с конкретными ансамблями и песнями. Например, экран может быть разделен на четыре части A, B, C и D, соответствующие четырем различным ансамблям, играющим на концерте, и каждая песня может быть пронумерована от 1 до 5, как показано. Может иметься всплывающий «бегущий прямоугольник», такой как показан в 78 для песни 2 ансамбля B. Этот прямоугольник 78 приводит больше подробностей для песни, например "лидерство Джона для "взрыва" B-2 соло", и покажет аудиофрагмент для профиля, подлежащего наложению на заданную по умолчанию кривую (например, 43 на Фиг.4), когда профиль «включен». Эта форма отображения и хранения конкретных профилей дает возможность звукоинженеру полной гибкости, чтобы адаптироваться к изменениям в отдельные моменты или последовательности исполнения в течение концерта.

Изобретение позволяет звукоинженерам полное эффективное управление применяемым ослаблением, с тем чтобы могли поддерживаться конкретное художественное содержание и специальные эффекты.

Смонтированные цифровые фонограммы концертного исполнения могут быть сформированы исходя из сигналов прежде трансляции, что является полезным, поскольку эти фонограммы не имеют паразитного шума и готовы к студийному повторному обновлению, как требуется.

Изобретение также может использоваться для цифровой перезаписи записанной музыки, в частности той, которая коммерчески продается в сжатой форме, такой как формат CD или MP3, и обычно воспроизводится на персональных портативных

аудиопроигрывателях.

Аудиофрагмент воспроизводится на эталонном аудиопроигрывателе, и выходной сигнал фильтруется с использованием фильтров (КИХ) с конечной импульсной характеристикой, устанавливающих значение по умолчанию или заранее заданные значения. Фильтрованный выходной сигнал затем используется, чтобы задавать целевой профиль, определяющий средний уровень громкости, удовлетворяющий целевому профилю, и он применяется к CODEC-файлам сжатой записи. Это может выполняться с использованием одного блока управления пост-смесителем, такого как показан на Фиг.7, для каждой аудиофонограммы, и центрального блока интеграции.

В расширенной форме изобретения, проиллюстрированной на Фиг.8 и 9, низкие частоты, предпочтительно ниже 100 Гц, исключают из обработки сигналов и позволяют проходить в виде основной несущей. Это уменьшает распространение задержки и уменьшает искажения в выходном сигнале, которые могут происходить вследствие ступенчатых изменений, происходящих в начале и останове применений самого низкого фильтра.

Четыре буфера обратного FFT добавлены к основной несущей, чтобы формировать составной аудиовыходной сигнал. Обычно задержка распространения может быть снижена до 85 миллисекунд для самого низкого диапазона, 43 миллисекунд для второго, 21 миллисекунды для третьего и пяти миллисекунд для четвертого.

Любые очень низкие частоты, вносящие вклад противоположно по отношению к накопленной дозе, могут управляться посредством простого аттенюатора после буферного суммирования, но такие низкие частоты обычно вносят вклад менее 1% от обычной полной дозы аудио, так что это не является существенным.

На Фиг.8 схематично показан приспособленный к этим условиям способ. Входной составной сигнал IN преобразовывается в цифровой посредством 24-разрядного аналого-цифрового преобразователя (АЦП, A/D) 100, работающего на 48 КГц, и фильтруется посредством КИХ-фильтра 101 на 24 кГц. Самые низкие частоты, ниже 100 Гц, могут пройти через КИХ-фильтр 102 и сформировать сигнал основной несущей, который вводится в блок 103 суммирования. Частоты выше 100 Гц подвергаются действию способа, соответствующего изобретению, то есть они подвергаются процессу разборки, использующему алгоритмы быстрого преобразования Фурье и фильтрацию КИХ, во входном кольцевом буфере 104 FFT, который работает в четырех диапазонах 1, 2, 3 и 4, как показано между 100 Гц и 24 кГц. Диапазоны преобразуются и ослабляются в соответствующих блоках 121, 122, 123 и 124 и обратно преобразуются посредством соответствующих блоков 131, 132, 133 и 134, и результирующие сигналы в четырех диапазонах затем подаются на блок 103 суммирования для суммирования с основной несущей. Суммированный сигнал затем масштабируется с помощью блока 105 масштабирования нижних частот и преобразовывается в аналоговый в цифроаналоговом преобразователе (ЦАП, D/A) 106 для формирования выходного сигнала OUT.

Разнесение четырех диапазонов основано на принятой практике перцепционного кодирования. Каждый диапазон определяет сегмент выборки, предварительную обработку выборки, например вставку нулевых битов, исполнение полного комплексного FFT и сравнения величин амплитуд в дБ с фильтрацией гармоник частотной области.

На Фиг.9 показана упрощенная временная диаграмма, иллюстрирующая основную последовательность действий обрабатывающего программного обеспечения для способа, проиллюстрированного на Фиг.8. Конечно, значения частот дискретизации и перекрытий данных диапазонов даются только в качестве примеров и будут оптимизированы для конкретных применений. Такой оптимизации можно содействовать путем поддержания в запоминающем устройстве набора конфигурационных параметров, чтобы позволить диспетчеру программ персонального компьютера (PC) выполнять изменения.

Схемное решение по Фиг.9 включает в состав те же элементы, что и Фиг.8, и использованы одинаковые ссылочные позиции. Перечень описаний программных процедур следует ниже:

Описания программных процедур

A/D Дискретизация аудиоканала с параметрами 48 кГц, 24 бита. Это непрерывная фоновая процедура, которая загружает входящие преобразования на приемный кольцевой буфер.

24K FIR КИХ-фильтр нижних частот для 4095-сэмпла с неравномерностью характеристики полосы пропускания в 0,02 дБ и 60 дБ подавления сигнала полосы заграждения, используемый в качестве общего фильтра защиты от наложения спектров. Фильтр действует с приращением над приемным кольцевым буфером с коэффициентом, установленным с помощью результирующего выходного сигнала, сохраненного в кольцевом буфере FFT и кольцевом буфере сигнала основной несущей.

100 FIR КИХ-фильтр нижних частот для 4095-сэмпла с неравномерностью характеристики полосы пропускания в 0,02 дБ, и подавлением сигнала полосы заграждения в 60 дБ, используемый для удаления всего, кроме составляющих буфера сигнала основной несущей.

Buffer управление дозами аудио, патент № 2419964 Процедура суммирования, которая суммирует основную несущую, элементы кольцевого буфера обратного FFT-1, обратного FFT-2, обратного FFT-3 и обратного FFT-4. Эта процедура также поддерживает пиковое обновление динамического диапазона, которое применяет подстройку шкалы нижних частот для любого необходимого ослабления нижних частот.

D/A 48 кГц, 24-битовый выходной сигнал в ослабленном звуковом канале. Это постоянная фоновая процедура, которая загружается из процедуры суммирования буфера и выводит непосредственный (прямой) аналоговый уровень.

A-Load Испытательная ветвь, которая проверяет позицию загрузки приемного кольцевого буфера по отношению к инициированной фильтрацией перезагрузке буфера сигнала основной несущей.

B-Load Испытательная ветвь, которая проверяет позицию кольцевого буфера FFT по отношению ко времени четырех диапазонов вычислений FFT относительно альтернативных исполнений, как показано в «выборе прохода».

FFT-4 Процедура FFT для самой высокой частоты, действует на кольцевом буфере FFT с указанной альтернативной дискретизацией и вставкой нулевых битов.

FATN-4 Используемый частотный диапазон элемента дискретизации спектра FFT-4 сравнивается с профилем прямого ослабления (принятым от диспетчера программ) и любые элементы дискретизации, превышающие профиль, приводятся к уровню профиля.

BUFF-4 Ослабленный спектр FFT-4 регулируется для подстройки временной области, обратное FFT исполняется над ослабленным спектром, и результат загружается на выход кольцевого буфера суммирования FFT-4.

FFT-3 Процедура FFT для средне-высокой частоты, действует над кольцевым буфером FFT с указанной альтернативной дискретизацией и вставкой нулевых битов.

FATN-3 Используемый частотный диапазон элемента дискретизации спектра FFT-3 сравнивается с непосредственным профилем ослабления (принятым от диспетчера программ) и любые элементы дискретизации, превышающие профиль, приводятся к уровню профиля.

BUFF-3 Ослабленный спектр FFT-3 регулируется для подстройки временной области, обратное FFT выполняется над ослабленным спектром, и результат загружается в кольцевой буфер FFT-4 для суммирования выходного сигнала.

FFT-2 Процедура FFT для средних-нижних частот действует над кольцевым буфером FFT с указанной альтернативной дискретизацией и вставкой нулевых битов.

FATN-2 Используемый частотный диапазон элемента дискретизации спектра FFT-2 сравнивается с профилем прямого ослабления (принятым от диспетчера программ) и любые элементы дискретизации, превышающие профиль, приводятся к уровню профиля.

BUFF-2 Ослабленный FFT-2 спектр регулируется для подстройки временной области, обратное FFT выполняется над ослабленным спектром, и результат загружается в кольцевой буфер FFT-4 для суммирования выходной сигнала.

FFT-1 Процедура FFT для нижних частот действует над кольцевым буфером FFT с указанной альтернативной дискретизацией и вставкой нулевых битов.

FATN-1 Используемый частотный диапазон элемента дискретизации из спектра FFT-1 сравнивается с профилем прямого ослабления (принятым от диспетчера программ) и любые элементы дискретизации, превышающие профиль, приводятся к уровню профиля.

BUFF-1 Ослабленный спектр FFT-1 регулируется для подстройки временной области, выполняется обратное FFT над ослабленным спектром, и результат загружается в кольцевой буфер FFT-4 для суммирования выходного сигнала.

COMM Chk Испытательная ветвь, чтобы выяснять, произошло ли прерывание связи, начиная с последнего прохода, вследствие запроса данных диспетчера программ.

EXCHG Эта процедура обрабатывает обмен последовательно передаваемыми данными относительно границ полос входящего профиля и исходящих немедленных уровней.

Класс H03G5/16 с автоматическим управлением

способ коррекции воспроизведения акустического сигнала электроакустическим преобразователем и устройство для его осуществления - патент 2419963 (27.05.2011)
способ и устройство для декодирования параметрического закодированного звукового сигнала - патент 2382485 (20.02.2010)

способ осуществления эквалайзера в декодере аудиосигнала и устройство для его осуществления - патент 2381617 (10.02.2010)
способ частотной коррекции и автоматическое устройство для его реализации - патент 2302074 (27.06.2007)
способ настройки звуковоспроизводящего тракта - патент 2297712 (20.04.2007)
способ автоматической настройки радиоэлектронного устройства и автоматический регулятор - патент 2292126 (20.01.2007)
способ автоматического управления тембром и автоматический регулятор - патент 2290750 (27.12.2006)
способ автоматической адаптивной частотной коррекции (варианты) - патент 2284648 (27.09.2006)
психоакустический процессор - патент 2279759 (10.07.2006)
адаптивный эквалайзер (варианты) - патент 2279758 (10.07.2006)