способ и устройство для масштабируемого кодирования/декодирования аудиосигналов

Классы МПК:	G11B20/10 цифровая запись или воспроизведение H03M7/40 преобразование в коды переменной длины или из них, например код Шеннона-Фано, код Хафмана, код Морзе G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи
Автор(ы):	КИМ Йеон-бае (KR)
Патентообладатель(и):	САМСУНГ ЭЛЕКТРОНИКС КО., ЛТД. (KR)
Приоритеты:	подача заявки: 1997-12-30 публикация патента: 20.02.2004

Изобретение относится к кодированию и декодированию аудиосигналов и может быть использовано в системах передачи аудиоданных. Согласно способу кодирования (а) обрабатывают входные аудиосигналы и квантуют их для каждой полосы кодирования; (b) кодируют квантованные данные, соответствующие базовому уровню, в пределах определенного размера уровня; (с) кодируют квантованные данные, соответствующие следующему уровню расширения, и остальные некодированные и принадлежащие кодируемому уровню квантованные данные, и (d) последовательно выполняют этапы кодирования уровня для всех уровней, причем каждый из этапов (b), (с) и (d) включает ряд операций, в результате выполнения которых генерируют потоки битов путем кодирования квантованных данных, соответствующих информации распределения битов диапазона голоса, размеру шага квантования, индексу и количеству битов, выделенных соответствующим субполосам. Предложены также способ для декодирования и соответствующие устройства для реализации способов. Изобретение обеспечивает приспособляемость к любому состоянию канала передачи аудиоданных и к запросам различных пользователей. 4 с. и 17 з.п. ф-лы, 2 табл., 20 ил.

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11, Рисунок 12, Рисунок 13, Рисунок 14, Рисунок 15, Рисунок 16, Рисунок 17, Рисунок 18, Рисунок 19, Рисунок 20, Рисунок 21, Рисунок 22, Рисунок 23, Рисунок 24, Рисунок 25, Рисунок 26, Рисунок 27, Рисунок 28, Рисунок 29, Рисунок 30, Рисунок 31, Рисунок 32, Рисунок 33, Рисунок 34, Рисунок 35, Рисунок 36, Рисунок 37, Рисунок 38, Рисунок 39, Рисунок 40, Рисунок 41, Рисунок 42, Рисунок 43, Рисунок 44, Рисунок 45

Формула изобретения

1. Способ масштабируемого кодирования аудиосигналов для кодирования аудиосигналов в многоуровневом потоке данных, имеющем базовый уровень и предварительно определенное число уровней расширения, по которому (a) обрабатывают входные аудиосигналы и квантуют эти сигналы для каждой предварительно определенной полосы кодирования; (b) кодируют квантованные данные, соответствующие базовому уровню, в пределах предварительно определенного размера уровня; (c) кодируют квантованные данные, соответствующие следующему уровню расширения кодированного базового уровня, и остальные некодированные и принадлежащие кодируемому уровню квантованные данные, в пределах предварительно определенного размера уровня; и (d) последовательно выполняют этапы кодирования уровня для всех уровней, причем каждый из этапов (b), (с) и (d) включает следующие этапы: (i) получают информацию распределения битов диапазона голоса, представляющую количество битов квантованных данных, соответствующих соответствующим субполосам, принадлежащим уровню, который подлежит кодированию; (ii) получают количество битов, выделенных соответствующим субполосам в пределах размера каждой субполосы уровней; (iii) генерируют индекс, представляющий наличие квантованных данных для предварительно определенных частотных составляющих, образующих cубполоcы, для квантованных данных, соответствующих количеству выделенных битов, и (iv) генерируют потоки битов путем кодирования квантованных данных, соответствующих информации распределения битов диапазона голоса, размеру шага квантования, индексу и количеству битов, выделенных соответствующим cубполоcам, посредством предварительно определенного способа кодирования.

2. Способ масштабируемого кодирования аудиосигналов по п.1, по которому квантованные данные, соответствующие количеству выделенных соответствующим субполосам бит, кодируют от самого старшего бита до самого младшего бита.

3. Способ масштабируемого кодирования аудиосигналов по п.2, по которому кодирование квантованных данных, соответствующих количеству выделенных битов, выполняют на этапе (iv) посредством объединения квантованных данных в блоки из заданного количества битов.

4. Способ масштабируемого кодирования аудиосигналов по п.2, по которому количество выделенных битов на этапе (ii) составляет один бит, а этап (iv) заключается в генерации информации распределения битов диапазона голоса и индекса в виде потоков битов посредством предварительно определенного способа кодирования.

5. Способ масштабируемого кодирования аудиосигналов по п.1, по которому в качестве предварительно определенного способа кодирования используют способ предварительно определенного кодирования без потерь.

6. Способ масштабируемого кодирования аудиосигналов по п.5, по которому кодирование без потерь представляет собой кодирование по алгоритму Хаффмана.

7. Способ масштабируемого кодирования аудиосигналов по п.5, по которому кодирование без потерь представляет собой арифметическое кодирование.

8. Способ масштабируемого кодирования аудиосигналов по п.1, по которому этап (а) включает следующие этапы: преобразуют входные аудиосигналы временной области в сигналы частотной области; объединяют преобразованные сигналы в виде сигналов предварительно определенных субполос посредством отображения время/частота и вычисления порога маскирования на каждой субполосе; и квантуют сигналы для каждой предварительно определенной полосы кодирования так, чтобы шум квантования каждой полосы был меньше порога маскирования.

9. Устройство масштабируемого кодирования аудиосигналов для кодирования аудиосигналов в многоуровневый поток данных, имеющий базовый уровень и предварительно определенное число повышающихся уровней, содержащее блок квантования для обработки входных аудиосигналов и их квантования для каждой полосы кодирования, и блок компоновки битов, включающий блок информации распределения битов диапазона голоса для генерации информации распределения битов диапазона голоса, представляющей количество битов квантованных данных, соответствующих соответствующим субполосам, принадлежащих уровню, подлежащему кодированию, блок для генерации информации индекса, для получения количества битов, выделенных соответствующим субполосам, и для генерации информации индекса, представляющей наличие данных для предварительно определенных частотных составляющих квантованных данных, соответствующих количеству битов, выделенных соответствующим субполосам, и блок кодирования для кодирования информации распределения битов диапазона голоса, размера шага квантования, информации индекса, и квантованных данных, соответствующих количеству битов, выделенных соответствующим субполосам, в котором блок компоновки битов кодирует информацию распределения битов диапазона голоса, индекс, размер шага квантования и квантованные данные следующего уровня после завершения кодирования базового уровня, для выполнения кодирования на всех уровнях.

10. Устройство масштабируемого кодирования аудиосигналов по п.9, в котором блок кодирования кодирует квантованные данные, соответствующие количеству выделенных битов для каждой субполосы, от самого старшего бита к младшим битам.

11. Устройство масштабируемого кодирования аудиосигналов по п.10, в котором блок кодирования кодирует, объединяя биты в блоки с предварительно определенным количеством бит.

12. Устройство масштабируемого кодирования аудиосигналов по п.10, в котором количество выделенных битов блока компоновки битов составляет один бит, и блок кодирования осуществляет кодирование по информации распределения битов диапазона голоса и индексу посредством заранее определенного метода кодирования.

13. Устройство масштабируемого кодирования аудиосигналов по п.10, в котором блок кодирования выполняет кодирование последовательно от низкочастотных составляющих к высокочастотным составляющим.

14. Устройство масштабируемого кодирования аудиосигналов по п.9 или 10, в котором блок квантования содержит блок отображения время/частота для преобразования входных аудиосигналов временной области в сигналы частотной области; блок психоакустической обработки для объединения преобразованных сигналов с помощью сигналов предварительно определенных субполос посредством отображения время/частота и вычисления порога маскирования в каждой субполосе; и блок квантования для квантования сигналов для каждой предварительно определенной полосы кодирования, так чтобы шум квантования каждой полосы был меньше порога маскирования.

15. Способ масштабируемого декодирования аудиосигнала для декодирования аудиосигналов, закодированных таким образом, что они имеют множество уровней скорости передачи в битах, который включает следующие этапы: декодируют информацию распределения битов диапазона голоса для каждой субполосы базового уровня, представляющей количество бит квантованных данных соответствующих субполос, принадлежащих базовому уровню, индекс, представляющий наличие данных для предварительно определенных частотных составляющих квантованных данных, соответствующих количеству битов, выделенных соответствующим субполосам, размер шага квантования и квантованные данные в генерированном порядке уровней потоков битов, причем декодирование выполняют путем получения количества бит, выделенных субполосам, принадлежащим каждому уровню, и декодирования квантованных данных, соответствующих количеству выделенных бит, с обращением к индексу; восстанавливают декодированный размер шага квантования и квантованные данные в сигналы, имеющие исходные уровни, и преобразуют деквантованные сигналы частотной области в сигналы временной области.

16. Способ масштабируемого декодирования аудиосигналов по п.15, по которому декодирование квантованных данных на этапе декодирования выполняют от самого старшего бита к младшим битам.

17. Способ масштабируемого декодирования аудиосигналов по п.15, по которому декодирование квантованных данных на этапе декодирования выполняют в блоках векторов заданного числа битов.

18. Способ масштабируемого декодирования аудиосигналов по п.15, по которому этап декодирования выполняют посредством арифметического декодирования.

19. Способ масштабируемого декодирования аудиосигналов по п.15, отличающийся тем, что этап декодирования выполняют посредством декодирования по алгоритму Хаффмана.

20. Устройство масштабируемого декодирования для декодирования аудиоданных, закодированных таким образом, что они имеют множество уровней скорости передачи битов, содержащее блок анализа потока битов, включающий первый декодирующий блок для декодирования информации распределения битов диапазона голоса для каждой субполосы уровня, представляющей количество битов квантованных данных соответствующих субполос, принадлежащих уровню, размера шага квантования и информации индекса, представляющей наличие данных для предварительно определенных частотных составляющих квантованных данных, соответствующих количеству битов, выделенных соответствующим субполосам, и декодирования квантованных данных в генерированном порядке уровней потоков битов, и второй декодирующий блок для получения количества битов, выделенных субполосам, принадлежащим каждому уровню, и декодирования квантованных данных, соответствующих количеству выделенных битов, с обращением к информации индекса; блок обратного квантования для восстановления декодированного размера шага квантования и квантованных данных в сигналы, имеющие исходные уровни; и блок отображения частота/время для преобразования сигналов частотной области, прошедших обратное квантование, в сигналы временной области.

21. Устройство масштабируемого декодирования аудиосигналов по п.20, в котором второй декодирующий блок декодирует квантованные данные от самого старшего бита к младшим битам.

Описание изобретения к патенту

Текст описания в факсимильном виде (см. графическую часть)у

Класс G11B20/10 цифровая запись или воспроизведение

устройство воспроизведения, способ записи, система воспроизведения носителя записи - патент 2522304 (10.07.2014)
устройство воспроизведения данных с носителя записи - патент 2512088 (10.04.2014)

оптический носитель для записи информации, устройство для записи информации, устройство для воспроизведения информации, способ записи информации, способ воспроизведения информации и способ изготовления оптического носителя для записи информации - патент 2511701 (10.04.2014)
способ и устройство для обработки сигнала для трехмерного воспроизведения дополнительных данных - патент 2510081 (20.03.2014)
устройство воспроизведения для воспроизведения данных с носителя хранения информации - патент 2491661 (27.08.2013)
устройство для воспроизведения данных с носителя для хранения информации - патент 2490730 (20.08.2013)
информационный носитель данных, приспособленный для управления структурой данных записанных на нём аудио-видеоданных, и устройство воспроизведения - патент 2484544 (10.06.2013)
способ записи информации и способ воспроизведения информации - патент 2483369 (27.05.2013)
устройство воспроизведения - патент 2481651 (10.05.2013)
носитель информации, содержащий метаданные для многоракурсного тайтла, и устройство и способ для его воспроизведения - патент 2480849 (27.04.2013)

Класс H03M7/40 преобразование в коды переменной длины или из них, например код Шеннона-Фано, код Хафмана, код Морзе

способ восстановления искаженных сжатых файлов - патент 2510957 (10.04.2014)
кодирование кодов переменной длины с эффективным использованием памяти - патент 2426227 (10.08.2011)
способ обработки движущегося изображения, носитель записи, на котором записана программа способа обработки движущегося изображения, и устройство обработки движущегося изображения - патент 2423017 (27.06.2011)
аппаратура и способ оценки объема кода, а также носитель информации для его реализации - патент 2420911 (10.06.2011)
эффективное кодирование и декодирование блоков преобразования - патент 2417518 (27.04.2011)
эффективное по использованию памяти адаптивное блочное кодирование - патент 2413360 (27.02.2011)
способ формирования и проверки заверенного цифровым водяным знаком электронного изображения - патент 2399953 (20.09.2010)
способ сжатия данных - патент 2386210 (10.04.2010)
адаптивная группировка параметров для улучшенной эффективности кодирования - патент 2368074 (20.09.2009)
вставка дополнительных данных в кодированный сигнал - патент 2251819 (10.05.2005)

Класс G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение - патент 2527760 (10.09.2014)
низведение параметров последовательности битов sbr - патент 2526745 (27.08.2014)
система стереотелевидения - патент 2525757 (20.08.2014)
стереофоническое кодирование на основе mdct с комплексным предсказанием - патент 2525431 (10.08.2014)
моделируемое снижение соотношения сигнал-шум в декодированном цифровом звуковом сигнале в зависимости от коэффициента однобитовых ошибок в беспроводном канале связи - патент 2524564 (27.07.2014)
передатчик - патент 2523934 (27.07.2014)
устройство для формирования выходного пространственного многоканального аудио сигнала - патент 2523215 (20.07.2014)
устройство и способ обработки аудио сигнала - патент 2523173 (20.07.2014)
способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала - патент 2522020 (10.07.2014)
переключаемая аудио кодирующая/декодирующая схема с мультиразрешением - патент 2520402 (27.06.2014)