способ передачи и приема закодированной речи

Классы МПК:G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи
Автор(ы):, ,
Патентообладатель(и):Дочернее государственное унитарное научно-исследовательское предприятие "АРГУС"
Приоритеты:
подача заявки:
2002-02-26
публикация патента:

Изобретение относится к преобразованию и передаче речевых сигналов. Его использование для передачи закодированной речи по каналам тональной частоты позволяет обеспечить технический результат в виде повышения качества и разборчивости речи. Этот технический результат достигается благодаря тому, что максимально возможный диапазон частот исходного сигнала от 0 до 2400 Гц передается в полосе частот 300-2700 Гц, в котором частоты выше 2400 Гц оказывают решающее влияние на разборчивость речи. Кроме того, дискретизация осуществляется не с удвоенной наивысшей частотой передаваемого спектра, а с частотой, равной удвоенной ширине этого спектра, что как раз и позволяет сдвинуть спектр передаваемого сигнала в область высоких частот. Для этого сначала спектр речевого сигнала 300-2700 Гц сдвигается в сторону низких частот на величину fcp=1500 Гц, равную средней частоте полосы частот, выделяемой для передачи речевого сигнала, и низкочастотной фильтрации этого сигнала с получением его синфазной и квадратурной составляющих, имеющих наивысшую частоту 1200 Гц, которые дискретизируются с частотой 2400 Гц, преобразуются в последовательности значений амплитуд и фаз в полярной системе координат, по отдельности засекречиваются, преобразуются в единый временной поток отсчетов и после цифроаналогового преобразования передаются по стандартному телефонному каналу связи. 2 ил.
Рисунок 1, Рисунок 2

Формула изобретения

Способ передачи и приема закодированной речи по предварительно откорректированному и засинхронизированному по тактовой, кадровой частотам и криптографическому алгоритму каналу связи, по которому на передающей стороне преобразуют аналоговый речевой сигнал в цифровую форму методом аналого-цифрового преобразования, используют операции нормализации числа уровней и представления цифровых речевых сигналов в полярной системе координат в виде цифровых значений амплитуд и фаз, увеличивают значения амплитуд на величину защитного интервала и засекречивают отдельно значения амплитуд и фаз по модулю 2r, где r - целое положительное число, после чего осуществляют дифференциальное кодирование засекреченных значений амплитуд и фаз сигналов и преобразование последних из частотной области во временную, присоединяют к временному потоку отсчетов циклический префикс и отсчеты полученного единого временного потока преобразуют методом цифроаналогового преобразования в аналоговый сигнал, который передают в канал связи, а на приемной стороне принимаемый аналоговый сигнал методом аналого-цифрового преобразования преобразуют в последовательность цифровых сигналов, которые, в свою очередь, преобразуют из временной области в частотную путем использования прямого преобразования Фурье для вычисления действительной и мнимой частей принятого цифрового сигнала, по которым определяют амплитуды и фазы гармоник этого сигнала, осуществляют дифференциальное декодирование значений амплитуд и фаз сигналов, после чего рассекречивают по модулю 2r отдельно значения амплитуд и фаз, уменьшают рассекреченные значения амплитуд на величину защитного интервала, используют операции денормализации числа уровней, низкочастотной фильтрации, формирования единого временного потока цифровых отсчетов и цифроаналогового преобразования этого потока, отличающийся тем, что на передающей стороне после операции преобразования аналогового речевого сигнала в цифровую форму и перед операцией увеличения значений амплитуд сигналов на величину защитного интервала формируют синфазную и квадратурную составляющие цифрового сигнала путем умножения цифрового сигнала на комплексную экспоненту exp(-j27способ передачи и приема закодированной речи, патент № 2221284fcpnT), где fcp - средняя частота полосы частот, выделяемой для передачи речевого сигнала, Т - временной интервал следования цифровых отсчетов, n=0, 1, 2,... - номер отсчета, после этого осуществляют низкочастотную фильтрацию указанных составляющих и прореживают их цифровые отсчеты, при этом значения амплитуд и фаз сигналов формируют по прореженным отсчетам синфазной и квадратурной составляющих, операцию нормализации числа уровней применяют к значениям амплитуд сигналов, а на приемной стороне операцию денормализации числа уровней применяют к уменьшенным на величину защитного интервала рассекреченным значениям амплитуд, после чего с использованием рассекреченных значений фаз и денормализованных значений амплитуд сигналов формируют отсчеты синфазной и квадратурной составляющих рассекреченного цифрового речевого сигнала, экспандируют частоту дискретизации синфазной и квадратурной составляющих, осуществляют их низкочастотную интерполяцию, затем спектр интерполированных составляющих переносят на частоту fсp в сторону верхних частот, при этом операцию формирования единого временного потока цифровых речевых сигналов осуществляют из перенесенных по спектру упомянутым выше способом отсчетов синфазной и квадратурной составляющих, низкочастотную фильтрацию осуществляют после формирования единого временного потока цифровых отсчетов перед их цифроаналоговым преобразованием.

Описание изобретения к патенту

Изобретение относится к способам преобразования речевых сигналов связи и может быть использовано для передачи закодированной речи по каналам тональной частоты, образованным кабельными и радиолиниями связи, в частности, коротковолновыми линиями.

Известные методы стойкого засекречивания речевого сигнала основаны на преобразовании его в цифровую форму с последующим наложением на цифровой сигнал, например, по модулю два, псевдослучайной последовательности, вырабатываемой на приемной и передающей сторонах синхронизированными генераторами, использующими один и тот же криптографический ключ, неизвестный посторонним лицам [1].

Пропускная способность канала связи, необходимая для передачи засекреченного сигнала в двоичной форме, в зависимости от требований к качеству речи и динамическому диапазону составляет десятки и даже сотни кбит/с [2, с. 112-113], что не позволяет передавать этот сигнал по стандартным каналам тональной частоты (ТЧ) с шириной полосы пропускания 300способ передачи и приема закодированной речи, патент № 22212843400 Гц.

Например, известно устройство конфиденциальной связи с асинхронным методом передачи (АТМ) [3]. Устройство осуществляет засекречивание речи по ГОСТ 28147-89 и обеспечивает скорость речепреобразования от 2,4 до 64 кбит/с.

Известен также способ шифрования и передачи шифрованной речевой информации в сетях сотовой подвижной связи [4]. Способ обеспечивает шифрование речевого сигнала, преобразованного в цифровую форму, на ключах парной связи, неизвестных третьим лицам, и передачу зашифрованного сигнала со скоростью 13 кбит/с.

Способы снижения скорости передачи со сжатием речевых сигналов, например, путем использования кодирования с линейным предсказанием требуют применения цифровых методов, для которых характерно резкое снижение разборчивости речи при достижении качества канала связи ниже порогового значения, вплоть до потери связи.

Кроме того, указанные технические решения не обеспечивают передачу засекреченного речевого сигнала по каналам ТЧ, для которых характерно многолучевое распространение сигнала, например, образованным коротковолновыми (KB) линиями связи.

Указанных недостатков лишены способы, использующие преобразование засекреченного речевого сигнала из цифровой формы в аналоговую перед передачей его в канал связи, что позволяет согласовать спектральные характеристики передаваемого сигнала со спектральными характеристиками стандартного канала ТЧ, образованного как кабельными, так и радиолиниями связи.

К такого класса техническим решениям относится способ, описанный в патенте США 4179586 [5], наиболее близкий к предлагаемому способу и выбранный вследствие этого в качестве прототипа.

Передача речи по известному способу осуществляется по предварительно скорректированному и засинхронизированному по тактовой и кадровой частотам и криптоалгоритму каналу связи шириной полосы пропускания 300способ передачи и приема закодированной речи, патент № 22212843400 Гц. Для указанных целей перед передачей речи в канал связи выдается преамбула, содержащая необходимую информацию.

Передаваемый аналоговый речевой сигнал подвергается низкочастотной фильтрации в диапазоне 0способ передачи и приема закодированной речи, патент № 22212841920 Гц, после чего дискретизируется по времени с частотой дискретизации 3840 отсчетов в секунду и квантуется по уровню с числом уровней 211-1 с представлением каждого отсчета 12 разрядами, из которых 11 разрядов используются для представления значения амплитуды, а один разряд - знака отсчета. Для уменьшения разрядности представления амплитуд отсчетов с 11 до 6 используют процедуру нормализации, при которой отсчетам малой величины соответствует малый, а большой величины - большой шаг квантования [2, с.113-128]. После нормализации осуществляется преобразование цифрового речевого сигнала из прямоугольной системы координат в полярную, для чего последовательность цифровых отсчетов преобразуют в последовательность псевдоамплитуд и в последовательность псевдофаз.

Значения псевдоамплитуды и псевдофазы приводятся к целочисленной форме и отдельно засекречиваются по модулю 2r, где r - положительное целое число (r= 7).

Предварительно значения псевдоамплитуд, принимающие значения в интервале 0способ передачи и приема закодированной речи, патент № 222128489, увеличиваются на величину защитного интервала, равного 25, для того, чтобы уменьшить вероятность так называемых аномальных ошибок, характерных для модульного сложения и имеющих большую амплитуду. Указанные ошибки возникают тогда, когда на уровень засекреченного сигнала, близкого к 0 или 128 действуют шумы, в результате чего после рассекречивания большой сигнал превращается в маленький и наоборот. Введение защитного интервала смещает диапазон амплитуд с (0способ передачи и приема закодированной речи, патент № 222128489) до (25способ передачи и приема закодированной речи, патент № 2221284114) вследствие чего шумы, амплитудой, меньшей 25, не вызовут аномальных ошибок.

При засекречивании псевдофазы защитный интервал не используется, так как в полярных координатах величины синуса и косинуса малых углов близки к синусам и косинусам больших углов (близких к 360o).

После засекречивания осуществляется дифференциальное (разностное) кодирование засекреченных значений псевдоамплитуд и псевдофаз, необходимое для компенсации медленных изменений амплитудных и фазовых характеристик канала связи.

Закодированные и засекреченные значения псевдоамплитуд и псевдофаз преобразуют из частотной области во временную с использованием обратного преобразования Фурье. В результате этого преобразования формируется временной поток V (кТ), содержащий 128 отсчетов, представляющих собой сумму из 50 гармонических составляющих с частотами от 550 до 3000 Гц. Из этих частот две частоты с постоянными амплитудами и фазами используются для служебных целей, а остальные 48 частот имеют амплитуды и фазы, соответствующие псевдоамплитудам и псевдофазам засекреченного цифрового сигнала. К полученным 128 отсчетам присоединяются 32 отсчета, являющиеся повторением первых 32 из 128 информационных отсчетов (циклический префикс), которые предназначены для создания защиты передаваемого сигнала от переменных задержек в канале связи, обусловленных многолучевым распространением сигнала.

Полученную таким образом последовательность кадров из 160 отсчетов каждый преобразуют со скоростью 6400 отсчетов в секунду в аналоговый сигнал, после чего осуществляют низкочастотную фильтрацию сигнала в диапазоне 0способ передачи и приема закодированной речи, патент № 22212843000 Гц и передают в канал связи. На противоположной стороне принимаемый аналоговый сигнал фильтруют в диапазоне способ передачи и приема закодированной речи, патент № 22212843000 Гц, дискретизируют по времени с частотой дискретизации 6400 Гц, квантуют по уровню 7-разрядным кодом, после чего преобразуют цифровой сигнал из временной области в частотную путем использования прямого преобразования Фурье для вычисления действительной и мнимой частей сигнала, по которым определяют значения амплитуд и фаз цифрового сигнала в частотной области.

Результатом этого преобразования является реальный амплитудный и фазовый спектры передаваемого сигнала. Эти реальные величины подвергаются преобразованиям, обратным преобразованиям, осуществленным на передающей стороне: осуществляют дифференциальное (разностное) декодирование амплитуд и фаз, после чего рассекречивают по модулю 2r отдельно значения амплитуд и фаз. Рассекреченные значения амплитуд уменьшают на величину защитного интервала, после чего рассекреченные значения амплитуд и фаз преобразуют в единый временной поток цифровых отсчетов, который фильтруют в диапазоне 0способ передачи и приема закодированной речи, патент № 22212841920 Гц и выдают получателю.

Таким образом, способ-прототип обеспечивает передачу зашифрованной речи по стандартному телефонному каналу с полосой пропускания 300способ передачи и приема закодированной речи, патент № 22212843400 Гц с одновременным обеспечением защиты передаваемого сигнала от задержек в канале связи, обусловленных многолучевостью, путем введения защитного временного интервала, смещение границ кадра в котором не вызывает сбой синхронизации.

Недостаток способа-прототипа заключается в низкой разборчивости речи, что обусловлено неоптимальным использованием полосы частот исходного речевого сигнала.

В самом деле, ограничение спектра исходного речевого сигнала сверху частотой 1920 Гц приводит к плохой разборчивости согласных букв [2, с.136], для качественной передачи которых необходимо наличие в спектре более высоких частот.

С другой стороны, неоправданным является расширение диапазона в сторону низких частот, вплоть до 0 Гц. Анализ технических характеристик наиболее применяемых микрофонов показывает, что их коэффициент передачи достигает установившегося значения в диапазоне 150способ передачи и приема закодированной речи, патент № 2221284300 Гц [6].

Кроме того, как показывает опыт эксплуатации систем передачи речи, разговорные цепи телефонных аппаратов подвержены низкочастотным наводкам, для устранения которых применяют низкочастотную заграждающую фильтрацию речевого сигнала, исключающую из последнего как сигналы помехи, так и часть информационных сигналов.

Таким образом, из исходного речевого сигнала в прототипе фактически используется полоса частот 150способ передачи и приема закодированной речи, патент № 22212841920 Гц, хотя для передачи предоставляется стандартный телефонный канал с полосой 300способ передачи и приема закодированной речи, патент № 22212843400 Гц, что в конечном итоге не позволяет обрабатывать и передавать речь с высокой точностью и приводит к плохому использованию канала связи.

Следует также отметить, что в известном способе используется операция нормализации и квантования уровней сигналов, которые вносят существенную погрешность в значения уровней речевого сигнала. С учетом того, что эти операции осуществляются в начале передающего тракта, а именно после аналого-цифрового преобразования речевого сигнала, то указанная погрешность уменьшает точность определения амплитуды и фазы сигнала, что также приводит к уменьшению разборчивости речи.

Задачей предлагаемого способа является повышение качества и разборчивости речи.

Технический результат, достигаемый предлагаемым способом, заключается в обеспечении передачи более высокочастотной области речевого сигнала, которая оказывает наибольшее влияние на разборчивость речи, и уменьшении погрешности определения параметров речевого сигнала.

В самом деле, с учетом того, что часть полосы телефонного канала используется для компенсации временных задержек, вызванных многолучевым распространением сигнала, максимально возможный диапазон частот исходного речевого сигнала, который может быть передан по известному способу, составляет 0способ передачи и приема закодированной речи, патент № 22212842400 Гц.

По предлагаемому способу также передается полоса частот речевого сигнала шириной 2400 Гц, однако расположена она в диапазоне 300способ передачи и приема закодированной речи, патент № 22212842700 Гц, то есть вместо низких частот 0способ передачи и приема закодированной речи, патент № 2221284300 Гц, оказывающих малое влияние на разборчивость, в состав передаваемого сигнала включены высокие частоты 2400способ передачи и приема закодированной речи, патент № 22212842700 Гц, оказывающие более существенное влияние на разборчивость речи, что подтверждается графиками, приведенными в [7].

Особенностью предлагаемого способа является то, что для передачи спектра речевого сигнала с наивысшей частотой fB используется частота дискретизации, равная не 2fB, что имеет место в известном способе согласно теореме В.А. Котельникова, а частота, равная удвоенной ширине спектра. Таким образом, предлагаемый способ позволяет без увеличения частоты дискретизации передавать речевой спектр, сдвинутый в область высоких частот.

Это стало возможным благодаря сдвигу спектра речевого сигнала 300-2700 Гц в сторону низких частот на величину fcp=1500 Гц, где fcp - средняя частота полосы частот, выделяемой для передачи речевого сигнала, и последующей низкочастотной фильтрации этого сигнала. Полученные в результате этих преобразований синфазная и квадратурная составляющие речевого сигнала имеют наивысшую частоту 1200 Гц, вследствие чего они могут быть представлены последовательностью дискретных отсчетов, следующих с частотой 2400 отсчетов в секунду, которые преобразуются в последовательность значений амплитуд и фаз в полярной системе координат. Последние отдельно засекречиваются, преобразуются в единый временной поток отсчетов, которые после цифроаналогового преобразования передаются по стандартному телефонному каналу связи.

Предлагаемый способ содержит известные из описания прототипа и научно-технической литературы операции, например, перенос спектра в сторону низких частот с последующей фильтрацией и понижение частоты дискретизации. Однако их сочетание является новым, так как позволило с одной стороны исключить из передачи низкочастотную область речевого сигнала 0способ передачи и приема закодированной речи, патент № 2221284300 Гц, пораженную помехами, наведенными в разговорных цепях, о чем упоминалось ранее, а с другой стороны - дискретизировать полосовой речевой сигнал 300способ передачи и приема закодированной речи, патент № 22212842700 Гц с частотой, меньшей частоты, требуемой по теореме В.А. Котельникова и, как следствие этого, передать по каналу связи более высокочастотную область речевого сигнала, к тому же превышающую область частот, передаваемую в прототипе, на ширину полосы низкочастотного заграждающего фильтра, что в свою очередь позволило получить новый технический результат и выполнить поставленную задачу повышения разборчивости речи.

Признаками предлагаемого способа, общими с признаками известного способа является передача речевого сигнала по предварительно откорректированному и засинхронизированному по тактовой, кадровой частотам и криптографическому алгоритму каналу связи. При этом на передающей стороне преобразуют аналоговый речевой сигнал в цифровую форму методом аналого-цифрового преобразования, используют операции нормализации числа уровней и представления цифровых речевых сигналов в полярной системе координат в виде цифровых значений амплитуд и фаз, увеличивают значения амплитуд на величину защитного интервала и засекречивают отдельно значения амплитуд и фаз по модулю 2r, где r - положительное целое число, после чего осуществляют дифференциальное кодирование засекреченных значений амплитуд и фаз сигналов и преобразование последних из частотной области во временную, присоединяют к временному потоку отсчетов циклический префикс, и отсчеты полученного единого временного потока преобразуют методом цифроаналогового преобразования в аналоговый сигнал, который передают в канал связи.

На приемной стороне принимаемый аналоговый сигнал методом аналого-цифрового преобразования преобразуют в последовательность цифровых сигналов, которые в свою очередь преобразуют из временной области в частотную путем использования прямого преобразования Фурье для вычисления действительной и мнимой частей принятого цифрового сигнала, по которым определяют амплитуды и фазы гармоник этого сигнала, осуществляют дифференциальное декодирование значений амплитуд и фаз, сигналов, после чего рассекречивают по модулю 2r отдельно значения амплитуд и фаз, уменьшают рассекреченные значения амплитуд на величину защитного интервала, используют операции денормализации числа уровней, низкочастотной фильтрации, формирования единого временного потока цифровых отсчетов и цифроаналогового преобразования этого потока.

Признаками предлагаемого способа, отличающимися от признаков способа - прототипа является то, что на передающей стороне после операции преобразования аналогового речевого сигнала в цифровую форму и перед операцией увеличения значений амплитуд сигналов на величину защитного интервала формируют синфазную и квадратурную составляющие цифрового сигнала путем умножения цифрового сигнала на комплексную экспоненту exp(-j2способ передачи и приема закодированной речи, патент № 2221284fcpnT), где fcp - средняя частота полосы частот, выделяемой для передачи речевого сигнала, Т - временной интервал следования цифровых отсчетов, n=0,1,2... - номер отсчета.

После этого осуществляют низкочастотную фильтрацию указанных составляющих, прореживают цифровые отсчеты их, при этом значения амплитуд и фаз сигналов формируют по прореженным отсчетам синфазной и квадратурной составляющих, операцию нормализации числа уровней применяют к значениям амплитуд сигналов, а на приемной стороне операцию денормализации числа уровней применяют к уменьшенным на величину защитного интервала рассекреченным значениям амплитуд, после чего с использованием рассекреченных значений фаз и денормализованных значений амплитуд сигналов формируют отсчеты синфазной и квадратурной составляющих рассекреченного цифрового сигнала, экспандируют частоту дискретизации синфазной и квадратурной составляющих, осуществляют низкочастотную интерполяцию их, затем спектр интерполированных составляющих переносят на частоту fcp в сторону верхних частот, при этом операцию формирования единого временного потока цифровых речевых сигналов осуществляют из перенесенных по спектру упомянутым выше способом отсчетов синфазной и квадратурной составляющих, низкочастотную фильтрацию осуществляют после формирования единого временного потока цифровых отсчетов перед их цифроаналоговым преобразованием.

Анализ последовательности выполнения операций предлагаемого способа свидетельствует, что, в отличие от способа - прототипа, операция нормализации осуществляется уже после определения амплитуды и фазы, к тому же она применяется только к значениям амплитуды и, следовательно, не вносит погрешности в значения фазы сигнала, что увеличивает точность определения параметров речевого сигнала и тем самым дополнительно увеличивает разборчивость речи.

На фиг. 1 представлена структурная схема передающей части, на фиг.2 - приемной части системы передачи и приема закодированной речи по предлагаемому способу (пример реализации).

Передающая часть содержит:

1 - микрофон,

2 - передающий аналого-цифровой преобразователь (АЦП),

3 - формирователь квадратурных составляющих,

4 - блок фильтров нижней частоты (ФНЧ),

5 - дециматор,

6 - передающий преобразователь прямоугольной системы координат (ППСК),

7 - нормализатор,

8 - сумматор,

9 - генератор опорной частоты,

10 - шифратор,

11 - кодер амплитуды,

12 - передающий цифроаналоговый преобразователь (ЦАП),

13 - канал связи,

14 - блок опорных частот,

15 - передающий генератор частоты fcp,

16 - кодер фазы,

17 - модулятор,

18 - блок защиты от временных задержек.

Приемная часть содержит:

19 - приемный АЦП,

20 - демодулятор,

21 - приемный ППСК,

22 - декодер амплитуды,

23 - дешифратор,

24 - блок вычитания,

25 - денормализатор,

26 - декодер фазы,

27 - блок памяти тригонометрических функций,

28 - преобразователь полярной системы координат,

29 - экспандер частоты дискретизации,

30 - умножитель частоты,

31 - приемный генератор частоты f,

32 - блок переноса спектра,

33 - блок интерполирующих фильтров,

34 - формирователь единого временного потока,

35 - выходной ФНЧ,

36 - приемный ЦАП,

37 - телефон.

Работа системы шифрования - дешифрования речи по предлагаемому способу осуществляется следующим образом. Перед передачей речи на приемную сторону передается преамбула синхронизации, содержащая, например, как в прототипе, 11 кадров амплитудной информации для настройки системы автоматической регулировки усиления, 10 кадров гармонических колебаний для коррекции амплитудно-частотных и фазовых характеристик канала связи, 6 кадров сигнала синхронизации по кадрам, 3 кадра стартовой посылки, используемой для установки начального момента обработки речи в приемнике, после чего передается цифровая информация для синхронизации шифратора и дешифратора. Детально параметры указанных сигналов приведены в прототипе и могут быть уточнены с учетом конкретных требований. Конечный результат указанных операций заключается в наличии перед передачей речи предварительно откорректированного и засинхронизированного по тактовой, кадровой частотам и криптографическому алгоритму канала связи, что не является предметом изобретения, в связи с чем узлы, реализующие упомянутые выше операции на фиг.1 и фиг.2 не представлены, хотя их наличие подразумевается.

Передаваемая речь с микрофона 1 поступает в АЦП 2, который стандартными методами аналого-цифрового преобразования преобразует непрерывную речь в последовательность цифровых отсчетов, следующих с частотой дискретизации fд= 9600 Гц, вырабатываемой блоком опорных частот 14 из частоты, формируемой генератором 9 опорной частоты. С выхода АЦП 2 поток цифровых отсчетов V(nТ), где n= (0,1,2. . . ) - номер отсчета, Т=1/fд - период следования отсчетов, поступает в формирователь 3 квадратурных составляющих, который из этого потока формирует синфазную и квадратурную составляющие путем умножения его на комплексную экспоненту exp(-j2способ передачи и приема закодированной речи, патент № 2221284fcpnT), где fcp - средняя частота полосы частот, выделяемой для передачи речевого сигнала. В предлагаемом способе передается полоса частот входного сигнала, равная 300-2700 Гц, следовательно cp=1500 Гц.

Так как

exp(-j2способ передачи и приема закодированной речи, патент № 2221284fсрnT) = cos2способ передачи и приема закодированной речи, патент № 2221284fсрnT-jsin2способ передачи и приема закодированной речи, патент № 2221284fсрnT, (1)

то операция формирования квадратурных составляющих может быть реализована с помощью двух умножителей 3.1 и 3.2, на первые входы которых поступает поток V(nT), а на вторые - синус и косинус частоты fсp, вырабатываемые передающим генератором частоты fсp 75 с частотой 9600 Гц, выдаваемой блоком опорных частот 14. На выходах умножителей 3.1 и 3.2 формируется синфазная VС(nT) и квадратурная VS(nT) составляющие.

В результате этого умножения происходит сдвиг спектра входного сигнала V (nT) в сторону низких частот на частоту сp [8]. Таким образом, информация передававшаяся на частоте fcp или около нее, смещается к 0 Гц. Эту информацию фильтруют в блоке 4 ФНЧ с помощью двух фильтров: 4.1 и 4.2, при этом подавляются частоты, выходящие за пределы нужного диапазона (свыше 1200 Гц). В качестве ФНЧ могут быть выбраны, например, биквадратные четырехсекционные эллиптические фильтры типа "ellip (8; 1,60; 0,245)" по системе "MATLAB 5,6" с точкой половинной мощности на частоте 1176 Гц [9].

На выходе фильтров формируется последовательность Х(nТ), полученная фильтрацией из последовательности Vc(nT), и Y(nT) - из последовательности Vg(nТ). Наибольшая частота выходных сигналов Х (nT) и Y(nT) не превышает 1200 Гц. Поэтому эти сигналы могут быть полностью восстановлены по прореженным отсчетам, сделанным с частотой в m=4 раза меньшей частоты следования входных сигналов, то есть по выборкам каждого четвертого отсчета, что соответствует частоте дискретизации 2400 Гц. Уменьшение частоты дискретизации осуществляется с помощью дециматора 5, на выходе которого получают синфазную X(nt) и квадратурную Y(nt) последовательности, где t=mT, с частотой следования 2400 отсчетов в секунду каждая.

После этого сигналы последовательностей Х(nt) и Y(nt) из прямоугольной системы координат преобразуются в амплитуду М(nt) и фазу способ передачи и приема закодированной речи, патент № 2221284(nt) в полярной системе координат, что необходимо для осуществления дальнейших преобразований и передачи по каналу связи. Указанные операции осуществляются передающим 6 ППСК.

Значения амплитуды и фазы определяются следующим образом:

M(nt)=(Y(nt)способ передачи и приема закодированной речи, патент № 2221284Y(nt)+X(nt)способ передачи и приема закодированной речи, патент № 2221284X(nt))0,5, (2)

способ передачи и приема закодированной речи, патент № 2221284(nt)=arctan(-Y(nt)/X(nt)). (3)

При осуществлении вычислений по выражениям (2) и (3) могут быть использованы операции нахождения значений аппроксимирующих многочленов, приведенные в [10, 4.4, р. 57-60] для выражения корня квадратного и в [10, 4.3, р. 54-57] - арктангенса.

Амплитуды M(nt) подвергаются нормализации в нормализаторе 7 и приобретают значения Мn (nt) в диапазоне от 0 до 63.

Примеры прямого (нормализации) и обратного (денормализации) преобразований приведены в [2, с.113-128], где эти операции называются как компрессия и экспандирование.

В нашем случае может быть применено компандирование по закону А [2, с. 125] при уменьшении диапазона входных сигналов (таблица 3.2 в [2, с.126]) до 2048 и уменьшении числа используемых разрядов с 8 до 7 за счет отбрасывания младшего разряда в коде квантования (4 столбец таблицы).

С целью повышения помехозащищенности передачи сигналов по каналу связи преобразованные значения амплитуды в сумматоре 8 смещаются на величину защитного интервала С=32.

Новые значения А(nt)=Мn(nt)+С, принимающие значения от 32 до 95, поступают в шифратор 10, где засекречиваются путем сложения по модулю 128 с последовательностью псевдослучайных чисел, вырабатываемых шифратором 10.

Вычисленные по выражению (3) величины фазы способ передачи и приема закодированной речи, патент № 2221284(nt), принимающие значения в интервале (0способ передачи и приема закодированной речи, патент № 2221284127) поступают синфазно со значениями амплитуды A(nt) в шифратор 10, где также засекречиваются путем сложения по модулю 128 со второй последовательностью псевдослучайных чисел, вырабатываемых шифратором 10.

Засекреченные значения амплитуд и фаз подвергаются дифференциальному (разностному) кодированию соответственно в кодере амплитуды 11 и кодере фазы 16, примеры реализации которых приведены в прототипе. Каждый кодер содержит сумматор по модулю 128 и регистр задержки. На сумматор поступают сигналы амплитуд (фаз) и задержанные на время, равное длительности кадра, сигналы с выхода сумматора. Такое кодирование обеспечивает компенсацию медленных изменений амплитудных и фазовых характеристик канала связи.

Закодированные значения амплитуд и фаз преобразуют из частотной области во временную с помощью модулятора 17. Поток информационных отсчетов определяется по формуле

способ передачи и приема закодированной речи, патент № 2221284

где j - номер гармоники,

к=1,2...128 - номер отсчета канального сигнала,

Aj-4, способ передачи и приема закодированной речи, патент № 2221284j-4 - значения амплитуды и фазы засекреченного сигнала,

Т - временной интервал следования цифровых отсчетов,

способ передачи и приема закодированной речи, патент № 22212840 = 62,5 Гц.

Так как скорость следования отсчетов V(кТ) составляет 8000 Гц, то наивысшая частота, которую можно передать этими отсчетами равна 4000 Гц. Весь спектр речевого сигнала в диапазоне 0способ передачи и приема закодированной речи, патент № 22212844000 Гц может быть передан с помощью 64 значений амплитуд и 64 значений фаз гармоник. Поэтому в (4) способ передачи и приема закодированной речи, патент № 22212840 = 4000/64 = 62,5 Гц, и, чтобы не выходить за пределы ширины полосы стандартного телефонного канала 300способ передачи и приема закодированной речи, патент № 22212843400 Гц, необходимо передавать гармоники с 5 по 54, что соответствует диапазону (312,5способ передачи и приема закодированной речи, патент № 22212843375) Гц, который полностью вписывается в стандартный канал тональной частоты 300способ передачи и приема закодированной речи, патент № 22212843400 Гц.

Сигнал с выхода модулятора 17 поступает в блок защиты от временных задержек 18, вносимых каналом связи, аналогичный соответствующему блоку прототипа. В блоке 18 формируется единый временной поток отсчетов, следующих с частотой 8000 Гц, который передается кадрами, длиной 20 мс, содержащими, как и в прототипе, 160 отсчетов, из которых 128 отсчетов используются для передачи информации, а остальные 32 (циклический префикс) - для создания защиты передаваемого сигнала от временных задержек в канале связи.

После чего единый временной поток отсчетов преобразуется в ЦАП 12 в аналоговую форму и передается в канал связи 13.

На приемной стороне (фиг.2) принимаемый сигнал из канала связи 13 поступает в АЦП 19, где преобразуется в цифровую форму со скоростью взятия отсчетов 8000 отсчетов в секунду. Цифровые отсчеты поступают в демодулятор 20, в котором они преобразуются из временной области в частотную путем использования прямого преобразования Фурье для вычисления действительной и мнимой частей сигнала по формулам

способ передачи и приема закодированной речи, патент № 2221284

способ передачи и приема закодированной речи, патент № 2221284

где j=5, 6...54,

NR(j) и NI(j) - соответственно действительная и мнимая части цифрового сигнала,

f(кТ) - значение амплитуды цифрового сигнала в момент времени кТ.

После этого в приемном ППСК 21 по значениям NR(j) и NI(j) вычисляют значения амплитуд и фаз гармоник цифрового сигнала в частотной области по следующим выражения:

A(j)=(NR2(j)+NI2(j))0,5, (7)

способ передачи и приема закодированной речи, патент № 2221284(j)=acrtan(-NI(j)/NR(j)). (8)

Значения амплитуд A(j) и фаз способ передачи и приема закодированной речи, патент № 2221284(j) подвергаются дифференциальному (разностному) декодированию соответственно в декодере амплитуды 22 и декодере фазы 26, после чего они рассекречиваются в дешифраторе 23.

Рассекреченные значения амплитуд в блоке вычитания 24 уменьшают на величину защитного интервала С=32 по следующему правилу:

Mr(nt)=A(nt)-32, если A(nt)>32, (9)

Mr(nt)=0, если A(nt) 32 (10),

где A(nt) - поток рассекреченных значений амплитуд,

Мr(nt) - уменьшенный поток значений амплитуд.

Поток Mr(nt) в денормализаторе 25 подвергается экспандированию с помощью соответствующей таблицы [2, с.113-128].

Значения фаз и экспандированных амплитуд преобразуются из полярной системы координат в прямоугольную в преобразователе 28 полярной системы координат по следующим соотношениям:

Vcr(nt)=Mr(nt)cos(2способ передачи и приема закодированной речи, патент № 2221284iспособ передачи и приема закодированной речи, патент № 2221284(nt)/128), (11)

Vsr=Mr(nt)sin(2способ передачи и приема закодированной речи, патент № 2221284iспособ передачи и приема закодированной речи, патент № 2221284(nt)/128), (12)

где Vcr(nt) и Vsr(nt) - соответственно синфазная и квадратурная составляющие речевого сигнала.

Значения sin (2способ передачи и приема закодированной речи, патент № 2221284iспособ передачи и приема закодированной речи, патент № 2221284(nt)/128) и cos(2способ передачи и приема закодированной речи, патент № 2221284iспособ передачи и приема закодированной речи, патент № 2221284(nt)/128) поступают из блока памяти 27 тригонометрических функций синусов и косинусов по адресу способ передачи и приема закодированной речи, патент № 2221284(nt)=0,1... 127. На фиг.2 эти значения обозначены через sin способ передачи и приема закодированной речи, патент № 2221284(nt)] и cos [способ передачи и приема закодированной речи, патент № 2221284(nt)].

Сигналы Vcr(nt) и Vsr(nt) имеют частоту дискретизации 2400 Гц. Спектр этих сигналов низкочастотный с верхней частотой не выше 1200 Гц. Для преобразования их в сигналы исходной речи проводятся последовательно два следующих этапа обработки.

Первый этап состоит в вычислении (интерполировании) между каждыми соседними отсчетами сигналов Vcr(nt) и Vsr(nt) трех новых отсчетов, что соответствует повышению частоты дискретизации сигналов в m=4 раза, то есть до 9600 Гц, без изменения их спектральных свойств.

Эти операции реализуются с помощью экспандера 29 частоты дискретизации и блока интерполирующих 33 фильтров, содержащих два интерполирующих фильтра низких частот 33.1 и 33.2 (4-х секционных биквадратных эллиптических фильтров), аналогичных фильтрам 4.1 и 4.2 передающей части. С выхода фильтра 33.1 будут выводиться сигналы Vcr(nT), а с выхода фильтра 33.2 - сигналы Vsr(nT).

Второй этап состоит в умножении сигналов с выходов интерполирующих фильтров на синус и соответственно косинус частоты fcp=1500 Гц с целью переноса спектра этих сигналов в сторону верхних частот, что осуществляется в блоке переноса 32 спектра состоящего из умножителей 32.1 и 32.2, на первые входы которых поступают сигналы Vcr(nT) и Vsr(nT), а на вторые - сигналы cos(2способ передачи и приема закодированной речи, патент № 2221284fcpnT) и sin(2способ передачи и приема закодированной речи, патент № 2221284fcpnT) из приемного генератора 31 частоты fcp. Последние сигналы выдаются со скоростью 9600 значений в секунду, формируемой умножителем частоты 30 из частоты 2400 Гц.

Перенесенные в область верхних частот сигналы Vcr(nT) и Vsr(nT) поступают в формирователь 34 единого временного потока, который объединяет указанные сигналы. Объединенный сигнал Vr(nT) имеет вид:

Vr(nT)=Vcr(nT)cos(2способ передачи и приема закодированной речи, патент № 2221284fcpnT)+

+Vsr(nT)sin(2способ передачи и приема закодированной речи, патент № 2221284fcpnT). (13)

Сигнал Vr (nT) с основным спектром, расположенным в полосе 300способ передачи и приема закодированной речи, патент № 22212842700 Гц, поступает в выходной ФНЧ 35 с верхней частотой пропускания 2700 Гц, в качестве которого выбран биквадратный трехсекционный эллиптический фильтр типа ellip (6; 0,5, 40; 0,5625) [9].

Применение этого фильтра позволяет устранить шумы выше частоты 2700 Гц без ухудшения спектральных характеристик. С выхода ФНЧ 35 речевой сигнал через приемный 36 ЦАП поступает на телефон получателя.

Приведенные на фиг.1 и фиг.2 структурные схемы поясняют лишь принципы и последовательность осуществления операций предлагаемого способа. Конкретные формы реализации этих операций и их параметры зависят от условий передачи, условий эксплуатации, используемой элементной базы. В связи с широким распространением вычислительной техники в настоящее время наиболее целесообразно выполнение операции предлагаемого способа программным методом, при котором операции выполняются путем преобразования цифровых комбинаций. В связи с этим приведенные примеры ориентированы на программную реализацию с помощью процессора.

Таким образом, предлагаемый способ по сравнению с прототипом обеспечивает передачу более высококачественной части спектра речевого сигнала 300способ передачи и приема закодированной речи, патент № 22212842700 Гц вместо потенциально достижимого в прототипе 0способ передачи и приема закодированной речи, патент № 22212842400 Гц. Как следует из графиков и таблицы, приведенных в [7] смещение нижней границы передаваемого спектра с 0 до 300 Гц уменьшает слоговую разборчивость примерно на 0,3%, а смещение верхней границы с 2400 до 2700 Гц увеличивает слоговую разборчивость примерно на 4%. Таким образом, при одинаковой ширине полосы передаваемого сигнала (2400 Гц) предлагаемый способ обеспечивает выигрыш по сравнению с прототипом на 3,7%, что доказывает достижимость заявленного технического результата.

Для доказательства влияния порядка выполнения операций определения амплитуды и фазы сигнала (до операции нормализации в предлагаемом способе и после в способе-прототипе) на точность выделения полезного сигнала было осуществлено компьютерное моделирование операций предлагаемого способа и способа прототипа, при этом в значения фазы передаваемого сигнала (частота 1000 Гц) вносились следующие искажения: с вероятностью 0,5 значение фазы оставалось неизменным, с вероятностью 0,25 значение увеличивалось на 1 и с вероятностью 0,25-уменьшалось на 1. (Точка ввода искажений в прототипе - на выходе блока 33 фиг.1, в примере реализации предлагаемого способа - на выходе блока 23 фиг.2). Результаты измерений отношения сигнал/помеха (точка на выходе блока 39 фиг.1 прототипа и точка на выходе блока 36 фиг.2 примера реализации предлагаемого способа) показали, что уровень шумов ниже уровня сигнала в прототипе на 15 дБ, а в предлагаемом способе - на 25 дБ.

Таким образом, выигрыш в точности выделения сигнала по предлагаемому способу по сравнению с прототипом составляет примерно 10 дБ, что дополнительно способствует повышению качества и разборчивости речи.

Источники информации

1. Диффи У. Хэллмэн М. Э. Защищенность и имитостойкость. Введение в криптографию. - ТИИЭР, 1979, 3.

2. Дж. Беллани. Цифровая телефония. - М.: Радио и связь, 1986, с.113-128.

3. Устройство конфиденциальной связи. Патент РФ 2117401, М.кл. Н 04 К 1/00, 10.08.98, БИ 22.

4. Способ шифрования и передачи шифрованной речевой информации в сетях сотовой подвижной связи стандартов GSM-900, DCS-1800. Патент РФ 2132597, М. кл. H 04 Q 7/32, 27.06.99, БИ 18.

5. Система передачи и приема кодированной речи. Патент США 4179586, М. кл. Н 04 К 1/00, 1999. Прототип.

6. И. М. Губренко, Е.В.Кучумов. Телефонные аппараты и таксофоны. - М.: Радио и связь. 1989, с.10.

7. Н.Б.Покровский. Расчет и измерение разборчивости речи. - М.: Связьиздат, 1962, с.144.

8. Л. М.Гольденберг, Б.Д.Матюшкин, М.Н.Поляк. Цифровая обработка сигналов. - М.: Радио и связь. 1985, с.171.

9. В.Г.Потемкин. Система инженерных и научных расчетов MATLAB 5.х. В 2-х т. - М.: ДИАЛОГ-МИФИ, 1999.

10. DIGITAL SIGNAL PROCESSING. Using the ADSP-2100 Family, v.1.

Класс G10L19/00 Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение -  патент 2527760 (10.09.2014)
низведение параметров последовательности битов sbr -  патент 2526745 (27.08.2014)
система стереотелевидения -  патент 2525757 (20.08.2014)
стереофоническое кодирование на основе mdct с комплексным предсказанием -  патент 2525431 (10.08.2014)
моделируемое снижение соотношения сигнал-шум в декодированном цифровом звуковом сигнале в зависимости от коэффициента однобитовых ошибок в беспроводном канале связи -  патент 2524564 (27.07.2014)
передатчик -  патент 2523934 (27.07.2014)
устройство для формирования выходного пространственного многоканального аудио сигнала -  патент 2523215 (20.07.2014)
устройство и способ обработки аудио сигнала -  патент 2523173 (20.07.2014)
способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала -  патент 2522020 (10.07.2014)
переключаемая аудио кодирующая/декодирующая схема с мультиразрешением -  патент 2520402 (27.06.2014)
Наверх