RU2408088C2 - Способ векторного квантования параметров линейного предсказания - Google Patents
Способ векторного квантования параметров линейного предсказания Download PDFInfo
- Publication number
- RU2408088C2 RU2408088C2 RU2009110838/09A RU2009110838A RU2408088C2 RU 2408088 C2 RU2408088 C2 RU 2408088C2 RU 2009110838/09 A RU2009110838/09 A RU 2009110838/09A RU 2009110838 A RU2009110838 A RU 2009110838A RU 2408088 C2 RU2408088 C2 RU 2408088C2
- Authority
- RU
- Russia
- Prior art keywords
- prediction
- vector
- scaling
- speech
- frame
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 92
- 238000000034 method Methods 0.000 title claims description 16
- 230000006978 adaptation Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000013139 quantization Methods 0.000 claims description 22
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Изобретение относится к системе электросвязи, а именно к системам низкоскоростного кодирования речевого сигнала, при котором осуществляется векторное квантование с предсказанием параметров линейного предсказания. Техническим результатом является снижение количества бит, выделяемых для кодирования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования. Указанный технический результат достигается введением в разностный векторный квантователь параметров линейного предсказания предсказателя с адаптацией к основному тону речи: при классификации кадра речевого сигнала как стационарного вокализованного выбирают схему предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному. 4 ил.
Description
Изобретение относится к системе электросвязи, а именно к системам низкоскоростного кодирования речевого сигнала, при котором осуществляется векторное квантование с предсказанием параметров линейного предсказания (ЛП).
Системы низкоскоростного кодирования предназначены для компактного представления речевого сигнала, необходимого для передачи по каналам связи с ограниченной пропускной способностью, без значительной потери его качества. В используемом низкоскоростными системами диапазоне скоростей (<16 кбит/с) доминирующее положение среди различных методов кодирования занимает кодирование на основе метода ЛП.
Отличительным признаком метода ЛП является одношаговое приближенное представление (предсказание) текущего отсчета s(k) речевого сигнала линейной комбинацией sпр(k) конечного числа предыдущих отсчетов:
где k - номер текущего отсчета; c(k) - порождающий сигнал с единичной дисперсией; G - масштабирующий коэффициент; М - порядок предсказания; bi - коэффициенты предсказания, i=1,2,…,M.
В системах низкоскоростного кодирования, основанных на методе ЛП, порядок предсказания М, как правило, является постоянным, а значения коэффициентов bi фиксируются на коротких, примыкающих друг к другу и равных по длительности временных интервалах, называемых кадрами речевого сигнала [Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: учеб. пособие для вузов. - М.: Радио и связь, 2003. - 144 с.: ил.]. Анализ предлагаемых алгоритмических решений низкоскоростных систем кодирования позволяет выделить доминирующие на сегодняшний день тенденции в совершенствовании липредерного метода кодирования речи:
1) преимущественное использование для описания текущего состояния голосового тракта М-мерного вектора линейных спектральных частот (ЛСЧ) Ω=(ω1,…,ωM), являющегося математическим эквивалентом множества {bi}, но обладающего лучшей устойчивостью к канальным ошибкам;
2) широкое применение разновидностей векторного квантования (ВК) для отображения кодируемых параметров речи при активном использовании внутрикадровых и межкадровых зависимостей последних с целью максимально возможного исключения избыточности.
Алгоритм определения ЛСЧ известен и представлен в [Рекомендации ITU-T G.729 «Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)», Женева, 1996]. Без потери общности в дальнейшем описании под параметрами ЛП будем понимать ЛСЧ.
Известен способ векторного квантования параметров ЛП [Рекомендации ITU-T G.729 «Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)», Женева, 1996], согласно которому квантование вектора параметров ЛП осуществляется в два этапа, причем вектор второго этапа разделяется на два субвектора. Недостатком данного способа является большое значение ошибки квантования, представляющей собой разницу между квантованным и исходным вектором параметров ЛП. Недостаток обусловлен малым числом бит, отводимым на квантование ЛСЧ в низкоскоростных системах кодирования речевого сигнала.
Известен способ преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов по патенту №2248619 от 27.08.2004, заключающийся в том, что при кодировании используют акустико-фонетическую классификацию обрабатываемых кадров речевого сигнала на четыре непересекающихся класса, классификационное решение включают в структуру кодовой комбинации, передаваемой по каналу связи, и используют для детерминирования режима функционирования классифицированного ВК, отличающихся различными объемами КК по каждому кодируемому параметру, чем обеспечивают адаптивное распределение информационных ресурсов. Недостатками данного способа являются значительная ошибка квантования параметров ЛП, увеличение числа передаваемых бит, а также артефакты звучания синтезированной речи, вызванные переключением ВК для каждого класса кадров речевого сигнала.
Наиболее близким, принятым за прототип, является способ для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью по патенту №2326450 от 10.06.2008, заключающийся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента. Недостатками данного способа являются следующие:
1) предсказание авторегрессией, применяемое для стационарных вокализованных кадров, не является надежным в условиях потери кадров - в случае потери речевых кадров ошибка распространяется на последующие кадры;
2) для получения минимальной ошибки квантования параметров ЛП стационарных вокализованных кадров требуется затрачивать значительное число бит.
Техническим результатом, на достижение которого направлено изобретение, является снижение количества бит, выделяемых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования.
Для достижения такого технического результата в способе векторного квантования, заключающемся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента, изменено множество схем предсказания. Множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание с адаптацией к основному тону речи, при этом если классификация кадра звукового сигнала включает в себя определение, что кадр звукового сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному. Далее осуществляют масштабирование вектора ошибки предсказания.
Для описания стационарных вокализованных кадров речевого сигнала модель (1) может быть преобразована к следующему виду:
где Ψ(s(k-1)) - типовое нелинейное преобразование, определяющее импульсное возбуждение линейной части уравнения [Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов. - М.: Радио и связь, 1984. - 240 с.: ил.].
В принятой модели (2) при G=0 период основного тона речи Т0 является неслучайной величиной и может быть рассчитан по формуле Т0=(lnΔ2 - lnΔ1)/lnb1, где Δ1 и Δ2 - параметры функции Ψ(s(k-1)). Откуда зависимость параметра ЛП b1 от периода основного тона речи Т0 может быть вычислена следующим образом:
Аналогичные зависимости для линейных регрессий большего порядка (bm, m>1) в аналитическом виде получить достаточно сложно, поэтому, учитывая связь коэффициентов ЛП bi с ЛСЧ, указанные зависимости определены экспериментальным путем и представлены на фиг.1. Данные зависимости могут быть аппроксимированы полиномиальными моделями [Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.] вида:
где ; - t-й коэффициент полинома, аппроксимирующего i-ю ЛСЧ. Значения коэффициентов аппроксимирующих полиномов представлены на фиг.2.
В низкоскоростных системах кодирования речевого сигнала значение периода (частоты, нормированного периода) основного тона подлежит передаче из кодера в декодер, поэтому реализация предсказания с адаптацией к основному тону речи в виде выражения (4) позволяет существенно уменьшить динамический диапазон ЛСЧ и, как следствие, ошибку квантования. При этом в случае потери речевых кадров ошибка не будет распространяться на последующие кадры.
Заявленное изобретение поясняется следующими чертежами:
фиг.1 - зависимости ЛСЧ ωi, i=1,2,…,М, от периода основного тона речи Т0 при М=10;
фиг.2 - коэффициенты полиномов, используемых для аппроксимации ЛСЧ;
фиг.3 - блок-схема, иллюстрирующая возможный вариант реализации векторного квантователя параметров линейного предсказания согласно изобретению;
фиг.4 - сравнительная оценка качества квантования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала для разного числа бит согласно прототипу и настоящему изобретению.
Для снижения количества бит, выделяемых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования согласно предлагаемому способу выполняют следующие операции:
1) принимают входной вектор параметров ЛП Ω=(ω1,…,ωM);
2) классифицируют кадр речевого сигнала, соответствующий входному вектору параметров ЛП;
3) вычисляют вектор предсказания ΩПР;
4) удаляют вычисленный вектор предсказания из входного вектора параметров ЛП для создания вектора ошибки предсказания Е;
5) масштабируют вектор ошибки предсказания;
6) квантуют масштабированный вектор ошибки предсказания Е'.
При этом вычисление вектора предсказания включает в себя выбор одной из схем предсказания (предсказание скользящим средним или предсказание с адаптацией к основному тону речи) в отношении классификации кадра звукового сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания; масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования.
Если кадр речевого сигнала классифицируют как стационарный вокализованный, то в качестве схемы предсказания выбирают предсказание с адаптацией к основному тону речи и с помощью нее вычисляют вектор ошибки предсказания ΩПР = ΩОТ, где ΩОТ = (ωОТ1,…,ωОТМ); в качестве схемы масштабирования выбирают масштабный коэффициент, равный одному, что эквивалентно отсутствию операции масштабирования.
Фиг.3 иллюстрирует возможный вариант реализации ВК параметров ЛП, использующий предсказатель с адаптацией к основному тону речи.
Как изображено на фиг.3, сначала получают вектор ошибки предсказания Е посредством вычитания в блоке 301 вектора предсказания ΩПР, полученного с выхода блока 307, из входного вектора параметров ЛП Ω:
Для стационарных вокализованных кадров речевого сигнала вектор предсказания ΩПР = ΩОТ определяют в блоке 305 по полиномиальной модели (4) с коэффициентами, приведенными на фиг.2.
Для нестационарных речевых кадров вектор предсказания ΩПР = ΩСС определяют посредством предсказания скользящим средним значением [Koestoer N.Р. Robust linear prediction analysis for low bit-rate speech coding: DPh dissertation. - Brisbane: Griffith University, 2002. - 132 p.] в блоке 306.
Вектор ошибки предсказания Е масштабируют в блоке 302 соответствующим масштабным коэффициентом. При этом для схемы предсказания с адаптацией к основному тону используют масштабный коэффициент, равный 1, а для схемы предсказания скользящим средним значением - масштабный коэффициент больше 1.
Квантованное значение масштабированного вектора ошибки предсказания Е' полученное в блоке 303, после обратного масштабирования в блоке 304 используют в блоке 306 предсказания скользящим средним значением, а его индекс в КК передают в декодер.
Для проверки работоспособности рассмотренного ВК и оценки качества квантования параметров ЛП согласно предлагаемому способу было произведено имитационное моделирование.
Качество квантования параметров ЛП оценивалось с использованием спектрального искажения [Павловец А.Н., Петровский А.А. Квантование огибающей спектра в вокодере, основанное на декомпозиции речевого сигнала на периодическую и апериодическую составляющие // Цифровая обработка сигналов. - 2005. - №3. - С.13-21], определяемого следующим образом:
где Pj и - спектры мощности речевого кадра, рассчитанные по входным и квантованным ЛСЧ соответственно. Среднее спектральное искажение оценивалось как
где J - число измерений (количество анализируемых кадров речевого сигнала). В [Palival K.K., Atal В.S. Efficient vector quantization of LPC parameters at 24 bits/frame // IEEE Trans. on Acoustics, Speech and Signal Processing. - 1993. - Vol.1. - №1. - P.3-14] экспериментально установлены следующие условия, приводящие к отсутствию слышимых искажений из-за спектральных несоответствий:
- среднее значение спектрального искажения SD не превышает 1 дБ;
- количество кадров, на которых sd принимает значения от 2 до 4 дБ, не превышает 2%;
- отсутствие сегментов со значением sd более 4 дБ.
Обучение КК масштабированного вектора ошибки предсказания Е' осуществлялось с помощью обобщенного алгоритма Ллойда [Макхоул Д., Рукос С., Гиш Г. Векторное квантование при кодировании речи // ТИИЭР. - 1985. - Т.73. - №11. - С.19-61]. Для обучения и тестирования КК использовалась речь различных дикторов длительностью около 125 и 15 минут соответственно. При этом речь в обучающей и тестовой выборках принадлежала различным дикторам, а общее число векторов ЛСЧ в них составило 375873 и 45318 соответственно (соотношение длительностей выборок приблизительно равно 8:1). Значение периода основного тона речи предполагалось известным. Сравнительная оценка качества квантования параметров линейного предсказания стационарных вокализованных кадров речевого сигнала для разного числа бит согласно прототипу и настоящему изобретению представлена на фиг.4.
Из фиг.4 следует, что ВК с адаптацией к основному тону речи согласно настоящему изобретению позволяет снизить количество бит, необходимых для кодирования параметров ЛП стационарных вокализованных кадров речевого сигнала, при минимальной ошибке квантования по сравнению с прототипом, использующим предсказание авторегрессией.
Claims (1)
- Способ векторного квантования параметров линейного предсказания, заключающийся в том, что принимают входной вектор параметров линейного предсказания, классифицируют кадр речевого сигнала, соответствующий входному вектору параметров линейного предсказания, вычисляют вектор предсказания, удаляют вычисленный вектор предсказания из входного вектора параметров линейного предсказания для создания вектора ошибки предсказания, масштабируют вектор ошибки предсказания, квантуют масштабированный вектор ошибки предсказания, при этом вычисление вектора предсказания включает в себя выбор одной из множества схем предсказания в отношении классификации кадра речевого сигнала и вычисление вектора предсказания в соответствии с выбранной схемой предсказания, и масштабирование вектора ошибки предсказания включает в себя выбор по меньшей мере одной из множества схем масштабирования в отношении выбранной схемы предсказания и масштабирование вектора ошибки предсказания в соответствии с выбранной схемой масштабирования, множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание авторегрессией, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания авторегрессией, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания авторегрессией, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, и масштабирование вектора ошибки предсказания включает в себя масштабирование вектора ошибки предсказания с использованием упомянутого масштабного коэффициента, отличающийся тем, что множество схем предсказания включает в себя предсказание скользящим средним значением и предсказание с адаптацией к основному тону речи, при этом если классификация кадра речевого сигнала включает в себя определение, что кадр речевого сигнала является стационарным вокализованным кадром, то выбор одной из множества схем предсказания включает в себя выбор предсказания с адаптацией к основному тону речи, вычисление вектора предсказания включает в себя вычисление вектора ошибки предсказания посредством предсказания с адаптацией к основному тону речи, выбор одной из множества схем масштабирования включает в себя выбор масштабного коэффициента, равного одному.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2009110838/09A RU2408088C2 (ru) | 2009-03-24 | 2009-03-24 | Способ векторного квантования параметров линейного предсказания |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2009110838/09A RU2408088C2 (ru) | 2009-03-24 | 2009-03-24 | Способ векторного квантования параметров линейного предсказания |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2009110838A RU2009110838A (ru) | 2010-09-27 |
| RU2408088C2 true RU2408088C2 (ru) | 2010-12-27 |
Family
ID=42940031
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2009110838/09A RU2408088C2 (ru) | 2009-03-24 | 2009-03-24 | Способ векторного квантования параметров линейного предсказания |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2408088C2 (ru) |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0573398A2 (en) * | 1992-06-01 | 1993-12-08 | Hughes Aircraft Company | C.E.L.P. Vocoder |
| US6098037A (en) * | 1998-05-19 | 2000-08-01 | Texas Instruments Incorporated | Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes |
| WO2000060579A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | A frequency domain interpolative speech codec system |
| WO2001022403A1 (en) * | 1999-09-22 | 2001-03-29 | Microsoft Corporation | Lpc-harmonic vocoder with superframe structure |
| EP1202251A2 (en) * | 2000-10-30 | 2002-05-02 | Fujitsu Limited | Transcoder for prevention of tandem coding of speech |
| CN101030377A (zh) * | 2007-04-13 | 2007-09-05 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
| RU2326450C2 (ru) * | 2002-12-24 | 2008-06-10 | Нокиа Корпорейшн | Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью |
-
2009
- 2009-03-24 RU RU2009110838/09A patent/RU2408088C2/ru not_active IP Right Cessation
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0573398A2 (en) * | 1992-06-01 | 1993-12-08 | Hughes Aircraft Company | C.E.L.P. Vocoder |
| US6098037A (en) * | 1998-05-19 | 2000-08-01 | Texas Instruments Incorporated | Formant weighted vector quantization of LPC excitation harmonic spectral amplitudes |
| WO2000060579A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | A frequency domain interpolative speech codec system |
| WO2001022403A1 (en) * | 1999-09-22 | 2001-03-29 | Microsoft Corporation | Lpc-harmonic vocoder with superframe structure |
| EP1202251A2 (en) * | 2000-10-30 | 2002-05-02 | Fujitsu Limited | Transcoder for prevention of tandem coding of speech |
| RU2326450C2 (ru) * | 2002-12-24 | 2008-06-10 | Нокиа Корпорейшн | Способ и устройство для векторного квантования с надежным предсказанием параметров линейного предсказания в кодировании речи с переменной битовой скоростью |
| CN101030377A (zh) * | 2007-04-13 | 2007-09-05 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| RU2009110838A (ru) | 2010-09-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5356406B2 (ja) | オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 | |
| KR101060533B1 (ko) | 신호 변화 검출을 위한 시스템, 방법 및 장치 | |
| US8670981B2 (en) | Speech encoding and decoding utilizing line spectral frequency interpolation | |
| JP6272619B2 (ja) | オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法 | |
| US8392178B2 (en) | Pitch lag vectors for speech encoding | |
| RU2632151C2 (ru) | Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник | |
| Jassim et al. | WARP-Q: Quality prediction for generative neural speech codecs | |
| KR20050061615A (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
| EP2502231B1 (en) | Bandwidth extension of a low band audio signal | |
| JP3254687B2 (ja) | 音声符号化方式 | |
| RU2744485C1 (ru) | Ослабление шума в декодере | |
| EP3899932B1 (en) | Phase reconstruction in a speech decoder | |
| CN103348597A (zh) | 低比特率信号编码器及解码器 | |
| EP1995723B1 (en) | Neuroevolution training system | |
| TWI467979B (zh) | 用於信號改變偵測之系統、方法及裝置 | |
| TW201218188A (en) | Encoder apparatus and encoding method | |
| US5819224A (en) | Split matrix quantization | |
| Yao et al. | Variational speech waveform compression to catalyze semantic communications | |
| Özaydın et al. | Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates | |
| RU2408088C2 (ru) | Способ векторного квантования параметров линейного предсказания | |
| EP3787270B1 (en) | Methods and devices for improvements relating to voice quality estimation | |
| US20090063158A1 (en) | Efficient audio coding using signal properties | |
| Bhatt et al. | Overall performance evaluation of adaptive multi rate 06.90 speech codec based on code excited linear prediction algorithm using MATLAB | |
| EP3514791B1 (en) | Sample sequence converter, sample sequence converting method and program | |
| WO2024208612A1 (en) | Method for performing packet loss concealment in complex filter bank domain |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20110325 |