[go: up one dir, main page]

KR100736324B1 - Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same - Google Patents

Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same Download PDF

Info

Publication number
KR100736324B1
KR100736324B1 KR1020050086657A KR20050086657A KR100736324B1 KR 100736324 B1 KR100736324 B1 KR 100736324B1 KR 1020050086657 A KR1020050086657 A KR 1020050086657A KR 20050086657 A KR20050086657 A KR 20050086657A KR 100736324 B1 KR100736324 B1 KR 100736324B1
Authority
KR
South Korea
Prior art keywords
codebook
signal
wavelet packet
synthesis
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020050086657A
Other languages
Korean (ko)
Other versions
KR20070032436A (en
Inventor
강동규
이승훈
Original Assignee
(주) 코아보이스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 코아보이스 filed Critical (주) 코아보이스
Priority to KR1020050086657A priority Critical patent/KR100736324B1/en
Publication of KR20070032436A publication Critical patent/KR20070032436A/en
Application granted granted Critical
Publication of KR100736324B1 publication Critical patent/KR100736324B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • G10L19/0216Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/22Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/0005DTS audio codecs

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 웨이블렛 패킷 분해/합성을 이용한 음향신호 압축/복원 방법 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(sub-band signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법에 관한 것으로, 인코더부 및 디코더부를 구비한 음향코덱에 있어서, 상기 인코더부 및 디코더부에는 코드북을 각각 포함하며, 상기 코드북은 고주파 대역의 서브밴드 신호를 코드북으로 대체할 때 해당 서브밴드 신호가 저주파 대역 신호의 위상과 일치하지 않을 경우 나타나는 잡음성분을 줄이기 위해, 추출된 서브 밴드별 신호의 진폭을 정규화하는 과정을 포함한다.According to the present invention, a codebook method replaces a subband signal of a high frequency band having a low distortion rate due to phase mismatch in a method of compressing and restoring an acoustic signal using wavelet packet decomposition / synthesis. Codebook-based wavelet packet decomposition / synthesis and compression and restoration of codebook based wavelet packet decomposition / synthesis, which can increase the efficiency of saving, transmitting and restoring digital audio signals by reducing the calculation amount by 1/3 while recovering more than 2 times. A sound codec comprising an encoder unit and a decoder unit, wherein the encoder unit and the decoder unit each include a codebook, and the codebook includes a codebook when the subband signal of a high frequency band is replaced with a codebook. Extraction to reduce noise component when it is out of phase with low frequency signal It comprises the step of normalizing the amplitude of the sub-band-specific signals.

웨이블렛 패킷, 음향신호, 코드북, 압축, 인코딩, 복원, 디코딩 Wavelet Packet, Acoustic Signal, Codebook, Compression, Encoding, Reconstruction, Decoding

Description

코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 복원방법{Audio CODEC using Wavelet Packet Decomposition AND Composition Based On Code Book AND Method of Decompression for Audio Signal Using Thereof}CODEC using Wavelet Packet Decomposition AND Composition Based On Code Book AND Method of Decompression for Audio Signal Using Thereof}

도 1은 일반적인 웨이블렛 패킷 분해구조를 나타내는 개략도,1 is a schematic diagram showing a general wavelet packet decomposition structure;

도 2는 종래의 웨이블렛 인코더부를 나타내는 블록도,2 is a block diagram showing a conventional wavelet encoder;

도 3은 종래의 웨이블렛 디코더부를 나타내는 블록도,3 is a block diagram showing a conventional wavelet decoder;

도 4는 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱을 나타내는 개략 블록도,4 is a schematic block diagram illustrating an acoustic codec using codebook based wavelet packet decomposition / synthesis according to the present invention;

도 5는 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해를 이용한 음향코덱의 인코더부를 나타내는 블록도,5 is a block diagram illustrating an encoder of an acoustic codec using codebook based wavelet packet decomposition according to the present invention;

도 6은 본 발명에 따른 코드북기반 웨이블렛 패킷 분해를 이용한 음향신호의 압축방법을 나타내는 흐름도,6 is a flowchart illustrating a method of compressing an audio signal using codebook based wavelet packet decomposition according to the present invention;

도 7은 본 발명에 따른 코드북기반 웨이블렛 패킷 합성을 이용한 음향코덱의 디코더부를 나타내는 블록도,7 is a block diagram showing a decoder of an acoustic codec using codebook based wavelet packet synthesis according to the present invention;

도 8은 본 발명에 따른 코드북기반 웨이블렛 패킷 합성을 이용한 음향신호의 복원방법을 나타내는 흐름도,8 is a flowchart illustrating a method for recovering an acoustic signal using codebook based wavelet packet synthesis according to the present invention;

도 9는 본 발명에 따른 음향코덱에 포함되는 코드북 후보 DB의 추출방법을 나타내는 흐름도,9 is a flowchart illustrating a method of extracting a codebook candidate DB included in an acoustic codec according to the present invention;

도 10은 정규화 전과 후의 서브밴드 신호의 진폭을 나타내는 파형도, 10 is a waveform diagram showing amplitudes of subband signals before and after normalization;

도 11은 본 발명에 따른 음향코덱에 포함되는 코드북의 훈련방법을 나타내는 흐름도이다.11 is a flowchart illustrating a training method of a codebook included in an acoustic codec according to the present invention.

*도면 내 주요부분에 대한 부호설명** Description of Signs for Main Parts in Drawings *

1: 음향코덱 3: 인코더부1: Sound Codec 3: Encoder

5: 디코더부 7: 코드북5: decoder section 7: codebook

본 발명은 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법에 관한 것으로, 특히 웨이블렛 패킷을 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 복원방법에 관한 것이다.The present invention relates to an acoustic codec and a method for compressing and reconstructing an acoustic signal using the same. Particularly, among subband signals decomposed into a wavelet packet, a codebook method is used for a subband signal of a high frequency band having a low distortion rate due to phase mismatch. By using the codebook-based wavelet packet decomposition / synthesis, which improves the efficiency of storing / transmitting / restoring digital sound signals by increasing the compression rate by more than 2 times compared to the conventional method, and reducing the calculation amount by 1/3. The present invention relates to a codec and a sound signal recovery method using the same.

일반적으로 웨이블렛 패킷 분해/합성(Wavelet Packet Decomposition/ Composition)에 의한 음향신호의 압축(인코딩) 방법은 도 1 및 도 2에서와 같이 대 역통과 필터(Band Pass filter) 특성을 갖는 웨이블렛 필터로 웨이블렛 패킷을 분해하여 생성된 각각의 서브밴드 신호(표 1 참조)에 대해 심리음향모델을 적용하여 서브밴드 별로 최적 비트를 할당하여 양자화하는 방법이다.In general, a method of compressing (encoding) an acoustic signal by wavelet packet decomposition / composition is a wavelet packet having a band pass filter characteristic as shown in FIGS. 1 and 2. This method is to apply a psychoacoustic model to each subband signal (refer to Table 1) generated by decomposing the quantization by assigning an optimal bit for each subband.

밴드 번호Band number 샘플 수/밴드Sample Count / Band 하위경계주파수(Hz)Lower boundary frequency (Hz) 상위경계주파수(Hz)Upper boundary frequency (Hz) 1One 1616 00 250250 22 1616 250250 500500 33 1616 500500 750750 44 1616 750750 10001000 55 1616 10001000 12501250 66 1616 12501250 15001500 77 1616 15001500 17501750 88 1616 17501750 20002000 99 3232 20002000 25002500 1010 3232 25002500 30003000 1111 3232 30003000 35003500 1212 3232 35003500 40004000 1313 6464 40004000 50005000 1414 6464 50005000 60006000 1515 128128 60006000 80008000

상기 표 1은 도 1과 같이 웨이블렛 패킷의 분해구조가 도 1과 같을 경우, 서브밴드별 신호의 특성(16KHz 샘플링/분석 프레임 길이 512 샘플)을 나타낸다.Table 1 shows characteristics of the signal for each subband (512 samples of 16KHz sampling / analysis frame length) when the decomposition structure of the wavelet packet is as shown in FIG. 1.

또한, 복원(디코딩)방법은 도 3에서와 같이 입력된 패킷을 분해하여 헤더정보(프레임길이, 비트 할당 등) 및 샘플정보를 분류하고 서브밴드별 비트할당 계수에 따라 서브밴드별 신호를 복원한 다음 역 웨이블렛 필터(Inverse Wavelet Filter)로 웨이블렛 패킷 합성과정을 수행하여 음향신호를 복원한다.In addition, the reconstruction (decoding) method decomposes the input packet as shown in FIG. Next, a wavelet packet synthesis process is performed with an inverse wavelet filter to restore the sound signal.

이와 같은 종래의 음향신호의 압축/복원방법은 웨이블렛 패킷을 주파수 대역별로 분해한 서브밴드별 신호의 구조가 단순화되어 낮은 비트할당으로도 신호의 특성 표현이 가능하고 심리음향모델에 의해 불필요한 서브밴드에 비트를 할당하지 않거나 최소화할 수 있기 때문에 고품질을 유지하면서도 고효율 압축/복원이 가능하다.In the conventional method of compressing and restoring an acoustic signal, the structure of a signal for each subband obtained by splitting a wavelet packet into frequency bands is simplified, so that the characteristics of the signal can be expressed even with low bit allocation. By not assigning or minimizing bits, high efficiency compression / restore is possible while maintaining high quality.

더욱이 상기 방법은 압축시 분석구간 대 복원구간의 정보가 일 대 일로 대응되는 방법이므로 짧은(예를 들면, 수십 msec) 구간의 음향신호에 대해서 이전 프레임의 부가적인 정보 없이도 고품질의 압축/복원이 가능한 방법이다.In addition, since the method corresponds to a one-to-one correspondence between the analysis section and the restoration section during compression, high quality compression / restore is possible without additional information of the previous frame for the sound signal of a short (for example, several tens of msec) intervals. Way.

또한, 압축된 데이터를 전송하는데 있어서 패킷손실이 발생하여도 이전 프레임에 대한 정보가 필요한 일반적인 방법(CELP)에 비하여 복원결과가 우수한 장점이 있다. 여기에서 CELP 라 함은, 모뎀에 최적화된 음성 발화 코덱의 ITU 표준을 말하는 것이며, 예를 들어 LD-CELP 방식이 사용되며, 5.3 또는 6.4 Kbps에서 장거리 통화 품질의 오디오를 제공한다. 더 높은 속도를 얻으려면 처리 능력이 더 떨어지는 점이 있고, 또한 한 번에 한 사람이 말하는 모드를 제공하고 대화 그룹에서는 추가 대역폭을 사용하는 것을 칭한다. In addition, even when packet loss occurs in transmitting the compressed data, the restoration result is superior to the general method (CELP), which requires information on a previous frame. Here, CELP refers to an ITU standard of a voice speech codec optimized for a modem. For example, the LD-CELP method is used, and provides long-distance call quality audio at 5.3 or 6.4 Kbps. To get higher speeds, the processing power is lowered, and it also refers to providing a mode that one person speaks at a time and using additional bandwidth in a conversation group.

그러나, 상기와 같은 장점에 비하여, 압축 시 웨이블렛 패킷(Wavelet Packet)으로 분해하고, 복원 시 재구성하기 위해서는 많은 계산이 소요되는 문제점이 있었고, 아울러 압축 비율이 8배 정도로 다른 압축방법(20~30배)에 비하여 높지 않은 단점이 있었다.However, in comparison with the above advantages, there was a problem that it takes a lot of calculation to decompose into a wavelet packet during compression and reconstruct when restoring, and a compression method having a compression ratio of about 8 times (20 to 30 times). There was a disadvantage that is not high compared to).

따라서 본 발명은 이러한 종래기술의 문제점을 감안하여 안출된 것으로, 그 목적은 웨이블렛 패킷을 주파수 대역별로 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법을 제공하는데 있다.Accordingly, the present invention has been made in view of the problems of the prior art, and an object thereof is to provide a high frequency band subband signal having a low distortion rate due to phase mismatch among subband signals obtained by splitting a wavelet packet for each frequency band. By replacing the codebook method, codebook-based wavelet packet decomposition / synthesis is possible to increase the efficiency of saving, transmitting and restoring digital audio signals by reducing the calculation amount by 1/3 while recovering the compression rate more than twice as compared to the conventional method. The present invention provides a sound codec and a method of compressing and restoring a sound signal using the same.

상기한 목적을 달성하기 위하여, 본 발명은 인코더부 및 디코더부를 구비한 음향코덱에 있어서, 상기 인코더부 및 디코더부에는 코드북을 각각 포함하는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱을 제공한다.In order to achieve the above object, the present invention is an acoustic codec having an encoder unit and a decoder unit, wherein the encoder unit and the decoder unit include a codebook, wherein the acoustic codec using wavelet packet decomposition / synthesis, respectively. To provide.

상기 코드북은 웨이블렛 패킷 분해된 고주파 대역의 서브밴드 신호를 코드북으로 대체할 때 서브밴드 신호가 저주파 대역 서브밴드 신호의 위상과 일치하지 않을 경우 나타나는 잡음성분을 줄이기 위하여, 추출된 서브밴드별 신호의 진폭을 정규화하고 다양한 특성들이 포함되도록 훈련과정을 수행하여 작성된다.In order to reduce noise components when the subband signal does not coincide with the phase of the low frequency band subband signal when the subband signal of the wavelet packet-decomposed high frequency band is replaced with the codebook, the codebook is the amplitude of the extracted subband signal. This is done by normalizing the training and conducting a training process to include the various features.

본 발명의 다른 특징은, 음향코덱의 인코더부로 입력된 디지털 음향신호를 웨이블렛 필터를 이용하여 웨이블렛 패킷을 주파수 대역별 서브밴드 신호로 분해하는 단계; 상기 분해된 저주파 대역의 서브밴드 신호에 대해 심리음향모델을 적용하여 서브 밴드별로 최적 비트를 할당하여 양자화하는 단계; 코드북으로 대체할 고주파 대역의 서브밴드 신호 진폭을 정규화하는 단계: 정규화된 각 고주파대역의 서브밴드 신호에 대하여 코드북과의 음향특성을 비교하여 가장 근접한 코드번호를 탐색하고 해당 서브밴드의 신호를 코드북으로 대체하는 코드북 탐색단계; 및 상기과정에 의해 생성된 결과를 저장, 전송, 복원에 편리한 형태인 비트스트리밍을 포맷시키는 단계로 이루어지는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해를 이용한 음향신호의 압축방법을 제공한다. Another aspect of the invention, the step of decomposing the wavelet packet into a subband signal for each frequency band using a wavelet filter the digital sound signal input to the encoder section of the acoustic codec; Applying a psychoacoustic model to the decomposed low frequency subband signal and quantizing an optimal bit for each subband; Normalizing the subband signal amplitude of the high frequency band to be replaced by the codebook: searching the closest code number by comparing acoustic characteristics with the codebook for the subband signals of each normalized high frequency band and converting the signal of the corresponding subband into the codebook Searching for a replaceable codebook; And formatting the bitstreaming, which is a convenient form for storing, transmitting, and restoring the result generated by the above process, and provides a method of compressing an acoustic signal using codebook based wavelet packet decomposition.

본 발명의 또 다른 특징은, 음향코덱의 디코더부로 입력된 압축된 디지털 음향신호의 패킷을 분해하여 헤더정보 및 샘플정보를 분류하는 단계; 저주파 대역의 서브밴드에 대해서는 비트할당 정보와 샘플정보를 이용하여 서브밴드 신호를 복원하는 단계; 코드북으로 대체된 고주파 대역의 서브밴드 신호는 각 서브밴드별 코드번호에 해당하는 코드북의 신호를 해당 서브밴드의 신호로 복원하고, 역 웨이블렛 필터를 이용하여 웨이블렛 패킷 합성을 수행하여 최종적인 음향신호를 복원하는 단계로 이루어지는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷분해를 이용한 음향신호의 복원방법을 제공한다.Another feature of the present invention includes the steps of: classifying header information and sample information by decomposing a packet of a compressed digital sound signal input to a decoder of an acoustic codec; Restoring the subband signal using bit allocation information and sample information on the subbands in the low frequency band; The subband signal of the high frequency band replaced by the codebook restores the codebook signal corresponding to the code number of each subband to the signal of the corresponding subband, and performs the wavelet packet synthesis using the inverse wavelet filter to perform the final sound signal. The present invention provides a method for recovering an acoustic signal using codebook based wavelet packet decomposition, characterized in that the step of recovering.

따라서, 본 발명에서는 웨이블렛 패킷을 분해한 고주파 대역의 서브밴드 별 신호를 코드북으로 대체하여 복원 시 계산량을 현저히 줄임과 동시에 압축률을 크게 개선하는 것은 물론, 고품질의 음질을 유지할 수 있다. Therefore, in the present invention, a signal book for each subband of a high frequency band obtained by decomposing a wavelet packet is replaced with a codebook, which significantly reduces the amount of computation during restoration and greatly improves the compression ratio, as well as maintaining high quality sound.

더욱이, 본 발명은 음향신호, 음성신호 등에 적용할 수 있으며, 특히 음성합성분야에서는 보다 높은 성능을 얻을 수 있다. Moreover, the present invention can be applied to acoustic signals, voice signals, and the like, and in particular, high performance can be obtained in the field of speech synthesis.

이하, 상기한 본 발명을 바람직한 실시예가 도시된 첨부도면을 참고하여 더욱 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings showing a preferred embodiment of the present invention described above in more detail.

첨부된 도 4는 본 발명에 따른 코드북 기반 웨이블렛 패킷분해/합성을 이용한 음향코덱을 나타내는 개략 블록도이고, 도 5 및 도 6은 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해를 이용한 음향코덱의 인코더부를 나타내는 블록도 및 음향신호의 압축방법을 나타내는 흐름도이고, 도 7 및 도 8은 본 발명에 따른 코드북 기반 웨이블렛 패킷 합성을 이용한 음향코덱의 디코더부를 나타내는 블록도 및 음향신호의 복원방법을 나타내는 흐름도이다. 4 is a schematic block diagram illustrating an acoustic codec using codebook based wavelet packet decomposition / synthesis according to the present invention, and FIGS. 5 and 6 illustrate an encoder of an acoustic codec using codebook based wavelet packet decomposition according to the present invention. 7 and 8 are block diagrams illustrating a decoder unit of an audio codec using codebook based wavelet packet synthesis according to the present invention, and a flowchart illustrating a method of recovering an audio signal.

먼저, 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱(1)은 도 4와 같이 각각 코드북(code book)(7)을 구비한 인코더부(3) 및 디코더부(5)를 포함한다.First, the acoustic codec 1 using codebook-based wavelet packet decomposition / synthesis according to the present invention includes an encoder unit 3 and a decoder unit 5 each having a code book 7 as shown in FIG. do.

상기 인코더부(3)는 도 5 및 도 6에 도시한 바와 같이, 디지털 음향신호가 입력되면, 대역통과 필터(Band Pass filter) 특성을 갖는 웨이블렛 필터로 주파수 대역별 서브밴드로 웨이블렛 패킷을 분해하고, 저주파 대역 서브밴드 신호에 대해서는 심리음향모델을 적용하여 서브 밴드별로 최적 비트를 할당하여 양자화하고, 고주파 대역의 NC(코드북 적용 밴드 수) 서브밴드 신호에 대하여 코드북(7)을 탐색하여 최적 코드번호를 탐색하여 대체한 후, 비트스트리밍으로 포맷시킨다. 이어서, 신호의 끝이 아니면 상기 과정을 반복하여 수행함으로서 연속적인 음향신호를 압축한다.5 and 6, when the digital sound signal is input, the encoder unit 3 is a wavelet filter having a band pass filter characteristic and decomposes the wavelet packet into subbands for each frequency band. For the low frequency band subband signal, the psychoacoustic model is applied to allocate the optimal bits for each subband and quantize them. The codebook 7 is searched for the NC (number of codebook applied band) subband signals of the high frequency band to obtain the optimal code number. Find and replace, then format it as bitstreaming. Then, if the signal is not at the end, the above process is repeated to compress the continuous sound signal.

이와 같이 웨이블렛 패킷을 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북(7)으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시킬 수 있다.In this way, by substituting the high frequency band subband signal having a low distortion rate due to phase mismatch among the subband signals in which the wavelet packet is decomposed by the codebook 7, the compression rate can be increased by more than twice as compared with the conventional method. Can be.

또한, 상기 디코더부(5)는 도 7 및 도 8과 같이, 상기 압축된 디지털 음향신호가 입력되면, 입력된 패킷을 분해하여 헤더정보(프레임길이, 비트 할당 등) 및 샘플정보를 분류하고, 저주파 대역의 서브밴드별 비트할당 계수와 샘플정보를 이용 하여 서브밴드 신호를 복원하고, 고주파 대역의 서브밴드별 신호는 밴드별 코드번호에 해당하는 코드북의 신호를 서브밴드 신호로 복원한 후, 역 웨이블렛 필터(Inverse Wavelet Filter)를 이용하여 웨이블렛 패킷 합성을 수행하여 음향신호를 복원한다. 이어서, 비트스트림의 끝이 아니면 상기 과정을 반복 수행하여 연속적인 음향신호를 복원한다.7 and 8, when the compressed digital sound signal is input, the decoder unit 5 decomposes the input packet to classify header information (frame length, bit allocation, etc.) and sample information. The subband signal is restored by using bit allocation coefficients and sample information for each subband of the low frequency band, and the subband signal of the high frequency band is obtained by restoring a codebook signal corresponding to a code number of each band into a subband signal. A wavelet packet is synthesized using an inverse wavelet filter to restore an acoustic signal. Subsequently, if the end of the bitstream is not repeated, the above process is repeated to restore a continuous sound signal.

이와 같이 상기 디코더부(5)를 통해 압축된 디지털 음향신호를 복원할 경우, 고주파 대역에 대해서는 역 웨이블렛 필터를 이용한 웨이블렛 패킷 합성과정을 단순화시켜 계산량을 1/3까지 줄일 수 있다.As described above, when the digital sound signal compressed by the decoder unit 5 is restored, the wavelet packet synthesis process using the inverse wavelet filter for the high frequency band can be simplified to reduce the amount of calculation to 1/3.

결국, 상기 인코더부(3) 및 디코더부(5)를 통해 압축 및 복원방법을 통해서, 디지털 음향신호의 저장/전송/복원에 효율성을 극대화 할 수 있다.As a result, through the compression and reconstruction method through the encoder unit 3 and the decoder unit 5, it is possible to maximize the efficiency in the storage / transmission / restoration of the digital sound signal.

도 9는 본 발명에 따른 음향코덱에 포함되는 코드북 후보 DB의 추출방법을 나타내는 흐름도이고, 도 10은 서브밴드 신호의 정규화 전과 후의 신호에 대한 진폭을 나타내는 파형도이다.9 is a flowchart illustrating a method of extracting a codebook candidate DB included in an acoustic codec according to the present invention, and FIG. 10 is a waveform diagram illustrating amplitudes of signals before and after normalization of subband signals.

한편, 고주파 대역의 서브밴드 신호를 코드북(7)으로 대체할 때 코드북(7)의 신호가 저주파 대역 서브밴드 신호의 위상과 일치하지 않을 경우 잡음 성분으로 나타나게 되는데, 본 발명에서는 이러한 현상을 줄이기 위해 도 9와 같이, 추출된 서브 밴드별 신호의 진폭을 정규화하는 과정을 수행하여 잡음성분을 최소화시킬 수 있다.On the other hand, when the subband signal of the high frequency band is replaced by the codebook 7, when the signal of the codebook 7 does not coincide with the phase of the low frequency band subband signal, it appears as a noise component. As shown in FIG. 9, a noise component may be minimized by performing a process of normalizing the amplitude of the extracted subband signal.

즉, 코드북 후보 DB의 추출방법은 대용량 음향신호 DB로부터 입력된 음향신호를 N(전체 밴드 수)밴드로 웨이블렛 필터링(웨이블렛 패킷 분해)하고 양자화하기 전에 NC(코드북 적용 밴드 수)서브밴드 신호의 진폭을 정규화한다.That is, the extraction method of the codebook candidate DB is the amplitude of the NC (codebook applied band) subband signal before wavelet filtering (wavelet packet decomposition) and quantizing the acoustic signal input from the large-capacity acoustic signal DB into N (total number of bands) bands. Normalize

이와 같은 정규화 과정은 도 10과 같이 평균피크를 초과하는 신호에 대하여 진폭의 크기를 평균피크와 유사한 크기가 되도록 조절하는 과정이다. 즉, 평균피크와 진폭의 차가 큰 경우는 강력한 에너지가 여기되는 유성음의 피치 시작점에서 주로 발생하며 이들 신호가 피치와 일치하지 않을 경우 잡음성분으로 나타나게 되며 정규화 과정은 주로 이들 신호를 억제하는 역할을 한다.This normalization process is a process of adjusting the magnitude of the amplitude to be similar to the average peak with respect to the signal exceeding the average peak as shown in FIG. In other words, when the difference between the average peak and the amplitude is large, it occurs mainly at the pitch starting point of the voiced sound where strong energy is excited, and when these signals do not match the pitch, they appear as noise components and the normalization process mainly suppresses these signals. .

한편 진폭 정규화가 이루어진 서브밴드 신호는 양자화된 후, 코드북 후보 DB에 저장되며, 음향신호의 끝이 아니면 상기 과정을 반복하여 코드북 후보 DB를 추출한다.On the other hand, the amplitude-normalized subband signal is quantized and stored in the codebook candidate DB, and if not the end of the sound signal, the above process is repeated to extract the codebook candidate DB.

도 11은 본 발명에 따른 음향코덱에 포함되는 코드북의 훈련방법을 나타내는 흐름도이다.11 is a flowchart illustrating a training method of a codebook included in an acoustic codec according to the present invention.

한편, 상기 코드북(7)은 다양한 신호로부터 추출된 서브밴드 신호로부터 추출하고 유사한 신호를 배제하며, 서로 다른 다양한 특성이 포함될 수 있도록 훈련하여 작성해야 음질의 저하를 최소화할 수 있다.Meanwhile, the codebook 7 may be extracted from subband signals extracted from various signals, exclude similar signals, and be trained and written to include different characteristics to minimize degradation of sound quality.

예를 들면, 최종 코드 워드(code word) 수가 N개일 때 음질 저하를 최소화하기 위해 일반적인 VQ(vector quantization)에 의한 코드북 훈련과정은 도 11에 도시한 바와 같이, 입력된 코드북 후보 DB에 대하여 전체 중심점을 검출한다. 이때 초기 코드 워드는 0이다.For example, in order to minimize the degradation of sound quality when the number of final code words is N, a general codebook training process by VQ (vector quantization) is performed as shown in FIG. 11. Is detected. The initial code word is zero.

이어서 코드 워드별로 2개로 분할하고, 코드 워드별 해당 후보들의 중심점을 추출한다. 그 후, 모든 후보들에 대하여 각 코드 워드 중심과 유사도를 측정한 다 음, 각 후보가 가장 유사한 중심점에 해당하는 코드 워드로 재할당한다.Subsequently, the coder divides the data into two codewords and extracts the center points of the candidates for each codeword. Then, for each candidate, each code word center and similarity are measured, and each candidate is reassigned to the code word corresponding to the most similar center point.

상기 재 할당된 코드 워드가 최적으로 할당되고, 코드 워드가 전체 수(N)와 일치하면 각 코드 워드의 중심값을 저장한 후, 코드북 훈련과정을 종료한다.If the reassigned code words are optimally allocated and the code words match the total number N, the center value of each code word is stored and the codebook training process is terminated.

본 발명의 방법으로 압축된 음향신호는 복원 시 음질을 MOS 4.0 이상 유지하면서 압축률은 16배 이상을 유지하고, 아울러 복원 시 계산량을 1/3로 줄일 수 있다.A sound signal compressed by the method of the present invention can maintain a compression quality of 16 times or more while maintaining the sound quality of MOS 4.0 or more at the time of restoration, and can also reduce the amount of calculation to 1/3 during restoration.

더욱이, 본 발명은 음향신호, 음성신호 등에 적용할 수 있으며, 특히 음성합성분야에서는 보다 높은 성능을 얻을 수 있다. 또한 본 발명은 필터뱅크 방식을 사용하는 음향신호 압축/복원장치에 모두 적용될 수 있다.Moreover, the present invention can be applied to acoustic signals, voice signals, and the like, and in particular, high performance can be obtained in the field of speech synthesis. In addition, the present invention can be applied to both the acoustic signal compression / restoration apparatus using the filter bank method.

상기한 바와 같이 본 발명에서는 웨이블렛 패킷 분해된 서브밴드 신호 중에서 고주파 대역의 서브밴드신호를 코드북으로 대체하여 복원 시 계산량을 현저히 줄임과 동시에 압축률을 크게 개선하는 것은 물론, 고품질의 음질을 유지할 수 있는 이점이 있다. As described above, in the present invention, the subband signal of the wavelet packet-decomposed subband signal is replaced with a codebook, thereby significantly reducing the amount of computation at the time of restoration and greatly improving the compression ratio, as well as maintaining high quality sound quality. There is this.

Claims (4)

인코더부 및 디코더부를 구비한 음향코덱에 있어서,In the acoustic codec having an encoder unit and a decoder unit, 상기 인코더부 및 디코더부에는 코드북을 각각 포함하는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱.The codec based wavelet packet decomposition / synthesis, characterized in that the encoder unit and the decoder unit comprises a codebook, respectively. 제1항에 있어서, 상기 코드북은 고주파 대역의 서브밴드 신호를 코드북으로 대체할 때 해당 서브밴드 신호가 저주파 대역의 위상과 일치하지 않을 경우 나타나는 잡음성분을 줄이기 위해, 추출된 서브 밴드별 신호의 진폭을 정규화하는 과정을 포함하는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱.The amplitude of the extracted subband signal according to claim 1, wherein the codebook reduces the noise component when the subband signal of the high frequency band does not match the phase of the low frequency band when the subband signal of the high frequency band is replaced with the codebook. A codebook-based wavelet packet decomposition / synthesis, comprising: a process for normalizing the audio codec. (삭제)(delete) 역 웨이블렛 필터링을 수행하는 단계로 이루어지는 것을 특징으로 하는 코드기반 웨이블렛 패킷 합성을 이용한 음향신호의 복원방법에 있어서, In the method of restoring an acoustic signal using code-based wavelet packet synthesis, characterized in that the step of performing inverse wavelet filtering, 음향코덱의 디코더부로 입력된 압축된 디지털 음향신호의 패킷을 분해하여 헤더정보 및 샘플정보를 분류하는 단계;Classifying header information and sample information by decomposing a packet of a compressed digital sound signal input to a decoder of an acoustic codec; 저주파 대역의 서브밴드 신호는 비트할당 정보 및 샘플정보를 이용하여 복원하고, 고주파 대역의 각 서브밴드 신호는 해당 서브밴드의 코드번호에 해당하는 코드북 신호를 해당 서브밴드 신호로 복원하는 단계: 및Reconstructing the subband signal of the low frequency band using bit allocation information and sample information, and reconstructing the codebook signal corresponding to the code number of the corresponding subband into the corresponding subband signal for each subband signal of the high frequency band: 각 대역별 서브밴드 신호를 역 웨이블렛 필터를 이용하여 웨이블렛 패킷 합성을 수행하여 최종 음향신호를 복원하는 단계로 이루어지는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 합성을 이용한 음향신호의 복원방법.And restoring a final sound signal by performing wavelet packet synthesis using an inverse wavelet filter on each subband signal for each band.
KR1020050086657A 2005-09-16 2005-09-16 Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same Expired - Fee Related KR100736324B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050086657A KR100736324B1 (en) 2005-09-16 2005-09-16 Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050086657A KR100736324B1 (en) 2005-09-16 2005-09-16 Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same

Publications (2)

Publication Number Publication Date
KR20070032436A KR20070032436A (en) 2007-03-22
KR100736324B1 true KR100736324B1 (en) 2007-07-09

Family

ID=41560432

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050086657A Expired - Fee Related KR100736324B1 (en) 2005-09-16 2005-09-16 Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same

Country Status (1)

Country Link
KR (1) KR100736324B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271841B (en) * 2018-07-25 2022-04-22 西安交通大学 Electromechanical system signal combination noise reduction method based on local projection and wavelet packet decomposition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문:Shape-Gain 벡터양자화를 이용한 웨이브릿 기반 영상의 임베디드 압축기법(1999.11.01)

Also Published As

Publication number Publication date
KR20070032436A (en) 2007-03-22

Similar Documents

Publication Publication Date Title
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
CN101510424B (en) Method and system for encoding and synthesizing speech based on speech primitive
KR101143724B1 (en) Encoding device and method thereof, and communication terminal apparatus and base station apparatus comprising encoding device
US10978091B2 (en) System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition
KR101819180B1 (en) Encoding method and apparatus, and deconding method and apparatus
KR20230125985A (en) Audio generation device and method using adversarial generative neural network, and trainning method thereof
CN101325059B (en) Method and apparatus for transmitting and receiving encoding-decoding speech
US6789066B2 (en) Phoneme-delta based speech compression
JPH11177434A (en) Voice code decoding system
KR20050027179A (en) Method and apparatus for decoding audio data
Khaldi et al. Audio encoding based on the empirical mode decomposition
KR20050009384A (en) Wide-band speech compression and decompression apparatus and method thereof
CN101740030B (en) Method and device for transmitting and receiving speech signals
EP1497631B1 (en) Generating lsf vectors
KR100736324B1 (en) Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same
CN101325058B (en) Method and device for transmitting, receiving and decoding voice code
CN108417219A (en) An Audio Object Codec Method Adapted to Streaming Media
Manohar et al. Audio compression using daubechie wavelet
Joseph Spoken digit compression using wavelet packet
US8849655B2 (en) Encoder, decoder and methods thereof
De Meuleneire et al. A CELP-wavelet scalable wideband speech coder
JP2002215192A (en) Audio information processor and processing method
Radha et al. Comparative analysis of compression techniques for Tamil speech datasets
CN1354456A (en) Block effect eliminating method in wavelet voice frequency signal processing
Mazor et al. Adaptive subbands excited transform (ASET) coding

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

G170 Re-publication after modification of scope of protection [patent]
PG1701 Publication of correction

St.27 status event code: A-5-5-P10-P19-oth-PG1701

Patent document republication publication date: 20080422

Republication note text: Request for Correction Notice (Document Request)

Gazette number: 1007363240000

Gazette reference publication date: 20070709

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

FPAY Annual fee payment

Payment date: 20120626

Year of fee payment: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

FPAY Annual fee payment

Payment date: 20130628

Year of fee payment: 7

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20140630

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20140630

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000