KR100736324B1 - Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same - Google Patents
Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same Download PDFInfo
- Publication number
- KR100736324B1 KR100736324B1 KR1020050086657A KR20050086657A KR100736324B1 KR 100736324 B1 KR100736324 B1 KR 100736324B1 KR 1020050086657 A KR1020050086657 A KR 1020050086657A KR 20050086657 A KR20050086657 A KR 20050086657A KR 100736324 B1 KR100736324 B1 KR 100736324B1
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- signal
- wavelet packet
- synthesis
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
- G10L19/0216—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/22—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing distortions
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
- G11B2020/0005—DTS audio codecs
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 웨이블렛 패킷 분해/합성을 이용한 음향신호 압축/복원 방법 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(sub-band signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법에 관한 것으로, 인코더부 및 디코더부를 구비한 음향코덱에 있어서, 상기 인코더부 및 디코더부에는 코드북을 각각 포함하며, 상기 코드북은 고주파 대역의 서브밴드 신호를 코드북으로 대체할 때 해당 서브밴드 신호가 저주파 대역 신호의 위상과 일치하지 않을 경우 나타나는 잡음성분을 줄이기 위해, 추출된 서브 밴드별 신호의 진폭을 정규화하는 과정을 포함한다.According to the present invention, a codebook method replaces a subband signal of a high frequency band having a low distortion rate due to phase mismatch in a method of compressing and restoring an acoustic signal using wavelet packet decomposition / synthesis. Codebook-based wavelet packet decomposition / synthesis and compression and restoration of codebook based wavelet packet decomposition / synthesis, which can increase the efficiency of saving, transmitting and restoring digital audio signals by reducing the calculation amount by 1/3 while recovering more than 2 times. A sound codec comprising an encoder unit and a decoder unit, wherein the encoder unit and the decoder unit each include a codebook, and the codebook includes a codebook when the subband signal of a high frequency band is replaced with a codebook. Extraction to reduce noise component when it is out of phase with low frequency signal It comprises the step of normalizing the amplitude of the sub-band-specific signals.
웨이블렛 패킷, 음향신호, 코드북, 압축, 인코딩, 복원, 디코딩 Wavelet Packet, Acoustic Signal, Codebook, Compression, Encoding, Reconstruction, Decoding
Description
도 1은 일반적인 웨이블렛 패킷 분해구조를 나타내는 개략도,1 is a schematic diagram showing a general wavelet packet decomposition structure;
도 2는 종래의 웨이블렛 인코더부를 나타내는 블록도,2 is a block diagram showing a conventional wavelet encoder;
도 3은 종래의 웨이블렛 디코더부를 나타내는 블록도,3 is a block diagram showing a conventional wavelet decoder;
도 4는 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱을 나타내는 개략 블록도,4 is a schematic block diagram illustrating an acoustic codec using codebook based wavelet packet decomposition / synthesis according to the present invention;
도 5는 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해를 이용한 음향코덱의 인코더부를 나타내는 블록도,5 is a block diagram illustrating an encoder of an acoustic codec using codebook based wavelet packet decomposition according to the present invention;
도 6은 본 발명에 따른 코드북기반 웨이블렛 패킷 분해를 이용한 음향신호의 압축방법을 나타내는 흐름도,6 is a flowchart illustrating a method of compressing an audio signal using codebook based wavelet packet decomposition according to the present invention;
도 7은 본 발명에 따른 코드북기반 웨이블렛 패킷 합성을 이용한 음향코덱의 디코더부를 나타내는 블록도,7 is a block diagram showing a decoder of an acoustic codec using codebook based wavelet packet synthesis according to the present invention;
도 8은 본 발명에 따른 코드북기반 웨이블렛 패킷 합성을 이용한 음향신호의 복원방법을 나타내는 흐름도,8 is a flowchart illustrating a method for recovering an acoustic signal using codebook based wavelet packet synthesis according to the present invention;
도 9는 본 발명에 따른 음향코덱에 포함되는 코드북 후보 DB의 추출방법을 나타내는 흐름도,9 is a flowchart illustrating a method of extracting a codebook candidate DB included in an acoustic codec according to the present invention;
도 10은 정규화 전과 후의 서브밴드 신호의 진폭을 나타내는 파형도, 10 is a waveform diagram showing amplitudes of subband signals before and after normalization;
도 11은 본 발명에 따른 음향코덱에 포함되는 코드북의 훈련방법을 나타내는 흐름도이다.11 is a flowchart illustrating a training method of a codebook included in an acoustic codec according to the present invention.
*도면 내 주요부분에 대한 부호설명** Description of Signs for Main Parts in Drawings *
1: 음향코덱 3: 인코더부1: Sound Codec 3: Encoder
5: 디코더부 7: 코드북5: decoder section 7: codebook
본 발명은 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법에 관한 것으로, 특히 웨이블렛 패킷을 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 복원방법에 관한 것이다.The present invention relates to an acoustic codec and a method for compressing and reconstructing an acoustic signal using the same. Particularly, among subband signals decomposed into a wavelet packet, a codebook method is used for a subband signal of a high frequency band having a low distortion rate due to phase mismatch. By using the codebook-based wavelet packet decomposition / synthesis, which improves the efficiency of storing / transmitting / restoring digital sound signals by increasing the compression rate by more than 2 times compared to the conventional method, and reducing the calculation amount by 1/3. The present invention relates to a codec and a sound signal recovery method using the same.
일반적으로 웨이블렛 패킷 분해/합성(Wavelet Packet Decomposition/ Composition)에 의한 음향신호의 압축(인코딩) 방법은 도 1 및 도 2에서와 같이 대 역통과 필터(Band Pass filter) 특성을 갖는 웨이블렛 필터로 웨이블렛 패킷을 분해하여 생성된 각각의 서브밴드 신호(표 1 참조)에 대해 심리음향모델을 적용하여 서브밴드 별로 최적 비트를 할당하여 양자화하는 방법이다.In general, a method of compressing (encoding) an acoustic signal by wavelet packet decomposition / composition is a wavelet packet having a band pass filter characteristic as shown in FIGS. 1 and 2. This method is to apply a psychoacoustic model to each subband signal (refer to Table 1) generated by decomposing the quantization by assigning an optimal bit for each subband.
상기 표 1은 도 1과 같이 웨이블렛 패킷의 분해구조가 도 1과 같을 경우, 서브밴드별 신호의 특성(16KHz 샘플링/분석 프레임 길이 512 샘플)을 나타낸다.Table 1 shows characteristics of the signal for each subband (512 samples of 16KHz sampling / analysis frame length) when the decomposition structure of the wavelet packet is as shown in FIG. 1.
또한, 복원(디코딩)방법은 도 3에서와 같이 입력된 패킷을 분해하여 헤더정보(프레임길이, 비트 할당 등) 및 샘플정보를 분류하고 서브밴드별 비트할당 계수에 따라 서브밴드별 신호를 복원한 다음 역 웨이블렛 필터(Inverse Wavelet Filter)로 웨이블렛 패킷 합성과정을 수행하여 음향신호를 복원한다.In addition, the reconstruction (decoding) method decomposes the input packet as shown in FIG. Next, a wavelet packet synthesis process is performed with an inverse wavelet filter to restore the sound signal.
이와 같은 종래의 음향신호의 압축/복원방법은 웨이블렛 패킷을 주파수 대역별로 분해한 서브밴드별 신호의 구조가 단순화되어 낮은 비트할당으로도 신호의 특성 표현이 가능하고 심리음향모델에 의해 불필요한 서브밴드에 비트를 할당하지 않거나 최소화할 수 있기 때문에 고품질을 유지하면서도 고효율 압축/복원이 가능하다.In the conventional method of compressing and restoring an acoustic signal, the structure of a signal for each subband obtained by splitting a wavelet packet into frequency bands is simplified, so that the characteristics of the signal can be expressed even with low bit allocation. By not assigning or minimizing bits, high efficiency compression / restore is possible while maintaining high quality.
더욱이 상기 방법은 압축시 분석구간 대 복원구간의 정보가 일 대 일로 대응되는 방법이므로 짧은(예를 들면, 수십 msec) 구간의 음향신호에 대해서 이전 프레임의 부가적인 정보 없이도 고품질의 압축/복원이 가능한 방법이다.In addition, since the method corresponds to a one-to-one correspondence between the analysis section and the restoration section during compression, high quality compression / restore is possible without additional information of the previous frame for the sound signal of a short (for example, several tens of msec) intervals. Way.
또한, 압축된 데이터를 전송하는데 있어서 패킷손실이 발생하여도 이전 프레임에 대한 정보가 필요한 일반적인 방법(CELP)에 비하여 복원결과가 우수한 장점이 있다. 여기에서 CELP 라 함은, 모뎀에 최적화된 음성 발화 코덱의 ITU 표준을 말하는 것이며, 예를 들어 LD-CELP 방식이 사용되며, 5.3 또는 6.4 Kbps에서 장거리 통화 품질의 오디오를 제공한다. 더 높은 속도를 얻으려면 처리 능력이 더 떨어지는 점이 있고, 또한 한 번에 한 사람이 말하는 모드를 제공하고 대화 그룹에서는 추가 대역폭을 사용하는 것을 칭한다. In addition, even when packet loss occurs in transmitting the compressed data, the restoration result is superior to the general method (CELP), which requires information on a previous frame. Here, CELP refers to an ITU standard of a voice speech codec optimized for a modem. For example, the LD-CELP method is used, and provides long-distance call quality audio at 5.3 or 6.4 Kbps. To get higher speeds, the processing power is lowered, and it also refers to providing a mode that one person speaks at a time and using additional bandwidth in a conversation group.
그러나, 상기와 같은 장점에 비하여, 압축 시 웨이블렛 패킷(Wavelet Packet)으로 분해하고, 복원 시 재구성하기 위해서는 많은 계산이 소요되는 문제점이 있었고, 아울러 압축 비율이 8배 정도로 다른 압축방법(20~30배)에 비하여 높지 않은 단점이 있었다.However, in comparison with the above advantages, there was a problem that it takes a lot of calculation to decompose into a wavelet packet during compression and reconstruct when restoring, and a compression method having a compression ratio of about 8 times (20 to 30 times). There was a disadvantage that is not high compared to).
따라서 본 발명은 이러한 종래기술의 문제점을 감안하여 안출된 것으로, 그 목적은 웨이블렛 패킷을 주파수 대역별로 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북 방식으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시키면서도 복원시 계산량을 1/3까지 줄여 디지털 음향신호의 저장/전송/복원에 효율성을 높일 수 있는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱 및 이를 이용한 음향신호의 압축 및 복원방법을 제공하는데 있다.Accordingly, the present invention has been made in view of the problems of the prior art, and an object thereof is to provide a high frequency band subband signal having a low distortion rate due to phase mismatch among subband signals obtained by splitting a wavelet packet for each frequency band. By replacing the codebook method, codebook-based wavelet packet decomposition / synthesis is possible to increase the efficiency of saving, transmitting and restoring digital audio signals by reducing the calculation amount by 1/3 while recovering the compression rate more than twice as compared to the conventional method. The present invention provides a sound codec and a method of compressing and restoring a sound signal using the same.
상기한 목적을 달성하기 위하여, 본 발명은 인코더부 및 디코더부를 구비한 음향코덱에 있어서, 상기 인코더부 및 디코더부에는 코드북을 각각 포함하는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱을 제공한다.In order to achieve the above object, the present invention is an acoustic codec having an encoder unit and a decoder unit, wherein the encoder unit and the decoder unit include a codebook, wherein the acoustic codec using wavelet packet decomposition / synthesis, respectively. To provide.
상기 코드북은 웨이블렛 패킷 분해된 고주파 대역의 서브밴드 신호를 코드북으로 대체할 때 서브밴드 신호가 저주파 대역 서브밴드 신호의 위상과 일치하지 않을 경우 나타나는 잡음성분을 줄이기 위하여, 추출된 서브밴드별 신호의 진폭을 정규화하고 다양한 특성들이 포함되도록 훈련과정을 수행하여 작성된다.In order to reduce noise components when the subband signal does not coincide with the phase of the low frequency band subband signal when the subband signal of the wavelet packet-decomposed high frequency band is replaced with the codebook, the codebook is the amplitude of the extracted subband signal. This is done by normalizing the training and conducting a training process to include the various features.
본 발명의 다른 특징은, 음향코덱의 인코더부로 입력된 디지털 음향신호를 웨이블렛 필터를 이용하여 웨이블렛 패킷을 주파수 대역별 서브밴드 신호로 분해하는 단계; 상기 분해된 저주파 대역의 서브밴드 신호에 대해 심리음향모델을 적용하여 서브 밴드별로 최적 비트를 할당하여 양자화하는 단계; 코드북으로 대체할 고주파 대역의 서브밴드 신호 진폭을 정규화하는 단계: 정규화된 각 고주파대역의 서브밴드 신호에 대하여 코드북과의 음향특성을 비교하여 가장 근접한 코드번호를 탐색하고 해당 서브밴드의 신호를 코드북으로 대체하는 코드북 탐색단계; 및 상기과정에 의해 생성된 결과를 저장, 전송, 복원에 편리한 형태인 비트스트리밍을 포맷시키는 단계로 이루어지는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷 분해를 이용한 음향신호의 압축방법을 제공한다. Another aspect of the invention, the step of decomposing the wavelet packet into a subband signal for each frequency band using a wavelet filter the digital sound signal input to the encoder section of the acoustic codec; Applying a psychoacoustic model to the decomposed low frequency subband signal and quantizing an optimal bit for each subband; Normalizing the subband signal amplitude of the high frequency band to be replaced by the codebook: searching the closest code number by comparing acoustic characteristics with the codebook for the subband signals of each normalized high frequency band and converting the signal of the corresponding subband into the codebook Searching for a replaceable codebook; And formatting the bitstreaming, which is a convenient form for storing, transmitting, and restoring the result generated by the above process, and provides a method of compressing an acoustic signal using codebook based wavelet packet decomposition.
본 발명의 또 다른 특징은, 음향코덱의 디코더부로 입력된 압축된 디지털 음향신호의 패킷을 분해하여 헤더정보 및 샘플정보를 분류하는 단계; 저주파 대역의 서브밴드에 대해서는 비트할당 정보와 샘플정보를 이용하여 서브밴드 신호를 복원하는 단계; 코드북으로 대체된 고주파 대역의 서브밴드 신호는 각 서브밴드별 코드번호에 해당하는 코드북의 신호를 해당 서브밴드의 신호로 복원하고, 역 웨이블렛 필터를 이용하여 웨이블렛 패킷 합성을 수행하여 최종적인 음향신호를 복원하는 단계로 이루어지는 것을 특징으로 하는 코드북 기반 웨이블렛 패킷분해를 이용한 음향신호의 복원방법을 제공한다.Another feature of the present invention includes the steps of: classifying header information and sample information by decomposing a packet of a compressed digital sound signal input to a decoder of an acoustic codec; Restoring the subband signal using bit allocation information and sample information on the subbands in the low frequency band; The subband signal of the high frequency band replaced by the codebook restores the codebook signal corresponding to the code number of each subband to the signal of the corresponding subband, and performs the wavelet packet synthesis using the inverse wavelet filter to perform the final sound signal. The present invention provides a method for recovering an acoustic signal using codebook based wavelet packet decomposition, characterized in that the step of recovering.
따라서, 본 발명에서는 웨이블렛 패킷을 분해한 고주파 대역의 서브밴드 별 신호를 코드북으로 대체하여 복원 시 계산량을 현저히 줄임과 동시에 압축률을 크게 개선하는 것은 물론, 고품질의 음질을 유지할 수 있다. Therefore, in the present invention, a signal book for each subband of a high frequency band obtained by decomposing a wavelet packet is replaced with a codebook, which significantly reduces the amount of computation during restoration and greatly improves the compression ratio, as well as maintaining high quality sound.
더욱이, 본 발명은 음향신호, 음성신호 등에 적용할 수 있으며, 특히 음성합성분야에서는 보다 높은 성능을 얻을 수 있다. Moreover, the present invention can be applied to acoustic signals, voice signals, and the like, and in particular, high performance can be obtained in the field of speech synthesis.
이하, 상기한 본 발명을 바람직한 실시예가 도시된 첨부도면을 참고하여 더욱 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings showing a preferred embodiment of the present invention described above in more detail.
첨부된 도 4는 본 발명에 따른 코드북 기반 웨이블렛 패킷분해/합성을 이용한 음향코덱을 나타내는 개략 블록도이고, 도 5 및 도 6은 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해를 이용한 음향코덱의 인코더부를 나타내는 블록도 및 음향신호의 압축방법을 나타내는 흐름도이고, 도 7 및 도 8은 본 발명에 따른 코드북 기반 웨이블렛 패킷 합성을 이용한 음향코덱의 디코더부를 나타내는 블록도 및 음향신호의 복원방법을 나타내는 흐름도이다. 4 is a schematic block diagram illustrating an acoustic codec using codebook based wavelet packet decomposition / synthesis according to the present invention, and FIGS. 5 and 6 illustrate an encoder of an acoustic codec using codebook based wavelet packet decomposition according to the present invention. 7 and 8 are block diagrams illustrating a decoder unit of an audio codec using codebook based wavelet packet synthesis according to the present invention, and a flowchart illustrating a method of recovering an audio signal.
먼저, 본 발명에 따른 코드북 기반 웨이블렛 패킷 분해/합성을 이용한 음향코덱(1)은 도 4와 같이 각각 코드북(code book)(7)을 구비한 인코더부(3) 및 디코더부(5)를 포함한다.First, the
상기 인코더부(3)는 도 5 및 도 6에 도시한 바와 같이, 디지털 음향신호가 입력되면, 대역통과 필터(Band Pass filter) 특성을 갖는 웨이블렛 필터로 주파수 대역별 서브밴드로 웨이블렛 패킷을 분해하고, 저주파 대역 서브밴드 신호에 대해서는 심리음향모델을 적용하여 서브 밴드별로 최적 비트를 할당하여 양자화하고, 고주파 대역의 NC(코드북 적용 밴드 수) 서브밴드 신호에 대하여 코드북(7)을 탐색하여 최적 코드번호를 탐색하여 대체한 후, 비트스트리밍으로 포맷시킨다. 이어서, 신호의 끝이 아니면 상기 과정을 반복하여 수행함으로서 연속적인 음향신호를 압축한다.5 and 6, when the digital sound signal is input, the
이와 같이 웨이블렛 패킷을 분해한 서브밴드 신호 중에서 위상의 불일치에 따른 왜곡률이 낮은 고주파 대역의 서브밴드 신호(subband signal)를 코드북(7)으로 대체함으로써, 종래의 방법에 비해 압축률을 2배 이상 증가시킬 수 있다.In this way, by substituting the high frequency band subband signal having a low distortion rate due to phase mismatch among the subband signals in which the wavelet packet is decomposed by the
또한, 상기 디코더부(5)는 도 7 및 도 8과 같이, 상기 압축된 디지털 음향신호가 입력되면, 입력된 패킷을 분해하여 헤더정보(프레임길이, 비트 할당 등) 및 샘플정보를 분류하고, 저주파 대역의 서브밴드별 비트할당 계수와 샘플정보를 이용 하여 서브밴드 신호를 복원하고, 고주파 대역의 서브밴드별 신호는 밴드별 코드번호에 해당하는 코드북의 신호를 서브밴드 신호로 복원한 후, 역 웨이블렛 필터(Inverse Wavelet Filter)를 이용하여 웨이블렛 패킷 합성을 수행하여 음향신호를 복원한다. 이어서, 비트스트림의 끝이 아니면 상기 과정을 반복 수행하여 연속적인 음향신호를 복원한다.7 and 8, when the compressed digital sound signal is input, the
이와 같이 상기 디코더부(5)를 통해 압축된 디지털 음향신호를 복원할 경우, 고주파 대역에 대해서는 역 웨이블렛 필터를 이용한 웨이블렛 패킷 합성과정을 단순화시켜 계산량을 1/3까지 줄일 수 있다.As described above, when the digital sound signal compressed by the
결국, 상기 인코더부(3) 및 디코더부(5)를 통해 압축 및 복원방법을 통해서, 디지털 음향신호의 저장/전송/복원에 효율성을 극대화 할 수 있다.As a result, through the compression and reconstruction method through the
도 9는 본 발명에 따른 음향코덱에 포함되는 코드북 후보 DB의 추출방법을 나타내는 흐름도이고, 도 10은 서브밴드 신호의 정규화 전과 후의 신호에 대한 진폭을 나타내는 파형도이다.9 is a flowchart illustrating a method of extracting a codebook candidate DB included in an acoustic codec according to the present invention, and FIG. 10 is a waveform diagram illustrating amplitudes of signals before and after normalization of subband signals.
한편, 고주파 대역의 서브밴드 신호를 코드북(7)으로 대체할 때 코드북(7)의 신호가 저주파 대역 서브밴드 신호의 위상과 일치하지 않을 경우 잡음 성분으로 나타나게 되는데, 본 발명에서는 이러한 현상을 줄이기 위해 도 9와 같이, 추출된 서브 밴드별 신호의 진폭을 정규화하는 과정을 수행하여 잡음성분을 최소화시킬 수 있다.On the other hand, when the subband signal of the high frequency band is replaced by the
즉, 코드북 후보 DB의 추출방법은 대용량 음향신호 DB로부터 입력된 음향신호를 N(전체 밴드 수)밴드로 웨이블렛 필터링(웨이블렛 패킷 분해)하고 양자화하기 전에 NC(코드북 적용 밴드 수)서브밴드 신호의 진폭을 정규화한다.That is, the extraction method of the codebook candidate DB is the amplitude of the NC (codebook applied band) subband signal before wavelet filtering (wavelet packet decomposition) and quantizing the acoustic signal input from the large-capacity acoustic signal DB into N (total number of bands) bands. Normalize
이와 같은 정규화 과정은 도 10과 같이 평균피크를 초과하는 신호에 대하여 진폭의 크기를 평균피크와 유사한 크기가 되도록 조절하는 과정이다. 즉, 평균피크와 진폭의 차가 큰 경우는 강력한 에너지가 여기되는 유성음의 피치 시작점에서 주로 발생하며 이들 신호가 피치와 일치하지 않을 경우 잡음성분으로 나타나게 되며 정규화 과정은 주로 이들 신호를 억제하는 역할을 한다.This normalization process is a process of adjusting the magnitude of the amplitude to be similar to the average peak with respect to the signal exceeding the average peak as shown in FIG. In other words, when the difference between the average peak and the amplitude is large, it occurs mainly at the pitch starting point of the voiced sound where strong energy is excited, and when these signals do not match the pitch, they appear as noise components and the normalization process mainly suppresses these signals. .
한편 진폭 정규화가 이루어진 서브밴드 신호는 양자화된 후, 코드북 후보 DB에 저장되며, 음향신호의 끝이 아니면 상기 과정을 반복하여 코드북 후보 DB를 추출한다.On the other hand, the amplitude-normalized subband signal is quantized and stored in the codebook candidate DB, and if not the end of the sound signal, the above process is repeated to extract the codebook candidate DB.
도 11은 본 발명에 따른 음향코덱에 포함되는 코드북의 훈련방법을 나타내는 흐름도이다.11 is a flowchart illustrating a training method of a codebook included in an acoustic codec according to the present invention.
한편, 상기 코드북(7)은 다양한 신호로부터 추출된 서브밴드 신호로부터 추출하고 유사한 신호를 배제하며, 서로 다른 다양한 특성이 포함될 수 있도록 훈련하여 작성해야 음질의 저하를 최소화할 수 있다.Meanwhile, the
예를 들면, 최종 코드 워드(code word) 수가 N개일 때 음질 저하를 최소화하기 위해 일반적인 VQ(vector quantization)에 의한 코드북 훈련과정은 도 11에 도시한 바와 같이, 입력된 코드북 후보 DB에 대하여 전체 중심점을 검출한다. 이때 초기 코드 워드는 0이다.For example, in order to minimize the degradation of sound quality when the number of final code words is N, a general codebook training process by VQ (vector quantization) is performed as shown in FIG. 11. Is detected. The initial code word is zero.
이어서 코드 워드별로 2개로 분할하고, 코드 워드별 해당 후보들의 중심점을 추출한다. 그 후, 모든 후보들에 대하여 각 코드 워드 중심과 유사도를 측정한 다 음, 각 후보가 가장 유사한 중심점에 해당하는 코드 워드로 재할당한다.Subsequently, the coder divides the data into two codewords and extracts the center points of the candidates for each codeword. Then, for each candidate, each code word center and similarity are measured, and each candidate is reassigned to the code word corresponding to the most similar center point.
상기 재 할당된 코드 워드가 최적으로 할당되고, 코드 워드가 전체 수(N)와 일치하면 각 코드 워드의 중심값을 저장한 후, 코드북 훈련과정을 종료한다.If the reassigned code words are optimally allocated and the code words match the total number N, the center value of each code word is stored and the codebook training process is terminated.
본 발명의 방법으로 압축된 음향신호는 복원 시 음질을 MOS 4.0 이상 유지하면서 압축률은 16배 이상을 유지하고, 아울러 복원 시 계산량을 1/3로 줄일 수 있다.A sound signal compressed by the method of the present invention can maintain a compression quality of 16 times or more while maintaining the sound quality of MOS 4.0 or more at the time of restoration, and can also reduce the amount of calculation to 1/3 during restoration.
더욱이, 본 발명은 음향신호, 음성신호 등에 적용할 수 있으며, 특히 음성합성분야에서는 보다 높은 성능을 얻을 수 있다. 또한 본 발명은 필터뱅크 방식을 사용하는 음향신호 압축/복원장치에 모두 적용될 수 있다.Moreover, the present invention can be applied to acoustic signals, voice signals, and the like, and in particular, high performance can be obtained in the field of speech synthesis. In addition, the present invention can be applied to both the acoustic signal compression / restoration apparatus using the filter bank method.
상기한 바와 같이 본 발명에서는 웨이블렛 패킷 분해된 서브밴드 신호 중에서 고주파 대역의 서브밴드신호를 코드북으로 대체하여 복원 시 계산량을 현저히 줄임과 동시에 압축률을 크게 개선하는 것은 물론, 고품질의 음질을 유지할 수 있는 이점이 있다. As described above, in the present invention, the subband signal of the wavelet packet-decomposed subband signal is replaced with a codebook, thereby significantly reducing the amount of computation at the time of restoration and greatly improving the compression ratio, as well as maintaining high quality sound quality. There is this.
Claims (4)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020050086657A KR100736324B1 (en) | 2005-09-16 | 2005-09-16 | Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020050086657A KR100736324B1 (en) | 2005-09-16 | 2005-09-16 | Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20070032436A KR20070032436A (en) | 2007-03-22 |
| KR100736324B1 true KR100736324B1 (en) | 2007-07-09 |
Family
ID=41560432
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020050086657A Expired - Fee Related KR100736324B1 (en) | 2005-09-16 | 2005-09-16 | Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR100736324B1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109271841B (en) * | 2018-07-25 | 2022-04-22 | 西安交通大学 | Electromechanical system signal combination noise reduction method based on local projection and wavelet packet decomposition |
-
2005
- 2005-09-16 KR KR1020050086657A patent/KR100736324B1/en not_active Expired - Fee Related
Non-Patent Citations (1)
| Title |
|---|
| 논문:Shape-Gain 벡터양자화를 이용한 웨이브릿 기반 영상의 임베디드 압축기법(1999.11.01) |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20070032436A (en) | 2007-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
| CN101510424B (en) | Method and system for encoding and synthesizing speech based on speech primitive | |
| KR101143724B1 (en) | Encoding device and method thereof, and communication terminal apparatus and base station apparatus comprising encoding device | |
| US10978091B2 (en) | System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition | |
| KR101819180B1 (en) | Encoding method and apparatus, and deconding method and apparatus | |
| KR20230125985A (en) | Audio generation device and method using adversarial generative neural network, and trainning method thereof | |
| CN101325059B (en) | Method and apparatus for transmitting and receiving encoding-decoding speech | |
| US6789066B2 (en) | Phoneme-delta based speech compression | |
| JPH11177434A (en) | Voice code decoding system | |
| KR20050027179A (en) | Method and apparatus for decoding audio data | |
| Khaldi et al. | Audio encoding based on the empirical mode decomposition | |
| KR20050009384A (en) | Wide-band speech compression and decompression apparatus and method thereof | |
| CN101740030B (en) | Method and device for transmitting and receiving speech signals | |
| EP1497631B1 (en) | Generating lsf vectors | |
| KR100736324B1 (en) | Acoustic Codec Using Codebook-based Wavelet Packet Decomposition / Synthesis and Acoustic Signal Restoration Method Using the Same | |
| CN101325058B (en) | Method and device for transmitting, receiving and decoding voice code | |
| CN108417219A (en) | An Audio Object Codec Method Adapted to Streaming Media | |
| Manohar et al. | Audio compression using daubechie wavelet | |
| Joseph | Spoken digit compression using wavelet packet | |
| US8849655B2 (en) | Encoder, decoder and methods thereof | |
| De Meuleneire et al. | A CELP-wavelet scalable wideband speech coder | |
| JP2002215192A (en) | Audio information processor and processing method | |
| Radha et al. | Comparative analysis of compression techniques for Tamil speech datasets | |
| CN1354456A (en) | Block effect eliminating method in wavelet voice frequency signal processing | |
| Mazor et al. | Adaptive subbands excited transform (ASET) coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| G170 | Re-publication after modification of scope of protection [patent] | ||
| PG1701 | Publication of correction |
St.27 status event code: A-5-5-P10-P19-oth-PG1701 Patent document republication publication date: 20080422 Republication note text: Request for Correction Notice (Document Request) Gazette number: 1007363240000 Gazette reference publication date: 20070709 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| FPAY | Annual fee payment |
Payment date: 20120626 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| FPAY | Annual fee payment |
Payment date: 20130628 Year of fee payment: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20140630 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20140630 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |