KR100195707B1 - A digital audio signal converter - Google Patents
A digital audio signal converter Download PDFInfo
- Publication number
- KR100195707B1 KR100195707B1 KR1019950045861A KR19950045861A KR100195707B1 KR 100195707 B1 KR100195707 B1 KR 100195707B1 KR 1019950045861 A KR1019950045861 A KR 1019950045861A KR 19950045861 A KR19950045861 A KR 19950045861A KR 100195707 B1 KR100195707 B1 KR 100195707B1
- Authority
- KR
- South Korea
- Prior art keywords
- sampling frequency
- bit rate
- audio signal
- mpeg
- applicable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 디지탈 오디오신호 변환장치에 관한 것으로, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오복호기(100)와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부(200) 및; 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기(300)를 포함하여 구성되어, AC-3 오디오 부호기에 의해 압축된 디지탈 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환시켜 줄 수 있는 것이다.The present invention relates to a digital audio signal conversion apparatus, comprising: an AC-3 audio decoder (100) for restoring and outputting an encoded AC-3 audio signal to a PCM audio signal; A sampling frequency and bit rate control unit (200) for converting the sampling frequency and bit rate of the PCM audio signal into a sampling frequency and bit rate applicable to an MPEG audio coding scheme and outputting the converted sampling frequency and bit rate; MPEG audio coder 300 for MPEG audio encoding and outputting the PCM audio signal output from the sampling frequency and bit rate control unit 200, MPEG audio to the digital audio signal compressed by the AC-3 audio coder It can be converted to restore using a decoder.
Description
제1도는 일반적인 MPEG 오디오 부호기의 블럭도.1 is a block diagram of a typical MPEG audio coder.
제2도는 일반적인 MPEG 오디오 복호기의 블럭도.2 is a block diagram of a typical MPEG audio decoder.
제3도는 일반적인 AC-3 오디오 부호기의 블럭도.3 is a block diagram of a typical AC-3 audio encoder.
제4도는 일반적인 AC-3 오디오 복호기의 블럭도.4 is a block diagram of a typical AC-3 audio decoder.
제5도는 본 발명에 따른 디지탈 오디오신호 변환장치의 블럭도이다.5 is a block diagram of a digital audio signal conversion apparatus according to the present invention.
* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings
2 : 분석 서브밴드 필터 4 : 심리 음향 모델2: analysis subband filter 4: psychoacoustic model
6 : 비트 할당 및 양자화기 8 : 비트스트림배열부6 bit allocation and quantizer 8 bit stream array
10 : 비트할당 디코더 12 : 역양자화기10: bit allocation decoder 12: dequantizer
14 : 스케일팩터 디코더 16 : 합성 서브밴드 필터14 scale factor decoder 16 synthesized subband filter
20 : 분석 필터 뱅크 22 : 스펙트럼포락선 부호기20: analysis filter bank 22: spectral envelope encoder
24 : 비트 할당부 26 : 양자화기24 bit allocation unit 26 quantizer
28 : 프레임 배열부 30 : 프레임 역배열부28: frame arrangement unit 30: frame inverse arrangement unit
32 : 비트 할당부 34 : 역양자화기32: bit allocation unit 34: dequantizer
36 : 스펙트포락선 부호기 38 : 합성 필터 뱅크36: spectra envelope encoder 38: synthesis filter bank
100 : AC-3 오디오 복호기100: AC-3 audio decoder
200 : 샘플링주파수 및 비트레이트 제어부200: sampling frequency and bit rate control unit
210 : 입력버퍼 220 : 파라메터 검출부210: input buffer 220: parameter detection unit
230 : 파라메터 변환부 300 : MPEG 오디오 부호기230: parameter converter 300: MPEG audio encoder
본 발명은 디지탈 오디오신호 변환장치에 관한 것으로, 특히 AC-3 오디오 부호기에 의해 압축된 디지탈 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환하는 디지탈 오디오신호 변환장치에 관한 것이다.The present invention relates to a digital audio signal converter, and more particularly, to a digital audio signal converter that converts a digital audio signal compressed by an AC-3 audio encoder to be recovered using an MPEG audio decoder.
디지탈 오디오는 80년대에 들어서면서 CD나 DAT와 같은 대용량 저장 매체의 개발과 함께 오디오 기기의 표준이 되었다. 그러나, 디지탈 오디오 데이터는 많은 정보량을 가지므로 공중파 방송 등의 제한된 대역폭을 갖는 매체에서 사용하기 위해서는 오디오 데이터를 압축하는 것이 필수적이다.Digital audio became the standard for audio equipment in the 80s with the development of mass storage media such as CDs and DATs. However, since digital audio data has a large amount of information, it is essential to compress audio data for use in a medium having a limited bandwidth such as over-the-air broadcasting.
따라서, 80년대 후반부터 다양한 고음질 오디오 압축 기술이 개발되었으며, 이와 같은 기술은 공통적으로 기존의 데이터 압축 기업에 사람의 청각 특성을 고려하여 결합한 형태를 갖는다.Therefore, various high quality audio compression technologies have been developed since the late 80's, and these technologies are commonly combined with existing data compression companies in consideration of human hearing characteristics.
상기 오디오 압축 기술의 대표적인 것으로는 MPEG 방식과 돌비연구소에서 제한한 AC-3 방식이 있다.Representative examples of the audio compression technology include the MPEG method and the AC-3 method limited by Dolby Laboratories.
즉, MPEG 방식은 동영상과 그에 부가되는 오디오 압축 방식의 표준안을 결정하는 MPEG/ISO에서 규정한 것으로, MPEG-1은 약 1.5Mbit/s에서 동영상과 오디오를 압축할 수 있는 부호화 방식으로서 MUSICAM(Masking-pattern adapted Universal Subband Integrated Coding And Multiplexing) 방식을 사용하였으며, MPEG-1은 디지탈 방송을 위한 6Mbit/s 이상의 전송율을 갖는 다채널 구조의 MPEG-2로 확장되었다.In other words, MPEG method is defined by MPEG / ISO which decides standard of video and audio compression method that is added. MPEG-1 is a coding method that can compress video and audio at about 1.5 Mbit / s. -pattern adapted Universal Subband Integrated Coding And Multiplexing) is used, and MPEG-1 has been extended to MPEG-2 of multi-channel structure with a data rate of 6Mbit / s or more for digital broadcasting.
상기 MUSICAM방식은 청각 특성을 이용한 서브밴드 부호화 방식으로 96~128Kbit/s에서 주관적으로 원음과 동일한 복원음을 얻을 수 있도록 되어 있다.The MUSICAM method is a subband coding method using auditory characteristics, so that a reconstructed sound identical to the original sound can be obtained subjectively from 96 to 128 Kbit / s.
한편, AC-3방식은 북미 지역의 HDTV 오디오 압축 기술의 표준안으로, AC-3는 MDCT(Modified Discrete Cosine Transform)을 이용한 적응 변환 부호화 방법을 사용하였으며, 처음 2채널 스테레오 신호만을 대상으로 한 AC-2로부터 AC-2a를 거쳐, 다채널 구조를 갖는 AC-3로 발전하였다.AC-3 is a standard for HDTV audio compression technology in North America. AC-3 uses an adaptive transform coding method using the Modified Discrete Cosine Transform (MDCT). From 2 to AC-2a, it was developed into AC-3 having a multichannel structure.
상기 MUSICAM방식을 사용한 MPEG 오디오 부호기는 제1도에 도시된 바와 같이, 입력신호(PCM data)를 다수개의 서브 밴드 샘플로 변환하여 출력하는 분석 서브밴드 필터(2)와; 입력신호를 고속 푸리에 변환(FFT:Fast Fourier Transform)하여 스펙트럼 정보를 구하고, 이 스펙트럼 정보로부터 마스킹 임계값을 얻은 다음 이 마스킹 임계값과 상기 스펙트럼 정보로부터 결정된 각서브 밴드 샘플의 음압 레벨의 차를 구하여 신호대 마스크 비(SMR:Signal to Mask Ratio)를 계산하여 출력하는 심리 음향 모텔(4); 상기 심리 음향 모텔(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 각 서브 밴드 샘플에 비트를 할당하고, 할당된 비트에 따라 상기 각 서브 밴드 샘플을 양자화시켜 출력하는 비트 할당 및 양자화기(6); 상기 비트할당 및 양자화기(6)에서 양자화되어 출력된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 비트스트림으로 배열(formatting)하여 출력하는 비트 스트림배열부(8)를 포함하여 구성된다.The MPEG audio coder using the MUSICAM scheme includes an analysis subband filter (2) for converting and outputting an input signal (PCM data) into a plurality of subband samples as shown in FIG. Fast Fourier Transform (FFT) of the input signal to obtain spectral information, obtain a masking threshold from the spectral information, and then obtain the difference between the masking threshold and the sound pressure level of each subband sample determined from the spectral information. A psychoacoustic motel 4 which calculates and outputs a signal to mask ratio (SMR); Bit allocation and quantizer 6 for allocating bits to the respective subband samples using the signal-to-mask ratio output from the psychoacoustic motel 4 and quantizing and outputting the respective subband samples according to the allocated bits. ); A bit stream array unit 8 that formats and outputs subband samples, additional information such as bit allocation information, and scale information, which are quantized and output by the bit assignment and quantizer 6, into a bit stream It is configured to include.
상기와 같이 구성된 MPEG 오디오 부호기에 있어서, 상기 분석 서브 밴드 필터(2)는 입력된 32개의 새로운 오디오 샘플을 차례로 512 샘플 크기로 갖는 버퍼에 저장하고, 이 버퍼에 분석 윈도우(analysis window)를 곱한 후, 512샘플을 8개의 64샘플 블럭으로 나누고 각 블럭을 더하여 새로운 벡터를 구성한다.In the MPEG audio encoder configured as described above, the analysis subband filter 2 stores 32 new audio samples input in a buffer having a size of 512 samples in turn, and multiplies the buffer by an analysis window. We divide the 512 samples into eight 64-sample blocks and add each block to form a new vector.
여기에 하기 제1식과 같은 분석 행렬을 곱하여 32개의 서브밴드 샘플을 만든다.This is multiplied by an analysis matrix such as the following equation 1 to make 32 subband samples.
그리고, 심리 음향 모델(4)은 각 서브밴드에서 원음에 의해 마스킹되어 들을 수 없는 최대 잡음 레벨을 결정하고, 이 잡음 레벨(마스킹 임계값)을 사용해서 각 밴드의 실제 양자화기를 결정한느 비트 할당을 할 수 있다.The psychoacoustic model 4 then determines the maximum noise level that is masked by the original sound in each subband and uses the noise level (masking threshold) to determine the bit allocation that determines the actual quantizer of each band. can do.
이때, MPEG 방식에서는 두 가지의 심리 음향 모델을 제공하는데, 심리 음향 모텔 1은 신호의 스펙트럼으로부터 순음과 잡음 성분을 구분하는 과정과, 순음과 잡음의 개별 마스킹 임계값을 계산하는 과정, 절대 가청 한계를 고려하여 전체 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호 대 마스크 비를 구한다.At this time, the MPEG method provides two psychoacoustic models. The psychoacoustic motel 1 distinguishes pure and noise components from a spectrum of a signal, calculates individual masking thresholds of pure and noise, and an absolute audible limit. In consideration of the above, the signal-mask ratio is obtained by calculating a total masking threshold and calculating a signal-to-mask ratio in each subband.
즉, 고속 푸리에 변환(FFT)을 통해 스펙트럼을 구하고, 이로부터 각 서브밴드에서의 음압 레벨을 결정한다. 여기에서 마스킹 성분이 순음 또는 잡음인가에 따라 마스킹 곡선이 달라지므로 스펙트럼 정보로부터 순음 성분과 잡음 성분을 찾아내야 한다.That is, the spectrum is obtained through a fast Fourier transform (FFT), and the sound pressure level in each subband is determined therefrom. Since the masking curve varies depending on whether the masking component is pure or noise, the pure and noise components must be found from the spectral information.
즉, 부분 최대값(local maxima) 중에서 주위 신호보다 7dB이상이 크면 순음으로 간주하여 순음 성분을 찾아낸 후 나머지 스펙트럼에서 하나의 임계 대역 내에서 하나의 잡음 성분을 구한다.In other words, if the local maxima is greater than 7dB higher than the surrounding signal, it is regarded as pure sound and finds the pure sound component, and then obtains one noise component within one critical band from the rest of the spectrum.
여기에서 실험적으로 구해진 마스킹 함수를 적용하여 순음에 의한 마스킹 임계값을 구하고, 전체 마스킹 임계값을 개별 마스킹 임계값과 가청 한계의 합으로 구해진다.The masking threshold obtained by the pure tone is obtained by applying the experimentally obtained masking function, and the total masking threshold is obtained as the sum of the individual masking threshold and the audible limit.
그리고, 각 서브밴드에서의 음압 레벨과 마스킹 임계값과의 차를 구하여 신호 대 마스크 비(SMR:Signal to Masking Ratio)를 계산한다.The signal-to-masking ratio (SMR) is calculated by calculating the difference between the sound pressure level in each subband and the masking threshold.
결국, 신호 대 마스크 비(SMR)가 작다면 신호의 음압 레벨이 작거나 마스킹이 많이 된 것이므로 적은 비트를 가지고 효과적인 양자화를 할 수 있다.As a result, if the signal-to-mask ratio (SMR) is small, the sound pressure level of the signal is small or masking is high, so that the effective quantization can be performed with fewer bits.
그리고, 심리 음향 모델 2에서는, 신호의 임계 대역에 따른 에너지를 계산하는 과정과, 스프레딩 함수와 컨벌루션, 청신경의 여기 정도를 계산하는 과정, 절대 가청 한계를 고려하여 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호대 마스크 비를 구하는 것이다.In the psychoacoustic model 2, a process of calculating energy according to a critical band of a signal, a process of calculating a spreading function, a convolution, an excitation degree of the auditory nerve, a process of calculating a masking threshold in consideration of an absolute audible limit, and Then, the signal-to-mask ratio is obtained by calculating the signal-to-mask ratio in each subband.
이와 같은 심리 음향 모델 2는 고속 푸리에 변환 스펙트럼을 청신경의 여기 모델인 스프레딩 함수와 컨벌루션하여 마스킹 임계값을 구하므로, 계산량은 많지만 더 정교한 결과를 얻을 수 있는 것이다.The psychoacoustic model 2 convolves the fast Fourier transform spectrum with a spreading function, which is an excitation model of the auditory nerve, to obtain a masking threshold, thereby obtaining a large amount of computation but more accurate results.
그리고, 상기 비트 할당 및 양자화기(6)는, 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 분석 서브밴드 필터(2)에서 출력된 각 서브 밴드 샘플에 대해 비트를 할당하고, 이 할당된 비트에 따라 크기 정보(scale factor)에 의해 나누어져 정규화된 각 서브밴드 샘플등을 양자화한다.The bit allocation and quantizer 6 then allocates bits for each subband sample output from the analysis subband filter 2 using the signal-to-mask ratio output from the psychoacoustic model 4. Each subband sample or the like is divided by a scale factor according to the allocated bits and quantized.
이때, 각 서브 밴드에 대한 크기 정보(scale factor) 계산은 양자화하기 이전에 행해지며, 상기 크기 정보(scale factor) 계산은 12 샘플마다 이루어지고, 12 샘플의 절대값 중 최대값을 찾아서 0에서 2사이로 정규화시킨다.At this time, the scale factor calculation for each subband is performed before quantization, and the scale factor calculation is performed every 12 samples, and the maximum value of the absolute values of 12 samples is found to be 0 to 2. Normalize to
그리고, 비트 스트림 배열부(8)는 상기 비트할당 및 양자화기(8)에서 출력된 양자화된 서브 밴드 샘플 및 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 MPEG 프레임으로 배열하여 비트 스트림으로 전송하는 것이다.The bit stream arranging unit 8 arranges additional information such as quantized subband samples, allocation information, and scale information output from the bit allocation and quantizer 8 into MPEG frames and transmits them as bit streams. It is.
한편, 상기와 같이 압축되어 전송된 비트 스트림을 복원하는 MPEG 오디오 복호기는 상기 MPEG 오디오 부호기를 역으로 구현하면 된다.Meanwhile, the MPEG audio decoder which restores the compressed and transmitted bit stream as described above may implement the MPEG audio coder in reverse.
즉, 종래의 MPEG 오디오 복호기는 제2도에 도시된 바와 같이, 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여 출력하는 비트 할당 디코더(10)와; 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력하는 역양자화기(12); 상기 비트 스트림 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 원래의 서브밴드 샘플로 계산하여 출력하는 스케일팩터 디코더(14) 및; 상기 스케일팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하는 합성 서브밴드 필터(16)로 이루어져 있다.That is, the conventional MPEG audio decoder includes a bit allocation decoder 10 for decoding and outputting bit allocation information for each subband sample from the compressed and transmitted bit stream as shown in FIG. 2; An inverse quantizer (12) for inversely quantizing each subband sample of the bit stream according to the bit allocation information output from the bit allocation decoder (10); A scale factor decoder (14) for detecting scale factor information in the bit stream and then calculating and outputting each subband sample quantized by the inverse quantizer (12) using the scale factor as an original subband sample; Composed of a subband filter 16 for reconstructing an audio signal by synthesizing each subband sample output from the scale factor decoder 14.
상기와 같은 MPEG 오디오 복호기에 있어서, 비트 할당 디코더(10)는 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여 출력하고, 역양자화기(12)는 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력한다.In the MPEG audio decoder as described above, the bit allocation decoder 10 decodes and outputs bit allocation information for each subband sample from the compressed and transmitted bit stream, and the dequantizer 12 uses the bit allocation decoder ( The subband samples of the bit stream are inversely quantized and output according to the bit allocation information output from 10).
그리고, 스케일팩터 디코더(14)는 상기 비트 스트림 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 원래의 서브밴드 샘플을 계산하여 출력하며, 합성 서브밴드 필터(16)는 상기 스케일팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하여 출력하는 것이다.The scale factor decoder 14 detects scale factor information in the bit stream, and then calculates and outputs original subband samples for each subband sample quantized by the dequantizer 12 using the scale factor. The synthesized subband filter 16 synthesizes each subband sample output from the scale factor decoder 14 to restore and output an audio signal.
이때, 상기 합성 서브밴드 필터(16)에서 각 서브밴드 샘플을 오디오 신호로 복원하기 위해 사용되는 행렬을 하기 제2식과 같다.In this case, a matrix used for reconstructing each subband sample into an audio signal in the synthesis subband filter 16 is represented by the following equation.
한편, MDCT 변환 부호화 방식을 사용한 AC-3 오디오 부호기는 제3도에 도시된 바와 같이, 입력 신호(PCM 오디오 신호)를 주파수 영역으로 변환하여 주파수 계수를 출력하는 분석 필터 뱅크(20)와; 상기 주파수 계수의 지수부를 스펙트럼 포락선으로 부화하여 출력하는 스펙트럼 포락선 부호기(22); 상기 스펙트럼 포락선에 따라 상기 주파수 계수의 가수부를 양자화하기 위한 비트 할당 정보를 출력하는 비트 할당부(24); 상기 비트 할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 출력하는 양자화기(26) 및; 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3 프레임으로 배열(format)하여 출력하는 프레임 배열부(28)로 이루어져 있다.On the other hand, the AC-3 audio encoder using the MDCT transform coding scheme, as shown in Figure 3, the analysis filter bank 20 for converting an input signal (PCM audio signal) to the frequency domain to output a frequency coefficient; A spectral envelope encoder 22 which outputs the exponential portion of the frequency coefficient by hatching a spectral envelope; A bit allocation section (24) for outputting bit allocation information for quantizing the mantissa section of the frequency coefficient according to the spectral envelope; A quantizer 26 for quantizing and outputting the mantissa of the frequency coefficient according to the bit allocation information; The spectral envelope and the quantized mantissa are arranged in an AC-3 frame, and are arranged in a frame arrangement unit 28.
상기와 같은 AC-3 오디오 부호기에 있어서, 상기 분석 필터 뱅크(20)는 입력 신호를 주파수 영역으로 변환하며, 이때 각 주파수 계수는 지수부와 가수부로 표현된다.In the AC-3 audio encoder as described above, the analysis filter bank 20 converts an input signal into a frequency domain, where each frequency coefficient is represented by an exponent part and a mantissa part.
그리고, 상기 스펙트럼 포락선 부호기(22)는 상기 지수부를 스펙트럼 포락선으로 부호화하여 비트 할당부(24) 및 프레임 배열부(30)로 출력하고, 상기 비트 할당부(24)는 상기 스펙트럼 포락선에 따라 상기 주파수 가수부를 양자화하기 위한 비트 할당 정보를 양자화기(26)로 출력한다.The spectral envelope encoder 22 encodes the exponent portion into a spectral envelope, and outputs the spectral envelope to the bit allocation unit 24 and the frame arranging unit 30. The bit allocation unit 24 outputs the frequency according to the spectral envelope. The bit allocation information for quantizing the mantissa part is output to the quantizer 26.
그리고, 양자화기(26)는 상기 비트 할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 프레임 배열부(28)로 출력하며, 프레임 배열부(28)는 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3 프레임으로 배열하여 출력하고, 이 AC-3 프레임시퀀스가 AC-3 비트 스트림이 되는 것이다.The quantizer 26 quantizes the mantissa of the frequency coefficient according to the bit allocation information, and outputs the quantized part to the frame arranging unit 28. The frame arranging unit 28 AC-3 to the spectral envelope and the quantized mantissa. They are arranged in frames and output, and this AC-3 frame sequence becomes an AC-3 bit stream.
한편, 상기와 같은 AC-3 오디오 부호기에 의해 압축된 오디오 신호를 복원하기 위한 AC-3 오디오 복호기는 상기 AC-3 오디오 부호기를 역으로 구현하면 된다.Meanwhile, the AC-3 audio decoder for restoring the audio signal compressed by the AC-3 audio encoder may implement the AC-3 audio encoder in reverse.
즉, AC-3 오디오 복호기는 제4도에 도시된 바와 같이, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 분리하는 프레임 역배열부(30); 상기 스펙트럼 포락선에 따라 비트 할당 정보를 출력하는 비트 할당부(32); 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 출력하는 역양자화기(34); 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 스펙트럼 포락선 복호기(36) 및; 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오 신호를 출력하는 합성 필터 뱅크(38)를 포함하여 구성되어 있다.That is, the AC-3 audio decoder includes a frame inverse arrangement unit 30 for separating the spectral envelope and the mantissa of the encoded AC-3 bit stream, as shown in FIG. A bit allocation unit (32) for outputting bit allocation information according to the spectral envelope; An inverse quantizer (34) for inversely quantizing and outputting the mantissa according to the bit allocation information; A spectral envelope decoder (36) for decoding the spectral envelope and outputting an exponent portion; And a synthesis filter bank 38 for converting the exponent portion and the mantissa portion into the time domain and outputting the PCM audio signal.
상기와 같은 AC-3 오디오 복호기에 있어서, 상기 프레임 역배열부(30)는, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 각각 분리하여 상기 스펙트럼 포락선은 비트 할당부(32) 및 스펙트럼 포락선 디코더(36)로 출력하는 한편, 상기 가수부는 역양자화기(34)로 출력한다.In the AC-3 audio decoder as described above, the frame inverse array unit 30 separates the spectral envelope and the mantissa of the encoded AC-3 bit stream, respectively, so that the spectral envelope is a bit allocator 32 and a spectral envelope decoder. While outputting to 36, the mantissa part is output to the dequantizer 34.
이때, 상기 프레임 역배열부(30)는 부호화된 AC-3 비트 스트림을 동기시키고, 에러 체크를 해야만 한다.In this case, the frame inverse array unit 30 must synchronize the encoded AC-3 bit stream and perform an error check.
그리고, 비트 할당부(30)는 상기 스펙트럼 포락선에 따라 비트 할당 정보를 역양자화기(34)로 출력하고, 역양자화기(34)는 상기 비트할당 정보에 따라 상기 가수부를 역양자화하여 합성 필터 뱅크(30)로 출력한다.The bit allocation unit 30 outputs bit allocation information to the inverse quantizer 34 according to the spectral envelope, and the inverse quantizer 34 inversely quantizes the mantissa unit according to the bit allocation information. Output to (30).
그리고, 스펙트럼 포락선 복호기(36)는 상기 엔코딩된 스펙트럼 포락선을 디코딩하여 지수부를 합성 필터 뱅크(38)로 출력하며, 합성 필터 뱅크(38)는 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 것이다.The spectral envelope decoder 36 decodes the encoded spectral envelope and outputs an exponent portion to the synthesis filter bank 38. The synthesis filter bank 38 converts the exponent portion and the mantissa portion into a time domain to convert the PCM audio signal. Will print
이상에서 살펴본 바와 같이 종래의 MPEG 오디오 부호기와 AC-3 오디오 부호기는, 음성 신호를 압축하는 방식이 서로 틀려 호환성이 없다.As described above, the conventional MPEG audio coder and the AC-3 audio coder are incompatible with each other because they have different compression methods.
즉, MPEG 오디오 부호기에 의해 부호화된 신호는 AC-3 오디오 복호기로 복원할 수 없고, AC-3 오디오 부호기에 의해 부호화된 신호는 MPEG 오디오 복호기로 복원할 수 없는 문제점이 있었다.That is, a signal encoded by the MPEG audio coder cannot be restored by the AC-3 audio decoder, and a signal encoded by the AC-3 audio coder cannot be restored by the MPEG audio decoder.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해소하기 위한 것으로, AC-3 오디오 부호기에 의해 부호화된 신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환하는 디지탈 오디오신호 변환장치를 제공하는데 그 목적이 있다.Accordingly, an object of the present invention is to solve a conventional problem as described above, and to provide a digital audio signal conversion apparatus for converting a signal encoded by an AC-3 audio coder to be recovered using an MPEG audio decoder. There is this.
이러한 목적을 달성하기 위한 본 발명에 따른 디지탈 오디오 신호 변환신호는, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오 복호기와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부 및; 상기 샘플링 주파수 및 비트 레이트 제어부에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기를 포함하여 구성된 것을 특징으로 한다.The digital audio signal conversion signal according to the present invention for achieving the above object comprises: an AC-3 audio decoder for restoring the encoded AC-3 audio signal to a PCM audio signal; A sampling frequency and bit rate control unit for converting the sampling frequency and the bit rate of the PCM audio signal into a sampling frequency and a bit rate applicable to an MPEG encoding method and outputting the sampling frequency and bit rate; And an MPEG audio encoder for MPEG audio encoding and outputting the PCM audio signal output from the sampling frequency and bit rate control unit.
따라서, AC-3 오디오 부호기에 의해 부호화된 신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있는 것이다.Therefore, the signal encoded by the AC-3 audio encoder can be recovered using the MPEG audio decoder.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail the present invention.
제5도는 본 발명에 따른 디지털 오디오신호 변환장치의 블럭도로서, 본 발명에 따른 디자탈 오디오신호 변환장치는, 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 출력하는 AC-3 오디오 복호기(100)와; 상기 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 출력하는 샘플링 주파수 및 비트 레이트 제어부(200) 및; 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 MPEG 오디오 부호기(300)를 포함하여 구성되어 있다.5 is a block diagram of a digital audio signal conversion device according to the present invention, wherein the digital audio signal conversion device according to the present invention restores and outputs an encoded AC-3 audio signal to a PCM audio signal. 100; A sampling frequency and bit rate control unit (200) for converting the sampling frequency and bit rate of the PCM audio signal into a sampling frequency and bit rate applicable to an MPEG audio coding scheme and outputting the converted sampling frequency and bit rate; And an MPEG audio encoder 300 for MPEG audio encoding and outputting the PCM audio signal output from the sampling frequency and bit rate control unit 200.
그리고, 상기 AC-3 오디오 복호기(100)는, 부호화된 AC-3 오디오 신호를 역배열하여 스펙트럼 포락선과 가수부 및 헤더 정보를 각각 분리하여 출력하는 프레임 역배열부(30); 상기 스펙트럼 포락선에 따라 비트 할당 정보를 출력하는 비트 할당부(32); 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 출력하는 역양자화기(34); 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 스펙트럼 포락선 복호기(36) 및; 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 합성 필터 뱅크(38)를 포함하여 구성되어 있다.The AC-3 audio decoder 100 includes: a frame inverse array unit 30 for rearranging the encoded AC-3 audio signal to separate and output the spectral envelope, the mantissa unit, and the header information, respectively; A bit allocation unit (32) for outputting bit allocation information according to the spectral envelope; An inverse quantizer (34) for inversely quantizing and outputting the mantissa according to the bit allocation information; A spectral envelope decoder (36) for decoding the spectral envelope and outputting an exponent portion; And a synthesis filter bank 38 for converting the exponent part and the mantissa part into the time domain and outputting the PCM audio signal.
그리고, 상기 샘플링 주파수 및 비트 레이트 제어부(200)는, 상기 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호를 저장하는 입력 버퍼(210)와; 상기 AC-3 오디오 복호기(100)의 프레임 역배열부(30)로부터 헤더 정보를 입력받아 샘플 링 주파수 및 비트 레이트 파라메터를 검출하여 출력하는 파라메터 검출부(220) 및; 상기 샘플링 주파수 및 비트 레이트 파라메터에 따라 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트레이트로 조정하는 파라메터 변환부(230)를 포함하여 구성되어 있다.The sampling frequency and bit rate control unit 200 includes: an input buffer 210 for storing the PCM audio signal output from the AC-3 audio decoder 100; A parameter detector 220 which receives header information from the frame inverse array unit 30 of the AC-3 audio decoder 100 and detects and outputs a sampling frequency and a bit rate parameter; And a parameter converter 230 that adjusts the sampling frequency and bit rate of the PCM audio signal stored in the input buffer 210 to the sampling frequency and bit rate applicable to the MPEG audio coding method according to the sampling frequency and bit rate parameters. It is composed.
그리고, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수이면 상기 입력버퍼(210)에서 저장된 PCM 오디오신호의 샘플링 주파수를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 샘플링 주파수이면 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 중에서 가장 근접한 샘플링 주파수로 상기 입력버퍼(210)에서 저장된 PCM 오디오신호의 샘플링 주파수를 조정하도록 되어 있는 한편, 상기 파라메터 검출부(220)에서 검출된 비트 레이트가 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 비트 레이트를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 비트 레이트이면 MPEG오디오 부호화 방식에 적용 가능한 비트 레이트로 조정하도록 되어 있다.In addition, the parameter converter 230 determines whether the sampling frequency output from the parameter detector 220 is a sampling frequency applicable to the MPEG audio coding scheme, and if the sampling frequency is applicable to the MPEG audio coding scheme, the input buffer 210. PCM stored in the input buffer 210 at the sampling frequency closest to the sampling frequency applicable to the MPEG audio coding method without converting the sampling frequency of the PCM audio signal stored at The sampling frequency of the audio signal is adjusted, and if the bit rate detected by the parameter detector 220 is a bit rate applicable to the MPEG audio coding method, the bit rate applicable to the MPEG audio coding method is determined. Me to 210) Without converting the bit rate of the PCM audio signal, when the MPEG audio coding scheme bit rate that can not be applied to is adapted to adjust to the available bit rate applied to the MPEG audio encoding method.
이때, 상기 파라메터 변환부(230)는, 상기 파라메터 검출부(220)에서 검출되어 출력된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 크면 데시메이션(decimation)을 통해 샘플링 주파수를 작게 하고, 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 작으면 보간(interpolation)을 통해 샘플링 주파를 크게 하여 MPEG 오디오 부호화 방식의 샘플링 주파수와 일치시키도록 되어 있다.In this case, the parameter converter 230 decreases the sampling frequency through decimation when the sampling frequency detected and output from the parameter detector 220 is greater than the sampling frequency applicable to the MPEG audio coding method, and sampling. If the frequency is smaller than the sampling frequency applicable to the MPEG audio coding method, the sampling frequency is increased through interpolation to match the sampling frequency of the MPEG audio coding method.
한편, 상기 MPEG 오디오 부호기(300)는, PCM 오디오신호를 다수개의 서브 밴드 샘플로 변환하여 출력하는 분석 서브밴드 필터(2)와; 입력신호를 고속 푸리에 변환(FFT:Fast Fourier Transform)하여 스펙트럼 정보를 구하고, 이 스펙트럼 정보로부터 마스킹 임계값을 얻은 다음 이 마스킹 임계값과 상기 스펙트럼 정보로부터 결정된 각서브 밴드 샘플의 음악 레벨의 차를 구하여 신호대 마스크 비(SMR:Signal to Mask Ratio)를 계산하여 출력하는 심리 음향 모델(4); 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 각 서브 밴드 샘플에 비트를 할당하고, 할당된 비트에 따라 상기 각 서브 밴드 샘플을 양자화시켜 출력하는 비트할당 및 양자화기(6); 상기 비트할당 및 양자화기(6)에서 양자화되어 출력된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 비트스트림으로 포맷팅(formatting)하여 출력하는 비트스트림포맷부(8)를 포함하여 구성되어 있다.On the other hand, the MPEG audio encoder 300 includes: an analysis subband filter (2) for converting and outputting a PCM audio signal into a plurality of subband samples; Fast Fourier Transform (FFT) of the input signal to obtain spectral information, obtain a masking threshold from the spectral information, and then obtain the difference between the masking threshold and the music level of each subband sample determined from the spectral information. A psychoacoustic model 4 for calculating and outputting a signal to mask ratio (SMR); Bit allocation and quantizer 6 for allocating bits to the respective subband samples using the signal-to-mask ratio output from the psychoacoustic model 4 and quantizing and outputting the respective subband samples according to the allocated bits. ); A bitstream format unit 8 that formats and outputs subband samples, additional information such as bit allocation information, scale information, etc., which are quantized and output by the bit allocation and quantizer 6 into a bitstream; It is configured to include.
상기와 같이 구성된 본 발명에 따른 디지탈 오디오신호 변환장치의 작용 및 효과를 상세히 설명하면 다음과 같다.Referring to the operation and effects of the digital audio signal conversion apparatus according to the present invention configured as described above in detail as follows.
AC-3 오디오 복호기(100)는 부호화된 AC-3 오디오신호를 PCM 오디오신호로 복원하여 샘플링 주파수 및 비트 레이트 제어부(200)로 출력하고, 샘플링 주파수 및 비트 레이트 제어부(200)는 상기 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트 레이트로 변환시켜 MPEG 오디오 부호기(300)로 출력하며, MPEG 오디오 부호기(300)는 상기 샘플링 주파수 및 비트 레이트 제어부(200)에서 출력된 PCM 오디오신호를 MPEG 오디오 부호화하여 출력하는 것이다.The AC-3 audio decoder 100 restores the encoded AC-3 audio signal to the PCM audio signal and outputs the converted AC-3 audio signal to the sampling frequency and bit rate control unit 200. The sampling frequency and bit rate control unit 200 generates the AC-3 audio signal. The sampling frequency and bit rate of the PCM audio signal output from the audio decoder 100 are converted into a sampling frequency and bit rate applicable to the MPEG audio encoding method, and output to the MPEG audio encoder 300. The MPEG audio encoder 300 is MPEG audio encoding is performed on the PCM audio signal output from the sampling frequency and bit rate controller 200.
즉, AC-3는 오디오 복호기(100)의 프레임 역배열부(30)는, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부 및 헤더 정보를 각각 분리하여 상기 스펙트럼 포락선은 비트 할당부(32) 및 스펙트럼 포락선 디코더(36)로 출력하는 한편, 상기 가수부는 역양자화기(34)로 출력하고, 헤더 정보는 샘플링 주파수 및 비트 레이트 제어부(200)의 파라메터 검출부(210)로 출력한다.That is, in AC-3, the frame inverse array unit 30 of the audio decoder 100 separates the spectral envelope, the mantissa unit, and the header information of the encoded AC-3 bit stream, respectively, and the spectral envelope is the bit allocation unit 32. And the output to the spectral envelope decoder 36, the mantissa to the inverse quantizer 34, and the header information to the parameter detector 210 of the sampling frequency and bit rate control unit 200.
이때, 상기 프레임 역배열부(30)는 부호화된 AC-3 비트 스트림을 동기시키고, 에러 체크를 해야만 한다.In this case, the frame inverse array unit 30 must synchronize the encoded AC-3 bit stream and perform an error check.
상기 비트 할당부(30)는 상기 스펙트럼 포락선에 따라 비트 할당정보를 역양자화기(34)로 출력하고, 역양자화기(34)는 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 합성 필터 뱅크(30)로 출력한다.The bit allocation unit 30 outputs bit allocation information to the inverse quantizer 34 according to the spectral envelope, and the inverse quantizer 34 dequantizes the mantissa unit according to the bit allocation information to perform a synthesis filter bank ( 30).
그리고, 스펙트럼 포락선 복호기(36)는 상기 엔코딩된 스펙트럼 포락선을 디코딩하여 지수부를 합성 필터 뱅크(38)로 출력하며, 합성 필터 뱅크(38)는 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 것이다.The spectral envelope decoder 36 decodes the encoded spectral envelope and outputs an exponent portion to the synthesis filter bank 38. The synthesis filter bank 38 converts the exponent portion and the mantissa portion into a time domain to convert the PCM audio signal. Will print
상기와 같이 복원된 PCM 오디오신호는 샘플링 주파수 및 비트 레이트 제어부(200)의 입력버퍼(210)에 저장되며, 이때 파라메터 검출부(220)가 상기 AC-3 오디오 복호기(100)의 프레임 역배열부(30)로부터 헤더 정보를 입력받아 샘플링 주파수 및 비트 레이트 파라메터를 검출하여 파라메터 변환부(230)로 출력하고, 파라메터 변환부(230)는 상기 샘플링 주파수 및 비트 레이트 파라메터에 따라 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수 및 비트 레이트를 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 및 비트레이트로 조정하는 것이다.The PCM audio signal restored as described above is stored in the input buffer 210 of the sampling frequency and bit rate control unit 200, wherein the parameter detector 220 controls the frame inverse array unit 30 of the AC-3 audio decoder 100. The header information is received from the header information, and the sampling frequency and bit rate parameters are detected and output to the parameter converter 230, and the parameter converter 230 is stored in the input buffer 210 according to the sampling frequency and bit rate parameters. The sampling frequency and bit rate of the PCM audio signal are adjusted to the sampling frequency and bit rate applicable to the MPEG audio coding method.
즉, 상기 파라메터 변환부(230)는 상기 파라메터 검출부(220)에서 검출된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 샘플링 주파수이면 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 중에서 가장 근접한 샘플링 주파수로 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 샘플링 주파수를 조정하는 한편, 상기 파라메터 검출부(220)에서 검출된 비트 레이트가 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트인지 판단하여 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트이면 상기 입력버퍼(210)에 저장된 PCM 오디오신호의 비트 레이트를 변환시키지 않고, MPEG 오디오 부호화 방식에 적용할 수 없는 비트 레이트이면 MPEG 오디오 부호화 방식에 적용 가능한 비트 레이트로 조정한다.That is, the parameter converter 230 determines whether the sampling frequency detected by the parameter detector 220 is a sampling frequency applicable to the MPEG audio coding scheme, and if the sampling frequency is applicable to the MPEG audio coding scheme, the input buffer 210. If the sampling frequency is not applicable to the MPEG audio coding method without converting the sampling frequency of the PCM audio signal stored in the PCM audio signal, the PCM audio stored in the input buffer 210 is the closest sampling frequency among the sampling frequencies applicable to the MPEG audio coding method. While adjusting the sampling frequency of the signal, it is determined whether the bit rate detected by the parameter detector 220 is a bit rate applicable to the MPEG audio coding method, and if the bit rate is applicable to the MPEG audio coding method, the input buffer 210 is applied. Of stored PCM audio signals Without converting the bit rate, MPEG bit rate is not applicable to audio coding methods and the available bit rate adjustment applies to the MPEG audio encoding method.
이때, 상기 파라메터 검출부(220)에서 검출된 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 크면 데시이션(decimation)을 통해 샘플링 주파수를 작게 하고, 샘플링 주파수가 MPEG 오디오 부호화 방식에 적용 가능한 샘플링 주파수 보다 작으면 보간(interpolation)을 통해 샘플링 주파수를 크게 하여 MPEG 오디오 부호화 방식의 샘플링 주파수와 일치시킨다.At this time, if the sampling frequency detected by the parameter detector 220 is larger than the sampling frequency applicable to the MPEG audio coding method, the sampling frequency is reduced by decimation, and the sampling frequency is applicable to the MPEG audio coding method. If smaller, the sampling frequency is increased through interpolation to match the sampling frequency of the MPEG audio encoding method.
상기와 같이 AC-3 오디오 복호기(100)에서 출력된 PCM 오디오신호가 상기 샘플링 주파수 및 비트 레이트(200)에서 샘플링 주파수 및 비트 레이트가 조정된 다음 MPEG 오디오 부호기(300)로 입력된다.As described above, the PCM audio signal output from the AC-3 audio decoder 100 is adjusted to the sampling frequency and bit rate at the sampling frequency and bit rate 200, and then input to the MPEG audio encoder 300.
그리고, 상기 MPEG 오디오 부호기(300)의 분석 서브밴드 필터(2)는 입력된 32개의 새로운 오디오 샘플을 차례로 512 샘플 크기를 갖는 버퍼에 저장하고, 이 버퍼에 분석 윈도우(analysis window)를 곱한 후, 512샘플을 8개의 64샘플 블럭으로 나누고 각 블럭을 더하여 새로운 벡터를 구성한다.In addition, the analysis subband filter 2 of the MPEG audio encoder 300 stores 32 input audio samples in a buffer having a size of 512 samples in turn, and multiplies the buffer by an analysis window. Divide the 512 samples into eight 64 sample blocks and add each block to form a new vector.
여기에 하기 제1식과 같은 분석 행렬을 곱하여 32개의 서브밴드 샘플을 만든다.This is multiplied by an analysis matrix such as the following equation 1 to make 32 subband samples.
그리고, 심리 음향 모델(4)은 각 서브밴드에서 원음에 의해 마스킹되어 들을 수 수 없는 최대 잡음 레벨을 결정하고, 이 잡음 레벨(마스킹 임계값)을 사용해서 각 밴드의 실제 양자화기를 결정하는 비트 할당을 할 수 있다.The psychoacoustic model 4 then determines the maximum noise level that is masked by the original sound in each subband and cannot be heard, and uses this noise level (masking threshold) to assign the bit to determine the actual quantizer of each band. can do.
이때, MPEG 방식에서는 두가지의 심리 음향 모델을 제공하는데, 심리 음향 모델 1은 신호의 스펙트럼으로부터 순음과 잡음 성분을 구분하는 과정과, 순음과 잡음의 개별 마스킹 임계값을 계산하는 과정, 절대 가청 한개를 고려하여 전체 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호 대 마스크 비를 구한다.In the MPEG method, two psychoacoustic models are provided. The psychoacoustic model 1 distinguishes pure and noise components from a spectrum of a signal, calculates individual masking threshold values of pure and noise, and generates an absolute audible signal. The signal-to-mask ratio is obtained by calculating the overall masking threshold value and calculating the signal-to-mask ratio in each subband.
즉, 고속 푸리에 변환(FFT)을 통해 스펙트럼을 구하고, 이로부터 각 서브밴드에서의 음압 레벨을 결정한다. 여기에서 마스킹 성분이 순음 또는 잡음인가에 따라 마스킹 곡선이 달라지므로 스펙트럼 정보로부터 순음 성분과 잡음 성분을 찾아내야 한다.That is, the spectrum is obtained through a fast Fourier transform (FFT), and the sound pressure level in each subband is determined therefrom. Since the masking curve varies depending on whether the masking component is pure or noise, the pure and noise components must be found from the spectral information.
즉, 부분 최대값(local maxima) 중에서 주위 신호보다 7dB 이상이 크면 순음으로 간주하여 순음 성분을 찾아낸 후 나머지 스펙트럼에서 하나의 임계 대역 내에서 하나의 잡음 성분을 구한다.That is, if the local maxima is greater than 7dB greater than the surrounding signal, the pure sound component is considered to be pure sound, and then one noise component is obtained within one critical band from the remaining spectrums.
여기에서 실험적으로 구해진 마스킹 함수를 적용하여 순음에 의한 마스킹 임계값을 구하고, 전체 마스킹 임계값은 개별 마스킹 임계값과 가청 한계의 합으로 구해진다.The masking threshold obtained by pure noise is applied by applying the experimentally obtained masking function, and the total masking threshold is obtained by the sum of the individual masking threshold and the audible limit.
그리고, 각 서브밴드에서의 음압 레벨과 마스킹 임계값과의 차를 구하여 신호 대 마스크 비(SMR:Signal to Masking Ratio)를 계산한다.The signal-to-masking ratio (SMR) is calculated by calculating the difference between the sound pressure level in each subband and the masking threshold.
결국, 신호 대 마스크 비(SMR)가 작다면 신호의 음압 레벨이 작거나 마스킹이 많이 된 것이므로 적은 비트를 가지고 효과적인 양자화를 할 수 있다.As a result, if the signal-to-mask ratio (SMR) is small, the sound pressure level of the signal is small or masking is high, so that the effective quantization can be performed with fewer bits.
그리고, 심리 음향 모델 2에서는, 신호의 임계 대역에 따른 에너지를 계산하는 과정과, 스프레딩 함수와 컨벌루션, 청신경의 여기 정도를 계산하는 과정, 절대 가청 한계를 고려하여 마스킹 임계값을 계산하는 과정 및, 각 서브밴드에서의 신호 대 마스크 비를 계산하는 과정을 거쳐 신호대 마스크 비를 구하는 것이다.In the psychoacoustic model 2, a process of calculating energy according to a critical band of a signal, a process of calculating a spreading function, a convolution, an excitation degree of the auditory nerve, a process of calculating a masking threshold in consideration of an absolute audible limit, and Then, the signal-to-mask ratio is obtained by calculating the signal-to-mask ratio in each subband.
이와 같은 심리 음향 모델 2는 고속 푸리에 변환 스펙트럼을 청신경의 여기 모델인 스프레딩 함수와 컨벌루션하여 마스킹 임계값을 구하므로, 계산량은 많지만 더 정교한 결과를 얻을 수 있을 것이다.The psychoacoustic model 2 convolves the fast Fourier transform spectrum with a spreading function, which is an excitation model of the auditory nerve, to obtain a masking threshold, thereby obtaining a large amount of computation but more accurate results.
그리고, 상기 비트 할당 및 양자화기(6)는, 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 분석 서브밴드 필터(2)에서의 출력된 각 서브 밴드 샘플에 대해 비트를 할당하고, 이 할당 된 비트에 따르 크기 정보(scale factor)에 의해 나누어져 정규화된 각 서브밴드 샘플들을 양자화한다.The bit allocation and quantizer 6 then uses a signal-to-mask ratio output from the psychoacoustic model 4 to allocate a bit for each subband sample output from the analysis subband filter 2. It allocates and quantizes each subband sample normalized by dividing by a scale factor according to this allocated bit.
이때, 각 서브 밴드에 대한 크기 정보(scale factor) 계산은 양자화하기 이전에 행해지며, 상기 크기 정보(scale factor) 계산은 12샘플마다 이루어지고, 12샘플의 절대값 중 최대값을 찾아서 0에서 2사이로 정규화시킨다.In this case, the scale factor calculation for each subband is performed before quantization, and the scale factor calculation is performed every 12 samples, and the maximum value of the absolute values of 12 samples is found to be 0 to 2. Normalize to
그리고, 비트 스트림 배열부(8)는 상기 비트할당 및 양자화기(8)에서 출력된 양자화된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor) 등의 부가 정보를 MPEG 프레임으로 배열하여 전송하는 것이다.The bit stream arrangement unit 8 arranges and transmits additional information such as quantized subband samples, bit allocation information, and scale information output from the bit allocation and quantizer 8 into MPEG frames. .
이상에서 살펴본 바와 같이 본 발명에 따르면, AC-3 오디오 부호기에 의해 압축된 디지털 오디오신호를 MPEG 오디오 복호기를 사용하여 복원할 수 있도록 변환시켜 줄 수 있는 것이다.As described above, according to the present invention, the digital audio signal compressed by the AC-3 audio encoder can be converted to be restored using an MPEG audio decoder.
Claims (5)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950045861A KR100195707B1 (en) | 1995-11-30 | 1995-11-30 | A digital audio signal converter |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950045861A KR100195707B1 (en) | 1995-11-30 | 1995-11-30 | A digital audio signal converter |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR970032131A KR970032131A (en) | 1997-06-26 |
| KR100195707B1 true KR100195707B1 (en) | 1999-06-15 |
Family
ID=19437221
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1019950045861A Expired - Fee Related KR100195707B1 (en) | 1995-11-30 | 1995-11-30 | A digital audio signal converter |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR100195707B1 (en) |
-
1995
- 1995-11-30 KR KR1019950045861A patent/KR100195707B1/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| KR970032131A (en) | 1997-06-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5539203B2 (en) | Improved transform coding of speech and audio signals | |
| EP1914724B1 (en) | Dual-transform coding of audio signals | |
| JP3352406B2 (en) | Audio signal encoding and decoding method and apparatus | |
| EP3457400B1 (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
| US20040162720A1 (en) | Audio data encoding apparatus and method | |
| US20080140393A1 (en) | Speech coding apparatus and method | |
| KR19990041072A (en) | Stereo Audio Encoding / Decoding Method and Apparatus with Adjustable Bit Rate | |
| EP1600946B1 (en) | Method and apparatus for encoding a digital audio signal | |
| US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
| JPH08204574A (en) | Adaptive coding system | |
| KR100750115B1 (en) | Audio signal encoding and decoding method and apparatus therefor | |
| KR100195707B1 (en) | A digital audio signal converter | |
| KR100195709B1 (en) | A digital audio signal converter | |
| KR100195711B1 (en) | Digital audio decoder | |
| JP3297238B2 (en) | Adaptive coding system and bit allocation method | |
| KR100204471B1 (en) | Bit divided method and apparatus of digital audio decoder | |
| KR100195708B1 (en) | Digital audio encoder | |
| KR100195712B1 (en) | Acoustoptic control apparatus of digital audio decoder | |
| KR970006827B1 (en) | Audio signal encoding device | |
| KR0121164B1 (en) | Coding/decoding method of compression and recurruence of audio | |
| KR0152016B1 (en) | Coding and Decoding System Using Variable Bit Allocation | |
| KR0144841B1 (en) | Apparatus for adaptive encoding and decoding of sound signals | |
| Boland et al. | Hybrid LPC And discrete wavelet transform audio coding with a novel bit allocation algorithm | |
| KR0134350B1 (en) | Coding and decoding system quantization bit | |
| JP2001094432A (en) | Subband encoding / decoding method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R14-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 11 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 12 |
|
| FPAY | Annual fee payment |
Payment date: 20110201 Year of fee payment: 13 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 13 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20120213 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20120213 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |