[go: up one dir, main page]

KR100389898B1 - Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding - Google Patents

Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding Download PDF

Info

Publication number
KR100389898B1
KR100389898B1 KR1019960051459A KR19960051459A KR100389898B1 KR 100389898 B1 KR100389898 B1 KR 100389898B1 KR 1019960051459 A KR1019960051459 A KR 1019960051459A KR 19960051459 A KR19960051459 A KR 19960051459A KR 100389898 B1 KR100389898 B1 KR 100389898B1
Authority
KR
South Korea
Prior art keywords
spectrum pair
interpolation
quantization
line spectrum
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019960051459A
Other languages
Korean (ko)
Other versions
KR19980031894A (en
Inventor
김홍국
김무영
조용덕
김상룡
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1019960051459A priority Critical patent/KR100389898B1/en
Publication of KR19980031894A publication Critical patent/KR19980031894A/en
Application granted granted Critical
Publication of KR100389898B1 publication Critical patent/KR100389898B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PURPOSE: A method for quantizing a linear spectrum pair coefficient in coding voice is provided to select a code word minimizing a whole spectrum error by combining an error generated in an interpolation subframe with quantization. CONSTITUTION: A pth linear spectrum pair coefficient is extracted from a voice signal of an ith frame(201,202). A linear spectrum pair coefficient is extracted from the voice signal of the ith frame by subframes(207,208). Another linear spectrum pair coefficient used for synthesizing a voice of a previous frame is obtained. A third linear spectrum pair coefficient interpolated by subframes by linear interpolation is obtained. An index c minimizing a quantization error is obtained by using a codebook of linear spectrum pair coefficients.

Description

음성 부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법Quantization Method of Line Spectrum Pair Coefficients in Speech Coding

본 발명은 음성 부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법에 관한 것으로서 더욱 상세하게는 보간 부프레임에서 발생하는 오차를 양자화 과정과 결합시킴으로써 전체 스펙트럼 오차를 최소화하는 코드워드를 선택할 수 있게 하는 개선된 양자화 방법에 관한 것이다.The present invention relates to a method of quantizing line spectrum pair coefficients in speech coding. More particularly, the present invention relates to an improved quantization method for selecting a codeword that minimizes an entire spectral error by combining an error occurring in an interpolation subframe with a quantization process. It is about a method.

8kbps이하의 저전송률을 갖는 분석 합성 및 파라메틱 음성 부호화기에서는 주로 음성을 스펙트럼 정보와 여기 정보로 표현한 후 각각을 양자화하여 전송한다.In analytical synthesis and parametric speech coders having a low data rate of 8 kbps or less, speech is mainly represented by spectrum information and excitation information, and then quantized and transmitted.

이 스펙트럼 정보와 여기 정보는 프레임이라 불리는 음성의 일정 블록마다 추출되며, 저전송률을 위해 스펙트럼 정보는 24bits/frame 이내로 표현되어야만 한다.This spectral information and excitation information are extracted for each block of voice called a frame, and for low data rate, the spectral information must be expressed within 24 bits / frame.

한편 음성 복호화기에서는 전송된 비트 스트림으로부터 음성 정보를 복구하여 합성음을 재생한다. 이때 음성의 부프레임의 길이가 길 경우 프레임 간의 급격한 스펙트럼의 변화를 최소화하기 위해 스펙트럼 보간(interpolation)을 행하는 것이 일반적이다.On the other hand, the speech decoder recovers the speech information from the transmitted bit stream and reproduces the synthesized sound. In this case, when the length of the subframe of speech is long, it is common to perform spectral interpolation to minimize the sudden change of the spectrum between frames.

그러나, 스펙트럼 보간은 양자화와는 독립적으로 수행되기 때문에 그 특성은 양자화 성능과 무관하게 되며, 보간에 의해 합성되는 구간(보간 부프레임)이 길수록 합성 음질은 양자화 성능보다는 보간 특성에 크게 좌우된다. 따라서, 음성 부호화기의 고품질 음성 부호화를 보장하기 위해서는 보간에 관한 정보를 부가 정보로서 전송하지 않으면 안된다는 문제점이 있다.However, since spectral interpolation is performed independently of quantization, the characteristic is irrelevant to quantization performance, and the longer the interval (interpolation subframe) synthesized by interpolation, the more the synthesized sound quality depends on interpolation characteristics rather than quantization performance. Therefore, there is a problem that information about interpolation must be transmitted as additional information in order to ensure high quality speech encoding of the speech encoder.

본 발명은 상기의 문제점을 해결하기 위하여 안출된 것으로서 보간 정보를 부가 정보로 처리하는 대신에 스펙트럼 양자화 및 보간 과정을 통합하는 개선된 방법을 제공하는 것을 그 목적으로 한다.It is an object of the present invention to provide an improved method for integrating spectral quantization and interpolation processes instead of processing interpolation information as additional information, which has been devised to solve the above problems.

도 1은 종래의 스펙트럼 양자화 방법을 보이는 과정도이다.1 is a process diagram showing a conventional spectral quantization method.

도 2는 본 발명에 따른 스펙트럼 양자화 및 보간 방법을 보이는 과정도이다.2 is a process diagram showing a spectral quantization and interpolation method according to the present invention.

상기의 목적을 달성하는 본 발명에 따른 선스펙트럼쌍 계수의 양자화 방법은 음성 신호로부터 추출된 선스펙트럼쌍 계수를 벡터 양자화하는 방법에 있어서, i번째 프레임의 음성 신호로부터 p차의 선스펙트럼쌍 계수(여기서, k=0,,,,p-1)을 추출하는 과정; i번째 프레임의 음성 신호로부터 부프레임별로 선스펙트럼쌍 계수(여기서, j=0,,,s-1, s는 부프레임의 수)를 추출하는 과정; 전 프레임의 음성 합성 시 사용되는 선스펙트럼쌍 계수를 구하는 과정; 선형보간에 의해 부프레임별로 보간된 선스펙트럼쌍 계수를 구하는 과정; 및 선스펙트럼쌍 계수의 코드북을 사용하여 하기의 식으로 보여지는 양자화 오차를 최소화하는 인덱스 c를 구하는 과정을A method of quantizing line spectrum pair coefficients according to the present invention which achieves the above object is a method of vector quantizing line spectrum pair coefficients extracted from a speech signal, wherein the line spectrum pair coefficients of the order of p from the speech signal of the i-th frame are (Where k = 0 ,,,, p-1); Line spectrum pair count for each subframe from audio signal of i th frame (Where j = 0 ,,, s-1, and s are the number of subframes); Line spectrum pair coefficients used in speech synthesis of the entire frame Process of obtaining; Coefficient of line spectrum pair interpolated by subframe by linear interpolation Process of obtaining; And a process of obtaining an index c that minimizes the quantization error shown by the following equation using a codebook of line spectrum pair coefficients.

포함함을 특징으로 한다. 이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.It is characterized by including. Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

초기의 스펙트럼 양자화 분야의 연구는 양자화 성능의 향상이라는 관점에서 최적의 스펙트럼 파라메타가 무엇인 가에 초점을 두었다. LPC(Linear Predictive Coding) 계수, PARCOR(PARtial CORrrelation) 계수, LSP(Line Specturm Pairs)계수, 그리고 합성 필터의 임펄스 응답 등이 스펙트럼 파라메타로 사용되며, 이중에서 LSP계수가 가장 좋은 성능을 나타내는 것으로 알려져 있다.Early research in the field of spectral quantization focused on what is the optimal spectral parameter in terms of improving quantization performance. Linear Predictive Coding (LPC) Coefficient, PARCOR (Paral CORrrelation) Coefficient, LSP (Line Specturm Pairs) Coefficient, and Impulse Response of Synthetic Filter are used as spectral parameters, and LSP coefficient is known to have the best performance. .

이와 함께 스펙트럼 보간은 보간 방법과 보간 간격에 대하여 연구되어져 왔다. 보간 방법으로는 주로 선형 보간이 사용되며, 보간 간격이 좁을수록 스펙트럼 왜곡이 적음이 밝혀졌다.In addition, spectral interpolation has been studied for interpolation methods and interpolation intervals. Linear interpolation is mainly used as the interpolation method, and the narrower the interpolation interval, the less spectral distortion is found.

유럽 이동 통신망인 GSM(Global Systems for Mobile Communication)용 5.6kbps/s VSELP(Vector Sum Excited Linear Prediction) 부호화기는 보간 부호책(interpolation codebook)으로부터 선형 보간을 개선하였다.The 5.6kbps / s Vector Sum Excited Linear Prediction (VSELP) coder for the European mobile network Global Systems for Mobile Communication (GSM) improved linear interpolation from an interpolation codebook.

그리고 20㎳ M-LCELP(Multimode Learned CELP)에서는 split vector weighting이라는 방법으로 부프레임에서의 보간 간격 법칙을 제안하였다. 그러나 지금까지 설명한 방법들은 양자화 과정과 보간 과정이 분리되어 있기 때문에 스펙트럼 파라메타가 최적의 양자화기를 통해 양자화되었을 지라도 선형으로 보간된 스펙트럼 오차가 클 경우 프레임 전체의 스펙트럼 왜곡은 증가한다.In addition, the 20㎳ M-LCELP (Multimode Learned CELP) proposed the interpolation spacing law in subframe by the method of split vector weighting. However, since the methods described so far are separated from the quantization process and interpolation process, even if the spectral parameters are quantized through the optimal quantizer, if the linearly interpolated spectral error is large, the spectral distortion of the entire frame increases.

심지어 최적으로 양자화되지 않았으면서도 보간이 잘된 경우가 프레임 전체의 스펙트럼 왜곡은 상대적으로 작을 수 있다.Even if it is not optimally quantized but well interpolated, the spectral distortion of the entire frame can be relatively small.

스펙트럼 양자화와 보간을 함께 고려하는 방법중의 하나로서 M-LCELP에서는 스펙트럼 양자화 과정에서 스펙트럼 양자화 값으로 복수개의 후보를 선택한다. 선택된 복수개의 각 후보마다 보간 양자화(interpolation quantizer)과정을 수행하여 최소의 스펙트럼 왜곡을 갖는 양자화 값을 최종 양자화 결과로서 판단한다. 그러나 이 방법은 보간 양자화를 위해 부가 정보를 할당하여 전송해야 하는 단점을 갖는다.As one of methods of considering spectral quantization and interpolation together, M-LCELP selects a plurality of candidates as spectral quantization values during spectral quantization. An interpolation quantizer process is performed for each selected plurality of candidates to determine a quantization value having a minimum spectral distortion as a final quantization result. However, this method has a disadvantage in that additional information is allocated and transmitted for interpolation quantization.

도 1은 종래의 양자화기의 양자화 과정을 보이는 과정도이다.1 is a process diagram showing a quantization process of a conventional quantizer.

제101단계에서는 입력 음성의 스펙트럼을 모델링하기 위해 선형 예측 분석을 행한다. 이를 통하여 음성을 수학식 1과 같은 선형 예측 필터로 표현한다.In step 101, the input voice A linear predictive analysis is performed to model the spectrum of. Through this, the voice is expressed by a linear prediction filter as shown in Equation 1.

여기서, i는 분석 프레임 번호로서 현재 프레임을 의미하며,는 i번째 프레임에서의 k차 선형 예측 계수(이하 LPC계수라 함)를 나타낸다.Here, i is the analysis frame number, which means the current frame, Denotes the k-th order linear prediction coefficient (hereinafter referred to as LPC coefficient) in the i-th frame.

제102단계에서는 이 p차 LPC계수를 선스펙트럼쌍 계수(이하 LSP계수라 함)로 변환한다.In step 102, the p-order LPC coefficient is converted into a line spectrum pair coefficient (hereinafter referred to as an LSP coefficient).

이 LPC계수로부터 LSP계수의 변환은 역변환이 가능한 변환이며, LSP계수의 양자화 특성이 LPC계수에 비해 우수하기 때문에 LPC 계수 대신에 LSP 계수를 양자화하는 것이 일반적이다.The conversion of the LSP coefficients from the LPC coefficients is a transform that can be inversely transformed. Since the quantization characteristics of the LSP coefficients are superior to those of the LPC coefficients, it is common to quantize the LSP coefficients instead of the LPC coefficients.

이때 변환된 i번째 프레임의 LSP계수를라 하자.At this time, the LSP coefficient of the converted i th frame Let's do it.

제103단계에서는 학습 데이터로부터 LSP 코드북을 미리 만드는 과정이다. 코드북 내의 m번째 코드워드는로 표현된다.In step 103, an LSP codebook is previously created from the training data. The mth codeword in the codebook is It is expressed as

제104단계에서는 제102단계와 제103단계의 출력을 이용하여 최적의 코드워드를 찾는 과정이다. 임의의 m번째 코드워드와의 오차는 다음 수학식 2와 같이 표현된다.In step 104, an optimal codeword is found using the outputs of steps 102 and 103. An error with any m-th codeword is expressed by Equation 2 below.

여기서는 distance measure로 가중 유클리디안 거리(weighted Euclidean distance)를 가정하였으며,는 가중 함수(weighting function)에 해당한다.Here we assume weighted Euclidean distance as the distance measure. Is a weighting function.

제103단계의 코드워드의 수 즉 코드북 크기를 M이라 하면 제104단계는 M개의 코드워드 중에서 수학식 2를 최소화하는 코드워드 인덱스 c를 찾는 과정이다.If the number of codewords in step 103, that is, the codebook size is M, step 104 is to find a codeword index c that minimizes Equation 2 among the M codewords.

이를 식으로 표현하면 다음 수학식 3과 같다.If this is expressed as an equation, Equation 3 below.

이 인덱스 c는 복호화기로 전송되며, 음성 합성시 사용되는 LSP값는 다음 수학식 4와 같이 할당된다.The index c is transmitted to the decoder and used for speech synthesis. Is allocated as in Equation 4 below.

만약 음성의 분석 프레임을 s개의 부프레임으로 나눌 경우 수학식 4의 값은 마지막 부프레임의 스펙트럼을 표현하는 파라메타가 되며, 그 밖의 부프레임에 대해서는 바로 전 프레임의 양자화된 스펙트럼 파라메터 즉, 바로 전 프레임의 마지막 부프레임의 LSP계수와 보간함으로써 부프레임간의 스펙트럼 변화를 최소화시킨다. 현재 i번째 프레임 중 j번째 부프레임에서의 보간된 LSP계수를, j번째 부프레임에 대한 보간 계수를, 바로 전 프레임의 양자화된 LSP계수를이라 하면 다음 수학식 5에 의해 선형 보간을 통해 부프레임별 보간된 LSP계수를 얻을 수 있다.If the analysis frame of speech is divided into s subframes, the value of Equation 4 becomes a parameter representing the spectrum of the last subframe, and for the other subframes, the quantized spectral parameter of the previous frame, that is, the previous frame. By interpolating with the LSP coefficient of the last subframe of, minimize the spectral change between subframes. The interpolated LSP coefficient at the j subframe of the current i th frame , the interpolation factor for the j subframe , The quantized LSP coefficient of the previous frame In this case, the interpolated LSP coefficient for each subframe can be obtained through linear interpolation according to Equation 5 below.

수학식 5중의 5b는 선형 보간을 의미하며 수학식 5에서로 표현된 것이다.5b in Equation 5 denotes linear interpolation. It is expressed as.

지금까지 설명한 기종의 양자화 방법은 수학식 3과 수학식 5에서 보여지듯이 양자화 과정에 부프레임의 보간 특성이 반영되지 않는다. 만약 실제로 추출된 각부프레임별 LSP계수를라 하면 보간 이후의 전체 스펙트럼 오차는 다음의 수학식 6과 같이 표현된다.The quantization methods of the models described so far do not reflect the interpolation characteristics of the subframes in the quantization process as shown in Equations 3 and 5. If the LSP coefficient of each subframe extracted In this case, the entire spectral error after interpolation is expressed as in Equation 6 below.

전체 스펙트럼 오차는 제104단계에서 코드워드 인덱스 c가 아닌 m이 선정되었을 경우와 비교하면 다음 수학식 7과 같다.The total spectral error is expressed by Equation 7 below when m is selected instead of the codeword index c in step 104.

여기서,로 가정하였다.here, Assume that

따라서,이기 위한 충분 조건은 다음 수학식 8과 같다.therefore, Sufficient conditions for this are as shown in Equation (8).

표 1은 최적의 코드워드가 최소의가 아님을 보인다.Table 1 shows that the optimal codeword Seems not.

kk code word 0ωo,k code word 0ω o, k code word1ω1,k code word1ω 1, k 전프레임All frames 현재프레임Current frame 보간프레임 분석값Interpolation Frame Analysis 보간프레임(code word 0 선택)Interpolation frame (select code word 0) 보간프레임(code word 1 선택)Interpolation frame (select code word 1) 00 0.150.15 0.20.2 0.150.15 0.20.2 0.10.1 0.150.15 0.1750.175 1One 0.60.6 0.40.4 0.60.6 0.50.5 0.60.6 0.60.6 0.50.5

이때 현재 프레임의 LSP값은 수학식 2에 의해 코드워드 1인 0.01의 양자화된다. 코드워드1로 양자화되고, 선형보간을 거친 후의 전체 오차는 수학식 6에 의해 0.025625가 된다. 그러나, 만약 양자화가 코드워드 0으로 되었다면 전체 오차는 0.015가 된다. 따라서, 표 1은 최적의 양자화가 최적의 양자화 및 보간을 의미하지 않음을 보여준다.In this case, the LSP value of the current frame is quantized to 0.01, which is codeword 1, by Equation 2. The total error after quantized with codeword 1 and subjected to linear interpolation becomes 0.025625 by equation (6). However, if the quantization is codeword 0, the overall error is 0.015. Thus, Table 1 shows that optimal quantization does not mean optimal quantization and interpolation.

본 발명에서는 이러한 문제를 해결하기 위해 수학식 6을 양자화 오차식으로 사용한다.To solve this problem, the present invention uses Equation 6 as a quantization error equation.

도 2는 본 발명에 따른 스펙트럼 양자화/보간 방법(Joint Spectral Quantization and interpolation, 이하 JQI라 함)의 수행과정을 보이는 과정도이다.2 is a process diagram illustrating a process of performing a spectral quantization / interpolation method (hereinafter referred to as JQI) according to the present invention.

제201단계 내지 제203단계는 도 1의 제101단계 내지 제103단계와 동일하다.Steps 201 to 203 are the same as steps 101 to 103 of FIG. 1.

제207단계는 각 부프레임별로 LPC분석을 수행하고, 제208단계를 거쳐 추출된 LSP계수는 JQI의 오차식에 사용된다. 제206단계는 JQI의 동작을 수행한다. 따라서, 제206단계에서 발생되어 제209단계의 입력으로 되는 양자화 인덱스 c는 다음 수학식 9와 같이 구할 수 있다.In step 207, LPC analysis is performed for each subframe, and the LSP coefficient extracted in step 208 is used for an error equation of JQI. Step 206 performs the operation of the JQI. Accordingly, the quantization index c generated in operation 206 and input as operation 209 may be obtained as in Equation 9 below.

여기서,는 가중 함수가 수학식 3에서와는 달리, 분석 차수 k와 부프레임 j의 함수임을 의미한다. 제209단계와 제210단계는 수학식 9에서 사용되는을 구하는 과정에 해당된다.here, Denotes that the weighting function is a function of the analysis order k and the subframe j, unlike in Equation 3. Steps 209 and 210 are used in Equation 9 Corresponds to the process of obtaining.

도 2도에 도시된 과정을 거칠 경우 표 1에 도시된 예의 양자화 결과는 코드워드 1이 되고 양자화 및 보간을 포함하는 전체 스펙트럼 오차는 최소가 된다.In the process illustrated in FIG. 2, the quantization result of the example shown in Table 1 is codeword 1, and the total spectral error including quantization and interpolation is minimized.

그리고 수학식 9는 다음의 수학식 10에 의해 수학식 3과 동일하게 된다.Equation 9 is equal to Equation 3 by Equation 10 below.

따라서, JQI는 기존의 양자화 방식을 포함하는 일반화된 방식이라 할 수 있다.Therefore, the JQI may be referred to as a generalized method including a conventional quantization method.

상술한 바와 같이 본 발명에 따른 스펙트럼 양자화 및 보간 방법은 보간 부프레임에서 발생하는 오차를 양자화 과정과 결합시킴으로써 전체 스펙트럼 오차를 최소화하는 코드워드를 선택할 수 있게 하는 효과를 갖는다.As described above, the spectral quantization and interpolation method according to the present invention has an effect of selecting a codeword that minimizes the overall spectral error by combining the error occurring in the interpolation subframe with the quantization process.

또한, 가중 함수의 선택에 따라 양자화 부프레임과 보간 부프레임 사이의 가중을 다르게 할 수 있다는 이점이 있다.In addition, there is an advantage in that the weighting between the quantization subframe and the interpolation subframe can be different according to the selection of the weighting function.

더욱이, 기존의 방식을 사용하는 음성 부호화기를 부가 정보 없이 향상시킬 수 있다는 이점도 있다.Furthermore, there is an advantage that the speech coder using the conventional scheme can be improved without additional information.

Claims (1)

음성 신호로부터 추출된 선스펙트럼쌍 계수를 벡터 양자화하는 방법에 있어서,In the method of vector quantizing the line spectrum pair coefficient extracted from the speech signal, i번째 프레임의 음성 신호로부터 p차의 선스펙트럼쌍 계수(여기서, k=0,,,,p-1)을 추출하는 과정;P-order line spectrum pair coefficient of order p from the audio signal of the i-th frame (Where k = 0 ,,,, p-1); i번째 프레임의 음성 신호로부터 부프레임별로 선스펙트럼쌍 계수(여기서, j=0,,,s-1, s는 부프레임의 수)를 추출하는 과정;Line spectrum pair count for each subframe from audio signal of i th frame (Where j = 0 ,,, s-1, and s are the number of subframes); 전 프레임의 음성 합성 시 사용되는 선스펙트럼쌍 계수를 구하는 과정;Line spectrum pair coefficients used in speech synthesis of the entire frame Process of obtaining; 선형보간에 의해 부프레임별로 보간된 선스펙트럼쌍 계수를 구하는 과정; 및Coefficient of line spectrum pair interpolated by subframe by linear interpolation Process of obtaining; And 선스펙트럼쌍 계수의 코드북을 사용하여 하기의 식으로 보여지는 양자화 오차를 최소화하는 인덱스 c를 구하는 과정을Using the codebook of the line spectrum pair coefficients, the process of finding the index c that minimizes the quantization error shown by 포함하는 선스펙트럼쌍 계수의 양자화 방법.A method of quantizing line spectrum pair coefficients, comprising.
KR1019960051459A 1996-10-31 1996-10-31 Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding Expired - Fee Related KR100389898B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960051459A KR100389898B1 (en) 1996-10-31 1996-10-31 Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960051459A KR100389898B1 (en) 1996-10-31 1996-10-31 Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding

Publications (2)

Publication Number Publication Date
KR19980031894A KR19980031894A (en) 1998-07-25
KR100389898B1 true KR100389898B1 (en) 2003-10-17

Family

ID=37421826

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960051459A Expired - Fee Related KR100389898B1 (en) 1996-10-31 1996-10-31 Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding

Country Status (1)

Country Link
KR (1) KR100389898B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
KR950022304A (en) * 1993-12-18 1995-07-28 완다 케이. 덴슨-로우 Quantization Method and Quantizer of Line Spectrum Frequency Vector
JPH07234697A (en) * 1994-02-08 1995-09-05 At & T Corp Audio-signal coding method
KR960027371A (en) * 1994-12-24 1996-07-22 양승택 Vector-Scalar Coupled Quantizer with Line Spectrum Pair Frequency

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
KR950022304A (en) * 1993-12-18 1995-07-28 완다 케이. 덴슨-로우 Quantization Method and Quantizer of Line Spectrum Frequency Vector
JPH07234697A (en) * 1994-02-08 1995-09-05 At & T Corp Audio-signal coding method
KR960027371A (en) * 1994-12-24 1996-07-22 양승택 Vector-Scalar Coupled Quantizer with Line Spectrum Pair Frequency

Also Published As

Publication number Publication date
KR19980031894A (en) 1998-07-25

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
KR100304682B1 (en) Fast Excitation Coding for Speech Coders
JP3196595B2 (en) Audio coding device
US6014622A (en) Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
CA2202825C (en) Speech coder
JP3114197B2 (en) Voice parameter coding method
JP2006525533A5 (en)
KR20010024935A (en) Speech coding
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH09319398A (en) Signal encoder
JPH0944195A (en) Voice encoding device
KR100465316B1 (en) Speech encoder and speech encoding method thereof
KR100416363B1 (en) Linear predictive analysis-by-synthesis encoding method and encoder
JP3308764B2 (en) Audio coding device
JPH0854898A (en) Voice coding device
KR100389898B1 (en) Quantization Method of Line Spectrum Pair Coefficients in Speech Encoding
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3153075B2 (en) Audio coding device
JPH08234795A (en) Voice encoding device
JPH08185199A (en) Voice coding device
JP3089967B2 (en) Audio coding device
JPH08320700A (en) Sound coding device
JP3192051B2 (en) Audio coding device
JP3092436B2 (en) Audio coding device
JP2808841B2 (en) Audio coding method

Legal Events

Date Code Title Description
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

A201 Request for examination
PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

FPAY Annual fee payment

Payment date: 20080312

Year of fee payment: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20090621

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20090621

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000