KR0155798B1 - 음성신호 부호화 및 복호화 방법 - Google Patents
음성신호 부호화 및 복호화 방법 Download PDFInfo
- Publication number
- KR0155798B1 KR0155798B1 KR1019950001575A KR19950001575A KR0155798B1 KR 0155798 B1 KR0155798 B1 KR 0155798B1 KR 1019950001575 A KR1019950001575 A KR 1019950001575A KR 19950001575 A KR19950001575 A KR 19950001575A KR 0155798 B1 KR0155798 B1 KR 0155798B1
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- signal
- unvoiced
- voice
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (15)
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 또는 무성음을 판별한 후, 선형예측부호화계수를 선형스펙트럼 쌍계수로 변환후 양자화하여 상기 각 프레임의 상기 유성음 및 상기 무성음 정보를 함께 전송하는 음성부호화단계; 및 상기 유성음 및 상기 무성음을 수신후 역양자화하여 상기 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하고 선형 예측부호화 계수가 상기 부 프레임에서 갖는 특성을 이용하여 다중 시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제1항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D변환단계; 성도특성을 나타내는 성도 특성 정보를 추출하는 정보추출단계; 상기 음성신호의 피치의 주기를 추정하는 피치주기추정단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 및 피치, 이득, 유·무성계수 및 선형스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제2항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 상기 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 및 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수들로 변환하여 상기 이득 및 선형스펙트럼 쌍계수들을 만드는 계수변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제3항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 잔차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇄피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 및 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 제4항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 및 상기 예측된 피치를 사용하여 상기 폐쇄회로피치중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 제2항에 있어서, 상기 음성복호화단계는 전송받은 상기 이득, 상기 선형스펙트럼 쌍계수들, 상기 피치 및 상기 유·무성계수들을 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과 각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 및 합성된 신호를 아날로그 형태의 신호로 변환하는 D/A변환단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 제6항에 있어서, 상기 다중 시·공간 스펙트럼생성단계는 이전 프레임의 상기 선형 스펙트럼쌍계수와 현재 프레임의 상기 선형 스펙트럼쌍계수를 선형 보간하여 각 부프레임의 상기 선형 스펙트럼쌍계수를 구하는 선형 스펙트럼쌍계수단계; 및 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출려하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호 부호화방법은 상기 음성신호의 포락을 구하고, 부프레임별 피치를 추출하여 현재 프레임의 실제 피치값을 추정하고, 유성음 및 무성음을 판별한 후, 선형예측부호화계수를 선형스펙트럼 쌍계수로 변환후 양자화하여 상기 각 프레임의 상기 유성음 및 상기 무성음 정보를 함께 전송하는 음성부호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제8항에 있어서, 상기 음성부호화단계는 상기 음성신호를 입력하여 디지탈신호로 변환하는 A/D변환단계; 성도특성을 나타내는 성도 특성 정보를 추출하는 정보추출단계; 상기 음성신호의 피치의 주기를 추정하는 피치주기추정단계; 상기 음성신호가 유성음인가 또는 무성음인가를 판별하는 판별단계; 및 피치, 이득, 유·무성계수 및 선형스펙트럼 쌍계수들을 이용하여 상기 음성신호를 양자화하여 전송하는 양자화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제9항에 있어서, 상기 정보추출단계는 자기상관 계수방법을 이용하여 상기 성도특성정보를 상기 선형예측부호화계수와 평균 전력으로 표현하고, 음성의 상호 관련성이 제거된 잔차신호를 만드는 단기예측단계; 및 상기 선형예측부호화계수를 상기 선형 스펙트럼 쌍계수들로 변환하여 상기 이득 및 선형스펙트럼 쌍계수들을 만드는 계수변환단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제10항에 있어서, 상기 피치주기추정단계는 적응코드북과 상기 잔차신호의 차가 최소로 되는 지연값인 폐쇄회로피치를 구하는 폐쇠피치검출단계; 상기 잔차신호의 자기상관계수를 이용하여 개방회로피치를 구하는 개방피치검출단계; 및 상기 개방회로피치 및 폐쇄회로피치를 이용하여 현재의 프레임을 가장 잘 표현하는 상기 피치계수를 예측 후 선택하는 피치적응단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제11항에 있어서, 상기 피치적응단계는 선형회귀법을 이용하여 상기 피치를 예측하는 피치예측단계; 및 상기 예측된 피치를 사용하여 상기 폐쇄회로피치중에서 현재의 프레임을 잘 표현하는 피치를 선택하는 피치선택단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 송신측에서 음성신호를 부호화하여 전송하고, 수신측에서 부호화된 상기 음성신호를 복호화하여 원래의 상기 음성신호로 출력하는 음성신호 부호화 및 복호화방법에서, 상기 음성신호의 복호화방법은 상기 수신측에서 부호화된 유성음 및 무성음을 수신후 역양자화하여 상기 음성신호의 유성음 및 무성음에 대한 정보를 복원하고, 상기 복원된 정보를 이용하고 선형 예측 부호화 계수가 상기 부 프레임에서 갖는 특성을 이용하여 다중 시·공간 스펙트럼을 만들어 상기 유성음 또는 무성음 대역별로 합성된 각각의 음성을 합쳐 원래의 상기 음성신호로 복호화하는 음성복호화단계를 구비하는 것을 특징으로 하는 음성신호 부호화 및 복호화방법.
- 제13항에 있어서, 상기 음성복호화단계는 상기 수신측으로부터 전송받은 이득, 선형스펙트럼 쌍계수들, 피치 및 유·무성계수를 역양자화하는 역양자화단계; 부프레임별로 음성을 생성하는 다중시간의 개념과각 주파수 대역별로 음성을 생성하는 다중 스펙트럼의 개념을 혼용하여 상기 역양자화된 계수들로 상기 다중 시·공간 스펙트럼을 생성하는 다중 시·공간 스펙트럼생성단계; 원래의 상기 음성신호를 생성하기 위해 상기 유성음 합성신호와 무성음 합성신호를 합하는 신호생성단계; 및 합성된 신호를 아날로그 형태의 신호로 변환하는 D/A변환단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
- 제14항에 있어서, 상기 다중 시·공간 스텍트럼생성단계는 이전 프레임의 상기 선형 스펙트럼쌍계수들과 현재 프레임의 상기 선형 스펙트럼쌍계수들을 선형 보간하여 각 부프레임의 상기 선형 스펙트럼상계수들을 구하는 선형 스펙트럼쌍계수단계; 및 각 부프레임에 대하여 유성음 및 무성음 스펙트럼 포락을 계산하는 유·무성스펙트럼포락단계를 구비하는 것을 특징으로 하는 음성 부호화 및 복호화방법.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950001575A KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019950001575A KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR960030558A KR960030558A (ko) | 1996-08-17 |
| KR0155798B1 true KR0155798B1 (ko) | 1998-12-15 |
Family
ID=19407411
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1019950001575A Expired - Fee Related KR0155798B1 (ko) | 1995-01-27 | 1995-01-27 | 음성신호 부호화 및 복호화 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR0155798B1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100455710B1 (ko) * | 2001-01-12 | 2004-11-06 | 가부시키가이샤 엔.티.티.도코모 | 암호화 장치, 복호 장치, 인증정보 부여 장치, 암호화방법, 복호 방법, 및 인증정보 부여 방법 |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
| KR100474826B1 (ko) * | 1998-05-09 | 2005-05-16 | 삼성전자주식회사 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
| JP4851447B2 (ja) * | 2005-06-09 | 2012-01-11 | 株式会社エイ・ジー・アイ | ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム |
-
1995
- 1995-01-27 KR KR1019950001575A patent/KR0155798B1/ko not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100455710B1 (ko) * | 2001-01-12 | 2004-11-06 | 가부시키가이샤 엔.티.티.도코모 | 암호화 장치, 복호 장치, 인증정보 부여 장치, 암호화방법, 복호 방법, 및 인증정보 부여 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR960030558A (ko) | 1996-08-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6260009B1 (en) | CELP-based to CELP-based vocoder packet translation | |
| JP4843124B2 (ja) | 音声信号を符号化及び復号化するためのコーデック及び方法 | |
| JP5343098B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
| JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
| EP0409239B1 (en) | Speech coding/decoding method | |
| US8392178B2 (en) | Pitch lag vectors for speech encoding | |
| US6081776A (en) | Speech coding system and method including adaptive finite impulse response filter | |
| US5027405A (en) | Communication system capable of improving a speech quality by a pair of pulse producing units | |
| EP1597721B1 (en) | 600 bps mixed excitation linear prediction transcoding | |
| KR100499047B1 (ko) | 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법 | |
| Özaydın et al. | Matrix quantization and mixed excitation based linear predictive speech coding at very low bit rates | |
| US7089180B2 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
| KR0155798B1 (ko) | 음성신호 부호화 및 복호화 방법 | |
| JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
| JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
| JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
| JP2853170B2 (ja) | 音声符号化復号化方式 | |
| JP4287840B2 (ja) | 符号化装置 | |
| Drygajilo | Speech Coding Techniques and Standards | |
| KR0156983B1 (ko) | 음성 부호기 | |
| Villette | Sinusoidal speech coding for low and very low bit rate applications | |
| JPH06130994A (ja) | 音声符号化方法 | |
| JP3035960B2 (ja) | 音声符号化復号化方法及びその装置 | |
| JPH06195098A (ja) | 音声符号化方法 | |
| JPH02160300A (ja) | 音声符号化方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
| FPAY | Annual fee payment |
Payment date: 20080627 Year of fee payment: 11 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 11 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20090717 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20090717 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |