[go: up one dir, main page]

KR100575193B1 - 적응 포스트필터를 포함하는 디코딩 방법 및 시스템 - Google Patents

적응 포스트필터를 포함하는 디코딩 방법 및 시스템 Download PDF

Info

Publication number
KR100575193B1
KR100575193B1 KR1020007007961A KR20007007961A KR100575193B1 KR 100575193 B1 KR100575193 B1 KR 100575193B1 KR 1020007007961 A KR1020007007961 A KR 1020007007961A KR 20007007961 A KR20007007961 A KR 20007007961A KR 100575193 B1 KR100575193 B1 KR 100575193B1
Authority
KR
South Korea
Prior art keywords
filtering
block
speech signal
postfiltering
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020007007961A
Other languages
English (en)
Other versions
KR20010024869A (ko
Inventor
오잘라파시
재르비넨카리
Original Assignee
노키아 모빌 폰즈 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 모빌 폰즈 리미티드 filed Critical 노키아 모빌 폰즈 리미티드
Publication of KR20010024869A publication Critical patent/KR20010024869A/ko
Application granted granted Critical
Publication of KR100575193B1 publication Critical patent/KR100575193B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/22Negotiating communication rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

본 발명은 비트 전송율이 프레임별로 변할 수 있는, 가변 비트 전송율에서의 음성 코딩에 관련한 것으로, 보다 상세하게는 디코딩된 음성의 품질을 향상시키기 위해 사용되는 방법 및 필터들에 관련한다. 본 발명에 따른 해결방안에서 포스트필터의 가중 인자들은 순간적인 비트 전송율 혹은 각 프레임의 코딩에서 사용된 비트 전송율에 기반하여 적응되지 않고, 포스트 필터의 가중 인자들은 소정 기간에 기반하여 계산된 평균 비트 전송율에 따라 적응된다. 이에 더하여, 포스트필터의 가중 인자들은 또한 당해 프레임이 유성음 신호, 무성음 신호 혹은 배경 잡음을 담고 있는지 여부에 기반하여 또한 조정된다. 무성음 신호 혹은 배경 잡음을 담고 있는 프레임들에서, 포스트필터링은 약화되어 포스트필터링이 유성음 신호에 적응되기 때문에 신호의 톤이 왜곡되는 것을 피할 수 있다. 포스트필터의 가중 인자들은 에러율 혹은 신호나 데이타 전송 채널의 품질을 설명하는 다른 매개변수에 기반하여 또한 적응될 수 있다. 예를 들어, 포스트필터링은 채널 에러율 및 코딩 에러의 양이 증가할때 포스트필터링이 증가하도록 편리하게 조정될 수 있어, 디코딩된 음성 신호에 대한 데이타 전송 에러들의 영향이 감소되고 데이타 전송 에러들에 대한 시스템의 허용한계가 증가한다.

Description

적응 포스트필터를 포함하는 디코딩 방법 및 시스템{A decoding method and system comprising an adaptive postfilter}
본 발명은 비트 전송율이 프레임별로 변할 수 있는, 가변 비트 전송율에서의 음성 코딩과 관련한 것으로, 보다 상세하게는 디코딩된 음성의 품질을 향상시키기 위하여 사용되는 방법 및 필터와 관련한다.
가변 비트 전송율에 의한 음성코딩은 특정 수준의 음성 품질로 데이타 전송 접속의 용량을 최대화 하기 위하여, 혹은 음성 접속의 평균 비트 전송율을 최소화하기 위하여 사용될 수 있다. 이는 음성이 동차(homogeneous)가 아니기 때문에 가능한 것으로, 만약 음성이 짧은 섹션들로 나뉜다면, 상이한 섹션들은 품질에서 인식할 수 있는 차이없이 각 섹션별로 다른 수의 비트를 사용하여 표시될 수 있다. 고정 비트 전송율을 사용하는 부호기들은 데이타 전송 용량을 절약하기 위하여 너무 높지는 않으면서, 충분한 품질로 음성의 다른 부분들을 나타내기에는 충분히 높은, 일종의 절충율로 동작해야만 한다. 이러한 절충율은 더작은 비트 수로 표시될 수 있는 소리에 대해서는 불필요하게 높다. 음성코딩의 가변-전송율 방법은 많은 어플리케이션에서 장점으로 사용될 수 있다. 인터넷과 같은 패킷-스위치 네트워크는 상이한 크기의 패키지들을 전송함으로써 가변-전송율 통신을 직접 사용할 수 있 다. 코드 분할 다중 접속(Code Division Multiple Access : CDMA) 시스템들은 또한 가변-전송율 코딩을 직접 활용할 수 있다. CDMA 시스템에서, 전송율의 평균적인 저하는 상이한 전송에 의해 초래되는 상호 장애를 감소시키고 사용자 수를 증가시키는 것을 가능하게 한다. 소위 3세대 이동 스테이션 시스템들에서, 가변-전송율 코딩은 몇가지 형태로 사용될 것이다. 데이타 전송에 더하여, 가변-전송율 코딩은 또한 가변-전송율 코딩에 의한 절약이 기록 용량을 절약하는 것으로 보이는 전화 응답기와 같은, 음성 녹음 및 음성 메세지 시스템과 관련하여 유용하다.
가변-전송율 부호기의 비트 전송율은 많은 방법으로 제어될 수 있다. 한가지 방법은 순간 비트 전송율이 사용 가능한 용량에 따라 결정되는, 데이타 전송 네트워크의 용량을 감시하는데 기반을 둔다. 이와같은 시스템에서, 비트 전송율은 사용 용량에 기반하여 상한 및 하한이 설정될 수 있다. 용량의 한계들은 시스템이 비트 전송율을 억제할 때, 특히 혼잡시간 동안 감소된 음성 품질로 보여진다.
가변-전송율 코딩은 또한 이동 스테이션들을 위한 에러-둔감형 코딩 방법을 구현하는데 사용될 수 있다. 이와 같은 방법에서, 음성 코딩의 비트 전송율은 전송 채널의 품질에 기반하여 적응된다. 전송 채널의 품질이 양호할 때, 비트전송율은 비교적 높게 유지되고, 코딩된 음성에 더하여 단지 약간의 에러 수정 정보만이 전송된다. 양호한 전송 조건에서, 이러한 방법은 전송 에러들을 제거하기에 충분하다. 전송 채널의 품질이 불량해질 때, 비트 전송율은 저하되어 더욱 강한 채널 코딩이 일반적인 고정-전송율 전송채널에 사용될 수 있다. 다음에 음성품질의 감소는 더 큰 에러들을 바로잡을 수 있는 더욱 강한 채널 코딩으로 최소화된다. 그 러나 음성 품질은 전송 접속의 품질이 약화될때, 비트 전송율이 저하되므로 어느정도 감소된다.
전형적인 코드 여기 선형 예측(Code Excited Linear Prediction : CELP) 코더는 적당한 여기신호가 코드북(codebook)에 담겨진 여기벡터들로부터 선택되는, 음성 형태를 모델링하는 많은 필터들을 포함한다. CELP 코더는 전형적으로 원래 음성 신호의 합성된 신호가 코드북으로 부터 선택된 여기신호들을 필터링하여 형성되는 단기 및 장기 필터 모두를 포함한다. 최적 여기신호를 생성하는 여기벡터는 코드북의 여기벡터들로 부터 검색된다. 검색하는 동안, 각각의 여기벡터는 단기 및 장기 필터들을 포함하는 합성기에 적용된다. 상기 합성된 음성신호는 인간의 가청 용량의 반응을 고려하여 원래의 음성 신호와 비교되어, 관측된 음성 품질에 상당하는 특성이 얻어진다. 최적 여기벡터는 코드북으로부터 당해 음성신호의 부분에 대하여 가장 작은 가중 에러 신호를 생성하는 여기벡터를 선택하여 처리되는 음성신호의 각부분에 대하여 얻어진다. 이와같은 CELP 코더들은 예를들어, 특허명세서 US-5 327 519 에 보다 상세하게 설명되어 있다.
도 1은 종래기술인 고정-전송율 CELP 코더의 블록도를 예시한다. 상기 코더는 두개의 분석 블록들, 즉 단기 분석 블록(10) 및 장기 분석 블록(11)을 포함한다. 이것들은 코딩될 음성신호 s(n)을 분석한다. 단기 분석 블록은 주로 음성 신호 스펙트럼의 포만트(formant)들을, 장기 분석 블록은 주로 음성신호의 주기성(피치)을 조사한다. 상기 블록들은 단기 및 장기 필터 블록들의 필터링 특성을 결정하는 곱셈기 세트 a(i) 및 b(i)를 형성한다. 단기 분석 블록에 의해 형성된 곱셈 기 세트 a(i)는 코딩될 음성 신호 스펙트럼의 포만트에 대응하고, 장기 분석 블록에 의해 형성된 곱셈기 세트 b(i)는 코딩될 음성신호의 주기성(피치)에 대응한다. 곱셈기 세트들 a(i)와 b(i)는 데이타 전송 채널(5)을 통해 수신단으로 송신된다. 곱셈기 세트들은 코딩될 음성신호의 각 프레임별로 분리되어 계산되고, 프레임들의 시간적 기간은 일반적으로 20 ms 이다.
장기 및 단기 필터 블록들(13, 12)은 곱셈기 세트 a(i)와 b(i)에 따라 코드북으로부터 선택된 여기신호를 필터링한다. 장기 필터는 목소리의 주기성(피치), 혹은 성대의 진동을 형상화 하고, 단기 필터는 스펙트럼의 포만트, 혹은 인간의 목소리 구성 채널을 형상화 한다. 필터링 결과인 ss(n)은 합산장치(18)에서 코딩될 음성 신호 s(n)으로부터 감소된다. 오차신호 e(n)은 웨이팅 필터(14)에 인가된다. 웨이팅 필터의 특성은 인간의 가청 용량에 따라 정해진다. 웨이팅 필터는 덜 중요하게 지각되는 주파수를 감소시키고, 인식되는 음성 품질에 중요한 영향을 가지는 주파수들을 강조한다. 코드 벡터 검색 제어 블록(15)은 웨이팅 필터의 출력 신호를 기반으로 상응하는 여기벡터 인덱스 u를 검색한다. 여기 코드북(16)은 상기 인덱스에 상응하는 코드벡터에 기반하여 의도했던 여기신호를 형성하고, 여기신호는 곱셈장치(17)로 입력된다. 곱셈 장치는 여기신호와 코드 벡터 검색 제어 블록에 의해 주어진 여기신호의 가중 요소 g와의 곱셈을 수행하고, 곱셈결과는 필터 블록(12,13)으로 입력된다. 코드 벡터 검색 제어 블록은 최적 여기 코드 벡터를 반복하여 검색한다. 오차 신호 e(n)이 최소이거나 혹은 충분히 작을 때, 요구된 코드 벡터는 발견된 것으로 간주되고, 여기 코드 벡터의 인덱스 u와 가중 요소 g는 수신기로 송신된다.
도 2는 종래기술인 CELP 디코더의 블록도를 예시한다. 디코더는 데이타 전송채널(5)로부터 코딩 인자 세트 a(i)와 b(i), 가중요소 g, 및 여기 코드 벡터 인덱스 u를 수신한다. 인덱스 u에 상응하는 여기 코드 벡터는 여기 코드북으로부터 선택되고, 상응하는 여기신호 c(n)은 곱셈 장치(21)에서 가중 인자 g가 곱해진다. 결과 신호는 장기 합성 필터(22)로 입력되고 더 나아가 단기 합성 필터(23)로 입력된다. 코딩 매개변수 세트들 a(i)와 b(i)는 도 1의 코더에서와 동일한 방식으로 필터들(22,23)을 제어한다. 단기 필터의 출력 신호는 더 나아가 복원된 음성 신호 s'(n)을 형성하기 위하여 포스트 필터(24)에서 더 필터링된다.
CELP 코딩의 수정, 즉 대수적 코드 여기 선형 예측(algebraic code excited linear prediction : ACELP)에서, 여기 신호는 0이 아닌 펄스 상수로 구성된다. 최적 여기 신호는 CELP 코딩에서의 에러 영역과 유사하게 펄스의 최적 위치와 진폭을 선택함으로써 얻어진다. 이와같은 코딩은 예를 들어 다음과 같은 학회 발표물들에서 설명된다. Jarvinen K., Vainio J., Kapanen P., Honkanen T., Haavisto P., Salami R., Laflamme C. Adoul J-P, GSM Enhanced Full Rate Speech Codec, 국제 음향, 음성 및 신호 처리 학회, Munich, Germany, April 21-24, 1997, 그리고 Honkanen T., Vainio J., Jarvinen K., Haavisto P., Salami R., Laflamme C. Adoul J-P., Enhanced Full Rate Speech Codec for IS-136 Digital Cellular System, 국제 음향, 음성 및 신호 처리 학회, Munich, Germany, April 21-24, 1997.
부정확한 여기신호 모델링으로 인하여 그러한 음성 품질이 떨어지는 것은 저 비트 전송율의 부호기에서는 전형적인 것이다. 이 때문에, 부호기의 출력 신호는 인식할 수 있는 음성 품질을 향상시키기 위하여 필터링된다. 단기 및 장기 필터링이 이와 같은 포스트필터링에 모두 사용될 수 있다. 필터링 특성은 가중 인자들로 조정된다. 단기 포스트필터링의 목적은 스펙트럼의 포만트를 강조하고 그것들 주위에 있는 주파수를 감소시켜 인식되는 음성 품질을 향상시키는 것이다. 장기 포스트필터링의 목적은 스펙트럼의 미세한 특성을 강조하는 것이다. 다음의 수학식 1은 10차 단기 포스트필터의 예를 나타낸 것이다.
Figure 112000015155517-pct00001
bi 및 ci는 분석될 프레임의 단기 스펙트럼의 결정 인자들이고, α 및 β는 필터링을 조정하는 가중 인자들이다. 상기 가중 인자들은 필터의 단기 모델의 영점 및 극점들을 원점에 가깝게 이동한다. 가중 인자들의 값들은 전형적으로 청취 테스트를 통해 각각의 부호기 종류에 대하여 개별적으로 선택된다. 이와 같은 포스트필터는 인자 β의 값을 감소함으로써 필터의 극점을 원점에 가깝게 하며 그리고/혹은 요소 α의 값을 증가함으로써 필터의 영점들을 단위원에 가깝게 이동하여 약화될 수 있다. 단기 포스트필터 또한 극점과 영점만을 가지는 전달함수로 구현될 수 있다.
음성코딩에 사용되는 비트 전송율을 저하할수록, 코딩에 의해 초래되는 왜곡 을 감소시키기 위하여 더욱 강한 포스트필터가 필요하다는 것은 알려진 사실이다. 그러나, 종래 기술인 가변 전송율 부호기에서는, 동일한 포스트필터가 최대 비트 전송율로 사용되었다. 이와 같은 가변-전송율 부호기의 예가 IS-96 CDMA 시스템에서 사용되는 QCELP 부호기이다.
그러나, 특허명세서 US 4 617 676 은 - 적응 차등 펄스 코드 변조(Adaptive Differential Pulse Code Modulation : ADPCM)와 관련하여 - 상이한 비트 전송율로 코딩된 음성 신호에 대하여 상이한 가중 인자가 포스트필터에 사용된 해결방안을 밝혀준다. 명세서에 따르면, 코딩을 위해 사용된 비트 전송율이 변하는 동안 가중 인자들이 변한다.
상이한 비트 전송율에 대하여 상이한 포스트필터들을 사용하는 것은 비트 전송율과 포스트필터가 변경될 때, 음성의 톤이 또한 변경된다는 문제점을 수반한다. 청취인은 이것을 단절 및 장애로 인식한다. 이 때문에, 종래기술인 가변-전송율 부호기에서는 포스트필터의 가중 인자들이 일반적으로 일정한 값을 유지했다. 각 프레임의 비트 전송율에 따라 조정된 포스트필터는 샘플별로 발생하는 코딩(ADPCM) 및 프레임별로 발생하는 코딩(CELP)에서 장애를 초래한다.
도 3은 ITU-T G.728 표준에 따라 LD-CELP 디코더에 적용된 종래 기술의 적응 포스트필터를 도시한다. 디코딩된 음성 피치의 매개변수 및 강도는 분석 블록(40)에서 분석된다.
이런 결과들은 장기 포스트필터 블록(42)의 기능을 제어하는데 사용된다. 장기 포스트필터 블록(42)의 전달 함수가 다음의 수학식 2에 표시된다.
Figure 112000015155517-pct00002
p는 지연 피치, b는 필터 가중 인자 그리고 g는 스케일링 인자이다. b와 gi에 적당한 값들이 다음의 수학식 3 및 4에 예시된다.
Figure 112000015155517-pct00003
Figure 112000015155517-pct00004
β는 지연 피치가 p 개 샘플에서, 단일 탭 피치 예측기의 증폭 인자이다. 상기 피치 포스트필터는 공진 피크가 포스트필터링 되는 음성의 피치 주파수의 집합들인 콤브 필터로 구성된다. 단기 포스트필터(43)의 전달함수가 다음의 수학식 5에 표시된다.
Figure 112000015155517-pct00005
가중 인자 매개변수 γ1 = 0.65 및 γ2 = 0.75 는 포스트필터링의 강도를 조정하고 인자들 a는 단기 스펙트럼을 결정하는 매개변수들이다. 포스트필터링은 다음과 같은 기울기 인자 H'(z)로 더 조정되어 수학식 6으로 표시된다.
Figure 112000015155517-pct00006
μ = γ3 k1이고, k1은 또한 음성 코딩에 사용된 단기 분석 블록을 위한 모델의 일차 반사 인자이다. 단기 모델의 인자들은 디코더로부터 얻어진다. 신호의 이득이 포스프필터링에서 바뀔 수 있기 때문에, 자동 이득 제어가 사용되어 이득을 일정하게 유지한다. 디코딩된 음성 s(n)의 이득은 포스트필터링된 음성 s'(n)의 이득이 스케일링 블록(44)에서 디코딩된 음성의 이득에 상응하여 조정된 후, 스케일링 인자 계산 블록(41)에서 결정된다. 각 프레임의 스케일링 인자는 일반적으로 다음의 수학식 7에 따라 계산된다.
Figure 112000015155517-pct00007
s(n)은 디코딩된 음성 신호이고, sf는 단기 및 장기 포스트필터링 블록의 후단 신호이며 L은 분석될 프레임의 길이이다. 스케일링 블록(44)는 곱셈을 수행하여 다음의 수학식 8이 얻어진다.
Figure 112000015155517-pct00008
GSM EFR 표준에서, 가중 인자들은 γ1 = 0.7, γ2 = 0.75 및 γ3 = 0.15이다.
도 4는 근원신호 및 데이타 전달 네트워크에 의해 제어되는 가변-전송율 코더를 도시한다. 코딩 블록(20)은 코딩될 음성신호 s(n)을 수신한다. 코딩될 음성신호는 또한 음성신호 s(n)에 따라 비트 전송율을 제어하는 비트 전송율 제어 블록(21)에 인가된다. 제어 블록(21)은 또한 일반적으로 최고와 최저 허용 비트 전송율 및 요구되는 평균 비트 전송율을 결정하는 제어 신호 O를 수신한다. 상기 정보에 더하여, 제어 블록(21)은 코딩의 품질 및 데이타 전송 채널의 품질 정보를 수신하고 이 정보를 비트 전송율을 제어하는데 사용할 수 있다. 예를 들어, 만약 데이타 전송 채널의 품질이 불량하다면, 더욱 강한 채널 코딩이 사용될 수 있도록, 비트 전송율을 낮추는 것이 유리하다. 데이타 전송 채널은 비트 전송율과 같은, 코더에 의해 사용된 매개변수의 정보를 수신부로 전달하는데 사용된다.
도 5는 원천 신호에 의해 제어되는 가변 전송율 코더의 비트 전송율이 도 4의 예에서처럼 어떻게 원천 신호에 따라 변하는지를 설명한다. 상단 곡선은 음성 신호를 나타내고 하단 곡선은 코더에 의해 사용되는 비트 전송율을 나타낸다. 원칙적으로, 비트 전송율은 프레임별로 변동할 수 있다. 도 5의 예에서, 평균 비트 전송율은 대략 7.0 kbit/s이다.
가변 전송율 부호기에 사용된 포스트필터 해결방안은 그러나 각 프레임의 소리가 유성음인지 무성음인지, 혹은 단지 배경 잡음인지 여부를 고려하지 않는다는 또다른 문제를 수반한다.
이 문제는 강한 포스트필터를 요구하는 저 비트 전송율에서 특히 발생한다. 강한 포스트필터링은 무성음 프레임의 음색과 단지 배경 잡음만을 지닌 프레임을 특히 왜곡한다. 이와 같은 프레임들에서, 신호 스펙트럼은 다소 평탄하고 명확한 포만트가 부족한데, 이는 강한 포스트필터링의 결과로써 형성되는 경향이 있다. 이렇게 음성 신호는 이와 같은 프레임에서 쉽게 왜곡되어, 청취인에 의해 음성품질이 약화된 것으로 인식된다.
가변-전송율 음성 코딩을 사용하는 원격통신 시스템에서 음성 품질을 향상시키는 것이 본 발명의 목적이다. 또한 코딩된 신호로부터 디코딩된 음성신호의 품질을 향상시키는 것이 본 발명의 또다른 목적이다. 더욱이, 본 발명은 데이타 전송 에러에 대한 원격통신 시스템의 허용한계를 향상시키는 것을 또다른 목적으로 한다.
상기 목적들은 포스트필터링이 적어도 장기 평균 비트 전송율에 따라 적응되는 포스트필터링 시스템을 구현함으로써, 그리고 이에 상응하여, 적어도 장기 평균 비트 전송율에 따라 적응하는 적응 포스트필터를 구현함으로써 이루어진다.
본 발명에 따른 방법은 독립 방법 청구항의 특성을 나타내는 부분에서 언급된 것에서 특성지워진다. 본 발명은 또한 디코딩 시스템과 관련한 독립 청구항의 특성을 나타내는 부분에서 언급된 것들에서 특성지워지는 디코딩 시스템과 연관된다. 본 발명은 또한 이동 스테이션과 관련한 독립 청구항의 특성을 나타내는 부분에서 언급된 것들에서 특성지워지는 이동 스테이션과 연관된다. 더욱이 본 발명은 원격통신 시스템의 구성요소와 관련한 독립 청구항의 특성을 나타내는 부분에서 언급된 것들에서 구성요소가 특성지워지는 원격 시스템의 구성요소와 관련된다. 종 속청구항들은 본 발명의 다양하고 유익한 실시예를 설명한다.
본 발명에 따른 해결방안에서, 포스트필터의 가중 인자들은 순간적인 비트 전송율, 혹은 각 프레임의 코딩에 사용된 비트 전송율에 따라 조정되지 않고, 가중 인자들은 특정 시간 기간 동안 계산된 평균 비트 전송율에 따라, 예를 들어 여러 프레임들에 걸친 평균을 계산함으로써 조정된다. 이에 더하여, 포스트필터의 가중 인자들은 또한 각 프레임이 유성음 신호, 무성음 신호 혹은 배경 잡음을 담고있는지 여부에 따라 조정된다. 포스트필터링은 무성음이나 배경 잡음을 담고 있는 프레임들에서 약화되어, 신호의 톤은 포스트필터링이 유성음 신호에 적응되기 때문에 이같은 지점에서 왜곡되지 않는다. 더욱이, 포스트필터의 가중 인자들은 또한 데이타 수신 신호나 다른 신호의 에러비율, 혹은 전송 채널의 품질을 나타내는 매개변수에 기반하여 적응될 수 있다. 예를들어, 포스트필터링은 비트 에러 비율이 증가할 때, 포스트필터링이 강화되어, 디코딩된 음성 신호에서 데이타 전송 에러의 영향이 감소하고 데이타 전송 에러들과 관련하여 시스템의 허용한계가 증가하도록 유익하게 조정될 수 있다.
다음에서, 본 발명은 예시 및 수반되는 도면들로서 보여지는 바람직한 실시예를 참조하여 보다 상세히 설명될 것이다.
도 1은 종래기술의 CELP 코더를 도시한다.
도 2는 종래기술의 포스트필터링 해결방안을 도시한다.
도 3은 종래기술의 디코더를 도시한다.
도 4는 종래기술의 가변 전송율 코더의 블록도를 도시한다.
도 5는 종래 기술의 가변-전송율 코더에 의해 생성된 코드 음성 신호의 비트 전송율의 변화예를 도시한다.
도 6은 본 발명의 바람직한 일 실시예에 따른 디코더를 도시한다.
도 7은 단기 포스트필터의 주파수 응답의 조정을 설명한다.
도 8은 본 발명의 바람직한 실시예의 포스트필터 구성을 도시한다.
도 9는 본 발명의 바람직한 실시예의 블록도를 도시한다.
도 10은 본 발명의 실시예의 블록도를 도시한다.
동일한 참조 번호 및 부호들은 도면에서 상응하는 부분들로 사용된다.
도 6은 본 발명의 바람직한 실시예에 따른 디코더의 블록도를 도시한다. 상기 디코더는 다중-전송율 어플리케이션이 다수의 디코딩 블록들(803a, 803b, 803c)을 구성하는, 가변-전송율 디코딩 블록(814)을 가진다. 상기 디코딩 블록(814)는 데이타 전송 채널(5)로부터 코딩 방법 정보(811)를 수신한다. 코딩 방법 정보는 도 6에서 스위치(802, 804)로 설명된, 각 비트 전송율에서 사용되는 디코딩 블록(803a, 803b, 803c)의 선택을 제어하기 위하여 사용된다. 본 발명은 도 6에 따른 디코딩 블록의 선택에 제한되지 않고, 어떠한 알려진 구성이라도 본 발명의 다른 실시예로 사용될 수 있다. 디코딩된 음성은 포스트필터(808)에 인가된다. 포스트필터는 장기 필터링 블록, 단기 필터링 블록 혹은 이에 따른 조합을 포함할 수 있다. 포스트필터(808)는 디코딩된 음성신호를 필터링하고 디코더의 출 력 신호(809)를 형성한다. 도 6의 실시예에서, 포스트필터의 가중 인자의 선택은 평균 비트 전송율에 기반하여 수행된다. 평균 계산 블록(801)은 예를 들어, 다음의 수학식 9를 기반으로 하여 평균 비트 전송율을 계산할 수 있다.
Figure 112000015155517-pct00009
α는 평균 주기를 결정하는 상수이고 비트_전송율i(bit_ratei)는 각 프레임 i의 비트 전송율이다. 예를 들어, 만약 평균이 3000 프레임 혹은 보통 프레임 길이에서 60초의 주기를 기반으로 하여 결정된다면, 인자 α의 값은 1/3000이다. 그러나, 본 발명은 3000 프레임의 주기로 계산된 평균을 사용하는 것에 한정되지 않고, 평균은 또한 상이한 길이의 주기로 결정될 수 있다. 적당한 주기는 각각의 어플리케이션에 대해 예를 들어 청취 테스트를 통해 결정될 수 있다. 평균 비트 전송율이 낮을때, 강한 포스트필터링이 필요하다. 반면에, 높은 평균 비트 전송율은 포스트필터링이 아주 강할 필요없는, 전달된 음성의 품질이 비교적 양호함을 보증한다. 포스트필터 블록(808)은 예를들어 식 5에 따라 단기 필터 블록을 사용할 수 있다. 식 5에 따른 포스트필터의 가중 인자들 γ1 과 γ2는 예를들어, 다음 표 1에 따라 바람직하게 선택될 수 있다.
비트 전송율 kbit/s 가중 인자들
γ1 γ2
8.0 이상 0.75 0.85
8.0 - 6.0 0.7 0.85
6.0 이하 0.6 0.85
무성음 혹은 배경 잡음을 담고 있는 프레임에 대해, 포스트필터링은 너무 강한 필터링때문에 이런 프레임들의 톤이 왜곡되는 것을 방지하기 위하여 약화된다. 만약 유성/무성음 지시블록(806)이 조사되고 있는 프레임의 음성 신호가 무성음임을 감지하거나, 혹은 배경 잡음 감지 블록(807)이 조사되고 있는 프레임이 배경 잡음을 담고 있다고 감지하면, 포스트필터링 제어 블록(805)은 필터의 가중 인자를 변경하여 당해 프레임은 정상보다 덜 필터링된다.
유성/무성음 분류 및 배경잡음/음성신호 분류에 상응하는 정보는 만약 코더가 이런 정보를 데이타 전송 채널을 통해 송신한다면, 음성신호를 코딩한 코더로부터 또한 수신될 수 있다. 이와같은 어플리케이션에서, 유성/무성음 지시 블록(806)과 배경 잡음 지시 블록(807)은 필요하지 않다.
필요한 필터링 감소량은 어떠한 종류의 디코딩 블록이 그때 사용되는지에 따라 바람직하게 선택된다. 음성 코딩의 상이한 방법들에 있어 적당한 감소는 예를들어 청취 테스트로 결정될 수 있다. 만약 식 5에 따른 포스트필터가 사용중이고, 배경 잡음이 증가한다면, 가중 인자 γ1 의 값은 예를들어 신호대 잡음비가 10dB 당 0.05dB 감소하도록 증가할 수 있다. 포스트필터링의 강도는 또한 코딩 에러, 즉 예를 들어 도 1에 도시된 신호 e(n)에 따라 변동될 수 있다. 코딩 에러의 정보는 포스트필터링의 강도가 코딩 에러의 양이 증가하는 동안 바람직하게 증가하여, 디코더로 전송될 수 있다.
유성음/무성음 지시 및 배경 잡음 강도의 추정은 또한 데이타 전송 채널을 통해 수신될수 있다. 이는 만약, 예를들어, 음성을 코딩한 장치가 전송될 음성 매개변수들의 일부로써 디코더로 본 정보를 송신한다면 가능하다.
본 발명의 바람직한 일실시예에서, 포스트필터의 가중인자들은 또한 데이타 전송 접속의 품질에 기반하여 조정된다. 이와같은 동작은 데이타 전송 접속의 품질 및 음성 신호의 비트 에러율을 결정하고, 데이타 전송 접속(5)의 품질이 평가되는 도 6의 결정 블록(810)으로 설명된다. 데이타전송 접속의 품질을 평가하기 위한 가능한 툴들은 예를들어 캐리어 대 간섭(Carrier to Interference : C/I) 혹은 수신되어 코딩된 음성 신호의 특징적인 비트 에러율(BER)을 포함한다. 음성 신호의 비트 에러율을 설명하는 특성 혹은 음성 신호의 정확도를 설명하는 다른 특성들은 포스트필터링의 동작을 조정하는데 또한 직접 사용될 수 있다. 이와 같은 어플리케이션에서, 포스트필터링은 데이타 전송 접속의 품질이 나빠지거나 혹은 음성 신호의 비트 에러율이 증가할 때 강화된다. 이런 방법으로, 데이타 전송 접속은 종래 기술의 해결방안보다 더욱 보호된다. 예를들어, 가중 인자 γ1의 값은 C/I 숫자의 10dB 당 0.05 감소에 의해 감소될 수 있다. 데이타 전송 접속의 품질에 따른 포스트필터의 조정은 또한, 만약 음성 코딩에 대한 채널 코딩의 비율이 데이타 전송 접속의 품질에 따라 변한다면, 평균 비트 전송율에 의해 구현될 수 있다. 열악한 환경에서, 음성 코딩의 비트 전송율 및 평균 비트 전송율은 감소하고, 평균 비트 전송율에 따라 조정될 포스트필터가 또한 데이타 전송 접속의 품질에 기반하여 간접적으로 조정되어, 채널 코딩 부분은 증가한다.
데이타 전송 접속이 갑자기 약화될때 포스트필터링이 너무 강해지지 않도록 상한 및 하한이 가중 인자들에 대해 설정될 수 있다. 예를들어, 식 5에 따른 포스트필터를 사용할 때, 가중 인자 γ1에 대한 적당한 하한은 0.55이고 적당한 상한은 대략 0.9이다. 이런 값들은 여기서 예시의 방법으로만 표시될뿐, 본 발명의 다른 실시예에 사용되는 값들은 제한하지 않는다.
상기 예는 가중 인자 γ1에 의하여 포스트필터링의 강도 조정을 설명했다. 그러나 이것은 가중 인자 γ2의 값도 포스트필터링의 강도를 변경하기 위하여 또한 변경될 수 있으므로, 본 발명의 다양한 실시예들을 제한하지 않는다.
장기 포스트필터링 블록의 가중 인자들은 단기 포스트필터링 블록의 가중 인자들과 같은 기준으로 바람직하게 조정된다. 더욱이, 무성음을 담고있는 프레임의경우, 장기 포스트필터링은 간편하게 삭제될 수 있다. 반면에, 강한 유성음을 담고 있는 프레임들에서 강한 장기 포스트필터링을 사용하는 것이 유리하다. 다음의 표 2는 상이한 상황에서 식 2에 따른 장기 포스트필터의 가중인자 b의 값을 예로 나타낸 것이다.
프레임의 신호 낮은 평균 비트 전송율에서 b의 값 높은 평균 비트 전송율에서 b의 값
무성음 0 0
유성음 0.15 β 0.1 β
강한 유성음 0.3 β 0.2 β

도 7은 본 발명의 바람직한 일실시예에 따른 포스트필터의 동작을 설명한다. 최상단 곡선은 음성 신호를 코딩한 코더의 단기 분석 블록에 의해 생성된 계수들을 나타낸 것으로, 계수들은 본 음성 신호의 스펙트럼과 밀접하게 매치된다. 하단 그래프의 두 곡선들은 상이한 가중 인자값을 가지는 식 5에 따른 포스트필터의 주파수 응답을 나타낸다. 연속선은 가중 인자 γ1=0.6 및 γ2=0.8에 따른 주파수 응답을 나타내고, 파단선은 γ1=0.7 및 γ2=0.8에 따른 주파수 응답을 나타낸다. 도시된 바와 같이, 단기 포스트 블록이 강해질수록, 음성 신호 스펙트럼의 포만트에 대한 강조도 강해진다.
도 8은 본 발명의 바람직한 실시예에 따른 포스트필터를 설명한다. 본 예의 구조는 도 3의 포스트필터의 구조와 부분적으로 유사하지만, 본 실시예는 예를들어 디코더에 의해 주어지거나 혹은 데이타 전송 채널을 따라 전송된 외부 매개변수들에 기반하여 단기 및 장기 필터 블록들의 가중 인자들을 조정하는 필터 제어 블록(103)을 또한 포함한다. 유리하게, 상기 매개변수들은 예를들어 각 프레임의 유성/무성음(V/UV) 분류, 비트전송율, 음성 신호를 코딩한 코더에 의해 사용된 매개변수 세트 a(i), 계수 g1 및 b, 가중 인자 γ1 및 γ2, 그리고 데이타 전송 채널의 품질 혹은 수신되어 코딩된 음성 신호의 정확도를 설명하는 다양한 특징들을 포함한다.
디코딩된 음성의 피치는 분석 블록(40)에서 분석된다. 장기 포스트필터 블록(42)의 동작은 분석 블록(40)에 의해 형성된 분석 결과에 따라 제어된다. 장기 포스트필터 블록(42)는 바람직하기는 필터의 주파수 응답의 피크 위치들이 분석 블록(40)의 분석 결과에 따라 조정되는 콤브 필터이다. 제어 블록(103)은 또한 디코 더로부터 오는 매개변수들에 따라 장기 포스트필터 블록의 동작을 조정한다. 이와 같은 파라미터들은 바람직하기로는 예를 들어 디코딩된 음성을 전송하는데 사용된평균 비트 전송율, 계수 g1 및 b, 그리고 각 프레임의 유성/무성음 분류를 포함한다. 제어 블록(103)은 장기 포스트필터의 강도를 예를들어 식 2에 따른 스케일링 인자 g1으로 조정한다. 무성음 프레임에서, 제어 블록(103)은 예를 들어 스케일링 인자 g1을 0으로 설정함으로써 장기 포스트필터링을 방지한다. 제어 블록은 바람직하기로는 식 2에 따라 가중 인자 b에 의하여 장기 포스트필터링 블록의 동작을 조정한다.
제어 블록(103)은 디코더로부터 수신된 계수 세트 a(i) 및 가중 인자 γ1 과 γ2에 기반하여 단기 포스트필터 블록(43)의 동작을 제어한다. 필터링된 신호는 예를 들어 식 7 및 8에 따라 스케일링 인자 계산 블록(41) 및 스케일링 블록(44)에 의하여 디코딩된 신호 강도에 비례하여 조정된다.
도 8에 도시된 예에 따르면, 제어블록(103)은 가중치와 다른 계수들 g, b, γ1 및 γ2를 기반으로 포스트필터 블록(42,43)의 동작을 제어한다. 그러나, 본 발명은 이와 같은 해결방안에만 제한되지 않고, 제어 블록(103)은 이러한 계수들을 예를 들어 평균 비트 전송율과 상기 표시된 표 혹은 다른 수단에 의해 결정한다. 예를 들어, 제어 블록(103)은 상기 나타난 표에 따라 평균 비트 전송율에 기반하여 가중 인자 b의 값을 적응함으로써 장기 포스트필터 블록의 동작을 또한 제어할 수 있다. 제어 블록은 예를 들어 상기 표 및 식 5와 6에 따라 가중 인자 γ1과 γ2를 알맞게 적응시킴으로써 평균 비트 전송율을 기반으로 포스트 블록의 동작을 또한 제어한다.
도 9는 본 발명의 예시적인 일 실시예에 따른 이동 스테이션의 블록도를 도시한다. 이동 스테이션은 마이크로폰(301), 키패드(307), 디스플레이(306), 이어폰(314), 송/수신 스위치(308), 안테나(309) 및 제어 유니트(305)와 같은 상기 장치를 대표하는 부품들을 포함한다. 더욱이, 도면은 이동 스테이션을 대표하는 전송 및 수신 블록(304, 311)을 도시한다. 송신 블록(304)은 음성 신호를 코딩하기 위하여 코더(321)를 포함한다. 전송 블록(304)는 또한 명확성을 위해 도 9에는 도시되지 않은, RF 기능뿐 아니라 채널 코딩, 해독 및 변조에 필요한 동작을 포함한다. 수신 블록(311)은 또한 본 발명에 따른 디코딩 및 포스트필터링 블록(320)을 포함한다. 디코딩 및 포스트필터링 블록(320)은 바람직하기로는 도 8에 도시된 것과 같은 포스트필터일 수 있는 포스트필터(322)를 포함한다. 마이크로폰(301)으로부터 입수되어, 증폭단계(302)에서 증폭되고 A/D 변환기에서 디지탈화된 신호는 전송 블록(304), 일반적으로 전송 블록에 포함된 음성 코딩 장치로 인가된다. 전송 블록에 의해 처리, 변조, 및 증폭된 전송 신호는 송신/수신 스위치(308)를 거쳐 안테나(309)로 인가된다. 수신될 신호는 안테나로부터 송신/수신 스위치(308)를 거쳐 수신 신호를 복조하고 해독 및 채널 코딩을 디코딩하는 수신 블록(311)에 인가된다. 결과물인 음성 신호는 D/A 변환기(312)를 거쳐 증폭기(313)와 더 나아가 이어폰(314)으로 인가된다. 제어 유니트(305)는 이동 스테이션의 동작을 제어하고, 키패드(307)로부터 사용자에 의해 주어진 명령을 제어하고 디스플레이(306)에 의하여 사용자에게 메세지를 전달한다.
본 발명에 따른 포스트 필터는 또한 일반적인 전화 네트워크 혹은 이동 스테이션 네트워크, GSM 네트워크와 같은 원격통신 네트워크에 사용될 수 있다. 도 10은 본 발명에 따른 그런 바람직한 실시예의 블록도를 예시한다. 예를 들어, 원격통신 네트워크는 일반 전화(370), 베이스 스테이션(340), 베이스 스테이션 제어기(350) 및 원격통신 네트워크의 기타 교환국 장치(355)들이 연결된 전화 교환국 혹은 상응하는 스위칭 시스템(360)을 포함할 수 있다. 이동 스테이션(330)은 베이스 스테이션(340)을 거쳐 원격통신 네트워크에 접속을 설정할 수 있다. 본 발명에 따른 디코딩 및 포스트필터링 블록(320)은 예를 들어 베이스 스테이션(340)에 특히 부분적으로 편리하게 위치할 수 있다. 그러나 본 발명은 이것에만 한정되지 않으며, 본 발명에 따른 디코딩 및 포스트필터링 블록(320)은 또한 예를 들어, 베이스 스테이션 제어기(350)나 혹은 다른 교환국 및 스위칭 장치(355)에 위치할 수 있다. 만약 이동 스테이션 시스템이 분리된 트랜스코더들을 예를 들어 베이스 스테이션 및 베이스 스테이션 제어기 사이에서 라디오 채널을 원격통신 시스템에서 전달된 일반적인 64kbit/s 신호에 인가하여 코딩 신호를 변경하기 위하여 사용하거나 그 반대 방향으로 인가한 코딩 신호를 변형하기 위하여 사용한다면, 본 발명에 따른 디코딩 및 포스트필터링 블록(320)은 또한 그러한 트랜스코더에 위치할 수 있다. 일반적으로, 본 발명에 따른 디코딩 및 포스트필터링 블록(320)은 코딩된 데이타 스트림을 코딩되지 않은 데이타 스트림으로 변형하는 원격통신 네트워크의 어 떠한 요소에도 위치할 수 있다. 디코딩 및 포스트필터링 블록(320)은 음성 신호가 원격통신 네트워크에서 비압축된 일반적인 방법으로 전송할 수 있게 된 후에 이동 스테이션(330)으로부터 입수되는 코딩된 음성 신호를 디코딩 및 필터링한다. 디코딩 및 포스트필터링 블록(320)은 본 특허 명세서에 설명된 포스트필터의 어떠한 실시예로도 구현될 수 있다.
적응 포스트필터링의 장점으로써, 포스트필터링된 목소리의 톤은 프레임별로 변화가 없다는 것이 언급될 수 있다. 포스트필터의 가중 인자들이 장기 평균 비트 전송율에 따라 적응될 때, 음성 톤은 평탄하고 혼란스럽게 빨리 변하지 않는다.
본 발명에 따른 해결방안은 낮은 평균 비트 전송율에서, 높은 비트 전송율로 코딩된 프레임들이 코딩된 음성 신호에서 갑자기 발생하는 것이 가능하기 때문에 종래기술의 해결방안과 비교할 때 명백한 장점을 가진다. 만약 포스트필터링이 기존의 해결책과 같이 순간적인 비트 전송율에 기반하여 적응된다면, 상이한 가중 인자들은 디코딩된 음성 톤에서의 빠르고 혼란스러운 변화를 만드는 낮은 비트 전송율의 프레임을 필터링하기보다는 이러한 갑작스러운 발생의 필터링에 사용될 것이다.
본 발명은 많은 점에서 다른 데이타 전송 시스템들에 적용될 수 있다. 일반적으로, 본 발명은 코딩된 음성신호가 디코딩되는 데이타 전송 시스템의 모든 부분에 사용될 수 있다. 본 발명은 이렇게, 예를들어, 이동 스테이션 혹은 데이타 전송 시스템의 다른 종류의 무선 혹은 고정 터미날 장치, 혹은 교환국 및 전화시스템의 스위칭 장치에 사용될 수 있다.
예시의 방법으로 나타낸 본 발명의 상기 실시예에서 포스트필터는 장기 및 단기 포스트필터링 블록을 모두 가진다고 가정되었다. 그러나 본 발명은 이에 한정되지 않으며, 포스트필터가 단지 하나의 포스트필터 블록을 가지는 구성에도 또한 적용될 수 있다.
상기 식 2 및 5는 단지 종래 기술의 포스트필터에 대한 예일 뿐이다. 본 발명은 이에 한정되지 않으며, 다른 종류의 필터들도 필터로써 또한 사용될 수 있다.
본 발명은 음성을 전달하는 모든 종류의 데이타 전송 시스템들에 적용될 수 있다. 본 발명은 각 어플리케이션에서 사용된 비트 전송율 결정 원리에 상관없이 적용될 수 있다.
본 어플리케이션에서 배경 잡음이라는 용어는 또한, 실제 잡음에 더하여, 실제 음성 신호의 부분이 아니라 교통, 장비, 사람 및 동물에 의해 초래된 모든 다른 배경 소리를 의미한다.
상기에서, 본 발명은 바람직한 실시예를 참조하여 설명되었지만, 본 발명이 첨부된 청구항들에 의해 정의된 발명적인 사상에 따라 많은 방법으로 수정될 수 있음은 명백하다.

Claims (14)

  1. 소정 기간 동안 평균 비트율을 계산하는 단계; 및
    상기 평균 비트율에 따라 필터링의 가중 인자들을 조정함으로써 디코딩된 음성 신호를 필터링하는 단계를 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  2. 제1항에 있어서,
    상기 디코딩된 음성 신호는 특정 길이의 프레임들에서 처리되며,
    상기 필터링의 가중 인자들은, 평균이 적어도 두 프레임의 기간동안 계산되는 평균 비트 전송율에 따라 조정되는 것을 특징으로 하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  3. 제1항에 있어서,
    상기 음성 신호는 특정 길이의 프레임들에서 처리되고 각 프레임에 담겨진 음성신호 부분은 유성음 혹은 무성음으로 분류되며,
    상기 디코딩된 음성 신호를 필터링하는 단계는, 상기 프레임에 담긴 음성 신호부분의 유성음/무성음 분류를 기반으로 필터링의 가중 인자들을 조정하는 단계를 더 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  4. 제1항에 있어서,
    상기 음성 신호는 특정 길이의 프레임들에서 처리되고 각 프레임에 담겨진 음성신호 부분은 배경잡음 혹은 음성으로 분류되며,
    상기 디코딩된 음성 신호를 필터링하는 단계는, 상기 프레임에 담긴 음성 신호부분의 배경잡음/음성 분류를 기반으로 필터링의 가중 인자들을 조정하는 단계를 더 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  5. 제1항에 있어서,
    데이타 전송 채널을 거쳐 전달된 음성신호가 처리되는 방법에서,
    상기 디코딩된 음성 신호를 필터링하는 단계는, 상기 데이타 전송 채널의 품질을 기반으로 필터링의 가중 인자들을 조정하는 단계를 더 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  6. 제1항에 있어서,
    상기 디코딩된 음성 신호를 필터링하는 단계는, 전달된 음성 신호의 비트 에러율을 기반으로 필터링의 가중 인자들은 조정하는 단계를 더 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  7. 제1항에 있어서,
    상기 디코딩된 음성 신호를 필터링하는 단계는,
    수신된 음성 신호의 코딩 동안 발생되는 코딩 에러의 정보를 획득하는 단계; 및
    상기 코딩 에러 정보를 기반으로 필터링의 가중 인자들을 조정하는 단계를 더 포함하는 가변 비트 전송율로 전송된 디코딩된 음성 신호를 필터링하는 방법.
  8. 음성신호를 디코딩하기 위한 디코딩 블록;
    상기 음성신호를 필터링하기 위한 포스트필터 블록(42,43); 및
    소정 기간에 기반하여 계산된 평균 비트 전송율에 따라 포스트필터링 블록의 동작을 조정하기 위한 포스트필터링 블록 제어 수단(103)을 포함함을 특징으로 하는 가변 비트 전송율로 코딩된 음성신호를 처리하는 디코딩 시스템.
  9. 특정 길이의 프레임들에서 코딩된 음성 신호를 디코딩하기 위한 제8항의 디코딩 시스템에 있어서,
    포스트필터링 블록 제어 수단(103)은 또한 상기 프레임에 담긴 음성 신호 부분의 유성음/무성음 분류에 따라 포스트필터링 블록에서 각 프레임의 필터링을 제어하기 위하여 구성됨을 특징으로 하는 가변 비트 전송율로 코딩된 음성신호를 처리하는 디코딩 시스템.
  10. 특정 길이의 프레임들에서 코딩된 음성 신호를 디코딩하기 위한 제8항의 디코딩 시스템에 있어서,
    포스트필터링 블록 제어 수단(103)은 또한 상기 프레임에 담긴 음성 신호 부분의 배경잡음/음성신호 분류에 따라 포스트필터링 블록에서 각 프레임의 필터링을 적응시키도록 구성됨을 특징으로 하는 가변 비트 전송율로 코딩된 음성신호를 처리하는 디코딩 시스템.
  11. 데이타 전송 채널을 거쳐 전송된 코딩된 음성 신호를 디코딩하기 위한 제8항의 디코딩 시스템에 있어서,
    포스트필터링 블록 제어 수단(103)이 데이타 전송 채널의 품질에 또한 기반하여 포스트필터링 블록의 동작을 조정하도록 구성되어, 데이타 전송 접속의 품질을 결정하기 위한 장치(810)를 포함함을 특징으로 하는 가변 비트 전송율로 코딩된 음성신호를 처리하는 디코딩 시스템.
  12. 제8항에 있어서,
    포스트필터링 블록 제어 수단(103)은 코딩된 음성 신호의 비트 에러율에 기반하여 포스트필터링 블록의 동작을 조정하도록 구성되어, 음성 신호의 비트 에러율을 결정하기 위한 장치(810)를 포함함을 특징으로 하는 가변 비트 전송율로 코딩된 음성신호를 처리하는 디코딩 시스템.
  13. 음성 신호를 디코딩하기 위한 디코딩 블록;
    디코딩된 음성 신호를 필터링하기 위한 포스트필터링 블록(322,42,43); 및
    소정 기간에 기반하여 계산된 평균 비트 전송율에 따라 포스트필터링 블록의 동작을 조정하기 위한 포스트필터링 블록 제어수단(103)을 포함함을 특징으로하는 가변 비트 전송율로 코딩된 음성신호를 수신하기 위해 구성된 이동 스테이션.
  14. 디코딩된 음성 신호를 수신하기 위하여 구성된 원격통신 네트워크의 요소(340,350,360)로서,
    디코딩 및 포스트필터링 블록(320)을 포함하고,
    상기 디코딩 및 포스트필터링 블록(320)은,
    음성 신호를 디코딩하기 위한 디코딩 블록;
    디코딩된 음성 신호를 필터링하기 위한 포스트필터링 블록(322,42,43); 및
    소정 기간에 기반하여 계산된 평균 비트 전송율에 따라 포스트필터링 블록의 동작을 조정하기 위한 포스트필터링 블록 제어 수단(103)을 더 포함하는, 디코딩된 음성 신호를 수신하기 위하여 구성된 원격통신 네트워크의 요소.
KR1020007007961A 1998-01-21 1999-01-20 적응 포스트필터를 포함하는 디코딩 방법 및 시스템 Expired - Fee Related KR100575193B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI980132 1998-01-21
FI980132A FI980132A7 (fi) 1998-01-21 1998-01-21 Adaptoituva jälkisuodatin

Publications (2)

Publication Number Publication Date
KR20010024869A KR20010024869A (ko) 2001-03-26
KR100575193B1 true KR100575193B1 (ko) 2006-04-28

Family

ID=8550488

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007007961A Expired - Fee Related KR100575193B1 (ko) 1998-01-21 1999-01-20 적응 포스트필터를 포함하는 디코딩 방법 및 시스템

Country Status (10)

Country Link
US (1) US6584441B1 (ko)
EP (1) EP1050040B1 (ko)
JP (1) JP4275855B2 (ko)
KR (1) KR100575193B1 (ko)
CN (1) CN1192356C (ko)
AU (1) AU2056299A (ko)
BR (1) BR9907031B1 (ko)
DE (1) DE69932593T2 (ko)
FI (1) FI980132A7 (ko)
WO (1) WO1999038155A1 (ko)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US7353168B2 (en) * 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
CN100578616C (zh) 2003-04-08 2010-01-06 日本电气株式会社 代码转换方法和设备
CN100334874C (zh) * 2003-07-02 2007-08-29 矽统科技股份有限公司 具滤噪声步骤的图框种类侦测方法
KR100554164B1 (ko) * 2003-07-11 2006-02-22 학교법인연세대학교 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
WO2005041170A1 (en) * 2003-10-24 2005-05-06 Nokia Corpration Noise-dependent postfiltering
US7478040B2 (en) * 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US9281794B1 (en) 2004-08-10 2016-03-08 Bongiovi Acoustics Llc. System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US9413321B2 (en) 2004-08-10 2016-08-09 Bongiovi Acoustics Llc System and method for digital signal processing
US8284955B2 (en) 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
EP1849156B1 (en) * 2005-01-31 2012-08-01 Skype Method for weighted overlap-add
JP5009910B2 (ja) * 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
US9615189B2 (en) 2014-08-08 2017-04-04 Bongiovi Acoustics Llc Artificial ear apparatus and associated methods for generating a head related audio transfer function
US9348904B2 (en) 2006-02-07 2016-05-24 Bongiovi Acoustics Llc. System and method for digital signal processing
US10069471B2 (en) 2006-02-07 2018-09-04 Bongiovi Acoustics Llc System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US11202161B2 (en) 2006-02-07 2021-12-14 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
US9195433B2 (en) 2006-02-07 2015-11-24 Bongiovi Acoustics Llc In-line signal processor
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
CN101548319B (zh) * 2006-12-13 2012-06-20 松下电器产业株式会社 后置滤波器以及滤波方法
JP5377287B2 (ja) * 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
EP2132733B1 (en) * 2007-03-02 2012-03-07 Telefonaktiebolaget LM Ericsson (publ) Non-causal postfilter
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
CN100550133C (zh) * 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
JP2010092057A (ja) * 2009-10-29 2010-04-22 Fujitsu Ltd 受話音声処理装置及び受話音声再生装置
ES2501840T3 (es) * 2010-05-11 2014-10-02 Telefonaktiebolaget Lm Ericsson (Publ) Procedimiento y disposición para el procesamiento de señales de audio
AU2015200065B2 (en) * 2010-07-02 2016-10-20 Dolby International Ab Post filter, decoder system and method of decoding
SG10201503004WA (en) 2010-07-02 2015-06-29 Dolby Int Ab Selective bass post filter
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US9576590B2 (en) * 2012-02-24 2017-02-21 Nokia Technologies Oy Noise adaptive post filtering
US9344828B2 (en) 2012-12-21 2016-05-17 Bongiovi Acoustics Llc. System and method for digital signal processing
EP2936484B1 (en) * 2013-01-29 2018-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9264004B2 (en) 2013-06-12 2016-02-16 Bongiovi Acoustics Llc System and method for narrow bandwidth digital signal processing
US9398394B2 (en) 2013-06-12 2016-07-19 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
CN104517612B (zh) * 2013-09-30 2018-10-12 上海爱聊信息科技有限公司 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
US9397629B2 (en) 2013-10-22 2016-07-19 Bongiovi Acoustics Llc System and method for digital signal processing
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US10639000B2 (en) 2014-04-16 2020-05-05 Bongiovi Acoustics Llc Device for wide-band auscultation
US9615813B2 (en) 2014-04-16 2017-04-11 Bongiovi Acoustics Llc. Device for wide-band auscultation
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
CN105023579A (zh) * 2014-04-30 2015-11-04 中国电信股份有限公司 语音通信中语音编码实现方法、装置和通信终端
US9564146B2 (en) 2014-08-01 2017-02-07 Bongiovi Acoustics Llc System and method for digital signal processing in deep diving environment
US9638672B2 (en) 2015-03-06 2017-05-02 Bongiovi Acoustics Llc System and method for acquiring acoustic information from a resonating body
CN106033672B (zh) 2015-03-09 2021-04-09 华为技术有限公司 确定声道间时间差参数的方法和装置
WO2017087495A1 (en) 2015-11-16 2017-05-26 Bongiovi Acoustics Llc Surface acoustic transducer
US9621994B1 (en) 2015-11-16 2017-04-11 Bongiovi Acoustics Llc Surface acoustic transducer
WO2019200119A1 (en) 2018-04-11 2019-10-17 Bongiovi Acoustics Llc Audio enhanced hearing protection system
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
JP2024044550A (ja) * 2022-09-21 2024-04-02 株式会社メタキューブ デジタルフィルタ回路、方法、および、プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
US4726037A (en) * 1986-03-26 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Predictive communication system filtering arrangement
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
FI98104C (fi) 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
JP3076086B2 (ja) * 1991-06-28 2000-08-14 シャープ株式会社 音声合成装置用ポストフィルタ
US5694519A (en) * 1992-02-18 1997-12-02 Lucent Technologies, Inc. Tunable post-filter for tandem coders
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI96248C (fi) 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
FI98163C (fi) 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
US5664053A (en) 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten

Also Published As

Publication number Publication date
KR20010024869A (ko) 2001-03-26
BR9907031A (pt) 2000-10-17
US6584441B1 (en) 2003-06-24
FI980132A7 (fi) 1999-07-22
DE69932593D1 (de) 2006-09-14
BR9907031B1 (pt) 2011-05-31
JP4275855B2 (ja) 2009-06-10
WO1999038155A1 (en) 1999-07-29
CN1192356C (zh) 2005-03-09
EP1050040B1 (en) 2006-08-02
JP2002501225A (ja) 2002-01-15
EP1050040A1 (en) 2000-11-08
AU2056299A (en) 1999-08-09
DE69932593T2 (de) 2006-12-07
CN1288557A (zh) 2001-03-21
FI980132A0 (fi) 1998-01-21

Similar Documents

Publication Publication Date Title
KR100575193B1 (ko) 적응 포스트필터를 포함하는 디코딩 방법 및 시스템
EP0848374B1 (en) A method and a device for speech encoding
KR100805983B1 (ko) 가변율 음성 코더에서 프레임 소거를 보상하는 방법
US8019599B2 (en) Speech codecs
EP0786760B1 (en) Speech coding
AU763409B2 (en) Complex signal activity detection for improved speech/noise classification of an audio signal
US20060116874A1 (en) Noise-dependent postfiltering
US6898566B1 (en) Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
US7613607B2 (en) Audio enhancement in coded domain
KR100754591B1 (ko) 음성 코더에서 목표 비트율을 유지하는 방법 및 장치
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
KR100754580B1 (ko) 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치
US20100106490A1 (en) Method and Speech Encoder with Length Adjustment of DTX Hangover Period
US6424942B1 (en) Methods and arrangements in a telecommunications system
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
KR100756570B1 (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치
AU6533799A (en) Method for transmitting data in wireless speech channels
EP1397655A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JP3896654B2 (ja) 音声信号区間検出方法及び装置
CN100369108C (zh) 编码域中的音频增强的方法和设备

Legal Events

Date Code Title Description
PA0105 International application

St.27 status event code: A-0-1-A10-A15-nap-PA0105

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

G170 Re-publication after modification of scope of protection [patent]
PG1701 Publication of correction

St.27 status event code: A-3-3-P10-P19-oth-PG1701

Patent document republication publication date: 20011015

Republication note text: Correction Notice

Gazette number: 1020010024869

Gazette reference publication date: 20010326

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

A201 Request for examination
PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

T11-X000 Administrative time limit extension requested

St.27 status event code: U-3-3-T10-T11-oth-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U12-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

FPAY Annual fee payment
PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

FPAY Annual fee payment
PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 10

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 11

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20170425

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20170425

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000