KR102060208B1 - 적응적 음성 명료도 처리기 - Google Patents
적응적 음성 명료도 처리기 Download PDFInfo
- Publication number
- KR102060208B1 KR102060208B1 KR1020147004922A KR20147004922A KR102060208B1 KR 102060208 B1 KR102060208 B1 KR 102060208B1 KR 1020147004922 A KR1020147004922 A KR 1020147004922A KR 20147004922 A KR20147004922 A KR 20147004922A KR 102060208 B1 KR102060208 B1 KR 102060208B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- speech
- enhancement
- speech signal
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
도 1은 음성 향상 시스템(voice enhancement system)을 구현할 수 있는 휴대폰 환경의 일 실시예를 나타낸 도면.
도 2는 음성 향상 시스템의 보다 상세한 실시예를 나타낸 도면.
도 3은 적응적 음성 향상 모듈(adaptive voice enhancement module)의 일 실시예를 나타낸 도면.
도 4는 음성 스펙트럼의 예시적인 플롯을 나타낸 도면.
도 5는 적응적 음성 향상 모듈의 다른 실시예를 나타낸 도면.
도 6은 시간 엔벨로프 정형기(temporal envelope shaper)의 일 실시예를 나타낸 도면.
도 7은 시간 영역 음성 엔벨로프의 예시적인 플롯을 나타낸 도면.
도 8은 어택(attack) 및 디케이(decay) 엔벨로프의 예시적인 플롯을 나타낸 도면.
도 9는 음성 검출 프로세스의 일 실시예를 나타낸 도면.
도 10은 마이크 교정 프로세스의 일 실시예를 나타낸 도면.
106: 송신기 108: 수신자 전화
110: 음성 향상 시스템 112: 마이크 입력
114: 출력 202: 음성 입력 신호
204: 마이크 입력(음성 및/또는 잡음) 212: 음성 활동 검출기
220: 적응적 음성 향상 모듈 222: 음성 향상 제어기
226: 추가의 향상 제어 230: 출력 이득 제어기
232: 레벨 제어 234: 마이크 교정 모듈
240: 클리핑 감소 모듈 250: 출력
310: 프리필터 312: LPC 분석 모듈
314: LPC-LSF 매핑 모듈 316: 포먼트 향상 모듈
322: 전영점 필터 324: 여기 신호
326: 향상된 전극점 필터 332: 시간 엔벨로프 정형기
526a: 향상된 전극점 필터 526b: 향상된 전극점 필터
602: 입력 610a: 서브대역
610b: 대역 1 610b: 대역 N
612: 서브 보상 이득 622: 엔벨로프 검출기
624: 엔벨로프 정형기 634: 출력
Claims (20)
- 음성 명료도(voice intelligibility) 향상을 조절하는 방법에 있어서,
입력 음성 신호를 수신하는 단계;
선형 예측 코딩(linear predictive coding; LPC) 프로세스에 의해 상기 입력 음성 신호의 스펙트럼 표현 - 상기 스펙트럼 표현은 하나 이상의 포먼트 주파수(formant frequency)를 포함함 - 을 획득하는 단계;
상기 하나 이상의 포먼트 주파수를 강조하도록 구성되는 향상 필터(enhancement filter)를 생성하기 위해 하나 이상의 프로세서에 의해 상기 입력 음성 신호의 상기 스펙트럼 표현을 조절하는 단계;
여기 신호(excitation signal)를 획득하기 위해 상기 입력 음성 신호에 역필터(inverse filter)를 적용하는 단계;
향상된 포먼트 주파수를 갖는 제1 수정된 음성 신호를 생성하기 위해 상기 여기 신호에 상기 향상 필터를 적용하는 단계;
제2 수정된 음성 신호를 생성하기 위해 상기 입력 음성 신호에 상기 향상 필터를 적용하는 단계;
결합된 수정된 음성 신호를 생성하기 위해 상기 제1 수정된 음성 신호의 적어도 일부를 상기 제2 수정된 음성 신호의 적어도 일부와 결합하는 단계;
상기 결합된 수정된 음성 신호에 기초하여 시간 엔벨로프(temporal envelope)를 검출하는 단계;
하나 이상의 시간 향상 파라미터를 결정하기 위해 상기 결합된 수정된 음성 신호의 엔벨로프를 분석하는 단계; 및
출력 음성 신호를 생성하기 위해 상기 결합된 수정된 음성 신호에 상기 하나 이상의 시간 향상 파라미터를 적용하는 단계
를 포함하고,
적어도 상기 하나 이상의 시간 향상 파라미터를 적용하는 단계는 하나 이상의 프로세서에 의해 수행되는 것인, 음성 명료도 향상을 조절하는 방법. - 제1항에 있어서, 상기 결합된 수정된 음성 신호에 상기 하나 이상의 시간 향상 파라미터를 적용하는 단계는, 상기 결합된 수정된 음성 신호에서의 선택된 자음을 강조하기 위해 상기 결합된 수정된 음성 신호의 하나 이상의 엔벨로프에서의 피크를 예리하게 하는 단계를 포함하는 것인, 음성 명료도 향상을 조절하는 방법.
- 삭제
- 삭제
- 음성 명료도 향상을 조절하는 시스템에 있어서,
입력 음성 신호의 적어도 일부의 스펙트럼 표현 - 상기 스펙트럼 표현은 하나 이상의 포먼트 주파수를 포함함 - 을 획득하도록 구성되는 분석 모듈;
여기 신호를 획득하기 위해 상기 입력 음성 신호에 적용되도록 구성되는 역필터;
상기 하나 이상의 포먼트 주파수를 강조하도록 구성되는 향상 필터를 생성하도록 구성되는 포먼트 향상 모듈(formant enhancement module);
제1 수정된 음성 신호를 생성하기 위해 하나 이상의 프로세서에 의해 상기 여기 신호에 적용되도록 구성되고, 또한 제2 수정된 음성 신호를 생성하기 위해 상기 하나 이상의 프로세서에 의해 상기 입력 음성 신호에 적용되도록 구성되는 상기 향상 필터;
결합된 수정된 음성 신호를 생성하기 위해 상기 제1 수정된 음성 신호의 적어도 일부를 상기 제2 수정된 음성 신호의 적어도 일부와 결합하도록 구성되는 결합기; 및
상기 결합된 수정된 음성 신호의 하나 이상의 엔벨로프에 적어도 부분적으로 기초하여 상기 결합된 수정된 음성 신호에 시간 향상을 적용하도록 구성되는 시간 엔벨로프 정형기(temporal enveloper shaper)
를 포함하는, 음성 명료도 향상을 조절하는 시스템. - 제5항에 있어서, 상기 분석 모듈은 또한, 상기 스펙트럼 표현에 대응하는 계수들을 생성시키도록 구성되는 선형 예측 코딩 기법을 사용하여 상기 입력 음성 신호의 상기 스펙트럼 표현을 획득하도록 구성되는 것인, 음성 명료도 향상을 조절하는 시스템.
- 제6항에 있어서, 상기 계수들을 선 스펙트럼 쌍(line spectral pair)에 매핑하도록 구성되는 매핑 모듈을 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 제7항에 있어서, 상기 포먼트 주파수에 대응하는 상기 스펙트럼 표현에서 이득을 증가시키기 위해 상기 선 스펙트럼 쌍을 수정하는 것을 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 삭제
- 제5항에 있어서, 상기 시간 엔벨로프 정형기는 또한, 상기 결합된 수정된 음성 신호를 복수의 대역으로 세분하도록 구성되고, 상기 하나 이상의 엔벨로프는 상기 복수의 대역 중 적어도 일부에 대한 엔벨로프에 대응하는 것인, 음성 명료도 향상을 조절하는 시스템.
- 제5항에 있어서, 입력 마이크 신호에서 검출된 환경 잡음의 양에 적어도 부분적으로 기초하여 상기 향상 필터의 이득을 조절하도록 구성되는 음성 향상 제어기(voice enhancement controller)를 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 제11항에 있어서, 상기 입력 마이크 신호에서 음성을 검출하고 상기 검출된 음성에 응답하여 상기 음성 향상 제어기를 제어하도록 구성되는 음성 활동 검출기(voice activity detector)를 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 제12항에 있어서, 상기 음성 활동 검출기는 또한, 상기 음성 향상 제어기로 하여금, 상기 입력 마이크 신호에서 음성을 검출한 것에 응답하여, 이전의 잡음 입력에 기초하여 상기 향상 필터의 이득을 조절하게 하도록 구성되는 것인, 음성 명료도 향상을 조절하는 시스템.
- 제11항에 있어서, 상기 입력 마이크 신호를 수신하도록 구성되는 마이크의 이득을 설정하도록 구성되는 마이크 교정 모듈(microphone calibration module)을 더 포함하고, 상기 마이크 교정 모듈은 또한, 기준 신호 및 기록된 잡음 신호에 적어도 부분적으로 기초하여 상기 이득을 설정하도록 구성되는 것인, 음성 명료도 향상을 조절하는 시스템.
- 음성 명료도 향상을 조절하는 시스템에 있어서,
입력 음성 신호의 스펙트럼 - 상기 스펙트럼은 하나 이상의 포먼트 주파수를 포함함 - 에 대응하는 선형 예측 코딩(linear predictive coding; LPC) 계수들을 획득하기 위해 LPC 기법을 적용하도록 구성되는 선형 예측 코딩 분석 모듈;
상기 LPC 계수들을 선 스펙트럼 쌍에 매핑하도록 구성되는 매핑 모듈; 및
하나 이상의 프로세서를 포함하고, 상기 선 스펙트럼 쌍을 수정하여 상기 입력 음성 신호의 스펙트럼을 조절하고 상기 하나 이상의 포먼트 주파수를 강조하도록 구성되는 향상 필터를 생성하도록 구성되는 포먼트 향상 모듈(formant enhancement module);
제1 수정된 음성 신호를 생성하기 위해 상기 입력 음성 신호로부터 도출되는 여기 신호에 적용되도록 구성되고, 제2 수정된 음성 신호를 생성하기 위해 상기 입력 음성 신호에 적용되도록 구성되는 상기 향상 필터;
결합된 수정된 음성 신호를 생성하기 위해 상기 제1 수정된 음성 신호의 적어도 일부를 상기 제2 수정된 음성 신호의 적어도 일부와 결합하도록 구성되는 결합기; 및
상기 결합된 수정된 음성 신호에 기초하여 음성 신호를 출력하도록 구성되는 출력 모듈
을 포함하는, 음성 명료도 향상을 조절하는 시스템. - 제15항에 있어서, 입력 마이크 신호에서 음성을 검출하고, 상기 입력 마이크 신호에서 음성을 검출한 것에 응답하여, 상기 향상 필터의 이득이 조절되게 하도록 구성되는 음성 활동 검출기를 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 제16항에 있어서, 상기 입력 마이크 신호를 수신하도록 구성되는 마이크의 이득을 설정하도록 구성되는 마이크 교정 모듈을 더 포함하고, 상기 마이크 교정 모듈은 또한, 기준 신호 및 기록된 잡음 신호에 적어도 부분적으로 기초하여 상기 이득을 설정하도록 구성되는 것인, 음성 명료도 향상을 조절하는 시스템.
- 삭제
- 제15항에 있어서, 상기 결합된 수정된 음성 신호의 하나 이상의 엔벨로프에 적어도 부분적으로 기초하여 상기 결합된 수정된 음성 신호에 시간 향상을 적용하도록 구성되는 시간 엔벨로프 정형기를 더 포함하는, 음성 명료도 향상을 조절하는 시스템.
- 제19항에 있어서, 상기 시간 엔벨로프 정형기는 또한, 상기 결합된 수정된 음성 신호의 선택된 부분을 강조하기 위해 상기 결합된 수정된 음성 신호의 하나 이상의 엔벨로프에서의 피크를 예리하게 하도록 구성되는 것인, 음성 명료도 향상을 조절하는 시스템.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161513298P | 2011-07-29 | 2011-07-29 | |
| US61/513,298 | 2011-07-29 | ||
| PCT/US2012/048378 WO2013019562A2 (en) | 2011-07-29 | 2012-07-26 | Adaptive voice intelligibility processor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20140079363A KR20140079363A (ko) | 2014-06-26 |
| KR102060208B1 true KR102060208B1 (ko) | 2019-12-27 |
Family
ID=46750434
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020147004922A Active KR102060208B1 (ko) | 2011-07-29 | 2012-07-26 | 적응적 음성 명료도 처리기 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US9117455B2 (ko) |
| EP (1) | EP2737479B1 (ko) |
| JP (1) | JP6147744B2 (ko) |
| KR (1) | KR102060208B1 (ko) |
| CN (1) | CN103827965B (ko) |
| PL (1) | PL2737479T3 (ko) |
| TW (1) | TWI579834B (ko) |
| WO (1) | WO2013019562A2 (ko) |
Families Citing this family (45)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2546026B (en) | 2010-10-01 | 2017-08-23 | Asio Ltd | Data communication system |
| US8918197B2 (en) * | 2012-06-13 | 2014-12-23 | Avraham Suhami | Audio communication networks |
| EP2798737B1 (en) | 2011-12-27 | 2018-10-10 | Dts Llc | Bass enhancement system |
| CN104143337B (zh) | 2014-01-08 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种提高音频信号音质的方法和装置 |
| JP6386237B2 (ja) * | 2014-02-28 | 2018-09-05 | 国立研究開発法人情報通信研究機構 | 音声明瞭化装置及びそのためのコンピュータプログラム |
| TR201809427T4 (tr) | 2014-03-25 | 2018-07-23 | Fraunhofer Ges Forschung | Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇ |
| US9747924B2 (en) | 2014-04-08 | 2017-08-29 | Empire Technology Development Llc | Sound verification |
| JP6565206B2 (ja) * | 2015-02-20 | 2019-08-28 | ヤマハ株式会社 | 音声処理装置および音声処理方法 |
| US9865256B2 (en) * | 2015-02-27 | 2018-01-09 | Storz Endoskop Produktions Gmbh | System and method for calibrating a speech recognition system to an operating environment |
| US9467569B2 (en) | 2015-03-05 | 2016-10-11 | Raytheon Company | Methods and apparatus for reducing audio conference noise using voice quality measures |
| EP3079151A1 (en) | 2015-04-09 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and method for encoding an audio signal |
| US10575103B2 (en) | 2015-04-10 | 2020-02-25 | Starkey Laboratories, Inc. | Neural network-driven frequency translation |
| EP3107097B1 (en) * | 2015-06-17 | 2017-11-15 | Nxp B.V. | Improved speech intelligilibility |
| US9847093B2 (en) | 2015-06-19 | 2017-12-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing speech signal |
| US9843875B2 (en) | 2015-09-25 | 2017-12-12 | Starkey Laboratories, Inc. | Binaurally coordinated frequency translation in hearing assistance devices |
| CN106558298A (zh) * | 2015-09-29 | 2017-04-05 | 广州酷狗计算机科技有限公司 | 一种音效模拟方法和装置及系统 |
| CN109416914B (zh) * | 2016-06-24 | 2023-09-26 | 三星电子株式会社 | 适于噪声环境的信号处理方法和装置及使用其的终端装置 |
| GB201617409D0 (en) * | 2016-10-13 | 2016-11-30 | Asio Ltd | A method and system for acoustic communication of data |
| US12341931B2 (en) | 2016-10-13 | 2025-06-24 | Sonos Experience Limited | Method and system for acoustic communication of data |
| GB201617408D0 (en) | 2016-10-13 | 2016-11-30 | Asio Ltd | A method and system for acoustic communication of data |
| CN106340306A (zh) * | 2016-11-04 | 2017-01-18 | 厦门盈趣科技股份有限公司 | 一种提高语音识别度的方法及装置 |
| CN106847249B (zh) * | 2017-01-25 | 2020-10-27 | 得理电子(上海)有限公司 | 一种发音处理方法及系统 |
| JP6646001B2 (ja) * | 2017-03-22 | 2020-02-14 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
| GB201704636D0 (en) | 2017-03-23 | 2017-05-10 | Asio Ltd | A method and system for authenticating a device |
| GB2565751B (en) | 2017-06-15 | 2022-05-04 | Sonos Experience Ltd | A method and system for triggering events |
| CN107346659B (zh) * | 2017-06-05 | 2020-06-23 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置及终端 |
| CN110800050B (zh) * | 2017-06-27 | 2023-07-18 | 美商楼氏电子有限公司 | 使用跟踪信号的后线性化系统和方法 |
| AT520106B1 (de) * | 2017-07-10 | 2019-07-15 | Isuniye Llc | Verfahren zum Modifizieren eines Eingangssignals |
| US10200003B1 (en) * | 2017-10-03 | 2019-02-05 | Google Llc | Dynamically extending loudspeaker capabilities |
| GB2570634A (en) | 2017-12-20 | 2019-08-07 | Asio Ltd | A method and system for improved acoustic transmission of data |
| JP7374099B2 (ja) * | 2018-01-03 | 2023-11-06 | ユニバーサル エレクトロニクス インコーポレイテッド | 制御デバイスにおいて音声入力を指示する装置、システム及び方法 |
| CN110610702B (zh) * | 2018-06-15 | 2022-06-24 | 惠州迪芬尼声学科技股份有限公司 | 以自然语言声控均衡器的方法及计算器可读存储介质 |
| CN109346058B (zh) * | 2018-11-29 | 2024-06-28 | 西安交通大学 | 一种语音声学特征扩大系统 |
| EP3671741A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency-enhanced audio signal using pulse processing |
| KR102096588B1 (ko) * | 2018-12-27 | 2020-04-02 | 인하대학교 산학협력단 | 음향 장치에서 맞춤 오디오 잡음을 이용해 사생활 보호를 구현하는 기술 |
| CN114402388B (zh) * | 2019-09-11 | 2025-06-06 | Dts公司 | 上下文感知语音可懂度增强 |
| CN113823299A (zh) * | 2020-06-19 | 2021-12-21 | 北京字节跳动网络技术有限公司 | 用于骨传导的音频处理方法、装置、终端和存储介质 |
| TWI748587B (zh) * | 2020-08-04 | 2021-12-01 | 瑞昱半導體股份有限公司 | 聲音事件偵測系統及方法 |
| US11988784B2 (en) | 2020-08-31 | 2024-05-21 | Sonos, Inc. | Detecting an audio signal with a microphone to determine presence of a playback device |
| CA3193267A1 (en) * | 2020-09-14 | 2022-03-17 | Pindrop Security, Inc. | Speaker specific speech enhancement |
| US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
| US11581004B2 (en) * | 2020-12-02 | 2023-02-14 | HearUnow, Inc. | Dynamic voice accentuation and reinforcement |
| CN113555033B (zh) * | 2021-07-30 | 2024-09-27 | 乐鑫信息科技(上海)股份有限公司 | 语音交互系统的自动增益控制方法、装置及系统 |
| US12284499B1 (en) | 2022-06-03 | 2025-04-22 | Meta Platforms Technologies, Llc | Augmented hearing via adaptive self-reinforcement |
| TWI878887B (zh) | 2023-05-16 | 2025-04-01 | 宏碁股份有限公司 | 音訊參數設定方法及電子裝置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001031632A1 (en) | 1999-10-26 | 2001-05-03 | The University Of Melbourne | Emphasis of short-duration transient speech features |
| US20040042622A1 (en) * | 2002-08-29 | 2004-03-04 | Mutsumi Saito | Speech Processing apparatus and mobile communication terminal |
Family Cites Families (113)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3101446A (en) | 1960-09-02 | 1963-08-20 | Itt | Signal to noise ratio indicator |
| US3127477A (en) | 1962-06-27 | 1964-03-31 | Bell Telephone Labor Inc | Automatic formant locator |
| US3327057A (en) * | 1963-11-08 | 1967-06-20 | Bell Telephone Labor Inc | Speech analysis |
| US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
| US4586193A (en) * | 1982-12-08 | 1986-04-29 | Harris Corporation | Formant-based speech synthesizer |
| JPS59226400A (ja) * | 1983-06-07 | 1984-12-19 | 松下電器産業株式会社 | 音声認識装置 |
| US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
| US4882758A (en) | 1986-10-23 | 1989-11-21 | Matsushita Electric Industrial Co., Ltd. | Method for extracting formant frequencies |
| US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
| GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
| CA2056110C (en) | 1991-03-27 | 1997-02-04 | Arnold I. Klayman | Public address intelligibility system |
| US5175769A (en) | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
| KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
| US5590241A (en) * | 1993-04-30 | 1996-12-31 | Motorola Inc. | Speech processing system and method for enhancing a speech signal in a noisy environment |
| JP3235925B2 (ja) | 1993-11-19 | 2001-12-04 | 松下電器産業株式会社 | ハウリング抑制装置 |
| US5471527A (en) | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
| US5537479A (en) | 1994-04-29 | 1996-07-16 | Miller And Kreisel Sound Corp. | Dual-driver bass speaker with acoustic reduction of out-of-phase and electronic reduction of in-phase distortion harmonics |
| US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
| GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
| US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
| DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
| US5864798A (en) * | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
| JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
| US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
| US5737719A (en) * | 1995-12-19 | 1998-04-07 | U S West, Inc. | Method and apparatus for enhancement of telephonic speech signals |
| US5742689A (en) | 1996-01-04 | 1998-04-21 | Virtual Listening Systems, Inc. | Method and device for processing a multichannel signal for use with a headphone |
| SE506341C2 (sv) * | 1996-04-10 | 1997-12-08 | Ericsson Telefon Ab L M | Metod och anordning för rekonstruktion av en mottagen talsignal |
| DE69730779T2 (de) | 1996-06-19 | 2005-02-10 | Texas Instruments Inc., Dallas | Verbesserungen bei oder in Bezug auf Sprachkodierung |
| US6766176B1 (en) | 1996-07-23 | 2004-07-20 | Qualcomm Incorporated | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
| JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
| GB2319379A (en) * | 1996-11-18 | 1998-05-20 | Secr Defence | Speech processing system |
| US5930373A (en) * | 1997-04-04 | 1999-07-27 | K.S. Waves Ltd. | Method and system for enhancing quality of sound signal |
| US6006185A (en) * | 1997-05-09 | 1999-12-21 | Immarco; Peter | System and device for advanced voice recognition word spotting |
| US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
| GB9714001D0 (en) * | 1997-07-02 | 1997-09-10 | Simoco Europ Limited | Method and apparatus for speech enhancement in a speech communication system |
| US6169971B1 (en) * | 1997-12-03 | 2001-01-02 | Glenayre Electronics, Inc. | Method to suppress noise in digital voice processing |
| US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
| US7392180B1 (en) * | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
| US6768801B1 (en) * | 1998-07-24 | 2004-07-27 | Siemens Aktiengesellschaft | Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same |
| US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
| US6073093A (en) * | 1998-10-14 | 2000-06-06 | Lockheed Martin Corp. | Combined residual and analysis-by-synthesis pitch-dependent gain estimation for linear predictive coders |
| US6993480B1 (en) * | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
| US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
| US6233552B1 (en) * | 1999-03-12 | 2001-05-15 | Comsat Corporation | Adaptive post-filtering technique based on the Modified Yule-Walker filter |
| US7423983B1 (en) | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
| US6732073B1 (en) * | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
| US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
| US7277767B2 (en) | 1999-12-10 | 2007-10-02 | Srs Labs, Inc. | System and method for enhanced streaming audio |
| JP2001175298A (ja) * | 1999-12-13 | 2001-06-29 | Fujitsu Ltd | 騒音抑圧装置 |
| US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
| WO2001059766A1 (en) * | 2000-02-11 | 2001-08-16 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
| US6606388B1 (en) * | 2000-02-17 | 2003-08-12 | Arboretum Systems, Inc. | Method and system for enhancing audio signals |
| US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
| WO2002015395A1 (en) | 2000-07-27 | 2002-02-21 | Clear Audio Ltd. | Voice enhancement system |
| US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
| EP1376539B8 (en) | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
| EP1280138A1 (de) | 2001-07-24 | 2003-01-29 | Empire Interactive Europe Ltd. | Verfahren zur Analyse von Audiosignalen |
| JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
| US6985857B2 (en) * | 2001-09-27 | 2006-01-10 | Motorola, Inc. | Method and apparatus for speech coding using training and quantizing |
| US7065485B1 (en) * | 2002-01-09 | 2006-06-20 | At&T Corp | Enhancing speech intelligibility using variable-rate time-scale modification |
| US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
| US6950799B2 (en) * | 2002-02-19 | 2005-09-27 | Qualcomm Inc. | Speech converter utilizing preprogrammed voice profiles |
| US20050246170A1 (en) | 2002-06-19 | 2005-11-03 | Koninklijke Phillips Electronics N.V. | Audio signal processing apparatus and method |
| US7233896B2 (en) * | 2002-07-30 | 2007-06-19 | Motorola Inc. | Regular-pulse excitation speech coder |
| CA2399159A1 (en) | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
| US7146316B2 (en) | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
| EP1557827B8 (en) * | 2002-10-31 | 2015-01-07 | Fujitsu Limited | Voice intensifier |
| FR2850781B1 (fr) | 2003-01-30 | 2005-05-06 | Jean Luc Crebouw | Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede |
| US7424423B2 (en) | 2003-04-01 | 2008-09-09 | Microsoft Corporation | Method and apparatus for formant tracking using a residual model |
| DE10323126A1 (de) | 2003-05-22 | 2004-12-16 | Rcm Technology Gmbh | Adaptive Bassanhebung für aktive Basslautsprecherboxen |
| AU2004248544B2 (en) | 2003-05-28 | 2010-02-18 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
| KR100511316B1 (ko) | 2003-10-06 | 2005-08-31 | 엘지전자 주식회사 | 음성신호의 포만트 주파수 검출방법 |
| KR20050049103A (ko) * | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
| ATE396537T1 (de) | 2004-01-19 | 2008-06-15 | Nxp Bv | System für die audiosignalverarbeitung |
| WO2005112005A1 (ja) * | 2004-04-27 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 |
| EP1770688B1 (en) | 2004-07-21 | 2013-03-06 | Fujitsu Limited | Speed converter, speed converting method and program |
| US7643993B2 (en) * | 2006-01-05 | 2010-01-05 | Broadcom Corporation | Method and system for decoding WCDMA AMR speech data using redundancy |
| WO2006030864A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号装置、通信装置及び音声符号化方法 |
| US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
| WO2006104555A2 (en) * | 2005-03-24 | 2006-10-05 | Mindspeed Technologies, Inc. | Adaptive noise state update for a voice activity detector |
| US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
| CN100580775C (zh) | 2005-04-21 | 2010-01-13 | Srs实验室有限公司 | 用于减小音频噪声的系统和方法 |
| US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
| US20070005351A1 (en) * | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
| DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
| US20070134635A1 (en) | 2005-12-13 | 2007-06-14 | Posit Science Corporation | Cognitive training using formant frequency sweeps |
| US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
| US7831420B2 (en) * | 2006-04-04 | 2010-11-09 | Qualcomm Incorporated | Voice modifier for speech processing systems |
| US8589151B2 (en) * | 2006-06-21 | 2013-11-19 | Harris Corporation | Vocoder and associated method that transcodes between mixed excitation linear prediction (MELP) vocoders with different speech frame rates |
| US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
| DE602006005684D1 (de) * | 2006-10-31 | 2009-04-23 | Harman Becker Automotive Sys | Modellbasierte Verbesserung von Sprachsignalen |
| EP2096632A4 (en) * | 2006-11-29 | 2012-06-27 | Panasonic Corp | DECODING DEVICE AND AUDIO DECODING METHOD |
| SG144752A1 (en) * | 2007-01-12 | 2008-08-28 | Sony Corp | Audio enhancement method and system |
| JP2008197200A (ja) | 2007-02-09 | 2008-08-28 | Ari Associates:Kk | 了解度自動調整装置及び了解度自動調整方法 |
| EP2116997A4 (en) * | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO-DECODING DEVICE AND AUDIO-DECODING METHOD |
| KR100876794B1 (ko) | 2007-04-03 | 2009-01-09 | 삼성전자주식회사 | 이동 단말에서 음성의 명료도 향상 장치 및 방법 |
| US20080249783A1 (en) * | 2007-04-05 | 2008-10-09 | Texas Instruments Incorporated | Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding |
| US20080312916A1 (en) * | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
| US8606566B2 (en) | 2007-10-24 | 2013-12-10 | Qnx Software Systems Limited | Speech enhancement through partial speech reconstruction |
| JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
| US8315398B2 (en) | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
| JP5219522B2 (ja) * | 2008-01-09 | 2013-06-26 | アルパイン株式会社 | 音声明瞭度改善システム及び音声明瞭度改善方法 |
| EP2151821B1 (en) * | 2008-08-07 | 2011-12-14 | Nuance Communications, Inc. | Noise-reduction processing of speech signals |
| KR101547344B1 (ko) * | 2008-10-31 | 2015-08-27 | 삼성전자 주식회사 | 음성복원장치 및 그 방법 |
| GB0822537D0 (en) * | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
| JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
| US8626516B2 (en) * | 2009-02-09 | 2014-01-07 | Broadcom Corporation | Method and system for dynamic range control in an audio processing system |
| WO2010148141A2 (en) * | 2009-06-16 | 2010-12-23 | University Of Florida Research Foundation, Inc. | Apparatus and method for speech analysis |
| US8204742B2 (en) | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
| WO2011080855A1 (ja) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
| US8798992B2 (en) * | 2010-05-19 | 2014-08-05 | Disney Enterprises, Inc. | Audio noise modification for event broadcasting |
| US8606572B2 (en) * | 2010-10-04 | 2013-12-10 | LI Creative Technologies, Inc. | Noise cancellation device for communications in high noise environments |
| US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
-
2012
- 2012-07-26 CN CN201280047329.2A patent/CN103827965B/zh active Active
- 2012-07-26 JP JP2014523980A patent/JP6147744B2/ja active Active
- 2012-07-26 KR KR1020147004922A patent/KR102060208B1/ko active Active
- 2012-07-26 EP EP12751170.7A patent/EP2737479B1/en active Active
- 2012-07-26 WO PCT/US2012/048378 patent/WO2013019562A2/en active Application Filing
- 2012-07-26 PL PL12751170T patent/PL2737479T3/pl unknown
- 2012-07-26 US US13/559,450 patent/US9117455B2/en active Active
- 2012-07-27 TW TW101127284A patent/TWI579834B/zh active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001031632A1 (en) | 1999-10-26 | 2001-05-03 | The University Of Melbourne | Emphasis of short-duration transient speech features |
| US20040042622A1 (en) * | 2002-08-29 | 2004-03-04 | Mutsumi Saito | Speech Processing apparatus and mobile communication terminal |
Non-Patent Citations (2)
| Title |
|---|
| Takayuki Arai, et al. Effective speech processing for various impaired listeners. Proceedings the 18th International Congress on Acoustics. 2004.* |
| Thomas Baer, et al. Spectral contrast enhancement of speech in noise for listeners with sensorineural hearing impairment. Journal of rehabilitation research and development. 1993.* |
Also Published As
| Publication number | Publication date |
|---|---|
| TWI579834B (zh) | 2017-04-21 |
| KR20140079363A (ko) | 2014-06-26 |
| US9117455B2 (en) | 2015-08-25 |
| US20130030800A1 (en) | 2013-01-31 |
| TW201308316A (zh) | 2013-02-16 |
| PL2737479T3 (pl) | 2017-07-31 |
| JP6147744B2 (ja) | 2017-06-14 |
| CN103827965A (zh) | 2014-05-28 |
| CN103827965B (zh) | 2016-05-25 |
| HK1197111A1 (en) | 2015-01-02 |
| JP2014524593A (ja) | 2014-09-22 |
| WO2013019562A2 (en) | 2013-02-07 |
| EP2737479A2 (en) | 2014-06-04 |
| EP2737479B1 (en) | 2017-01-18 |
| WO2013019562A3 (en) | 2014-03-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102060208B1 (ko) | 적응적 음성 명료도 처리기 | |
| US20250104728A1 (en) | Post-processing gains for signal enhancement | |
| US8447617B2 (en) | Method and system for speech bandwidth extension | |
| US9361901B2 (en) | Integrated speech intelligibility enhancement system and acoustic echo canceller | |
| CN113823319B (zh) | 改进的语音可懂度 | |
| RU2464652C2 (ru) | Способ и устройство для оценки энергии полосы высоких частот в системе расширения полосы частот | |
| RU2447415C2 (ru) | Способ и устройство для расширения ширины полосы аудиосигнала | |
| RU2638744C2 (ru) | Устройство и способ для уменьшения шума квантования в декодере временной области | |
| US11128954B2 (en) | Method and electronic device for managing loudness of audio signal | |
| JP7658953B2 (ja) | コンテキスト適応の音声了解度を向上させる方法 | |
| RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
| HK1197111B (en) | Adaptive voice intelligibility processor | |
| JP2011071806A (ja) | 電子機器、及び電子機器の音量制御プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20140225 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20170725 Comment text: Request for Examination of Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190405 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190927 |
|
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20191220 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20191220 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20221212 Start annual number: 4 End annual number: 4 |
|
| PR1001 | Payment of annual fee |
Payment date: 20231213 Start annual number: 5 End annual number: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20241210 Start annual number: 6 End annual number: 6 |