JP4882899B2 - 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム - Google Patents
音声解析装置、および音声解析方法、並びにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP4882899B2 JP4882899B2 JP2007193931A JP2007193931A JP4882899B2 JP 4882899 B2 JP4882899 B2 JP 4882899B2 JP 2007193931 A JP2007193931 A JP 2007193931A JP 2007193931 A JP2007193931 A JP 2007193931A JP 4882899 B2 JP4882899 B2 JP 4882899B2
- Authority
- JP
- Japan
- Prior art keywords
- relative pitch
- pitch difference
- analysis
- speech
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1807—Speech classification or search using natural language modelling using prosody or stress
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
音声情報の韻律的特徴を解析して韻律識別結果を出力する音声解析装置であり、
音声情報の入力を行う入力部と、
前記入力部から入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析し、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出する音響分析部と、
前記音響分析部の生成した相対ピッチ変化量に基づく音声識別処理を実行する識別部を有し、
前記音響分析部は、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求め、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定し、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求め、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出する構成であることを特徴とする音声解析装置にある。
T=log(2)−δ
上記式によって定義される閾値、およびマージン値を適用した処理を実行する構成であることを特徴とする。
音声解析装置において、音声情報の韻律的特徴を解析して韻律識別結果を出力する音声解析方法であり、
入力部が、音声情報の入力を行う入力ステップと、
音響分析部が、前記入力部から入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析し、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出する音響分析ステップと、
識別部が、前記音響分析部の生成した相対ピッチ変化量に基づく音声識別処理を実行する識別ステップを有し、
前記音響分析ステップは、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求め、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定し、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求め、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出するステップであることを特徴とする音声解析方法にある。
T=log(2)−δ
上記式によって定義される閾値、およびマージン値を適用した処理を実行するステップであることを特徴とする。
音声解析装置において、音声情報の韻律的特徴を解析して韻律識別結果を出力させるコンピュータ・プログラムであり、
入力部に、音声情報の入力を行わせる入力ステップと、
音響分析部に、前記入力部から入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析させて、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出させる音響分析ステップと、
識別部に、前記音響分析部の生成した相対ピッチ変化量に基づく音声識別処理を実行させる識別ステップを有し、
前記音響分析ステップは、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求め、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定し、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求め、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出させるステップであることを特徴とするコンピュータ・プログラムにある。
韻律識別部32は、入力された音声信号の韻律識別処理を実行する。韻律とは、イントネーション、スピードの変化、大きさの変化など、テキストとして表現できない音声情報の特徴を示すものである。韻律識別部32による韻律識別処理の詳細については後述する。
音響分析部52は、図2に示すように、周波数特性分析部61と相対ピッチ変化量計算部62の2つを有して成る。
(a)時間的に異なる分析フレームにおける2つの周波数特性、
(b)分析フレームの周波数特性と固定されたテンプレート周波数特性、
Y=(y1,y2,…yN)T ・・・(式2)
M=X×YT ・・・(式3)
(a)分析フレームの周波数特性とテンプレート周波数特性との比較による第1の相対ピッチ差、
(b)時間的に隣接する部分の周波数特性との比較による第2の相対ピッチ差、
これら(a)、(b)の2つの相対ピッチ差を求め、これら2種類の相対ピッチ差を利用して本来のピッチ周波数のピーク成分を確実に検出して正しい相対ピッチ差を得ることを可能としている。
なお、
T:閾値
δ:マージン値
である。
31 入力部
32 韻律識別部
33 音声認識部
34 結果選択部
35 特定単語記憶部
36 出力部
51 入力部
52 音響分析部
53 識別部
54 パラメータ記憶部
55 出力部
61 周波数特性分析部
62 相対ピッチ変化量計算部
Claims (19)
- 音声情報の韻律的特徴を解析して韻律識別結果を出力する音声解析装置であり、
音声情報の入力を行う入力部と、
前記入力部から入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析し、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出する音響分析部と、
前記音響分析部の生成した相対ピッチ変化量に基づく音声識別処理を実行する識別部を有し、
前記音響分析部は、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求め、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定し、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求め、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出する構成であることを特徴とする音声解析装置。 - 前記音響分析部は、
前記先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下である場合は、前記現行テンプレート相対ピッチ差を現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出する構成であることを特徴とする請求項1に記載の音声解析装置。 - 前記音響分析部は、
前記先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下でなく、かつ、前記隣接相対ピッチ差が予め設定されたマージン値以下でない場合は、前記現行テンプレート相対ピッチ差を現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出する構成であることを特徴とする請求項1に記載の音声解析装置。 - 前記音響分析部は、
相対ピッチ差を算出する2つの周波数特性の関係を定義する相互相関行列を算出し、相互相関行列の構成データの値のピーク位置を結ぶ稜線の前記相互相関行列の主対角線からのシフト量に相当する値を相対ピッチ差として算出する構成であることを特徴とする請求項1〜3いずれかに記載の音声解析装置。 - 前記音響分析部は、
前記周波数特性情報を対数周波数軸上で表現した周波数特性情報を生成し、
前記閾値をT、前記マージン値をδとした場合、
T=log(2)−δ
上記式によって定義される閾値、およびマージン値を適用した処理を実行する構成であることを特徴とする請求項1〜4いずれかに記載の音声解析装置。 - 前記識別部は、
予め記憶部に格納された韻律識別単位辞書に相当するパラメータと、前記音響分析部の生成する相対ピッチ変化量データとを比較して音声識別処理を実行する構成であることを特徴とする請求項1〜5いずれかに記載の音声解析装置。 - 前記識別部は、
DP(Dynamic Programming)マッチング、またはニューラル・ネットワーク、またはHMM(隠れマルコフモデル)のいずれかを適用した処理により音声識別処理を実行する構成であることを特徴とする請求項6に記載の音声解析装置。 - 前記音声解析装置は、さらに、
前記入力部からの入力音声データに対応したテキスト情報を音声認識結果として出力する音声認識部と、
前記識別部の識別結果と、前記音声認識部の識別結果を適用して音声認識結果を出力する結果選択部と、
を有する構成であることを特徴とする請求項1〜7いずれかに記載の音声解析装置。 - 前記結果選択部は、
前記音声認識部における音声認識結果と特定単語記憶部に貯えられている特定単語との比較を行ない、音声認識結果が特定単語と一致する場合には、音声認識結果に、前記識別部において識別された韻律識別結果を付与して出力し、
前記音声認識結果が特定単語と一致しない場合は、音声認識結果をそのまま出力する構成であることを特徴とする請求項8に記載の音声解析装置。 - 音声解析装置において、音声情報の韻律的特徴を解析して韻律識別結果を出力する音声解析方法であり、
入力部が、音声情報の入力を行う入力ステップと、
音響分析部が、前記入力部から入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析し、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出する音響分析ステップと、
識別部が、前記音響分析部の生成した相対ピッチ変化量に基づく音声識別処理を実行する識別ステップを有し、
前記音響分析ステップは、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求め、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定し、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求め、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出するステップであることを特徴とする音声解析方法。 - 前記音響分析ステップは、
前記先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下である場合は、前記現行テンプレート相対ピッチ差を現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出するステップであることを特徴とする請求項10に記載の音声解析方法。 - 前記音響分析ステップは、
前記先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下でなく、かつ、前記隣接相対ピッチ差が予め設定されたマージン値以下でない場合は、前記現行テンプレート相対ピッチ差を現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出するステップであることを特徴とする請求項10に記載の音声解析方法。 - 前記音響分析ステップは、
相対ピッチ差を算出する2つの周波数特性の関係を定義する相互相関行列を算出し、相互相関行列の構成データの値のピーク位置を結ぶ稜線の前記相互相関行列の主対角線からのシフト量に相当する値を相対ピッチ差として算出するステップであることを特徴とする請求項10〜12いずれかに記載の音声解析方法。 - 前記音響分析ステップは、
前記周波数特性情報を対数周波数軸上で表現した周波数特性情報を生成し、
前記閾値をT、前記マージン値をδとした場合、
T=log(2)−δ
上記式によって定義される閾値、およびマージン値を適用した処理を実行するステップであることを特徴とする請求項10〜13いずれかに記載の音声解析方法。 - 前記識別ステップは、
予め記憶部に格納された韻律識別単位辞書に相当するパラメータと、前記音響分析部の生成する相対ピッチ変化量データとを比較して音声識別処理を実行するステップであることを特徴とする請求項10〜14いずれかに記載の音声解析方法。 - 前記識別ステップは、
DP(Dynamic Programming)マッチング、またはニューラル・ネットワーク、またはHMM(隠れマルコフモデル)のいずれかを適用した処理により音声識別処理を実行するステップであることを特徴とする請求項15に記載の音声解析方法。 - 前記音声解析方法は、さらに、
音声認識部が、前記入力部からの入力音声データに対応したテキスト情報を音声認識結果として出力する音声認識ステップと、
結果選択部が、前記識別部の識別結果と、前記音声認識部の識別結果を適用して音声認識結果を出力する結果選択ステップと、
を有することを特徴とする請求項10〜16いずれかに記載の音声解析方法。 - 前記結果選択ステップは、
前記音声認識部における音声認識結果と特定単語記憶部に貯えられている特定単語との比較を行ない、音声認識結果が特定単語と一致する場合には、音声認識結果に、前記識別部において識別された韻律識別結果を付与して出力し、
前記音声認識結果が特定単語と一致しない場合は、音声認識結果をそのまま出力するステップであることを特徴とする請求項17に記載の音声解析方法。 - 音声解析装置において、音声情報の韻律的特徴を解析して韻律識別結果を出力させるコンピュータ・プログラムであり、
前記音声解析装置に、
音声情報の入力を行わせる入力ステップと、
入力する音声情報に対して時系列に設定される分析フレーム各々の周波数特性を解析させて、各分析フレームの周波数特性の変化情報としての相対ピッチ変化量を算出させる音響分析ステップと、
前記音響分析ステップにおいて生成した相対ピッチ変化量に基づく音声識別処理を実行させる識別ステップを実行させ、
前記音響分析ステップにおいては、
現行分析フレームの周波数特性と、予め設定されたテンプレート周波数特性との間の相対ピッチ差である現行テンプレート相対ピッチ差を求めさせ、
前記現行分析フレームに時間的に先行する先行フレームの周波数特性と、前記テンプレート周波数特性との間の相対ピッチ差である先行テンプレート相対ピッチ差と、前記現行テンプレート相対ピッチ差との差分絶対値が予め定めた閾値以下であるか否かを判定させ、
閾値以下でない場合、前記現行分析フレームの周波数特性と、前記先行フレームの周波数特性との間の相対ピッチ差である隣接相対ピッチ差を求めさせ、
該隣接相対ピッチ差が予め設定されたマージン値以下である場合、前記現行テンプレート相対ピッチ差を1オクターブ分加算または減算する補正処理を実行して現行分析フレームの相対ピッチ差として、該相対ピッチ差を適用して前記相対ピッチ変化量を算出させることを特徴とするコンピュータ・プログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007193931A JP4882899B2 (ja) | 2007-07-25 | 2007-07-25 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
| US12/176,739 US8165873B2 (en) | 2007-07-25 | 2008-07-21 | Speech analysis apparatus, speech analysis method and computer program |
| CN2008101350647A CN101373593B (zh) | 2007-07-25 | 2008-07-25 | 语音分析设备和语音分析方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007193931A JP4882899B2 (ja) | 2007-07-25 | 2007-07-25 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009031452A JP2009031452A (ja) | 2009-02-12 |
| JP4882899B2 true JP4882899B2 (ja) | 2012-02-22 |
Family
ID=40296148
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007193931A Expired - Fee Related JP4882899B2 (ja) | 2007-07-25 | 2007-07-25 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US8165873B2 (ja) |
| JP (1) | JP4882899B2 (ja) |
| CN (1) | CN101373593B (ja) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4599420B2 (ja) * | 2008-02-29 | 2010-12-15 | 株式会社東芝 | 特徴量抽出装置 |
| US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
| US20120143611A1 (en) * | 2010-12-07 | 2012-06-07 | Microsoft Corporation | Trajectory Tiling Approach for Text-to-Speech |
| US9129605B2 (en) | 2012-03-30 | 2015-09-08 | Src, Inc. | Automated voice and speech labeling |
| CN102842307A (zh) * | 2012-08-17 | 2012-12-26 | 鸿富锦精密工业(深圳)有限公司 | 利用语音控制的电子装置及其语音控制方法 |
| JP2016061970A (ja) * | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 音声対話装置、方法およびプログラム |
| US9396740B1 (en) * | 2014-09-30 | 2016-07-19 | Knuedge Incorporated | Systems and methods for estimating pitch in audio signals based on symmetry characteristics independent of harmonic amplitudes |
| US9548067B2 (en) | 2014-09-30 | 2017-01-17 | Knuedge Incorporated | Estimating pitch using symmetry characteristics |
| US9842611B2 (en) | 2015-02-06 | 2017-12-12 | Knuedge Incorporated | Estimating pitch using peak-to-peak distances |
| US9922668B2 (en) | 2015-02-06 | 2018-03-20 | Knuedge Incorporated | Estimating fractional chirp rate with multiple frequency representations |
| US9870785B2 (en) | 2015-02-06 | 2018-01-16 | Knuedge Incorporated | Determining features of harmonic signals |
| CN106340295B (zh) * | 2015-07-06 | 2019-10-22 | 无锡天脉聚源传媒科技有限公司 | 一种语音识别结果的接受方法及装置 |
| CN105866011B (zh) * | 2016-03-31 | 2018-10-26 | 艾康生物技术(杭州)有限公司 | 脉冲基线值计算方法及血球分析仪的粒子计数方法 |
| CN109903751B (zh) * | 2017-12-08 | 2023-07-07 | 阿里巴巴集团控股有限公司 | 关键词确认方法和装置 |
| RU2711153C2 (ru) | 2018-05-23 | 2020-01-15 | Общество С Ограниченной Ответственностью "Яндекс" | Способы и электронные устройства для определения намерения, связанного с произнесенным высказыванием пользователя |
| CN111145778B (zh) * | 2019-11-28 | 2023-04-04 | 科大讯飞股份有限公司 | 音频数据的处理方法、装置、电子设备及计算机存储介质 |
Family Cites Families (60)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3603738A (en) * | 1969-07-07 | 1971-09-07 | Philco Ford Corp | Time-domain pitch detector and circuits for extracting a signal representative of pitch-pulse spacing regularity in a speech wave |
| US3978287A (en) * | 1974-12-11 | 1976-08-31 | Nasa | Real time analysis of voiced sounds |
| US4477925A (en) * | 1981-12-11 | 1984-10-16 | Ncr Corporation | Clipped speech-linear predictive coding speech processor |
| JPS58140798A (ja) * | 1982-02-15 | 1983-08-20 | 株式会社日立製作所 | 音声ピツチ抽出方法 |
| CA1219079A (en) * | 1983-06-27 | 1987-03-10 | Tetsu Taguchi | Multi-pulse type vocoder |
| JPH0754440B2 (ja) * | 1986-06-09 | 1995-06-07 | 日本電気株式会社 | 音声分析合成装置 |
| US4860360A (en) * | 1987-04-06 | 1989-08-22 | Gte Laboratories Incorporated | Method of evaluating speech |
| US4809334A (en) * | 1987-07-09 | 1989-02-28 | Communications Satellite Corporation | Method for detection and correction of errors in speech pitch period estimates |
| JPS6432300A (en) * | 1987-07-28 | 1989-02-02 | Nec Corp | Pitch cycle extraction system and apparatus |
| IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
| JPH0466999A (ja) * | 1990-07-04 | 1992-03-03 | Sharp Corp | 文節境界検出装置 |
| JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
| US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
| JP3450411B2 (ja) * | 1994-03-22 | 2003-09-22 | キヤノン株式会社 | 音声情報処理方法及び装置 |
| SE504177C2 (sv) * | 1994-06-29 | 1996-12-02 | Telia Ab | Metod och anordning att adaptera en taligenkänningsutrustning för dialektala variationer i ett språk |
| US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
| US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
| US5704000A (en) * | 1994-11-10 | 1997-12-30 | Hughes Electronics | Robust pitch estimation method and device for telephone speech |
| US5751905A (en) * | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
| DE69614799T2 (de) * | 1995-05-10 | 2002-06-13 | Koninklijke Philips Electronics N.V., Eindhoven | Übertragungssystem und -verfahren für die sprachkodierung mit verbesserter detektion der grundfrequenz |
| JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
| US5799276A (en) * | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
| US5864795A (en) * | 1996-02-20 | 1999-01-26 | Advanced Micro Devices, Inc. | System and method for error correction in a correlation-based pitch estimator |
| CN1163870C (zh) * | 1996-08-02 | 2004-08-25 | 松下电器产业株式会社 | 声音编码装置和方法,声音译码装置,以及声音译码方法 |
| JPH10105195A (ja) * | 1996-09-27 | 1998-04-24 | Sony Corp | ピッチ検出方法、音声信号符号化方法および装置 |
| JP3006677B2 (ja) * | 1996-10-28 | 2000-02-07 | 日本電気株式会社 | 音声認識装置 |
| US5970441A (en) * | 1997-08-25 | 1999-10-19 | Telefonaktiebolaget Lm Ericsson | Detection of periodicity information from an audio signal |
| CA2249792C (en) * | 1997-10-03 | 2009-04-07 | Matsushita Electric Industrial Co. Ltd. | Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus |
| US6219635B1 (en) * | 1997-11-25 | 2001-04-17 | Douglas L. Coulter | Instantaneous detection of human speech pitch pulses |
| US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
| EP1045372A3 (en) * | 1999-04-16 | 2001-08-29 | Matsushita Electric Industrial Co., Ltd. | Speech sound communication system |
| CN1136538C (zh) * | 1999-05-21 | 2004-01-28 | 松下电器产业株式会社 | 语音识别用的输入语音音程标准化装置 |
| US6199036B1 (en) * | 1999-08-25 | 2001-03-06 | Nortel Networks Limited | Tone detection using pitch period |
| AU2001260162A1 (en) * | 2000-04-06 | 2001-10-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Pitch estimation in a speech signal |
| AU2001273904A1 (en) * | 2000-04-06 | 2001-10-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimating the pitch of a speech signal using a binary signal |
| JP2003530605A (ja) * | 2000-04-06 | 2003-10-14 | テレフオンアクチーボラゲツト エル エム エリクソン(パブル) | 音声信号におけるピッチ推定 |
| JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
| AU2001270365A1 (en) * | 2001-06-11 | 2002-12-23 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
| KR100347188B1 (en) * | 2001-08-08 | 2002-08-03 | Amusetec | Method and apparatus for judging pitch according to frequency analysis |
| US20030163304A1 (en) * | 2002-02-28 | 2003-08-28 | Fisseha Mekuria | Error concealment for voice transmission system |
| JP2003295880A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 録音音声と合成音声を接続する音声合成システム |
| KR100463417B1 (ko) * | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
| US7284004B2 (en) * | 2002-10-15 | 2007-10-16 | Fuji Xerox Co., Ltd. | Summarization of digital files |
| US7251597B2 (en) * | 2002-12-27 | 2007-07-31 | International Business Machines Corporation | Method for tracking a pitch signal |
| US7272551B2 (en) * | 2003-02-24 | 2007-09-18 | International Business Machines Corporation | Computational effectiveness enhancement of frequency domain pitch estimators |
| US20050086052A1 (en) * | 2003-10-16 | 2005-04-21 | Hsuan-Huei Shih | Humming transcription system and methodology |
| US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
| US8150683B2 (en) * | 2003-11-04 | 2012-04-03 | Stmicroelectronics Asia Pacific Pte., Ltd. | Apparatus, method, and computer program for comparing audio signals |
| EP1605439B1 (en) * | 2004-06-04 | 2007-06-27 | Honda Research Institute Europe GmbH | Unified treatment of resolved and unresolved harmonics |
| JP2006084664A (ja) * | 2004-09-15 | 2006-03-30 | Denso Corp | 音声認識装置および音声認識プログラム |
| US7788091B2 (en) * | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
| JP2006161370A (ja) | 2004-12-06 | 2006-06-22 | Panahome Corp | 外壁構造 |
| EP1686561B1 (en) * | 2005-01-28 | 2012-01-04 | Honda Research Institute Europe GmbH | Determination of a common fundamental frequency of harmonic signals |
| CN1848240B (zh) * | 2005-04-12 | 2011-12-21 | 佳能株式会社 | 基于离散对数傅立叶变换的基音检测方法、设备和介质 |
| JP2006325780A (ja) | 2005-05-25 | 2006-12-07 | Pentax Corp | 超音波内視鏡の先端部 |
| DE602006015712D1 (de) * | 2006-03-20 | 2010-09-02 | Mindspeed Tech Inc | Tonhöhen-track-glättung in offener schleife |
| US20080120094A1 (en) * | 2006-11-17 | 2008-05-22 | Nokia Corporation | Seamless automatic speech recognition transfer |
| EP1973101B1 (en) * | 2007-03-23 | 2010-02-24 | Honda Research Institute Europe GmbH | Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency |
| US7674970B2 (en) * | 2007-05-17 | 2010-03-09 | Brian Siu-Fung Ma | Multifunctional digital music display device |
| WO2011004579A1 (ja) * | 2009-07-06 | 2011-01-13 | パナソニック株式会社 | 声質変換装置、音高変換装置および声質変換方法 |
-
2007
- 2007-07-25 JP JP2007193931A patent/JP4882899B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-21 US US12/176,739 patent/US8165873B2/en not_active Expired - Fee Related
- 2008-07-25 CN CN2008101350647A patent/CN101373593B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US8165873B2 (en) | 2012-04-24 |
| CN101373593A (zh) | 2009-02-25 |
| JP2009031452A (ja) | 2009-02-12 |
| CN101373593B (zh) | 2011-12-14 |
| US20090030690A1 (en) | 2009-01-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4882899B2 (ja) | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム | |
| JP4264841B2 (ja) | 音声認識装置および音声認識方法、並びに、プログラム | |
| JP4657736B2 (ja) | ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法 | |
| US11810471B2 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
| JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
| US20190019500A1 (en) | Apparatus for deep learning based text-to-speech synthesizing by using multi-speaker data and method for the same | |
| CN101983402B (zh) | 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法 | |
| KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
| US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
| Eringis et al. | Improving speech recognition rate through analysis parameters | |
| JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
| JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
| CN101968958B (zh) | 一种音频数据的比较方法和装置 | |
| JP2019008120A (ja) | 声質変換システム、声質変換方法、及び声質変換プログラム | |
| JP3701850B2 (ja) | 音声言語の韻律表示装置および記録媒体 | |
| JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
| KR20080018658A (ko) | 사용자 선택구간에 대한 음성비교 시스템 | |
| JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
| JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
| Slaney et al. | Pitch-gesture modeling using subband autocorrelation change detection. | |
| JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
| JP2007248529A (ja) | 音声認識装置、音声認識プログラム、及び音声動作可能な装置 | |
| JP2012137580A (ja) | 音声認識装置,および音声認識プログラム | |
| CN120452421A (zh) | 一种英语发音教学系统及方法 | |
| Greibus et al. | Segmentation analysis using synthetic speech signals |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100318 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110720 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111014 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111121 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |