[go: up one dir, main page]

JPH04299400A - Voice detector - Google Patents

Voice detector

Info

Publication number
JPH04299400A
JPH04299400A JP3087381A JP8738191A JPH04299400A JP H04299400 A JPH04299400 A JP H04299400A JP 3087381 A JP3087381 A JP 3087381A JP 8738191 A JP8738191 A JP 8738191A JP H04299400 A JPH04299400 A JP H04299400A
Authority
JP
Japan
Prior art keywords
voice
detector
prediction
prediction coefficients
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3087381A
Other languages
Japanese (ja)
Other versions
JP3081264B2 (en
Inventor
Seiji Sasaki
誠司 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Denki Electric Inc
Original Assignee
Kokusai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Co Ltd filed Critical Kokusai Electric Co Ltd
Priority to JP03087381A priority Critical patent/JP3081264B2/en
Publication of JPH04299400A publication Critical patent/JPH04299400A/en
Application granted granted Critical
Publication of JP3081264B2 publication Critical patent/JP3081264B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】携帯型の無線機等では、送信時の
消費電力を低減するために、音声があるときのみ送信し
音声がない時には送信を中断するVOX(Voice 
 Operate  Switch  Exchang
e)制御が使用されており、これを用いると送信時の平
均消費電力を約15%削減することができる。このよう
なVOX機能を実行するために送信出力回路の前段に音
声信号の有無を検出する音声検出器が必要になる。本発
明は、このような音声符号化方式に用いられる音声検出
器に関するものである。
[Industrial Application Field] In order to reduce power consumption during transmission, portable radios, etc. transmit VOX (Voice) only when there is voice and interrupt transmission when there is no voice.
Operate Switch Exchange
e) control is used, which can reduce the average power consumption during transmission by about 15%. In order to perform such a VOX function, an audio detector that detects the presence or absence of an audio signal is required before the transmission output circuit. The present invention relates to a speech detector used in such a speech encoding method.

【0002】0002

【従来の技術】音声検出器をディジタルコードレス電話
装置のVOX制御に適用することを前提にして説明する
。このディジタルコードレス電話装置では、音声符号化
方式(CODEC)として、32kb/s適応差分パル
ス符号化(ADPCM:Adaptive  Diff
erential  Pulse  Code  Mo
dulation)が用いられる。また、この装置での
処理遅延時間は7msec以下であることが要求される
。図6は従来の音声検出器のブロック図であり、8kH
zサンプリングで8ビット量子化された入力音声信号a
を、20msecフレーム単位(160サンプル)に分
割して音声の有無を判定し有音/無音フラグを出力する
音声検出器である。音声入力信号aは直流成分抑圧器1
1の広帯域フィルタにより直流成分が取り除かれた信号
bとなって次の各回路に与える。
2. Description of the Related Art A description will be given on the premise that a voice detector is applied to VOX control of a digital cordless telephone device. This digital cordless telephone device uses 32 kb/s adaptive differential pulse coding (ADPCM) as a voice encoding method (CODEC).
erential Pulse Code Mo
duration) is used. Furthermore, the processing delay time in this device is required to be 7 msec or less. FIG. 6 is a block diagram of a conventional audio detector.
Input audio signal a 8-bit quantized with z sampling
This is a voice detector that divides the signal into 20 msec frame units (160 samples), determines the presence or absence of voice, and outputs a voice/silence flag. Audio input signal a is sent to DC component suppressor 1
The DC component is removed by the broadband filter No. 1, resulting in a signal b, which is applied to each of the following circuits.

【0003】高レベルパワー検出器12では、20ms
ecの音声区間を4msec毎のサブフレーム(32サ
ンプル)に5分割し各サブフレームについて次の(1)
式により短区間パワーPskを算出する。 但し、xi はフィルタ出力,kはサブフレーム番号で
ある。算出された各サブフレームのPskに対して、パ
ワーしきい値Th2(−30dBm0)により次式のよ
うにパワー検出を行う。 Psk≧Th2  のとき  D2k=1      
    (2)Psk<Th2  のとき  D2k=
0          (3)さらに(4)式の重み付
け総和D2 をとり、これを1フレームの検出結果とし
て信号cを出力する。
[0003] In the high level power detector 12, 20 ms
Divide the audio interval of ec into 5 subframes (32 samples) every 4 msec, and perform the following (1) for each subframe.
Short-term power Psk is calculated using the formula. However, xi is the filter output and k is the subframe number. Power detection is performed for the calculated Psk of each subframe using the power threshold Th2 (-30 dBm0) as shown in the following equation. When Psk≧Th2, D2k=1
(2) When Psk<Th2, D2k=
0 (3) Furthermore, the weighted sum D2 of equation (4) is obtained, and this is output as the signal c as the detection result of one frame.

【0004】低レベルパワー検出器13では、(1)式
により算出した短区間パワーに対してパワーしきい値T
h1(−50dBm0)により次式のようにパワー検出
を行う。 Psk≧Th1  のとき  D1k=1      
    (5)Psk<Th1  のとき  D1k=
0          (6)同様に次式の重み付け総
和D1 をとり、1フレームの検出結果として信号dを
出力する。 また、このとき同時に下式の値を求めておく。
In the low level power detector 13, a power threshold value T is determined for the short period power calculated by equation (1).
Power detection is performed using h1 (-50 dBm0) as shown in the following equation. When Psk≧Th1, D1k=1
(5) When Psk<Th1, D1k=
0 (6) Similarly, take the weighted sum D1 of the following equation and output the signal d as the detection result of one frame. Also, at the same time, calculate the value of the following formula.

【0005】零交差数検出器14では、信号bの零クロ
ス数(連続した2サンプルの音声信号の符号ビットが異
符号となる数)をカウントするため、サブフレーム毎に
次の(9)式によるZskの演算を行う。 算出された各Zskに対して零クロスしきい値Th3(
24個)により、次式のように零クロス数を検出する。 Zsk≧Th3  のとき  DZsk=1     
   (10)Zsk<Th3  のとき  DZsk
=0        (11)同様に、次式の重み付け
総和Dz をとり1フレームの検出結果として信号eを
出力する。
[0005] The zero crossing number detector 14 counts the number of zero crossings of signal b (the number where the sign bits of two consecutive samples of the audio signal have different signs), so the following equation (9) is used for each subframe. Zsk is calculated by Zero cross threshold Th3(
24), the number of zero crosses is detected as shown in the following equation. When Zsk≧Th3, DZsk=1
(10) When Zsk<Th3 DZsk
=0 (11) Similarly, the weighted sum Dz of the following equation is taken and the signal e is output as the detection result of one frame.

【0006】フレーム間パワー増分比較器15では、1
フレーム分のパワーPTnを次の(13)式の演算によ
り求める。 さらに前フレームのフレーム間パワーPT(n−1)と
の比較を行って次のパワー増分検出D4 を行い、その
結果をして信号fを出力する。 PTn≧4PT(n−1)  のとき  D4 =1 
   (14)PTn<4PT(n−1)  のとき 
 D4 =0    (15)
In the interframe power increment comparator 15, 1
The power PTn for a frame is calculated by the following equation (13). Furthermore, a comparison is made with the interframe power PT(n-1) of the previous frame to perform the next power increment detection D4, and the result is output as a signal f. When PTn≧4PT(n-1), D4 = 1
(14) When PTn<4PT(n-1)
D4 = 0 (15)

【0007】判定器16
では、これらの各信号c,d,e,fを入力して図7の
判定理論フローに従って音声検出結果を示す有音/無音
フラグを出力する。図7において、HOTはハングオー
バタイマ(語尾切れ防止のため有音から無音に判定が変
わった時それ以降の数フレームを有音に設定する機能)
を意味し、SPフラグは有音/無音フラグを意味する。
Determiner 16
Now, these signals c, d, e, and f are inputted, and a speech/silence flag indicating the voice detection result is output according to the determination theory flow shown in FIG. In Figure 7, HOT is a hangover timer (a function that sets the next few frames to be voiced when the judgment changes from voiced to silent to prevent endings of sentences).
, and the SP flag means a sound/silence flag.

【0008】[0008]

【発明が解決しようとする課題】以上述べた従来の音声
検出器の処理は20msecフレーム単位で実行される
ため最低20msecの遅延時間を生じ、上述した7m
sec以下という条件を満たすことができない。また、
従来の音声検出器は音声符号化器と独立して構成されて
いるため処理量が大きくなるなどの欠点がある。本発明
の目的は、適応予測機能を有する音声符号化器の処理過
程で得られる予測係数を有効に利用して、短い処理時間
で、かつ、遅延時間を7msec以下に抑えて音声の有
無を検出することのできる音声検出器を提供することに
ある。
[Problems to be Solved by the Invention] The processing of the conventional voice detector described above is executed in units of 20 msec frames, resulting in a delay time of at least 20 msec.
The condition of less than sec cannot be satisfied. Also,
Conventional speech detectors are configured independently of the speech encoder, so they have drawbacks such as a large amount of processing. An object of the present invention is to detect the presence or absence of speech in a short processing time and by suppressing the delay time to 7 msec or less by effectively utilizing prediction coefficients obtained in the processing process of a speech encoder having an adaptive prediction function. The object of the present invention is to provide a voice detector that can perform the following tasks.

【0009】[0009]

【課題を解決するための手段】本発明の音声検出器は、
適応予測機能を有する音声符号化器内の適応予測器から
得られる予測係数を入力とし、その予測係数について一
定区間での平均値を計算する手段と、前記予測係数の発
生分布から予め求めた予測係数用しきい値と前記平均値
とを比較することにより有音区間(音声が存在する区間
)であるか無音区間(背景雑音のみ存在する区間)であ
るかを判定する手段とを備えて、有音/無音のいずれか
を示す有音/無音フラグを出力するように構成したこと
を特徴とするものである。
[Means for Solving the Problems] The voice detector of the present invention includes:
A means for inputting prediction coefficients obtained from an adaptive predictor in a speech encoder having an adaptive prediction function and calculating an average value of the prediction coefficients in a certain interval, and a prediction obtained in advance from the occurrence distribution of the prediction coefficients. means for determining whether it is a voiced section (a section where voice exists) or a silent section (a section where only background noise exists) by comparing the coefficient threshold value with the average value, This device is characterized in that it is configured to output a voice/silence flag indicating whether there is a voice or no voice.

【0010】0010

【実施例】実施例として、本発明をディジタルコードレ
ス電話装置用の音声符号化器である32kb/s(キロ
ビット/秒)ADPCMに適用する例を以下に示す。図
3は本発明を適用する音声検出機能を有するADPCM
音声符号化器のブロック図であり、図1は本発明の音声
検出器の実施例を示すブロック図である。まず、図3の
ADPCM符号化器について説明する。21は64kb
/sのμ則PCM入力信号を線形13ビットPCMに変
換する均一PCM変換器である。22は均一PCM変換
器の出力から適応予測器23の出力である予測信号jを
差し引いて差分信号kを得る減算器22である。この差
分信号kは適応量子化器24により量子化され、ADP
CM音声符号化器の出力として32kb/sの音声デー
タが伝送路に送出される。一方、適応逆量子化器26は
、32kb/sの音声データを適応逆量子化することに
より量子化差分信号mを出力する。加算器25は、量子
化差分信号mと予測信号jを加算することにより再生信
号nを出力する。適応予測器23は、予測係数a1 ,
a2 を算出しそれを用いて量子化差分信号mおよび再
生信号nから予測信号jを生成する。適応予測器23が
予測信号jを生成するために算出する予測係数a1 ,
a2 はある時点の標本値を隣接する過去の2つの標本
値で予測するための係数であり、その値は、自己相関が
大きい音声信号の場合と自己相関が小さい背景雑音の場
合とでは異なった発生分布となる。この予測係数a1 
,a2 が本発明の音声検出器27に入力される。
DESCRIPTION OF THE PREFERRED EMBODIMENTS As an example, an example in which the present invention is applied to a 32 kb/s (kilobits per second) ADPCM which is a voice encoder for a digital cordless telephone device will be shown below. Figure 3 shows an ADPCM with a voice detection function to which the present invention is applied.
1 is a block diagram of a speech encoder, and FIG. 1 is a block diagram showing an embodiment of a speech detector of the present invention. First, the ADPCM encoder shown in FIG. 3 will be explained. 21 is 64kb
This is a uniform PCM converter that converts a /s μ-law PCM input signal into a linear 13-bit PCM. 22 is a subtracter 22 that obtains a difference signal k by subtracting the prediction signal j that is the output of the adaptive predictor 23 from the output of the uniform PCM converter. This difference signal k is quantized by an adaptive quantizer 24, and ADP
32 kb/s audio data is sent to the transmission path as the output of the CM audio encoder. On the other hand, the adaptive dequantizer 26 outputs a quantized difference signal m by adaptively dequantizing the 32 kb/s audio data. The adder 25 outputs a reproduced signal n by adding the quantized difference signal m and the prediction signal j. The adaptive predictor 23 uses prediction coefficients a1,
a2 is calculated and used to generate a predicted signal j from the quantized difference signal m and the reproduced signal n. The prediction coefficient a1 calculated by the adaptive predictor 23 to generate the prediction signal j,
a2 is a coefficient for predicting a sample value at a certain point in time using two adjacent past sample values, and its value is different for speech signals with large autocorrelation and background noise with small autocorrelation. This is the distribution of occurrence. This prediction coefficient a1
, a2 are input to the audio detector 27 of the present invention.

【0011】これを実証するため、予測係数a1 ,a
2 の発生分布を測定した例を図4(A),(B)及び
図5(C),(D)に示す。図において、図4(A)は
音声信号(男声)、(B)は音声信号(女声)を示し、
図5(C)は白色雑音、(D)は有色雑音(−6dB/
oct)を示す。これらの図では、各サンプル点〇,●
,◎が示す予測係数a1 ,a2 の範囲は、そのサン
プル点を原点とし−0.05より大きく+0.05より
小さいものとしている。また、最大の発生頻度を示すサ
ンプル点を◎印で示し、最大の発生頻度で正規化した場
合0.1以上の値をとるサンプル点を●印で示している
。図4,図5の結果から、予測係数a1 ,a2 につ
いてそれぞれ適当なしきい値を与えれば有音区間,背景
雑音区間(無音区間)の判定が可能となることが分かる
。図4,図5の予測係数a1 ,a2 の発生分布図よ
り、音声検出器27ではそれらが以下に示す■〜■の範
囲の値となる時は背景雑音区間であると判定し、その他
の場合は有音区間と判定し、それぞれLレベル,Hレベ
ルで示す音声検出フラグを出力する。   ■  (0.70≦a1 ≦1.00) かつ (
−0.45<a2 ≦−0.35)   ■  (0.
75≦a1 ≦1.10) かつ (−0.55<a2
 ≦−0.45)   ■  (0.85≦a1 ≦1
.20) かつ (−0.65<a2 ≦−0.55)
   ■  (0.95≦a1 ≦1.20) かつ 
(−0.70<a2 ≦−0.65)   ■  (a
1 ≦0.75)       かつ (a2 ≦0)
[0011] To prove this, the prediction coefficients a1, a
Examples of measuring the occurrence distribution of 2 are shown in FIGS. 4(A), (B) and 5(C), (D). In the figure, FIG. 4 (A) shows the audio signal (male voice), (B) shows the audio signal (female voice),
Figure 5(C) shows white noise, and (D) shows colored noise (-6dB/
oct). In these figures, each sample point 〇,●
The range of the prediction coefficients a1 and a2 indicated by , ◎ is larger than -0.05 and smaller than +0.05, with the sample point as the origin. Further, a sample point indicating the maximum frequency of occurrence is indicated by a mark ◎, and a sample point which takes a value of 0.1 or more when normalized by the maximum frequency of occurrence is indicated by a mark. From the results shown in FIGS. 4 and 5, it can be seen that if appropriate threshold values are given to the prediction coefficients a1 and a2, it is possible to determine whether there is a voice area or a background noise area (silence area). According to the occurrence distribution diagrams of the prediction coefficients a1 and a2 shown in FIGS. 4 and 5, the speech detector 27 determines that it is a background noise section when they have values in the range of ■ to ■ shown below, and in other cases is determined to be a sound section, and outputs voice detection flags indicated by L level and H level, respectively. ■ (0.70≦a1≦1.00) and (
-0.45<a2≦-0.35) ■ (0.
75≦a1≦1.10) and (-0.55<a2
≦-0.45) ■ (0.85≦a1 ≦1
.. 20) And (-0.65<a2≦-0.55)
■ (0.95≦a1≦1.20) and
(-0.70<a2 ≦-0.65) ■ (a
1 ≦0.75) and (a2 ≦0)

【0012】図1は本発明の音声検出器の構成例を示す
ブロック図である。図1の各ブロックの処理内容につい
て説明する。予測係数a1 ,a2をそれぞれフレーム
化器31,32に入力しそれぞれ5msec間隔にフレ
ーム化して平均値計算器33,34に与える。平均値計
算器33,34では、1フレーム分の平均値を計算して
有音/無音判定器35に入力する。有音/無音判定器3
5では、予測係数a1 ,a2 の平均値が、上記のし
きい値■〜■の範囲に入れば音声検出フラグuを無音(
L)に設定し、それ以外の場合は有音(H)に設定する
。以上で得られた結果に対してハングオーバ処理装置3
6により100msecのハングオーバ処理を施し最終
的な音声検出出力vを得る。図2はコンピュータシミュ
レーションによる音声検出の動作確認の結果を示すタイ
ムチャートである。入力信号には有色雑音(−6dB/
oct)を重畳したものを用いている。同図(A)には
入力信号、(B)にはハングオーバ処理後の有音/無音
判定結果を示す。これらより、本方式は周囲雑音に対し
て誤動作が少なく良好な結果が得られているのが分かる
。また、(C),(D)にはそれぞれ予測係数a1 ,
a2 の時間的変化を示す。これらより、有音区間と背
景雑音区間とでは予測係数a1 ,a2 の値が異なる
ことが確認出来る。
FIG. 1 is a block diagram showing an example of the configuration of a voice detector according to the present invention. The processing contents of each block in FIG. 1 will be explained. The prediction coefficients a1 and a2 are inputted to framers 31 and 32, respectively, and are framed at 5 msec intervals and provided to average value calculators 33 and 34, respectively. The average value calculators 33 and 34 calculate the average value for one frame and input it to the voice/silence determiner 35. Sound/silence determiner 3
5, if the average value of the prediction coefficients a1 and a2 falls within the range of the above thresholds ■ to ■, the voice detection flag u is set to silence (
In other cases, it is set to sound (H). The hangover processing device 3
6, a hangover process of 100 msec is performed to obtain the final voice detection output v. FIG. 2 is a time chart showing the results of checking the operation of voice detection by computer simulation. The input signal contains colored noise (-6dB/
oct) is used. In the figure, (A) shows the input signal, and (B) shows the sound/silence determination result after hangover processing. From these results, it can be seen that the present method produces good results with few malfunctions due to ambient noise. In addition, prediction coefficients a1 and (D) are shown in (C) and (D), respectively.
It shows the temporal change of a2. From these, it can be confirmed that the values of the prediction coefficients a1 and a2 are different between the voice section and the background noise section.

【0013】[0013]

【発明の効果】以上詳細に説明したように、本発明を実
施することにより、音声検出処理の所要処理時間は約5
msecと小さくなり、また、ADPCMの処理過程で
得られる係数を効率良く利用しているため小規模なハー
ドウェア(処理量はADPCMの15%)で実現するこ
とができるため実用上極めて大きい効果がある。
[Effects of the Invention] As explained in detail above, by implementing the present invention, the processing time required for voice detection processing can be reduced to about 50%.
msec, and because it efficiently uses the coefficients obtained in the ADPCM processing process, it can be realized with small-scale hardware (processing amount is 15% of ADPCM), so it has an extremely large practical effect. be.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明の音声検出器のブロック図である。FIG. 1 is a block diagram of a speech detector of the present invention.

【図2】本発明の動作を示すタイムチャートである。FIG. 2 is a time chart showing the operation of the present invention.

【図3】本発明の音声検出器を付加したADPCM符号
器のブロック図である。
FIG. 3 is a block diagram of an ADPCM encoder with added speech detector of the present invention.

【図4】予測係数a1 ,a2 の発生分布図である。FIG. 4 is an occurrence distribution diagram of prediction coefficients a1 and a2.

【図5】予測係数a1 ,a2 の発生分布図である。FIG. 5 is an occurrence distribution diagram of prediction coefficients a1 and a2.

【図6】従来の音声検出器のブロック図である。FIG. 6 is a block diagram of a conventional voice detector.

【図7】従来の判定論理フローチャートである。FIG. 7 is a conventional decision logic flowchart.

【符号の説明】[Explanation of symbols]

11  直流成分抑圧器 12  高レベルパワー検出器 13  低レベルパワー検出器 14  零交差数検出器 15  フレーム間パワー増分比較器 16  判定器 21  均一PCM変換器 22  減算器 23  適応予測器 24  適応量子化器 25  加算器 26  適応逆量子化器 27  音声検出器 31,32  フレーム化器 33,34  平均値計算器 35  有音/無音判定器 36  ハングオーバ処理装置 11 DC component suppressor 12 High level power detector 13. Low level power detector 14 Zero crossing number detector 15 Interframe power increment comparator 16 Judgment device 21 Uniform PCM converter 22 Subtractor 23 Adaptive predictor 24 Adaptive quantizer 25 Adder 26 Adaptive inverse quantizer 27 Audio detector 31, 32 Framerizer 33, 34 Average value calculator 35 Sound/silence detector 36 Hangover processing device

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】  適応予測機能を有する音声符号化器内
の適応予測器から得られる予測係数を入力とし、その予
測係数について一定の区間毎に平均値を計算する手段と
、前記予測係数の発生分布から予め求めた予測係数用し
きい値と前記平均値とを比較することにより前記区間が
有音区間であるか無音区間であるかを判定する手段とを
備えて、有音または無音のいずれかを示す有音/無音フ
ラグを出力するように構成した音声検出器。
1. Means for inputting prediction coefficients obtained from an adaptive predictor in a speech encoder having an adaptive prediction function and calculating an average value for each predetermined interval for the prediction coefficients, and generating the prediction coefficients. means for determining whether the section is a sound section or a silent section by comparing a prediction coefficient threshold value obtained in advance from a distribution with the average value; A voice detector configured to output a voice/silence flag indicating whether the voice is active or silent.
JP03087381A 1991-03-28 1991-03-28 Voice detector Expired - Fee Related JP3081264B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03087381A JP3081264B2 (en) 1991-03-28 1991-03-28 Voice detector

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03087381A JP3081264B2 (en) 1991-03-28 1991-03-28 Voice detector

Publications (2)

Publication Number Publication Date
JPH04299400A true JPH04299400A (en) 1992-10-22
JP3081264B2 JP3081264B2 (en) 2000-08-28

Family

ID=13913322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03087381A Expired - Fee Related JP3081264B2 (en) 1991-03-28 1991-03-28 Voice detector

Country Status (1)

Country Link
JP (1) JP3081264B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
JP2008151840A (en) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> Temporary voice segment determination device, method, program, recording medium thereof, and voice segment determination device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
JP2008151840A (en) * 2006-12-14 2008-07-03 Nippon Telegr & Teleph Corp <Ntt> Temporary voice segment determination device, method, program, recording medium thereof, and voice segment determination device

Also Published As

Publication number Publication date
JP3081264B2 (en) 2000-08-28

Similar Documents

Publication Publication Date Title
JPH0226901B2 (en)
US5509102A (en) Voice encoder using a voice activity detector
RU2705458C2 (en) Masking errors in frames
US4688256A (en) Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal
JP3478209B2 (en) Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium
JPH04299400A (en) Voice detector
JPS6031325A (en) System and circuit of forecast stop adpcm coding
Nikolic et al. Low complex forward adaptive loss compression algorithm and its application in speech coding
WO2004112256A1 (en) Speech encoding device
EP3787270B1 (en) Methods and devices for improvements relating to voice quality estimation
JPH08202394A (en) Voice detector
JPH021661A (en) Packet interpolation system
Peric et al. Multilevel delta modulation with switched first-order prediction for wideband speech coding
JP2656069B2 (en) Voice detection device
GB2268669A (en) Voice activity detector
JP3580906B2 (en) Voice decoding device
JPH0832526A (en) Voice detector
JPH0748696B2 (en) Speech coding system
KR950022980A (en) Soft Decision Method Using Adaptive Quantization
CA1144651A (en) Echo detector particularly for speech interpolation communication systems
JP2609737B2 (en) Voice / data discriminator
JPS63289600A (en) Voice encoding system
JPH02216199A (en) Sound encoder
JPH0834458B2 (en) Voice detector
JPS5947903B2 (en) Digital call audio introduction method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees