[go: up one dir, main page]

JPH01233498A - speech encoding device - Google Patents

speech encoding device

Info

Publication number
JPH01233498A
JPH01233498A JP63060139A JP6013988A JPH01233498A JP H01233498 A JPH01233498 A JP H01233498A JP 63060139 A JP63060139 A JP 63060139A JP 6013988 A JP6013988 A JP 6013988A JP H01233498 A JPH01233498 A JP H01233498A
Authority
JP
Japan
Prior art keywords
pitch
waveform
band
audio
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63060139A
Other languages
Japanese (ja)
Inventor
Koji Okazaki
岡崎 晃二
Takashi Ota
恭士 大田
Fumio Amano
文雄 天野
Shigeyuki Umigami
重之 海上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63060139A priority Critical patent/JPH01233498A/en
Priority to US07/321,153 priority patent/US5003604A/en
Priority to CA000593537A priority patent/CA1327404C/en
Priority to EP19890104473 priority patent/EP0333121A3/en
Publication of JPH01233498A publication Critical patent/JPH01233498A/en
Pending legal-status Critical Current

Links

Landscapes

  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔概要〕 音声の高能率符号化等に用いる音声符号化装置に関し。[Detailed description of the invention] 〔overview〕 Regarding a speech encoding device used for high-efficiency encoding of speech, etc.

ピッチ切出し方法および帯域制限方法を用いて伝送ビッ
トレートの低減を図りつつ、これらの方法の欠点である
符号化遅延の増大および再生音のこちりを抑制すること
を目的とし。
The purpose of this invention is to reduce the transmission bit rate by using a pitch cutting method and a band limiting method, while suppressing the disadvantages of these methods, such as increased encoding delay and distortion of reproduced sound.

音声信号のピッチ周期を検出するピッチ検出手段と、ピ
ッチ検出手段で検出されたピッチ周期に基づき音声波形
を複数ピッチ分サンプルして該複数ピッチ分の波形から
1ピッチ分の波形を発生するピッチ波形発生手段と、ピ
ッチ波形発生手段で発生された1ピフチ波形の周波数帯
域を帯域制限する帯域制限手段と、帯域制限手段で帯域
制限された音声波形を符号化する符号化手段とを具備し
Pitch detection means for detecting the pitch period of an audio signal; and a pitch waveform that samples the audio waveform for a plurality of pitches based on the pitch period detected by the pitch detection means and generates a waveform for one pitch from the waveform for the plurality of pitches. The apparatus includes a generating means, a band limiting means for band-limiting the frequency band of the 1-pitch waveform generated by the pitch waveform generating means, and an encoding means for encoding the audio waveform band-limited by the band limiting means.

ピッチ検出手段で検出されたピッチ周期の大きさに応じ
てピッチ波形発生手段での複数ピッチ分の波形の数およ
び帯域制限手段による制限帯域幅を変更するように構成
される。
The number of waveforms for a plurality of pitches in the pitch waveform generating means and the limited bandwidth by the band limiting means are changed in accordance with the size of the pitch period detected by the pitch detecting means.

〔産業上の利用分野〕[Industrial application field]

本発明は音声の高能率符号化等に用いる音声符号化装置
に関する。
The present invention relates to a speech encoding device used for high-efficiency encoding of speech.

音声符号化装置では、音声信号を低ビツトレートで符号
化しつつ、再生側で聴感上の違和感なく元の音声を再生
できることが必要とされている。
An audio encoding device is required to be able to encode an audio signal at a low bit rate while reproducing the original audio without causing any audible discomfort on the playback side.

〔従来の技術〕[Conventional technology]

高能率符号化の1手法として、音声信号からNピッチ分
の波形をサンプルしてこれらNピッチ分の音声波形から
1ピッチ分の音声波形を作成し。
One method of high-efficiency encoding is to sample N-pitch waveforms from an audio signal and create a 1-pitch audio waveform from these N-pitch audio waveforms.

これを符号化して受信側に伝送し、受信側では受信信号
を復号後、N回繰り返すことによって元のNピッチ分の
音声信号を再生するピッチ切出し方法が知られている。
A pitch extraction method is known in which the received signal is encoded and transmitted to the receiving side, and the receiving side decodes the received signal and repeats it N times to reproduce the original N pitches worth of audio signal.

この方法によれば、伝送ビットレートは全ての音声波形
を伝音する場合に比べて1/Nに低減することができる
According to this method, the transmission bit rate can be reduced to 1/N compared to the case where all audio waveforms are transmitted.

また高能率符号化の他の手法として、音声信号を帯域制
限することによってサンプリング周波数を低減し、それ
によって低ビツトレート化を図る方法も知られている。
As another method of high-efficiency encoding, a method is also known in which the sampling frequency is reduced by band-limiting the audio signal, thereby lowering the bit rate.

すなわち音声信号の帯域を1/Mニ1lfflし、1/
Mのサンプリング周波数でダウンサンプリングすること
によって伝送ビットレートを帯域制限を行わない場合に
比べて1/Mに低減するものである。
In other words, the band of the audio signal is reduced to 1/M by 1lffl, and 1/
By downsampling at a sampling frequency of M, the transmission bit rate is reduced to 1/M compared to the case where no band limitation is performed.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

複数ピッチ波形から1ピツチ波形を生成する前者のピッ
チ切出し方法は、符号化遅延でか低音時において大きく
なり過ぎるという問題点がある。
The former pitch extraction method, which generates a one-pitch waveform from a plurality of pitch waveforms, has a problem in that the pitch becomes too large at bass frequencies, probably due to encoding delay.

すなわち、送信側の符号化遅延では、ピッチ周期をT、
1ピツ千波形を切り出す元の複数ピッチ波形のサンプル
波形の数をNとすると一般にτ=2N−T となる。いまピッチ周期の最大値Tmaxを2Qmse
c。
That is, in the encoding delay on the transmitting side, the pitch period is T,
If the number of sample waveforms of the multi-pitch waveform from which the 1-pitch waveform is cut out is N, then generally τ=2N-T. Now set the maximum pitch period Tmax to 2Qmse
c.

サンプル波形の数Nを6とすると、最大符号化遅延τw
axは240 m5ecとなり、この大きさは通話のた
めには実用上支障がある。したがってサンプル波形の数
Nの大きさは最大ピッチ周期によって制限され、このた
め充分に低ビツトレート化を図れない。
When the number N of sample waveforms is 6, the maximum encoding delay τw
The ax is 240 m5ec, and this size poses a practical problem for telephone calls. Therefore, the size of the number N of sample waveforms is limited by the maximum pitch period, and therefore a sufficiently low bit rate cannot be achieved.

音声信号の帯域制限を行う後者の方法は、帯域制限され
た音声信号を受信側で再生した場合、聴感上、音がこも
ってしまうという問題点がある。
The latter method of band-limiting the audio signal has a problem in that when the band-limited audio signal is reproduced on the receiving side, the sound becomes muffled to the auditory sense.

したがって本発明の目的は、ピッチ切出し方法および帯
域制限方法を用いて伝送ビットレートの低減を図りつつ
、これらの方法の欠点である符号化遅延の増大および再
生音のこもりを抑制した音声符号化装置を提供すること
にある。
Therefore, an object of the present invention is to provide an audio encoding device that reduces the transmission bit rate by using a pitch cutting method and a band limiting method, while suppressing the disadvantages of these methods, such as an increase in encoding delay and muffled reproduced sound. Our goal is to provide the following.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は本発明に係る音声符号化装置の原理を説明する
ブロック図である。
FIG. 1 is a block diagram illustrating the principle of a speech encoding device according to the present invention.

本発明に係る音声符号化装置は、音声信号のピッチ周期
Tを検出するピッチ検出手段lと、ピッチ検出手段1で
検出されたピッチ周期Tに基づき音声信号を複数ピッチ
分サンプルしてNピッチ分の音声波形から1ピッチ分の
波形を発生するピッチ波形発生手段2と、ピッチ波形発
生手段2で発生された1ピツチ波形の周波数帯域を1/
Mに帯域制限する帯域制限手段3と、帯域制限手段3で
帯域制限された音声波形を符号化する符号化手段4とを
具備し、ピッチ検出手段1で検出されたピッチ周期Tの
大きさに応じてピッチ波形発生手段2でのピッチ波形の
サンプル数Nおよび帯域制限手段3による帯域制限の割
合Mを変更するように構成される。
The speech encoding device according to the present invention includes a pitch detection means 1 for detecting the pitch period T of the speech signal, and a plurality of pitches of the speech signal sampled based on the pitch period T detected by the pitch detection means 1 and N pitches. The pitch waveform generating means 2 generates a waveform for one pitch from the audio waveform of , and the frequency band of the one pitch waveform generated by the pitch waveform generating means 2 is
It is equipped with a band limiting means 3 that limits the band to M, and an encoding means 4 that encodes the audio waveform whose band has been band limited by the band limiting means 3. The number of samples N of the pitch waveform in the pitch waveform generating means 2 and the rate M of band limiting by the band limiting means 3 are changed accordingly.

〔作用〕[Effect]

通常1人間の音声のピッチ周期は80)1z以上であり
、イントネーションによりたまにこれより低くなること
がある程度である。よって符号化遅延でか問題となるピ
ッチ周期Tの長い音声は大部分イントネーションが低い
場合に出現することになるが、このようなイントネーシ
ョンが低い音声に対しては送信側で周波数帯域の制限を
行っても、受信側の再生音声は聴感上こもった音には聞
こえず。
Normally, the pitch period of one person's voice is 80)1z or more, and it may sometimes be lower than this depending on intonation. Therefore, speech with a long pitch period T, which causes problems due to encoding delay, will mostly appear when the intonation is low, but for such speech with low intonation, the frequency band should be limited on the transmitting side. However, the playback audio on the receiving side does not sound muffled to the auditory sense.

帯域制限による影響は実用上少ない。Bandwidth limitations have little effect in practical terms.

そこでこのような聴感上の特性を利用して符号化ビア)
レートを低減しつつ、符号化遅延を短くしかつ再生音の
こちりをなくした音声符号化を行う。すなわちピッチ周
期Tの長い音声に対してはピッチ波形発生手段1でピッ
チ波形サンプル数Nを減らして符号化遅延τが太き(な
ることを防ぎつつ、ピッチ波形サンプル数Nを減らした
ことによるビットレートの増大を、帯域制限手段3で音
声波形の帯域を1/Mに制限してビットレートを1/M
に低減することにより相殺する。このように帯域制限を
行ってもピッチ周期の長い音声であるから再生側では帯
域制限による影響は聴感上あまり判らない。
Therefore, using these auditory characteristics, the coded via)
To perform audio encoding that reduces the rate, shortens the encoding delay, and eliminates the distortion of reproduced sound. In other words, for speech with a long pitch period T, the pitch waveform generating means 1 reduces the number of pitch waveform samples N to increase the encoding delay τ (bits due to the reduction in the number of pitch waveform samples N) To increase the rate, limit the audio waveform band to 1/M using the band limiting means 3 to reduce the bit rate to 1/M.
offset by reducing the Even if the band is limited in this manner, since the voice has a long pitch period, the effect of the band limit is not very perceptible on the playback side.

ピッチ周期Tの短い音声に対してはピッチ波形発生信号
2でピッチ波形サンプル数Nを増加してビットレートを
低減するとともに、帯域制限信号3での帯域制限の程度
を緩和して再生音声がこもった音となることを防ぐ。
For audio with a short pitch period T, the pitch waveform generation signal 2 increases the number of pitch waveform samples N to reduce the bit rate, and the band restriction signal 3 relaxes the degree of band restriction to make the reproduced audio muffled. This prevents the sound from becoming too loud.

このように本発明では、ピッチ波形サンプル数Nと帯域
制限率1/Mとをピッチ周期Tに応じて制御しており、
Tが大きいときはピッチ波形サンプルNを小さくして符
号化遅延τをより短<シ。
In this way, in the present invention, the number N of pitch waveform samples and the band limiting rate 1/M are controlled according to the pitch period T.
When T is large, the pitch waveform sample N is made small to shorten the encoding delay τ.

その代わりにMを大きくすることで、符号化圧縮率1/
L=1/NMをほぼ一定に保つとともに。
Instead, by increasing M, the encoding compression rate is 1/
While keeping L=1/NM almost constant.

再生音の品質を聴感上、帯域制限を行っていない時と同
等なものとしている。
The quality of the reproduced sound is aurally equivalent to when no band limitation is applied.

例えば、ピッチ周期T=O〜12.5m5ecのときサ
ンプル数N−6,帯域制限率1/M=1とし。
For example, when the pitch period T=0 to 12.5 m5ec, the number of samples is N-6 and the band limit rate is 1/M=1.

一方、ピッチ周期T = 12.5〜20m5ecのと
きサンプル数N−3,帯域制限率1−/M=1/2とな
るようにサンプル数Nおよび帯域制限率1/Mをピッチ
周期Tに応じて変えた場合、前者の場合には符号化遅延
の最大値r waxは2 X12.5X 6 =150
msec +後者の場合には最大符号化遅延τl1ax
は2 X20X 3 =120 m5ecとなり、符号
化遅延は最大で150 m5ec程度となり、実用上問
題とならない程度とすることができる。
On the other hand, when the pitch period T = 12.5 to 20 m5ec, the number of samples N and the band restriction rate 1/M are set according to the pitch period T so that the number of samples N-3 and the band restriction rate 1-/M = 1/2. In the former case, the maximum value of encoding delay r wax is 2 x 12.5 x 6 = 150
msec + maximum encoding delay τl1ax in the latter case
is 2 x 20 x 3 = 120 m5ec, and the encoding delay is about 150 m5ec at maximum, which can be set to a level that does not pose a problem in practice.

〔実施例〕〔Example〕

以下9図面を参照して本発明の詳細な説明する。 The present invention will be described in detail below with reference to nine drawings.

本発明に係る実施例の符号化部が第2図に示される。第
2図において、音声信号Sはピッチ抽出回路10および
1/N切出し回路11に入力される。
An encoding unit according to an embodiment of the present invention is shown in FIG. In FIG. 2, the audio signal S is input to a pitch extraction circuit 10 and a 1/N extraction circuit 11.

ピッチ抽出回路10は入力音声波形のピッチ周期を抽出
する回路であり、抽出されたピッチ周期Tは1/N切出
し回路11および切替え回路15に送られるとともに伝
送路を介して復号化部に伝送される。
The pitch extraction circuit 10 is a circuit that extracts the pitch period of the input speech waveform, and the extracted pitch period T is sent to the 1/N extraction circuit 11 and the switching circuit 15, and is also transmitted to the decoding section via the transmission line. Ru.

1/N切出し回路11はNピッチ分の入力音声波形から
1ピツチ分の音声波形を作る回路であり。
The 1/N extraction circuit 11 is a circuit that generates a 1-pitch audio waveform from an N-pitch input audio waveform.

ピッチ抽出回路10で抽出されるピッチ周期Tが15m
5ec以上の場合にはN=3すなわち3ピツチ分の音声
波形から1ピツチの波形を作成し、ピッチ周期T < 
15m5ecのときにはN=6すなわち6ピツチ分の音
声波形から1ピッチの音声波形を作成する。
The pitch period T extracted by the pitch extraction circuit 10 is 15 m.
In the case of 5ec or more, create a 1-pitch waveform from N=3, that is, 3-pitch audio waveform, and pitch period T <
In the case of 15m5ec, N=6, that is, a 1-pitch audio waveform is created from 6 pitches' worth of audio waveforms.

1/N切出し回路11で発生された1ピツチ波形は次に
帯域分割フィルタ12に入力される。帯域分割フィルタ
12はO〜4kHzの帯域幅の入力音声信号SをO〜2
 k Hzの低域信号Stと2に〜4kHzの高域信号
SHとに分割してそれぞれ符号器13と14に送出して
符号化を行っており、これらの低域信号SLおよび高域
信号SL1は元の音声信号のサンプリング信号の172
にダウンサンプリングされる。
The 1-pitch waveform generated by the 1/N extraction circuit 11 is then input to the band division filter 12. The band division filter 12 divides the input audio signal S with a bandwidth of O~4kHz into O~2
The low frequency signal St of kHz and the high frequency signal SH of 2 to 4 kHz are divided and sent to encoders 13 and 14 for encoding, and these low frequency signal SL and high frequency signal SL1 is the sampling signal of the original audio signal.
is downsampled to.

符号器13からの低域信号SLはそのまま伝送路に送出
され、符号器14からの高域信号SHは切替え回路15
を介して伝送路に送出される。切替え回路15はピッチ
抽出回路10からピッチ周期T情報を受け+ T<15
m5ecの時には閉じられていて符号器14の高域信号
Soを伝送路へ送出し、一方、T≧15m5ecの時に
は開かれて符号器14の高域信号SHの伝送路への送出
をしゃ断するように構成されている。
The low frequency signal SL from the encoder 13 is sent as is to the transmission path, and the high frequency signal SH from the encoder 14 is sent to the switching circuit 15.
It is sent out to the transmission path via. The switching circuit 15 receives pitch period T information from the pitch extraction circuit 10 + T<15
When m5ec, it is closed and sends out the high frequency signal So of the encoder 14 to the transmission path, while when T≧15m5ec, it is opened and cuts off the sending of the high frequency signal SH of the encoder 14 to the transmission path. It is composed of

このようにこの実施例では符号化部における帯域制限方
式として帯域分割符号化方式、すなわち人力を高域成分
と低域成分とに分割し各帯域の信号を独立に符号化する
方式を利用しており、この特番帯域の信号はその帯域幅
に応じてダウンサンプリングされている。。
In this way, this embodiment uses a band division coding method as a band limiting method in the encoding section, that is, a method in which human power is divided into high frequency components and low frequency components and the signals of each band are independently encoded. The signal of this special number band is downsampled according to its bandwidth. .

本発明に係る実施例の復号化部が第3図に示される。第
3図において、符号化部から伝送路を介して送られてき
た低域信号SLは復号器20に入力され、また高域信号
3Mは切替え器24を介して復号器21に入力される。
A decoding section of an embodiment according to the present invention is shown in FIG. In FIG. 3, a low frequency signal SL sent from the encoding section via a transmission path is input to a decoder 20, and a high frequency signal 3M is input to a decoder 21 via a switch 24.

さらにピッチ周期T情報は切替え器24およびN回繰返
し回路23に入力される。
Further, the pitch period T information is input to the switch 24 and the N-times repeat circuit 23.

切替え器24はピッチ周期Tに応じて切り替えられる回
路であり、T<15m5ecのとき伝送路側に切り替え
られて伝送路からの高域信号SRを復号器21に入力さ
せ、T≧15m5ecでは伝送路からの高域信号SHの
復号器2Iへの入力をしゃ断するように構成されている
The switch 24 is a circuit that is switched according to the pitch period T, and when T<15m5ec, it is switched to the transmission line side and inputs the high frequency signal SR from the transmission line to the decoder 21, and when T≧15m5ec, it is switched to the transmission line side and inputs the high frequency signal SR from the transmission line to the decoder 21. It is configured to cut off input of the high frequency signal SH to the decoder 2I.

復号器20および2Iの各出力信号は帯域合成フィルタ
22に入力されて合成され、その合成信号はN回繰返し
回路23に入力される。N回繰返し回路23は帯域合成
フィルタ22からの復号音声波形をピッチ周期Tに基づ
きN回繰り返して再生音声を作成する回路である。
The output signals of the decoders 20 and 2I are input to a band synthesis filter 22 and combined, and the combined signal is input to an N-times repeating circuit 23. The N-times repeating circuit 23 is a circuit that repeats the decoded audio waveform from the band synthesis filter 22 N times based on the pitch period T to create reproduced audio.

実施例システムの動作が以下に説明される。まず符号化
部において、入力音声信号Sがピッチ抽出回路10およ
び1/N切出し回路11に入力され。
The operation of the example system is described below. First, in the encoding section, the input audio signal S is input to the pitch extraction circuit 10 and the 1/N extraction circuit 11.

ピッチ抽出回路10で音声信号Sのピッチ周期Tが抽出
される。いまこの抽出されたピッチ周期TがT<15m
5ecであるとする。1/N切出し回路11はこのピッ
チ周期Tに基づき、T<15m5ecであるので入力音
声信号を6ピツチ分サンプリングしてこの6ピツチ分の
波形から1ピツチの音声波形を生成して出力する。この
1/N切出し回路11からの1ピツチ分の音声波形は帯
域分割フィルタ12に入力されて低域信号SLと高域信
号SHとに分割され、l/2にダウンサンプリングしつ
つ符号器13と14で符号化される。切替え器15はピ
ッチ周期T<15m5ecであるから閉じられており、
したがって符号器13および14からの低域信号SLお
よび高域信号Soは共に伝送路を介して復号化部に伝送
される。
A pitch extraction circuit 10 extracts the pitch period T of the audio signal S. Now, this extracted pitch period T is T<15m
Suppose that it is 5ec. Based on this pitch period T, the 1/N extraction circuit 11 samples the input audio signal by 6 pitches and generates and outputs a 1-pitch audio waveform from the 6-pitch waveform since T<15m5ec. The 1 pitch audio waveform from the 1/N extraction circuit 11 is input to the band division filter 12 where it is divided into a low frequency signal SL and a high frequency signal SH. 14. The switch 15 is closed because the pitch period T<15m5ec.
Therefore, both the low frequency signal SL and the high frequency signal So from encoders 13 and 14 are transmitted to the decoding section via the transmission path.

一方、ピッチ抽出回路10で抽出されたピッチ周期Tが
T≧15m5ecである場合、1/N切出し回路11は
音声信号Sを3ピツチ分サンプリングしてこの3ピツチ
分の音声波形から1ピツチ分の音声波形を発生する。こ
の音声波形は前述同様に帯域分割フィルタ12で低域信
号SLおよび高域信号SHに分割されて符号器13およ
び14で符号化されるが。
On the other hand, when the pitch period T extracted by the pitch extraction circuit 10 is T≧15m5ec, the 1/N extraction circuit 11 samples the audio signal S for 3 pitches and uses the audio waveform for 3 pitches to extract 1 pitch from the audio waveform for 3 pitches. Generates audio waveform. This audio waveform is divided into a low frequency signal SL and a high frequency signal SH by the band division filter 12 and encoded by encoders 13 and 14, as described above.

T≧15m5ecでは切替え器15が開かれているので
Since the switch 15 is open when T≧15m5ec.

符号器14からの高域信号Soは伝送路に送出されない
The high frequency signal So from the encoder 14 is not sent out to the transmission path.

このようにピッチ周期TがT≧15m5ecの時には1
/N切出し回路11でのピッチ波形サンプル数NがT<
15m5ecの時の半分となるので、この1/N切出し
回路11における符号化圧縮率は半分に減るが、音声信
号Sのうち帯域分割フィルタ12で分割した低域信号S
t、のみしか復号化部に送出しないのでビットレートを
半分にでき、したがって伝送路に送出される信号の符号
化圧縮率は結局。
In this way, when the pitch period T is T≧15m5ec, 1
/N The number of pitch waveform samples N in the extraction circuit 11 is T<
Since it is half of that of 15m5ec, the encoding compression rate in this 1/N extraction circuit 11 is reduced by half, but the low frequency signal S divided by the band division filter 12 of the audio signal S is
Since only t is sent to the decoding unit, the bit rate can be halved, and therefore the encoding compression rate of the signal sent to the transmission path is ultimately .

ピッチ周期TがT<15m5ecの時と同じになる。The pitch period T is the same as when T<15 m5ec.

すなわち、ピッチ波形サンプル数をNとし、1/Mに帯
域制限して1/Mにダウンサンプリングしたものとする
と、圧縮率1/L=1/ (N−M)はピッチ周期Tに
かかわらず常に一定である。
In other words, if the number of pitch waveform samples is N, and the band is limited to 1/M and downsampled to 1/M, then the compression ratio 1/L = 1/ (N - M) is always constant regardless of the pitch period T. constant.

復号化部ではT<15m5ecでは切替え器24は伝送
路側に接続されており、したがって伝送路を介して伝送
されてきた低域信号St、および高域信号SHが復号器
20および21に入力されて復号され。
In the decoding section, when T<15m5ec, the switch 24 is connected to the transmission line side, and therefore the low frequency signal St and the high frequency signal SH transmitted via the transmission channel are input to the decoders 20 and 21. decrypted.

その後、帯域合成フィルタ22で合成されてその合成信
号がN回繰返し回路23に入力される。N回繰返し回路
23はこの合成信号の波形を6回繰り返して再生信号を
発生する。
Thereafter, the signals are synthesized by the band synthesis filter 22 and the synthesized signal is inputted to the repeating circuit 23 N times. The N-time repeat circuit 23 repeats the waveform of this composite signal six times to generate a reproduced signal.

T≧15 m secでは伝送路からの低域信号Stの
みが復号器20で復号されて帯域合成フィルタ22を介
してN回繰返し回路23に入力され、N回繰返し回路2
3では合成信号波形を3回繰り返して再生信号を発生す
る。
When T≧15 m sec, only the low-frequency signal St from the transmission path is decoded by the decoder 20 and inputted to the N-times repeating circuit 23 via the band synthesis filter 22, and the N-times repeating circuit 2
3, the synthesized signal waveform is repeated three times to generate a reproduced signal.

本発明の実施にあたっては種々の変形形態が可能である
。上述の実施例では符号化部における帯域制限方法とし
て帯域分割符号化方式を用いたが。
Various modifications are possible in implementing the invention. In the above-described embodiment, a band division encoding method was used as a band limiting method in the encoding section.

勿論これに限らず9例えば離散フーリエ変換(DFT)
を用いることもできる。すなわち入力音声信号に対して
離散フーリエ変換を行って線スベクトルを抽出し、ピッ
チ周期Tに応じてこの線スペクトルのうちの高周波成分
を除去することにより帯域制服を行うことができる。こ
の場合も圧縮率がほぼ一定となるように線スペクトルの
高域成分を落としていくことになる。
Of course, the invention is not limited to this.9 For example, discrete Fourier transform (DFT)
You can also use That is, by performing discrete Fourier transform on the input audio signal to extract a line spectrum, and removing high frequency components of this line spectrum according to the pitch period T, band uniformity can be performed. In this case as well, the high frequency components of the line spectrum are reduced so that the compression ratio remains approximately constant.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、音声信号の符号化に際して符号化遅延
が大きくなり過ぎたりあるいは再生側において再生音が
こもった音になったりすることを防止しつつ、低ビツト
レートによる音声符号化を行うことができる。
According to the present invention, it is possible to perform audio encoding at a low bit rate while preventing the encoding delay from becoming too large or the reproduced sound becoming muffled on the playback side when encoding the audio signal. can.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係る原理説明図。 第2図は本発明に係る実施例の符号化部のブロック図、
および 第3図は本発明に係る実施例の復号化部のブロック図で
ある。 図において。 1−ピッチ検出手段 2−ピッチ波形発生手段 3・−帯域制限手段 4・・−符号化手段 IO・・・ピッチ抽出回路 11・−1/N切出し回路 12・−・帯域分割フィルタ 13、14−一符号器 15、24−・切替え器 20、21・・−復号器 22−・−帯域合成フィルタ 23−N回繰返し回路 41−千ご 日月1=イ禾う S  理 序う第1図 、4又ヂr日月の裏施侍1]のTf号イご邪第2図 A脅1月の×夛馴列のイ夏号イこ侶p 第3図
FIG. 1 is a diagram explaining the principle of the present invention. FIG. 2 is a block diagram of an encoding unit according to an embodiment of the present invention;
and FIG. 3 is a block diagram of a decoding section of an embodiment according to the present invention. In fig. 1 - Pitch detection means 2 - Pitch waveform generation means 3 - Band limiting means 4 - Encoding means IO - Pitch extraction circuit 11 - 1/N extraction circuit 12 - Band division filters 13, 14 - - Encoder 15, 24 - Switcher 20, 21 - Decoder 22 - Band synthesis filter 23 - N-times repeat circuit 41 4-way dir Sun Moon no Ura Sai Samurai 1] Tf number Igoya Figure 2

Claims (1)

【特許請求の範囲】 1、音声信号のピッチ周期を検出するピッチ検出手段(
1)と、 該ピッチ検出手段(1)で検出されたピッチ周期に基づ
き音声信号を複数ピッチ分サンプルして該複数ピッチ分
の音声波形から1ピッチ分の波形を発生するピッチ波形
発生手段(2)と、 該ピッチ波形発生手段(2)で発生された1ピッチ波形
の周波数帯域を帯域制限する帯域制限手段(3)と、 該帯域制限手段(3)で帯域制限された音声波形を符号
化する符号化手段(4)と を具備し、 該ピッチ検出手段(1)で検出されたピッチ周期の大き
さに応じて該ピッチ波形発生手段(2)での波形のサン
プル数および該帯域制限手段(3)による制限帯域幅を
変更するように構成された音声符号化装置。
[Claims] 1. Pitch detection means for detecting the pitch period of an audio signal (
1), and pitch waveform generating means (2) which samples the audio signal for a plurality of pitches based on the pitch cycle detected by the pitch detection means (1) and generates a waveform for one pitch from the audio waveform for the plurality of pitches. ), band limiting means (3) for band limiting the frequency band of the one pitch waveform generated by the pitch waveform generating means (2), and encoding the audio waveform band limited by the band limiting means (3). the number of waveform samples in the pitch waveform generating means (2) and the band limiting means according to the size of the pitch period detected by the pitch detecting means (1); (3) A speech encoding device configured to change the limited bandwidth according to (3).
JP63060139A 1988-03-14 1988-03-14 speech encoding device Pending JPH01233498A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP63060139A JPH01233498A (en) 1988-03-14 1988-03-14 speech encoding device
US07/321,153 US5003604A (en) 1988-03-14 1989-03-09 Voice coding apparatus
CA000593537A CA1327404C (en) 1988-03-14 1989-03-13 Voice coding apparatus
EP19890104473 EP0333121A3 (en) 1988-03-14 1989-03-14 Voice coding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63060139A JPH01233498A (en) 1988-03-14 1988-03-14 speech encoding device

Publications (1)

Publication Number Publication Date
JPH01233498A true JPH01233498A (en) 1989-09-19

Family

ID=13133509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63060139A Pending JPH01233498A (en) 1988-03-14 1988-03-14 speech encoding device

Country Status (1)

Country Link
JP (1) JPH01233498A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360199B1 (en) 1998-06-19 2002-03-19 Oki Electric Ind Co Ltd Speech coding rate selector and speech coding apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360199B1 (en) 1998-06-19 2002-03-19 Oki Electric Ind Co Ltd Speech coding rate selector and speech coding apparatus
US6799161B2 (en) 1998-06-19 2004-09-28 Oki Electric Industry Co., Ltd. Variable bit rate speech encoding after gain suppression

Similar Documents

Publication Publication Date Title
KR100427753B1 (en) Method and apparatus for reproducing voice signal, method and apparatus for voice decoding, method and apparatus for voice synthesis and portable wireless terminal apparatus
KR100402189B1 (en) Audio signal compression method
US6446037B1 (en) Scalable coding method for high quality audio
US6009386A (en) Speech playback speed change using wavelet coding, preferably sub-band coding
JP2976860B2 (en) Playback device
JPH1084284A (en) Signal reproducing method and device
CA1327404C (en) Voice coding apparatus
US6647063B1 (en) Information encoding method and apparatus, information decoding method and apparatus and recording medium
KR100601748B1 (en) Encoding and Decoding Method of Digital Speech Data
JP3557674B2 (en) High efficiency coding method and apparatus
EP1054400A2 (en) Signal processing method and apparatus, and information serving medium
EP0772185A2 (en) Speech decoding method and apparatus
JP4508599B2 (en) Data compression method
JPH01233498A (en) speech encoding device
JP2000036755A (en) Method and device for code convesion and program supply medium thereof
JPH04249300A (en) Audio code/decoding method and device
JP2816052B2 (en) Audio data compression device
JP3778739B2 (en) Audio signal reproducing apparatus and audio signal reproducing method
JPH07221650A (en) Method and device for encoding information and method and device for decoding information
JP3149562B2 (en) Digital audio transmission equipment
JP4222250B2 (en) Compressed music data playback device
JP3513879B2 (en) Information encoding method and information decoding method
JP3175162B2 (en) Secret communication method
JPS63178300A (en) Voice encoder
JP4123632B2 (en) Information encoding method and apparatus, and program supply medium