WO2006011367A1

WO2006011367A1 - オーディオ信号符号化装置および復号化装置

Info

Publication number: WO2006011367A1
Application number: PCT/JP2005/012941
Authority: WO
Inventors: Kazuhiro Iida; Mineo Tsushima; Yoshiaki Takagi; Naoya Tanaka
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2004-07-30
Filing date: 2005-07-13
Publication date: 2006-02-02
Anticipated expiration: 2007-01-30

Abstract

　マルチチャンネルのオーディオ信号が混入され符号化された符号列から、マルチチャネルの信号列を聴感上、違和感のないように簡便に分離して取り出すことが課題となっている。　マルチチャネル信号の受聴に関しては、包まれ感という特性が重要であり、その特性を損なわないように弁別特性にあわせて符号化を構成する。包まれ感は、人間の耳より前にあるチャンネル（Ｌ、Ｃ、Ｒ）の信号のエネルギーの和Ｅｆと、耳より後ろにあるチャンネル（ＢＬ、ＢＲ）の信号のエネルギーの和Ｅｂとの比Ｅｆ／Ｅｂで表される。本発明のオーディオ信号符号化装置では、マルチチャンネルの信号が混入され符号化された符号列に包まれ感を表す前後のエネルギー比Ｅｆ／Ｅｂを多重化しておくので、臨場感のあるマルチチャネルのオーディオ信号を復号化することができる。

Description

明細書

オーディオ信号符号化装置および復号化装置

技術分野

[0001] 本発明は、オーディオ信号の符号ィ匕装置および復号ィ匕装置に関するものである。

背景技術

[0002] 従来のオーディオ信号符号化方法、および、復号化方法としては、公知なものとして ISO/IECの国際標準方式、通称 MPEG方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号ィ匕方式として、 ISO/IEC 13818— 7、通称 MPEG2 AAC (Advanced Audio Coding)などがあげられる。本方式の拡張規格も複数規格化が現在なされている。その一つとして、空間音響情報 (Spatial Cue Inform ation)もしくは、聴覚的音響情報 (Binaural Cue)と呼ばれる情報を利用する技術がある。このような技術の例としては、 ISO国際標準規格である MPEG- 4 Audio (ISO/IEC 14 496- 3)において定められたパラメトリックステレオ (Parametric Stereo)方式がある（例えば、非特許文献 1参照)。また、別の方式も提案されている (例えば、特許文献 1、特許文献 2参照)。

非特許文献 1 : ISO/IEC 14496-3:2001 AMD2 "Parametric Coding for High Quality Audio

特許文献 1 :米国公開特許 US2003/0035553 "Backwards- compatible Perceptual Cod ing of Spatial Cues

特許文献 2 :米国公開特許 US2003/0219130 "Coherence- based Audio Coding and S ynthesis"

発明の開示

発明が解決しょうとする課題

[0003] しかしながら、従来のオーディオ信号符号化方法、および、復号化方法では、例えば背景技術に記載の AACなどでは、マルチチャネルの信号を符号ィ匕する際に、チヤンネル間の相関を十分に生力しきれていないため、低ビットレートイ匕することが困難であった。チャンネル間の相関を用いて符号ィ匕を実施する場合においても、人間の音源の包まれ感などに関する知覚特性をもちいることで得られる符号ィ匕効率の向上などの効果を、十分に量子化と符号化に活かしきれて、な、と、う課題があった。

[0004] また従来の方法では、マルチチャネルの信号を符号ィ匕したものを復号ィ匕する際に、 2つのスピーカやヘッドホンなどで再生する場合において、一度、すべてのチャンネルを復号化し、その後、ダウンミクスなどの方法を用いて、 2つのスピーカやヘッドホンで再生すべきオーディオ信号を加算により生成しなければならな力つた。このことは 2 つのスピーカやヘッドホンで再生する場合に、多くの計算量や計算用のバッファを要し、それを実装する DSPなどの計算手段の消費電力やコストを高める原因となった。課題を解決するための手段

[0005] 上記課題を解決するため、本発明のオーディオ信号符号化装置は、マルチチヤネルのオーディオ信号を符号ィ匕するオーディオ信号符号ィ匕装置であって、マルチチヤネルのオーディオ信号のうち、リスナーのフロント側に存在するチャンネルの信号のエネルギー和、および、リスナーのバック側に存在するチャンネルの信号のエネルギ一和を算出するエネルギー和算出手段と、フロント側の前記エネルギー和と、バック側の前記エネルギー和との比を算出するエネルギー比算出手段と、算出された前記エネルギー和の比を符号ィ匕するエネルギー比符号ィ匕手段とを備えることを特徴とする。

[0006] また、前記エネルギー比符号ィ匕手段は、前記エネルギー和の比を、聴覚上の包まれ感に関する弁別特性に応じて量子化し、符号ィ匕するとしてもよい。

[0007] さらに、前記弁別特¾は、フロント側の前記エネルギー和と、バック側の前記エネノレギー和との差が所定範囲内である場合に、弁別性能が最も高いことを示し、前記ェネルギー比符号ィ匕手段は、フロント側とバック側とのエネルギー和の差が最も小さ!/ヽとき最も量子化精度が高くなるよう量子化し、前記エネルギー和の差が大きくなるほどビット数が少なくなるよう量子化を行なうとしてもよい。

[0008] 本発明のオーディオ信号復号化装置は、マルチチャネルのオーディオ信号を表す符号ィ匕列を復号ィ匕することによって、聴覚上の包まれ感を有するマルチチャネルォ一ディォ信号を出力するオーディオ信号復号化装置であって、符号列を復号化することによって、マルチチャネルオーディオ信号を生成するオーディオ信号復号ィ匕手段と、前記符号列を復号ィ匕することによって、リスナーのフロント側に存在するチャンネルの信号のエネルギー和と、リスナーのバック側に存在するチャンネルの信号のエネルギー和との比を復号ィ匕するエネルギー比復号ィ匕手段と、復号化された前記エネルギー和の比に従って、前記フロント側チャンネルと前記バック側チャンネルとにエネルギーを分配するエネルギー分配手段とを備えることを特徴とする。

発明の効果

[0009] 以上説明したように、本発明のオーディオ信号符号化方法、および、復号化方法では、混入された複数の信号列から、複数の信号列に分離する場合において、人間の音源の包まれ感などに関する知覚特性をもちいて、非常に小さな補助情報を生成することで、聴感上、違和感がない程度に信号の分離を達成することが可能となる。

[0010] また、あら力じめ混入された信号力マルチチャンネル信号のダウンミクス信号であるように構成しておけば、復号時においては、補助情報を読み取って信号処理することなぐダウンミクス信号部だけを復号すれば、 2チャンネル信号の再生系を有するスピーカやヘッドホンにおいても、低演算量で高音質な再生が可能となる。

図面の簡単な説明

[0011] [図 1]図 1は、本実施の形態の符号化装置および復号化装置の処理の流れを示す図である。

[図 2]図 2は、チャンネル情報が示すリスナーと音源の関係を表す図である。

[図 3]図 3は、人間の聴覚特性に基づいて、前後のエネルギー比の量子化精度を変える符号ィ匕方法を示す図である。

[図 4]図 4は、図 1に示したエネルギー比符号ィ匕部とエネルギー分配部とを備えた符号化装置および復号化装置の構成を示すブロック図である。

符号の説明

[0012] 100 符号化装置

101 前方チャンネルエネルギー算出部

102 後方チャンネルエネルギー算出部

103 前方後方エネルギー比算出部

104 エネルギー量子化符号ィ匕部 105 エネルギー復号化逆量子化部

106 前方後方エネルギー算出部

107 前方チャンネルエネルギー分配部

108 後方チャンネルエネルギー分配部

109 符号化列

110 復号化装置

400 エネルギー比符号ィ匕部

401 ダウンミクス部

402 周波数変換部

403 量子化部

404 符号化部

405 多重化部

406 逆多重化部

407 復号化部

408 逆量子化部

409 逆周波数変換部

410 エネルギー分配部

411 信号分離部

発明を実施するための最良の形態

[0013] 以下、本発明の実施の形態を、図面を参照しながら説明する。

[0014] (実施の形態）

図 1は、本実施の形態のオーディオ信号符号化装置 100、および、復号化装置 11 0の処理の流れを模式的に示した図である。なお、本実施の形態では各チャンネルのオーディオ信号がどのような符号ィ匕方式によって符号ィ匕および復号ィ匕されるかは問題ではな!、ので、後に一例にっ、て説明する。

[0015] この符号ィ匕装置 100は、復号ィ匕装置 110においてマルチチャネル信号による包まれ感を復元するために、マルチチャネル信号の前方と後方とのエネルギー比を符号化する符号ィ匕装置であって、エネルギー比符号ィ匕部 400を備える。エネルギー比符号ィ匕部 400は、前方チャンネルエネルギー算出部 101、後方チャンネルエネルギー算出部 102、前方後方エネルギー比算出部 103、エネルギー量子化符号ィ匕部 104 力もなる。符号ィ匕列 109は符号ィ匕装置 100で符号化された信号である。

[0016] また、この復号ィ匕装置 110は、符号ィ匕装置 100によって出力された符号列 109から、マルチチャネル信号の前方と後方とのエネルギー比を算出し、復号化された各チヤンネルの信号により、原信号の包まれ感が復元されるよう、エネルギーを分配する復号化装置であって、エネルギー分配部 410を備える。エネルギー分配部 410は、ェネルギー復号ィ匕逆量子化部 105、前方後方エネルギー算出部 106、前方チャンネルエネルギー分配部 107、後方チャンネルエネルギー分配部 108からなる。

[0017] まず簡単に符号ィ匕装置 100から説明する。図 2は、チャンネル情報が示すリスナーと音源の関係を表す図である。マルチチャンネルのオーディオ信号の受聴システムにおいて、例えば図 2に示すような 5チャンネル信号を扱うものを想定した場合、リスナ一が正面を向、て着座してリスナーの正面方向に対して、耳より前方にあるフロント Lチャンネル（L)、フロント Rチャンネル (R)、センターチャンネル（C)と、耳より後方にあるバック Lチャンネル（BL)、バック Rチャンネル（BR)とに大別して以降の処理を実施する。耳より前方にあるチャンネルを前方チャンネル、耳より後方にあるチャンネルを後方チャンネルと呼ぶことにする。簡単のために 5チャンネルのシステムにつ!/ヽて説明をする力リスナーの耳より前方と後方のチャンネルに大別して処理をするという意味において、他のチャンネル数のシステムでもよい。一般に低域信号を扱う LF E (Low Frequency Effect)チャンネルは、リスナーの前方（または後方）においても、人間の聴覚特性において、その方向性は知覚されるものではないので、前方 (または後方)チャンネルと区別しな、。

[0018] 再び図 1に戻って、前方チャンネル信号（L、 R、 C)は、前方チャンネルエネルギー算出部 101に入力される。前方チャンネルエネルギー算出部 101は、前方チャンネル信号（L、 R、 C)それぞれのエネルギーを算出した上、前方チャンネル信号のエネルギー総和を算出する。また、後方チャンネル信号 (BL, BR)は、後方チャンネルェネルギー算出部 102に入力される。後方チャンネルエネルギー算出部 102は、後方チャンネル信号（BL, BR)それぞれのエネルギーを算出し、後方チャンネル信号のエネルギー総和を算出する。これら前方チャンネルエネルギー算出部 101、および後方チャンネルエネルギー算出部 102の処理はオーディオ符号ィ匕方法の一部であるので、一般的に規定の時間間隔で処理を実施する。つまり、時間間隔ごとのエネルギー算出となる。

[0019] 次に前方チャンネルエネルギー、および、後方チャンネルエネルギーは、前方後方エネルギー比算出部 103に入力される。前方後方エネルギー比算出部 103では、前方チャンネルエネルギーと後方チャンネルエネルギーのエネルギー比を算出する。あわせて、前方後方エネルギー比算出部 103の出力としては、前記のエネルギー比だけでなぐエネルギーの絶対量 (前方エネルギーそのもの、もしくは、後方エネルギ一そのもの、もくしは、前方エネルギーと後方エネルギーの加算値)も出力する。エネルギー量子化符号ィ匕部 104では、前方後方エネルギー比算出部 103の出力である、前記のエネルギー比とエネルギーの絶対量とを入力として、量子化し符号列 109を生成する。ここでは量子化方法および符号ィ匕方法にっ、ては特に規定しな、。

[0020] 図 4は、図 1に示したエネルギー比符号ィ匕部 400とエネルギー分配部 410とを備えた符号ィ匕装置 100および復号ィ匕装置 110の全体の構成を示すブロック図である。符号化装置 100は、エネルギー比符号ィ匕部 400、ダウンミクス部 401、周波数変換部 4 02、量子化部 403、符号化部 404および多重化部 405を備える。復号化装置 110 は、逆多重化部 406、復号化部 407、逆量子化部 408、逆周波数変換部 409、エネルギ一分配部 410および信号分離部 411を備える。

[0021] まず、符号ィ匕装置 100について説明する。エネルギー比符号ィ匕部 400で前後のチヤンネルのエネルギー比、およびエネルギーの絶対量が量子化および符号ィ匕されるのと並行して、ダウンミクス部 401、周波数変換部 402、量子化部 403、符号化部 40 4で各チャンネル信号が符号ィ匕される。

[0022] 前方チャンネル信号 (L、 R、 C)および後方チャンネル信号（BL, BR)力ダウンミタス部 401に入力される。ダウンミクス部 401は、前方左チャンネルの信号 Lと後方左チャンネルの信号 BLとから、 (L + BL) Z2で表される左ダウンミクス信号を生成する。また、前方右チャンネル信号 Rと後方右チャンネルの信号 BRとから、 (R + BR) /2 で表される右ダウンミクス信号を生成する。センターチャンネル信号 Cはそのままで、 3チャンネルの信号を出力する。なお、ここでは（L + BL)Z2および (R + BR)Z2というダウンミクスについて説明する力ダウンミタスの方法については複数提案されており、いずれの方法を用いてもよい。また、ここではいずれのダウンミタスの方法を用いたとしても、本発明を限定するものではない。ダウンミクス部 401からの信号は、周波数変換部 402に入力される。周波数変換部 402は、チャンネルごとの信号を、例えば、所定のサンプル数ずつ、周波数軸上の周波数スペクトルに変換する。量子化部 403は、周波数変換された各チャンネルの信号を量子化する。符号ィ匕部 404は、量子化された変換係数を符号化する。多重化部 405は、符号化されたそれぞれのチヤンネルの変換係数およびエネルギー比符号ィ匕部 400で符号ィ匕されたエネルギー比などを多重化して、符号列 109を出力する。

[0023] 次に復号ィ匕装置 110を説明する。前記の符号ィ匕装置 100で符号化された符号ィ匕列 109を入力として、復号化装置 110では、前方チャンネルの信号のエネルギーと、後方チャンネルの信号のエネルギーを再生する。

[0024] まず、エネルギー分配部 410のエネルギー復号化逆量子化部 105は、図 4に示した逆多重化部 406によって符号ィ匕列 109から分離された符号列を読み取って、前方チャンネルと後方チャンネルのエネルギー比とエネルギーの絶対量（前方エネルギ一そのもの、もしくは、後方エネルギーそのもの、もくしは、前方エネルギーと後方ェネルギ一の加算値)を復号する。前方後方エネルギー算出部 106では、前記前方チヤンネルと後方チャンネルのエネルギー比とエネルギーの絶対量を受けて、前方チヤンネルのエネルギー和と、後方チャンネルのエネルギー和を出力する。前方チャンネルのエネルギー和は、前方チャンネルエネルギー分配部 107へ、後方チャンネルのエネルギー和は、後方チャンネルエネルギー分配部 108へそれぞれ入力される。

[0025] 一方、逆多重化部 406は、符号列 109から、左チャンネル、右チャンネルおよびセンターチヤンネルのスペクトルを表す符号列を逆多重化する。復号ィ匕部 407は、各チヤンネルに対応する符号列を復号化する。逆量子化部 408は、復号化された各チヤネルのスペクトルを逆量子化する。逆周波数変換部 409は、周波数スペクトルで表された左チャンネル、右チャンネルおよびセンターチャンネルの信号を、時間の関数で表される信号に変換する。信号分離部 411は、時間の関数に変換されたダウンミクス信号を、元のマルチチャネル信号に分離する。すなわち、左チャンネル信号から前方左チャンネル信号 Lおよび後方左チャンネル信号 BLを分離し、右チャンネル信号カゝら前方右チャンネル信号 Rおよび後方右チャンネル信号 BRを分離する。このとき、前方チャンネルエネルギー分配部 107では、前方チャンネル間でのエネルギー比率に従って、 L, R, Cそれぞれのチャンネルのエネルギーを導出し、後方チャンネルェネルギー分配部 108では、後方チャンネル間でのエネルギー比率に従って、 BL、 B Rそれぞれのチャンネルのエネルギーを導出する。このように導出されたエネルギーに従って、各チャンネル信号が生成されることにより、原信号のマルチチャネル信号による包まれ感が復元される。

[0026] 本発明の具体的な符号ィ匕方法について図 1を用いてさらに詳細に説明する。符号化装置 100は、前方チャンネルエネルギー算出部 101、後方チャンネルエネルギー算出部 102、前方後方エネルギー比算出部 103、エネルギー量子化符号ィ匕部 104 力もなる。符号ィ匕列 109は符号ィ匕装置 100で符号化された信号である。

[0027] また、この復号ィ匕装置 110は、エネルギー復号ィ匕逆量子化部 105、前方後方エネルギー算出部 106、前方チャンネルエネルギー分配部 107、後方チャンネルェネルギー分配部 108からなる。

[0028] 符号ィ匕装置 100および復号ィ匕装置 110は、マルチチャンネルオーディオ受聴時のリスナーの空間的な印象のひとつである包まれ感に関する特性に着眼したものであり、包まれ感に関して ίま、 The role of reflections from behind the listener in spatial ι mpression", Masayu i orimoto, Kazuniro Iida, et.al, Applied Acoustics 2001, pp.1 09-124などに記載があり、リスナーの受聴状況において、前方チャンネルの音源のレベルと、後方チャンネルの音源のレベルの比の保持が重要であることがのべられている。言い換えれば、前方チャンネルの音源と後方チャンネルのエネルギーレベルの比（本実施の开態では、 FBR (Front Back Energy Ratio)と称する。 )を保つことで、リスナーに十分な包まれ感を提供できる可能性があることを意味する。

[0029] 簡単のために、取り扱うマルチチャンネルのオーディオ信号として、フロント左チヤンネル（L)、フロント右チャンネル（R)、フロントセンターチャンネル（C)、バック左チヤンネル（BL)、バック右チャンネル（BR)の 5チャンネルの場合を想定し、前方チャンネルとして、 L, R, C、後方チャンネルとして、 BL、 BRとする。マルチチャンネルのシステムとして、さらに多いチャンネル数のものや、少ないチャンネル数のものも考えられるが、リスナーに対して、前方に存在するチャンネルを前方チャンネル、後方に存在するチャンネルを後方チャンネルとして、本実施の形態と同様に扱うことが可能である。

[0030] まず、前方チャンネル信号 (L、 R、 C)は、前方チャンネルエネルギー算出部 101に入力され、前方チャンネルエネルギー算出部 101は、前方チャンネル信号のエネルギー総和を算出する。また、後方チャンネル信号 (BL, BR)は、後方チャンネルエネルギー算出部 102に入力され、後方チャンネルエネルギー算出部 102は、後方チヤンネル信号のエネルギー総和を算出する。これら前方チャンネルエネルギー算出部 101、および後方チャンネルエネルギー算出部 102の処理はオーディオ符号ィ匕方法の一部であるので、一般的に規定の時間間隔で処理を実施する。つまり、時間間隔ごとのエネルギー算出となる。前方チャンネルのエネルギーを Ef、後方チャンネルのエネルギーを Ebとする。例えば、前方チャンネル信号（L、 R、 C)のそれぞれのエネルギーを LE、 RE、 CEとすると、前方チャンネル信号のエネルギー総和 Efは、 Ef= LE+RE + CEと表される。同様に、後方チャンネル信号（BL, BR)の各エネルギーを、 BLE、 BREとすると、後方チャンネル信号のエネルギー総和 Ebは、 Eb = BLE + BREと表される。

[0031] 次に前方チャンネルエネルギー Ef、および、後方チャンネルエネルギー Ebは、前方後方エネルギー比算出部 103に入力される。前方後方エネルギー比算出部 103 では、前方チャンネルエネルギーと後方チャンネルエネルギーのエネルギー比 FBR ( (1)式参照)を算出する。

[0032] FBR = 10 1og( Ef / Eb ) (1)

あわせて、前方後方エネルギー比算出部 103の出力としては、前記のエネルギー比だけでなぐエネルギーの絶対量 (前方エネルギー Efそのもの、もしくは、後方エネルギー Ebそのもの、もくしは、前方エネルギーと後方エネルギーの加算値 Ef + Eb)も出力する。エネルギー量子化符号ィ匕部 104では、前方後方エネルギー比算出部 10 3の出力である、前記のエネルギー比 (FBR)とエネルギーの絶対量を入力として、量子化し符号列 109を生成する。前述したように、エネルギー比 (FBR)はリスナーの「包まれ感」に関する聴感特性に強く関連する値であるので、量子化の際には、人間の聴覚特性上、鋭敏に感知される範囲ではエネルギー比 (FBR)を緻密に量子化し、すなわち、小さい値の量子化ステップで量子化し、あまり感知されない範囲では粗く量子化するようにすれば、符号ィ匕効率を高めることが出来る。図 3は、人間の聴覚特性に基づ、て、前後のエネルギー比の量子化精度を変える符号ィ匕方法を示す図である。同図において、横軸は前後のエネルギー比（Ef / Eb)を表しており、内部の縦線は量子化精度の粗密を表している。同図に示すように、人間の聴覚特性からいうと、前方向から聞こえる音のエネルギーと、後方向から聞こえる音のエネルギーとの差は、前後のエネルギー値が同程度である場合に最も知覚されやすい。すなわち、 Ef I Eb= lのときに、前後のエネルギー値のずれが最も知覚されやすい。逆に、元々、前後のエネルギー値がかけ離れて、る場合には、本来の前後のエネルギーが少しぐらいずれていても人間の耳には感知されない。従って、前後のエネルギー比（Ef / E b)が「1」に近いところでは、そのエネルギー比に対して緻密な量子化を行い、「1」から離れるに従って粗く量子化を行なう。

[0033] また、前方エネルギー Efそのものの値の保持や、後方エネルギー Ebのそのものの値の保持以上に、エネルギー比 (FBR)の値の保持を目指した量子化および符号ィ匕方法が望まヽ。ここでは量子化方法および符号化方法につ！ヽては特に規定しなヽ

[0034] 次に復号ィ匕装置 110を説明する。前記の符号ィ匕装置 100で符号化された符号ィ匕列 109を入力として、復号化装置 110では、前方チャンネルの信号のエネルギーと、後方チャンネルの信号のエネルギーを再生する。

[0035] まず、符号ィ匕列 109は、エネルギー復号ィ匕逆量子化部 105にて、符号化列を読み取って、前方チャンネルと後方チャンネルのエネルギー比（FBR)とエネルギーの絶対量（前方エネルギーそのもの Ef、もしくは、後方エネルギーそのもの Eb、もくしは、前方エネルギーと後方エネルギーの加算値 Ef+Eb)を復号する。前方後方エネルギー算出部 106では、前記前方チャンネルと後方チャンネルのエネルギー比（FBR) とエネルギーの絶対量を受けて、前方チャンネルのエネルギー和 Efと、後方チャンネルのエネルギー和 Ebを出力する。前方チャンネルのエネルギー和 Efは、前方チャンネルエネルギー分配部 107へ、後方チャンネルのエネルギー和 Ebは、後方チャンネルエネルギー分配部 108へそれぞれ入力される。前方チャンネルエネルギー分配部 107では、前方チャンネル間でのエネルギー比率に従って、 L, R, Cそれぞれのチヤンネルのエネルギーを導出し、後方チャンネルエネルギー分配部 108では、後方チャンネル間でのエネルギー比率に従って、 BL、 BRそれぞれのチャンネルのエネルギーを導出する。前方チャンネル間でのエネルギー比率や、後方チャンネル間でのエネルギー比率の復号ィ匕方法については、本願では特に規定しない。別途入手可能な情報に基づいて復号ィ匕するのが一般である。

[0036] このように構成されたオーディオ信号符号化装置 100および復号化装置 110を用いれば、リスナーのマルチチャンネル受聴時の、「包まれ感」の特性を保持することが容易であり、少ない情報で符号ィ匕列を構成し、マルチチャンネルを再生する際にも、快適な音場を提供することが可能となる。

[0037] なお、上記実施の形態で説明した各チャンネル信号の符号化方法および復号ィ匕方法は、単に一例を示したに過ぎず、本発明のオーディオ信号符号化装置および復号ィ匕装置における各チャンネル信号の符号ィ匕方法および復号ィ匕方法は、これに限定されない。例えば、上記の例では、 5チャンネルのマルチチャネル信号を、左チヤネル、右チャンネルおよびセンターチャンネルの 3チャンネルにダウンミックスして符号化したが、左チャネル、右チャンネルおよびセンターチャンネルの 3チャンネルを、さらにモノーラル信号にダウンミックスして、符号ィ匕および復号ィ匕するとしてもよい。産業上の利用可能性

[0038] 本発明のオーディオ信号復号化方法、および、符号化方法は、従来からオーディォ符号ィ匕および復号ィ匕方法が適用されていたあらゆるアプリケーションにおいて、適用可能である。

[0039] オーディオ符号ィ匕されたビットストリームなる符号ィ匕列は、現在、放送コンテンツの伝送、 DVDや SDカードなどの蓄積媒体に記録され再生される応用、携帯電話に代表される通信機器に AVコンテンツを伝送する場合などに用いられている。また、インターネット上でやりとりされる電子データとして、オーディオ信号を伝送する場合においても有用である。

Claims

請求の範囲

[1] マルチチャネルのオーディオ信号を符号化するオーディオ信号符号化装置であつて、

マルチチャネルのオーディオ信号のうち、リスナーのフロント側に存在するチャンネルの信号のエネルギー和、および、リスナーのバック側に存在するチャンネルの信号のエネルギー和を算出するエネルギー和算出手段と、

フロント側の前記エネルギー和と、バック側の前記エネルギー和との比を算出するエネルギー比算出手段と、

算出された前記エネルギー和の比を符号ィ匕するエネルギー比符号ィ匕手段とを備えることを特徴とするオーディオ信号符号ィ匕装置。

[2] 前記エネルギー比符号ィ匕手段は、前記エネルギー和の比を、聴覚上の包まれ感に関する弁別特性に応じて量子化し、符号化する

ことを特徴とする請求項 1記載のオーディオ信号符号ィ匕装置。

[3] 前記弁別特性は、フロント側の前記エネルギー和と、バック側の前記エネルギー和との差が所定範囲内である場合に、弁別性能が最も高いことを示し、

前記エネルギー比符号ィ匕手段は、フロント側とバック側とのエネルギー和の差が最も小さいとき最も量子化精度が高くなるよう量子化し、前記エネルギー和の差が大きくなるほどビット数が少なくなるよう量子化を行なう

ことを特徴とする請求項 2記載のオーディオ信号符号ィ匕装置。

[4] マルチチャネルのオーディオ信号を表す符号ィ匕列を復号ィ匕することによって、聴覚上の包まれ感を有するマルチチャネルオーディオ信号を出力するオーディオ信号復号化装置であって、

符号列を復号ィヒすることによって、マルチチャネルオーディオ信号を生成するォーディォ信号復号化手段と、

前記符号列を復号ィ匕することによって、リスナーのフロント側に存在するチャンネルの信号のエネルギー和と、リスナーのバック側に存在するチャンネルの信号のェネルギー和との比を復号ィ匕するエネルギー比復号ィ匕手段と、

復号化された前記エネルギー和の比に従って、前記フロント側チャンネルと前記バック側チャンネルとにエネルギーを分配するエネルギー分配手段と

を備えることを特徴とするオーディオ信号復号ィ匕装置。

[5] マルチチャネルのオーディオ信号を符号ィ匕するオーディオ信号符号ィ匕方法であつて、

マルチチャネルのオーディオ信号のうち、リスナーのフロント側に存在するチャンネルの信号のエネルギー和、および、リスナーのバック側に存在するチャンネルの信号のエネノレギー和を算出し、

フロント側の前記エネルギー和と、バック側の前記エネルギー和との比を算出し、算出された前記エネルギー和の比を符号ィ匕する

ことを特徴とするオーディオ信号符号ィ匕方法。

[6] マルチチャネルのオーディオ信号を表す符号ィ匕列を復号ィ匕することによって、聴覚上の包まれ感を有するマルチチャネルオーディオ信号を出力するオーディオ信号復号化方法であって、

符号列を復号ィ匕することによって、マルチチャネルオーディオ信号を生成し、前記符号列を復号ィ匕することによって、リスナーのフロント側に存在するチャンネルの信号のエネルギー和と、リスナーのバック側に存在するチャンネルの信号のェネルギー和との比を復号ィ匕し、

復号化された前記エネルギー和の比に従って、前記フロント側チャンネルと前記バック側チャンネルとにエネルギーを分配する

ことを特徴とするオーディオ信号復号ィ匕方法。

[7] オーディオ信号符号化装置のためのプログラムであって、マルチチャネルのオーディォ信号のうち、リスナーのフロント側に存在するチャンネルの信号のエネルギー和、および、リスナーのバック側に存在するチャンネルの信号のエネルギー和を算出するステップと、フロント側の前記エネルギー和と、バック側の前記エネルギー和との比を算出するステップと、算出された前記エネルギー和の比を符号ィ匕するステップとを含む各ステップをコンピュータに実行させるプログラム。

[8] オーディオ信号復号ィ匕装置のためのプログラムであって、符号列を復号化することによって、マルチチャネルオーディオ信号を生成するステップと、前記符号列を復号化することによって、リスナーのフロント側に存在するチャンネルの信号のエネルギー和と、リスナーのバック側に存在するチャンネルの信号のエネルギー和との比を復号化するステップと、復号ィヒされた前記エネルギー和の比に従って、前記フロント側チヤンネルと前記バック側チャンネルとにエネルギーを分配するステップとを含む各ステップをコンピュータに実行させるプログラム。

[9] マルチチャネルのオーディオ信号のうち、リスナーのフロント側に存在するチャンネルの信号のエネルギー和、および、リスナーのバック側に存在するチャンネルの信号のエネルギー和を算出するステップと、フロント側の前記エネルギー和と、バック側の前記エネルギー和との比を算出するステップと、算出された前記エネルギー和の比を符号ィ匕するステップとを含む各ステップをコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体。

[10] 符号列を復号ィ匕することによって、マルチチャネルオーディオ信号を生成するステップと、前記符号列を復号ィ匕することによって、リスナーのフロント側に存在するチヤンネルの信号のエネルギー和と、リスナーのバック側に存在するチャンネルの信号のエネルギー和との比を復号ィ匕するステップと、復号ィ匕された前記エネルギー和の比に従って、前記フロント側チャンネルと前記バック側チャンネルとにエネルギーを分配するステップとを含む各ステップをコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体。