[go: up one dir, main page]

JP2013054395A - 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 - Google Patents

多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 Download PDF

Info

Publication number
JP2013054395A
JP2013054395A JP2012278575A JP2012278575A JP2013054395A JP 2013054395 A JP2013054395 A JP 2013054395A JP 2012278575 A JP2012278575 A JP 2012278575A JP 2012278575 A JP2012278575 A JP 2012278575A JP 2013054395 A JP2013054395 A JP 2013054395A
Authority
JP
Japan
Prior art keywords
audio
information
audio signal
signal
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012278575A
Other languages
English (en)
Other versions
JP5453515B2 (ja
Inventor
Seung Kwon Beack
スン−クォン バク
Jong-Il Seo
ジョン−イル ソ
Tae-Jin Lee
テ−ジン イ
Yong-Ju Lee
ヨン−ジュ イ
In-Seon Jang
イン−ソン チャン
Jae-Hyoun Yoo
ジェ−ヒョン ユ
Dae-Young Jang
デ−ヨン チャン
Jin-Woo Hong
ジン−ウ ホン
Jin-Woong Kim
ジン−ウン キム
Kyeong-Ok Kang
キョン−オク カン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2013054395A publication Critical patent/JP2013054395A/ja
Application granted granted Critical
Publication of JP5453515B2 publication Critical patent/JP5453515B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

【課題】多様なチャネルから構成されたマルチオブジェクトオーディオ信号符号化および復号化装置並びに方法を提供する。
【解決手段】本発明は、入力信号から復元されたダウンミックスオーディオ信号に対する制御情報(前記制御情報は、前記復元されたオーディオ信号に対するレンダリング制御情報を含む)を用いて、前記入力信号から抽出された付加情報を制御する付加情報制御手段と、前記制御された付加情報を用いて、前記復元されたダウンミックスオーディオ信号をマルチチャネルオーディオ信号として出力する出力手段とを備え、前記付加情報は、前記オーディオ信号に対するプリセット情報を含み、オーディオ符号化および復号化に利用される。
【選択図】図10

Description

本発明は、マルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法に関し、詳細には多様なチャネルを有するマルチオブジェクトオーディオ信号を符号化および復号化する、多様なチャネルから構成されたマルチオブジェクトオーディオ信号符号化および復号化装置、並びにその方法に関する。
ここで、多様なチャネルを有するマルチオブジェクトオーディオ信号とは、マルチオブジェクトオーディオ信号として各々のオーディオオブジェクトが相異なるチャネル(例えば、モノ、ステレオ、5.1チャネル)で構成されたオーディオ信号を意味する。
従来のオーディオ符号化/複号化技術によると、ユーザはオーディオコンテンツを受動的に聴取するほかはないため、ユーザの必要に応じて相異なるチャネルから構成された各オーディオオブジェクトを制御して1つのオーディオコンテンツを多様な方法で組合せることによって、多様なオーディオオブジェクトを消費することのできる多様なチャネルから構成された複数のオーディオオブジェクト別の符号化および復号化装置、並びに方法が要求されている。
従来技術であるSAC(Spatial Audio Coding)は、マルチチャネルオーディオ信号をダウンミックスされたモノまたはステレオ信号および空間キュー(spatial cue)として表現、伝送、および復元する技術であって、低いビット率でも高品質のマルチチャネルオーディオ信号を伝送できる。
しかし、SACは、マルチチャネルから構成された単一オブジェクトオーディオ信号に対してのみ符号化および復号化が可能な技術であるため、マルチチャネルでありながらも同時にマルチオブジェクトオーディオ信号、例えば、モノ、ステレオ、および5.1チャネルから構成された多様なオブジェクトのオーディオ信号を符号化/複号化することができないといった問題がある。
また別の従来技術であるバイノーラルキューコーディング(Binaural Cue Coding:BCC)は、マルチオブジェクトオーディオ信号を符号化/復号化することができるが、該当のオーディオオブジェクトは、モノチャネルである場合に限定されるため、モノチャネル以外の多様なチャネルから構成されたマルチオブジェクトオーディオ信号を符号化/複号化することができない短所がある。
まとめると、従来技術によると、単一チャネルから構成されたマルチオブジェクトオーディオ信号またはマルチチャネルの単一オブジェクトオーディオ信号に対してのみ符号化/複号化を行い得るため、多様なチャネルから構成されたマルチオブジェクトオーディオ信号に対しては符号化/複号化を行なえないという問題があり、したがって、従来のオーディオ信号符号化/複号化技術によると、ユーザはオーディオコンテンツを受動的に聴取せざるを得ないという問題がある。
したがって、ユーザの必要に応じて相異なるチャネルから構成された複数のオーディオオブジェクトの各々を制御して1つのオーディオコンテンツを多様な方法で組合せることによって、多様なオーディオオブジェクトを消費することのできる多様なチャネルから構成された複数のオーディオオブジェクト別の符号化および復号化装置、並びに方法が要求される。
本発明は前述の要求に対応するために提案されたものであって、多様なチャネルを有するマルチオブジェクトオーディオ信号を符号化および復号化する、多様なチャネルから構成されたマルチオブジェクトオーディオ信号符号化および復号化装置、並びにその方法を提供することを目的とする。
前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の符号化装置であって、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号を1つのダウンミックスされたオーディオ信号にダウンミキシングし、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対するヘッダ情報および空間キュー情報を含む付加情報を抽出するダウンミキシング手段と、前記ダウンミキシングされたオーディオ信号を符号化する符号化手段と、前記付加情報をビットストリームとして生成する付加情報符号化手段と、を備え、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む符号化装置を提供する。
また、前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の符号化方法であって、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号を1つのダウンミックスされたオーディオ信号にダウンミキシングし、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対するヘッダ情報および空間キュー情報を含む付加情報を抽出するダウンミキシングステップと、前記ダウンミキシングされたオーディオ信号を符号化する符号化ステップと、前記付加情報をビットストリームとして生成する付加情報符号化ステップと、を含み、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む符号化方法を提供する。
また、前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の復号化装置であって、入力オーディオ信号からダウンミックスオーディオ信号を復元し、入力されたオーディオ信号に含まれた付加情報ビットストリームからヘッダ情報および空間キュー情報を含む付加情報を抽出する入力信号分析手段と、該入力信号分析手段から抽出された付加情報を用いて、前記復元されたダウンミックスオーディオ信号をオブジェクト別のオーディオ信号に復元するオーディオオブジェクト抽出手段と、入力されたオーディオ信号に対する制御情報を用いて前記復元されたオブジェクト別のオーディオ信号をマルチオブジェクトオーディオ信号として出力する出力手段と、を備え、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む復号化装置を提供する。
また、前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の復号化方法であって、入力オーディオ信号からダウンミックスオーディオ信号を復元し、入力されたオーディオ信号に含まれた付加情報ビットストリームからヘッダ情報および空間キュー情報を含む付加情報を抽出する入力信号分析ステップと、該入力信号分析ステップから抽出された付加情報を用いて、前記復元されたダウンミックスオーディオ信号をオブジェクト別のオーディオ信号に復元するオーディオオブジェクト抽出ステップと、入力されたオーディオ信号に対する制御情報を用いて前記復元されたオブジェクト別のオーディオ信号をマルチオブジェクトオーディオ信号として出力する出力ステップと、を含み、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む復号化方法を提供する。
また、前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の復号化装置であって、入力オーディオ信号からダウンミックスオーディオ信号を復元し、入力されたオーディオ信号に含まれた付加情報ビットストリームからヘッダ情報および空間キュー情報を含む付加情報を抽出する入力信号分析手段と、入力オーディオ信号に対する制御情報を用いて、前記入力信号分析手段から抽出された付加情報を制御する付加情報制御手段と、制御された付加情報を用いて前記復元されたダウンミックスオーディオ信号をマルチオブジェクトオーディオ信号として出力する出力手段と、を備え、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む復号化装置を提供する。
また、前述した目的を達成するための本発明は、相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の復号化方法であって、入力オーディオ信号からダウンミックスオーディオ信号を復元し、入力されたオーディオ信号に含まれた付加情報ビットストリームからヘッダ情報および空間キュー情報を含む付加情報を抽出する入力信号分析ステップと、入力オーディオ信号に対する制御情報を用いて、前記入力信号分析ステップから抽出された付加情報を制御する付加情報制御ステップと、制御された付加情報を用いて前記復元されたダウンミックスオーディオ信号をマルチオブジェクトオーディオ信号として出力する出力ステップと、を含み、前記ヘッダ情報は、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の各々に対する識別子情報と、前記相異なるチャネルから構成されたマルチオブジェクトオーディオ信号に対するチャネル情報と、を含む復号化方法を提供する。
本発明は、多様なチャネルを有するマルチオブジェクトオーディオ信号を符号化および復号化する、多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化装置および方法を提供することによって、多様なチャネルから構成された多様なオーディオオブジェクトのオーディオコンテンツを効率的に符号化および復号化することにより、ユーザが必要に応じて能動的にオーディオコンテンツを消費することができる。
本発明に係るマルチオブジェクトオーディオ信号符号化装置を示す一実施例の図である。 図1におけるモノチャネルのダウンミキサを示す図である。 図1におけるステレオチャネルダウンミキサを示す図である。 図1におけるマルチチャネルダウンミキサを示す図である。 図1における第2ダウンミキサを示す図である。 図1における付加情報エンコーダから生成される付加情報ビットストリームの構造を示す図である。 図6に示す付加情報ビットストリームの構造を詳細に示す図である。 本発明に係る図6に示す付加情報ビットストリームの構造を詳細に示す他の実施例の図である。 本発明に係るマルチオブジェクトオーディオ復号化装置を示す一実施例を示すブロック図である。 本発明に係るマルチオブジェクトオーディオ復号化装置を示す他の実施例のブロック図である。 本発明に係る図1の装置を用いたマルチオブジェクトオーディオの符号化方法を示す一実施例のフローチャートである。 本発明に係る図9の装置を用いたマルチオブジェクトオーディオの復号化方法を示す一実施例のフローチャートである。 本発明に係る図10の装置を用いたマルチオブジェクトオーディオの復号化方法を示す一実施例のフローチャートである。
前述した目的、特徴、および長所は、添付の図面と関連した次の詳細な説明を介して更に明確になるであろう。以下、添付の図面を参照して本発明に係る好ましい一実施例を詳説する。
図1は、本発明に係るマルチオブジェクトオーディオ信号符号化装置を示す一実施例の図であって、例えば、入力される複数のオーディオオブジェクトのチャネルが、各々モノ、ステレオ、および5.1チャネルである。
同図に示すように、本発明の一実施例に係るマルチオブジェクトオーディオ符号化装置は、第1ダウンミキサ101、第2ダウンミキサ103、オーディオエンコーダ105、付加情報エンコーダ107、および多重化部(multiplexer)109を備える。
前記第1ダウンミキサ101は、モノチャネルのダウンミキサ111、ステレオチャネルダウンミキサ113、およびマルチチャネルダウンミキサ115を備えている。
前記第1ダウンミキサ101は、入力オーディオオブジェクトのヘッダ情報を用いて入力された多様なチャネルのマルチオブジェクトオーディオ信号をモノ、ステレオ、マルチチャネルに識別し、チャネル別にグルーピングする。したがって、多様なチャネルのマルチオブジェクトオーディオ信号は、各々チャネル別にグルーピングされて各チャネル別のダウンミキサ111、113、115によってダウンミキシングされる。
また、前記第1ダウンミキサ101は、入力オーディオオブジェクトからダウンミックスされたオーディオ信号、および空間キューを含む付加情報を抽出する。すなわち、同じチャネル別に音源がグルーピングされて前記第1ダウンミキサ101に入力され、モノチャネルのダウンミキサ111は、入力されたモノオーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報を抽出し、ステレオチャネルダウンミキサ113は、入力されたステレオオーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報を抽出し、マルチチャネルダウンミキサ115は、入力されたマルチチャネル(例えば5.1チャネル)オーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報を抽出する。
前記オーディオエンコーダ105は、前記第2ダウンミキサ103から出力された第2ダウンミックス信号を符号化する。
前記付加情報エンコーダ107は、前記第1ダウンミキサ101から出力された付加情報および前記第2ダウンミキサ103から出力された付加情報を用いて付加情報ビットストリームを生成する。ここで、付加情報ビットストリームに含まれた情報は、下記の図6において詳説する。
前記多重化部109は、前記オーディオエンコーダ105から符号化された信号および前記付加情報エンコーダ107から生成された付加情報ビットストリームを多重化して復号化装置に伝送されるビットストリームを生成する。
前記第1ダウンミキサ101から出力される第1ダウンミックス信号は、ステレオ信号またはモノ信号である。すなわち、前記モノチャネルのダウンミキサ111から出力されるダウンミックス信号はモノ信号であって、残りのダウンミキサ113、115から出力されるダウンミックス信号はモノまたはステレオ信号である。
前記第2ダウンミキサ103は、前記第1ダウンミキサ101から出力された第1ダウンミックス信号を第2ダウンミックスして第2ダウンミックス信号を出力し、前記第2ダウンミックスの過程で分析された空間キューを含む付加情報を抽出する。ここで、第2ダウンミックス信号は、モードに応じてモノまたはステレオ信号である。
ここで、前記付加情報には、空間キュー、オーディオ信号の復元および制御のためのヘッダ情報が含まれている。付加情報は、下記の図6において詳説する。
図2は、図1のモノチャネルのダウンミキサ111を示す図であって、例えば、入力されるモノオーディオオブジェクトがN個(m1、…、mN)である。
同図に示すように、前記モノチャネルのダウンミキサ111は、基本ダウンミキサ(1)(201a、…、201d)をカスケード(cascade)構造で備える。
モノチャネルのダウンミキサ111に含まれる基本ダウンミキサ(1)201の個数は、モノオーディオオブジェクトの個数(N)に応じて決定される。すなわち、モノオーディオオブジェクトがN個であるとき、基本ダウンミキサ(1)201の個数はN−1個となり、モノオーディオオブジェクトが1つであるときは基本ダウンミキサが無く入力信号がバイパス(bypass)される。
一方、実施例によって1つの基本ダウンミキサ(1)がカスケード方式によりN−1回利用され得る。
基本的に基本ダウンミキサ(1)は、2つの入力信号をダウンミックスして1つのダウンミックスされたモノ信号を生成し、入力信号に対する空間キューを含む付加情報を抽出する。最初の基本ダウンミキサ(1)201aは、前記モノチャネルのダウンミキサ111に入力されるモノオーディオオブジェクト2つを用いて1つのダウンミックスされたモノ信号を生成し、空間キューを含む付加情報を抽出する。次に、2番目に利用される基本ダウンミキサ(1)201bは、最初の基本ダウンミキサ(1)201aから出力されるダウンミックスされたモノ信号および前記モノチャネルのダウンミキサ111に入力されるモノオーディオオブジェクトを用いて1つのダウンミックスされたモノ信号を生成し、空間キューを含む付加情報を抽出する。N−1番目の基本ダウンミキサ(1)201dは、N−2番目の基本ダウンミキサ(1)(図示せず)から出力されるダウンミックスモノ信号および前記モノチャネルのダウンミキサ111に入力されるモノオーディオオブジェクトを用いて1つのダウンミックスされたモノ信号を生成し、空間キューを含む付加情報を抽出する。
ここで、空間キューとは、オーディオ信号を符号化および復号化する過程において利用される情報であって、周波数領域で抽出され、基本ダウンミキサ(1)201に入力される2つの信号の大きさの差(amplitude difference)、遅延差、相関性などの情報を含む。例えば、本発明の一実施例に従って活用可能な空間キューとして、オーディオ信号のパワー利得情報を示す、オーディオ信号間のレベル差(Channel(audio signal)Level Difference:CLD)、オーディオ信号間のエネルギー比(Inter-Channel Level Difference:ICLD)、オーディオ信号間の時間差(Inter Channel Time Difference:ICTD)、オーディオ信号間の相関性情報を示すオーディオ信号間の相関性(Inter Channel Correlation:ICC)、および仮想音源位置情報(Virtual Source Location Information)があるが、これに限定されない。
ここで、前記付加情報には、空間キュー、オーディオ信号の復元および制御のためのヘッダ情報が含まれる。付加情報は、下記の図6において詳説する。
図3は、図1のステレオチャネルダウンミキサ113を示す図であって、例えば、入力されるステレオオーディオオブジェクトは、各々M個のLEFT信号およびRIGHT信号(SL1、…、SLMおよびSR1、…、SRM)である。
ステレオチャネルダウンミキサ113に入力されるステレオオーディオオブジェクトは、ステレオのLEFT信号とRIGHT信号とに分離されて、分離された信号は再びグルーピングされる。
同図に示すように、前記ステレオチャネルダウンミキサ113は、複数の基本ダウンミキサ(1)201を備える。前記ステレオチャネルダウンミキサ113に備えられた基本ダウンミキサ(1)201は、M個のLEFT信号およびM個のRIGHT信号をダウンミキシングするために、2×(M−1)個が必要である。ここで、図2で説明したように他の実施例では、1つの基本ダウンミキサ(1)が2×(M−1)回利用され得る。
図3に示すように、M個のLEFT信号を分析するためのM−1個の基本ダウンミキサ(1)201la〜201leは、図2で説明したように、入力される信号を分析し、1つのダウンミックスされたLEFT信号を生成し、空間キューを含む付加情報を抽出する。
図3に示すように、M個のRIGHT信号を分析するためのM−1個の基本ダウンミキサ(1)201ra〜201reは、図2で説明したように、入力される信号を分析して1つのダウンミックスされたRIGHT信号を生成し、空間キューを含む付加情報を抽出する。
図3に示すように、ステレオオーディオオブジェクトが1つである場合は、入力されるLEFT信号およびRIGHT信号がバイパスされ得る。
したがって、前記ステレオチャネルダウンミキサ113は、ダウンミックスされたLEFT信号およびダウンミックスされたRIGHT信号を生成することによってステレオダウンミックス信号を出力し、空間キューを含む付加情報を抽出する。
ここで、前記付加情報には、空間キュー、オーディオ信号の復元および制御のためのヘッダ情報が含まれる。付加情報は下記の図6において詳説する。
図4は、図1のマルチチャネルダウンミキサ115を示す図であって、例えば、入力される5.1チャネルオーディオオブジェクトはP個である。
同図に示すように、マルチチャネルダウンミキサ115は、MPEGサラウンドまたはSAC技術によるダウンミキサであって、マルチチャネルオーディオ信号から空間キューが含まれた付加情報を抽出し、オーディオ信号をモノまたはステレオダウンミックス信号にダウンミックスする。
すなわち、マルチチャネルダウンミキサ115は、入力信号のP個のマルチチャネルオーディオオブジェクトから空間キューを抽出して伝送し、オーディオ信号をモノまたはステレオ信号にダウンミックスする。一般的にマルチチャネルオーディオオブジェクトは1つである場合がほとんどである。
図5は、図1の第2ダウンミキサ103を示す図である。
前記第2ダウンミキサ103は、前記第1ダウンミキサ101から出力された信号を再度ダウンミックスしてステレオダウンミックス信号を出力し、空間キューが含まれた付加情報を抽出する。
同図に示すように、前記第2ダウンミキサ103は、基本ダウンミキサ(1)201f、201gおよび基本ダウンミキサ(2)501を備える。
ステレオチャネルダウンミキサ113およびマルチチャネルダウンミキサ115からダウンミックスされた信号がステレオ信号である場合、該当のダウンミックスされたステレオ信号は、各々LEFTおよびRIGHT信号にグルーピングされると、基本ダウンミキサ(1)201fおよび201gが該当のグルーピングされたLEFTおよびRIGHT信号をダウンミキシングする。各々の基本ダウンミキサ(1)201fおよび201gから出力されたダウンミックスモノ信号は、LEFTおよびRIGHT信号の代表的なダウンミックス信号である。
すなわち、前記基本ダウンミキサ(1)201fは、前記ステレオチャネルダウンミキサ113から出力されるダウンミックスされたLEFT信号、および前記マルチチャネルダウンミキサ115から出力されるダウンミックスされたLEFT信号を再度ダウンミックスし、代表LEFT信号として1つの代表ダウンミックスLEFT信号を出力して、付加情報を抽出する。
そして、前記基本ダウンミキサ(1)201gは、前記ステレオチャネルダウンミキサ113から出力されるダウンミックスされたRIGHT信号、および前記マルチチャネルダウンミキサ115から出力されるダウンミックスされたRIGHT信号を再度ダウンミックスし、1つの代表ダウンミックスRIGHT信号を出力して、付加情報を抽出する。
ここで、図2で説明したように、他の実施例によって1つの基本ダウンミキサ(1)が2回利用され得る。
次に、前記基本ダウンミキサ(2)501は、前記モノチャネルのダウンミキサ111から出力されるダウンミックスモノ信号、前記基本ダウンミキサ(1)201fおよび201gから出力される代表ダウンミックスLEFT信号および代表ダウンミックスRIGHT信号をダウンミックスし、全体のダウンミックスLEFT信号および全体のダウンミックスRIGHT信号を出力して、空間キューが含まれた付加情報を抽出する。
ここで、前記付加情報には、空間キュー、オーディオ信号の復元および制御のためのヘッダ情報が含まれる。付加情報は下記の図6において詳説する。
前記基本ダウンミキサ(1)201および前記基本ダウンミキサ(2)501は、各々下記の式1および式2に基づいて入力オーディオ信号をダウンミキシングする。
Figure 2013054395
Figure 2013054395
Figure 2013054395
Figure 2013054395
前記重み付け要素は、ダウンミックス信号に対する表現目的の制約条件(constraint condition)に応じて決定され得る。ここで、制約条件とは、音響シーン(scene)に対する制約条件であって、例えば、ダウンミックスされたオーディオ信号においてバイオリンおよびギターに対するオーディオ信号がバイオリン0.7、ギター0.3の比率で再生(play back)されるために、各々の重み付け要素が各々0.7および0.3に設定され得る。制約条件情報は、システムまたはユーザなどの外部からの入力によって決定される。
一方、前記重み付け要素は、空間キューレベル情報に反映されなければならない。例えば、CLDを空間キューとして利用する場合、式1に対して式3のように空間キューレベル情報が予測できる。
Figure 2013054395
Figure 2013054395
基本ダウンミキサ(2)501は、MPEGサラウンドのTTT(Three-To-Two)ボックスと同一に空間キューを抽出する。
図6は、図1の付加情報エンコーダ107から生成される付加情報ビットストリームの構造を示す図である。
同図に示すように、付加情報ビットストリームは、ヘッダ情報および空間キューを含む。
前記ヘッダ情報は、多様なチャネルから構成されたマルチオブジェクトオーディオ信号の復元および再生のための情報を含み、オーディオオブジェクトに対するチャネル情報および該当のオーディオオブジェクトのIDを定義することによって、モノ、ステレオ、マルチチャネルのオーディオオブジェクトに対する復号化情報を提供することができる。すなわち、例えば、符号化された所定のオーディオオブジェクトがモノオーディオ信号であるか、ステレオオーディオ信号であるか区分できるように識別IDおよびオブジェクト別情報が定義され得る。前記ヘッダ情報は、一実施例としてSACヘッダ情報、オーディオオブジェクト情報、およびプリセット(preset)情報を含み得る。
一実施例として、前記SACヘッダ情報は、空間キュー基盤のオーディオ符号化の過程において生成される情報であって、タイムスロット(time-slot)情報を含み得る。前記SACヘッダ情報は、前記第1ダウンミキサ101および前記第2ダウンミキサ103が付加情報を抽出する過程において、前記第1ダウンミキサ101および前記第2ダウンミキサ103により抽出される。
一実施例として、前記オーディオオブジェクト情報は、ダウンミックスされるオーディオオブジェクトがモノ、ステレオ、またはマルチチャネルオーディオオブジェクトであるかを識別するための情報およびオブジェクトID情報を含む。例えば、オーディオオブジェクト情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数およびマルチチャネルオーディオオブジェクト数)および各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオおよびマルチチャネルであるかを識別する情報を含む)を含む。
一実施例として、前記プリセット情報はヘッダ情報の付加情報として、各オブジェクトの制御情報があらかじめ定義されている。
例えば、前記プリセット情報は、プリセットモード情報およびプリセットモード支援情報を含む。前記プリセットモード情報は、例えば、カラオケモード、ソロオブジェクト抽出(extraction)モード(ギター演奏オーディオオブジェクト抽出、ピアノ演奏オーディオオブジェクト抽出など)、選好レンダリング情報、および基本再生モードセッティング(playback mode setting)情報を含み得る。
前記プリセットモード支援情報は、例えば、カラオケモード支援のための情報としてボーカルインデックス情報、ソロオブジェクト抽出モードの支援のための情報として該当のオブジェクトインデックス情報、選好レンダリング支援のための情報として各オブジェクト別レンダリング情報(ローテーション、エレベーション(elevation)、スピードなど)、並びに基本ステレオおよびマルチチャネル再生モードセッティング支援のための情報として各オーディオオブジェクト別の最適のレンダリング情報を含む。
また、前記付加情報に含まれる空間キューは、入力されたマルチオブジェクトオーディオ信号のオブジェクト別の空間キュー情報を含む。
付加情報のフォーマットは、設計者の選択に応じて多様に構成され得る。
図7は、図6に示された付加情報ビットストリームの構造を示す図であって、モノおよびステレオチャネルから構成されたマルチオブジェクトオーディオ信号に対する付加情報を示す。
同図に示すように、ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数およびステレオオーディオオブジェクト数など)、各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオ、またはマルチチャネルであるかを識別する情報を含む)を含み、また、付加情報ビットストリームは空間キューを含んでいる。同図の一実施例では、空間キューの一実施例としてCLDまたはICCが利用されている。
同図に示すように、各モノおよびステレオオブジェクトに対応する空間キュー(CLDまたはICCなど)が付加情報に含まれる。すなわち、各入力オーディオオブジェクトに対応する空間キュー情報はすべての付加情報に含まれていなければならない。
図8は、本発明に係る図6に示された付加情報ビットストリームの構造を詳細に示す他の実施例の図であって、モノ、ステレオ、およびマルチチャネルから構成されたマルチオブジェクトオーディオ信号に対する付加情報を示す。
同図に示すように、ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数およびマルチチャネルオーディオオブジェクト数など)、各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオ、またはマルチチャネルであるかを識別する情報など)を含み、また、付加情報ビットストリームは空間キューを含む。同図の一実施例では、空間キューの一実施例としてCLDおよびICCを利用する。
一方、ここで、マルチチャネルオブジェクトに対する空間キューは、マルチチャネルオブジェクトの空間キュー並びにモノおよびステレオオブジェクトに対する空間キューをカスケード多重化(cascaded multiplexing)することで、1つの付加情報ビットストリームとして表現され得る。前記モノチャネルのダウンミキサ111、ステレオチャネルダウンミキサ113、および第2ダウンミキサ103によって抽出された空間キューが、図8のモノおよびステレオオーディオオブジェクトに対する空間キューであって、前記マルチチャネルダウンミキサ115によって抽出された空間キューが、図8のマルチチャネルオーディオオブジェクトに対する空間キューである。
図9は、本発明に係る多様なチャネルのマルチオブジェクトオーディオ信号を復号化する装置の一実施例を示すブロック図である。
本発明の一実施例に係る多様なチャネルのマルチオブジェクトオーディオ信号を復号化する装置は、例えば、図1のマルチオブジェクトオーディオ信号符号化装置から生成されたオーディオビットストリームから空間キュー情報を抽出し、抽出された空間キューを用いて各チャネル情報を予測することによって、多様なチャネルから構成されたマルチオブジェクトオーディオ信号(モノ、ステレオ、およびマルチチャネルオーディオオブジェクトを含むオーディオ信号)を復元する。
同図に示すように、本発明の一実施例に係る多様なチャネルのマルチオブジェクトオーディオ信号を復号化する装置は、逆多重化部(demultiplexer:DEMUX)901、オーディオデコーダ903、付加情報解析部905、オーディオオブジェクト抽出部907、およびレンダリング処理部909を備える。
前記逆多重化部901は、例えば、図1のマルチオブジェクトオーディオ信号符号化装置から生成されたオーディオビットストリームからオーディオ情報ビットストリームと付加情報ビットストリームとを分離する。
前記オーディオデコーダ903は、前記逆多重化部901により分離されたオーディオ情報ビットストリームからダウンミックスオーディオ信号を復元する。
前記付加情報解析部905は、前記逆多重化部901により分離された付加情報ビットストリームから各オーディオオブジェクトの空間キュー情報が含まれた付加情報を抽出する。
前記オーディオオブジェクト抽出部907は、前記付加情報解析部905から抽出された付加情報のヘッダ情報を用いて、ダウンミックスオーディオ信号からオブジェクト別のオーディオ信号を復元する。前記ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数およびマルチチャネルオーディオオブジェクト数など)および各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオおよびマルチチャネルオーディオオブジェクトであるかを識別する情報など)を含んでいるため、前記オーディオオブジェクト抽出部907は、前記付加情報解析部905から抽出された付加情報のヘッダ情報および空間キュー情報に基づいて前記オーディオデコーダ903によって出力されたダウンミックスオーディオ信号からオブジェクト別のオーディオ信号を復元することができる。
前記レンダリング処理部909は、前記オーディオオブジェクト抽出部907により復元された各オーディオオブジェクトに対するレンダリング制御情報(例えば、空間的オーディオオブジェクトの位置および大きさ)および出力チャネル制御情報(例えば、5.1もしくは7.1チャネル、またはステレオ)が外部から入力され、前記レンダリング制御情報および出力チャネル制御情報に基づき、前記オーディオオブジェクト抽出部907から復元された各オブジェクト別のオーディオ信号を配列して(arrange)オーディオ信号を出力する。
図10は、本発明に係る多様なチャネルのマルチオブジェクトオーディオ信号を復号化する装置の他の実施例を示すブロック図である。同図の他の実施例によるマルチオブジェクトオーディオ信号複合化装置は、各オブジェクト別に復元されたオーディオ信号をレンダリングする図9の複合化装置とは異なって、付加情報を制御してから、制御された付加情報に応じてオーディオオブジェクトをレンダリングすることによって、オーディオ信号を復元する。
同図に示すように、本発明の他の実施例に係る多様なチャネルのマルチオブジェクトオーディオ信号を復号化する装置は、逆多重化部901、オーディオデコーダ903、付加情報解析部905、付加情報制御部1001、およびSACデコーダ1003を備える。
図10の前記逆多重化部901、オーディオデコーダ903、付加情報解析部905は、図9の逆多重化部901、オーディオデコーダ903、付加情報解析部905と同じ構成である。
前記付加情報制御部1001は、前記オーディオデコーダ903により復元されたダウンミックスオーディオ信号に対するレンダリング制御情報(例えば、空間的オーディオオブジェクトの位置および大きさ)および出力チャネル制御情報(例えば、5.1もしくは7.1チャネル、またはステレオ)が外部から入力され、前記付加情報解析部905から抽出された付加情報(例えば、各オーディオオブジェクトの信号の大きさ情報および相関性情報)を前記外部入力信号によって制御する。
前記SACデコーダ1003は、前記付加情報制御部1001により制御された付加情報を用いて、前記オーディオデコーダ903から復元されたダウンミックスオーディオ信号から多様なチャネルのマルチオブジェクトオーディオ信号に復元する。前記SACデコーダ1003は、前記付加情報制御部1001により制御された付加情報のヘッダ情報を用いて、ダウンミックスオーディオ信号からオブジェクト別のオーディオ信号を復元する。前記ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数およびマルチチャネルオーディオオブジェクト数など)および各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオ、およびマルチチャネルであるかを識別する情報など)を含んでいるため、前記SACデコーダ1003は、前記付加情報制御部1001により制御された付加情報のヘッダ情報および空間キュー情報に基づいて前記オーディオデコーダ903によって出力されたダウンミックスオーディオ信号からオブジェクト別のオーディオ信号を復元することができる。
図11は、本発明に係る図1の装置を用いたマルチオブジェクトオーディオの符号化方法を示す一実施例のフローチャートである。
同図に示すように、入力された多様なチャネルのマルチオブジェクトオーディオ信号は、入力オーディオオブジェクトのヘッダ情報によってモノ、ステレオ、およびマルチチャネルオーディオ信号に識別され、チャネル別にグルーピングされる(S1101)。
次に、ステップS1101によって同じチャネル別にグルーピングされた音源がダウンミックスされ、空間キューを含む付加情報が抽出される(S1103)。すなわち、入力されたモノオーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報が抽出され、入力されたステレオオーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報が抽出され、入力されたマルチチャネル(例えば5.1チャネル)オーディオオブジェクトからダウンミックス信号、および空間キューを含む付加情報が抽出される。
前記ステップS1103から出力される第1ダウンミックス信号は、ステレオ信号またはモノ信号である。すなわち、前記入力されたモノオーディオオブジェクトから出力されるダウンミックス信号はモノ信号であり、ステレオオーディオオブジェクトまたはマルチチャネルオーディオオブジェクトから出力されるダウンミックス信号はモノまたはステレオ信号である。
次に、ステップS1103から出力される第1ダウンミックス信号は、第2ダウンミックスされ、前記第2ダウンミックスの過程で分析された空間キューを含む付加情報が抽出される(S1105)。ここで、第2ダウンミックス信号は、モードによってモノまたはステレオ信号である。
次に、ステップS1105から出力された第2ダウンミックス信号が符号化される(S1107)。
次に、ステップS1103から出力された付加情報およびステップS1105から出力された付加情報を用いて付加情報ビットストリームが生成される(S1109)。
次に、ステップS1107から符号化された信号およびステップS1109から生成された付加情報ビットストリームが多重化されて復号化装置に伝送されるビットストリームが生成される(S1111)。
図12は、本発明に係る図9の装置を用いたマルチオブジェクトオーディオの復号化方法を示す一実施例のフローチャートである。
同図に示すように、前記ステップS1111によって生成されたオーディオビットストリームからオーディオ情報ビットストリームと付加情報ビットストリームとに分離される(S1201)。
次に、ステップS1201により分離されたオーディオ情報ビットストリームからダウンミックスオーディオ信号が復元される(S1203)。
次に、ステップS1201により分離された付加情報ビットストリームから各オーディオオブジェクトの空間キュー情報の含まれた付加情報が抽出される(S1205)。
次に、ステップS1205から抽出された付加情報のヘッダ情報を用いて、ダウンミックスオーディオ信号からオブジェクト別のオーディオ信号が復元される(S1207)。前記ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数およびマルチチャネルオーディオオブジェクト数など)および各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオ、およびマルチチャネルオーディオオブジェクトであるかを識別する情報など)を含んでいるため、前記ステップS1205から抽出された付加情報のヘッダ情報および空間キュー情報に基づいて前記ステップS1203により出力されたダウンミックスオーディオ信号からオブジェクト別のオーディオ信号が復元され得る。
次に、ステップS1207によって復元された各オーディオオブジェクトに対するレンダリング制御情報(例えば、空間的オーディオオブジェクトの位置および大きさ)および出力チャネル制御情報(例えば、5.1もしくは7.1チャネル、またはステレオ)が外部から入力され、前記ステップS1207から復元された各オブジェクト別のオーディオ信号が配列され、マルチオブジェクトオーディオ信号が出力される。
図13は、本発明に係る図10の装置を用いたマルチオブジェクトオーディオの復号化方法を示す一実施例のフローチャートである。
同図に示すように、前記ステップS1111により生成されたオーディオビットストリームからオーディオ情報ビットストリームと付加情報ビットストリームとが分離される(S1301)。
次に、ステップS1301により分離されたオーディオ情報ビットストリームからダウンミックスオーディオ信号が復元される(S1303)。
次に、ステップS1301により分離された付加情報ビットストリームから各オーディオオブジェクトの空間キュー情報の含まれた付加情報が抽出される(S1305)。
次に、ステップS1303によって復元された各オーディオオブジェクトに対するレンダリング制御情報(例えば、空間的オーディオオブジェクトの位置および大きさ)および出力チャネル制御情報(例えば、5.1もしくは7.1チャネル、またはステレオ)が外部から入力され、前記ステップS1305から抽出された付加情報(例えば、各オーディオオブジェクトの信号の大きさおよび相関性情報を含む)が前記外部入力信号によって制御される(S1307)。
次に、ステップS1307によって制御された付加情報を用いて、前記ステップS1303から復元されたダウンミックスオーディオ信号から多様なチャネルのマルチオブジェクトオーディオ信号に復元される(S1309)。前記ステップS1307により制御された付加情報のヘッダ情報を用いて、ダウンミックスオーディオ信号からオブジェクト別のオーディオ信号が復元される。前記ヘッダ情報は、チャネル別のオーディオオブジェクト数(モノオーディオオブジェクト数、ステレオオーディオオブジェクト数、およびマルチチャネルオーディオオブジェクト数など)および各チャネル別のオーディオオブジェクトのインデックス情報(IDおよびオーディオオブジェクトがモノ、ステレオ、およびマルチチャネルであるかを識別する情報など)を含んでいるため、前記ステップS1307によって制御された付加情報のヘッダ情報および空間キュー情報に基づいて前記ステップS1303により出力されたダウンミックスオーディオ信号からオブジェクト別のオーディオ信号が復元され得る。
前述したような本発明の方法は、プログラムで具現されてコンピュータで読み出し可能な記録媒体(CD−ROM、RAM、ROM、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスクなど)に保存され得る。
特定の好ましい実施例について本発明を説明してきたが、特許請求の範囲において定義した本発明の精神および範囲から逸脱しない範囲内で様々な置換、変形および変更が可能であることは、本発明が属する技術分野において通常の知識を有する者にとって明白であろう。
本発明は、多様なチャネルから構成された多様なオブジェクトのオーディオコンテンツを効率的に符号化および復号化することによって、ユーザが必要に応じて能動的にオーディオコンテンツを消費することができる。

Claims (5)

  1. 相異なるチャネルから構成されたマルチオブジェクトオーディオ信号の復号化装置であって、
    入力信号から復元されたダウンミックスオーディオ信号に対する制御情報(前記制御情報は、前記復元されたオーディオ信号に対するレンダリング制御情報を含む)を用いて、前記入力信号から抽出された付加情報を制御する付加情報制御手段と、
    前記制御された付加情報を用いて、前記復元されたダウンミックスオーディオ信号をマルチチャネルオーディオ信号として出力する出力手段と
    を備え、
    前記付加情報は、
    前記オーディオ信号に対するプリセット情報を含むことを特徴とする復号化装置。
  2. 前記プリセット情報は、
    前記オーディオ信号に対するプリセットモードを定義するプリセットモード情報と、
    前記プリセットモードを支援するために必要な情報を定義するプリセットモード支援情報と
    を含むことを特徴とする請求項1に記載の復号化装置。
  3. 前記付加情報は、
    前記オーディオ信号の各々に対する識別子情報と、
    前記オーディオ信号に対するチャネル情報と
    をさらに含むことを特徴とする請求項1に記載の復号化装置。
  4. 前記チャネル情報は、
    前記オーディオ信号の各々に対するチャネル情報と、
    前記オーディオ信号のチャネル別のオーディオオブジェクト数情報と
    を含むことを特徴とする請求項3に記載の復号化装置。
  5. 前記付加情報は、
    前記オーディオ信号のモノ、ステレオ、及びマルチチャネルのうち、いずれか1つのオーディオオブジェクトに対する空間キュー情報をさらに含むことを特徴とする請求項1に記載の復号化装置。
JP2012278575A 2006-09-29 2012-12-20 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法 Expired - Fee Related JP5453515B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2006-0096172 2006-09-29
KR20060096172 2006-09-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009530277A Division JP5451394B2 (ja) 2006-09-29 2007-10-01 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法

Publications (2)

Publication Number Publication Date
JP2013054395A true JP2013054395A (ja) 2013-03-21
JP5453515B2 JP5453515B2 (ja) 2014-03-26

Family

ID=39230399

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2009530277A Expired - Fee Related JP5451394B2 (ja) 2006-09-29 2007-10-01 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
JP2012278574A Expired - Fee Related JP5453514B2 (ja) 2006-09-29 2012-12-20 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
JP2012278575A Expired - Fee Related JP5453515B2 (ja) 2006-09-29 2012-12-20 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2009530277A Expired - Fee Related JP5451394B2 (ja) 2006-09-29 2007-10-01 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
JP2012278574A Expired - Fee Related JP5453514B2 (ja) 2006-09-29 2012-12-20 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法

Country Status (6)

Country Link
US (4) US8364497B2 (ja)
EP (3) EP2100297A4 (ja)
JP (3) JP5451394B2 (ja)
KR (1) KR100917843B1 (ja)
CN (3) CN101617360B (ja)
WO (1) WO2008039038A1 (ja)

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1984916A4 (en) * 2006-02-09 2010-09-29 Lg Electronics Inc AUDIO SIGNAL-BASED ENCODING AND DECODING METHOD AND CORRESPONDING APPARATUS
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
CN102892070B (zh) 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
KR101055739B1 (ko) * 2006-11-24 2011-08-11 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그 장치
US8370164B2 (en) * 2006-12-27 2013-02-05 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
CA2645912C (en) 2007-02-14 2014-04-08 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR20080082917A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
WO2008111773A1 (en) * 2007-03-09 2008-09-18 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101828219B (zh) * 2007-09-06 2012-05-09 Lg电子株式会社 解码音频信号的方法和装置
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
JP5406276B2 (ja) * 2008-04-16 2014-02-05 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
KR101062351B1 (ko) 2008-04-16 2011-09-05 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
WO2009128662A2 (en) 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8175295B2 (en) 2008-04-16 2012-05-08 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR20090110242A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR102149019B1 (ko) * 2008-04-23 2020-08-28 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
KR101724326B1 (ko) * 2008-04-23 2017-04-07 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
KR101596504B1 (ko) * 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
US8452430B2 (en) 2008-07-15 2013-05-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2010008198A2 (en) * 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2010036060A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169666B1 (en) 2008-09-25 2015-07-15 Lg Electronics Inc. A method and an apparatus for processing a signal
KR20100035121A (ko) * 2008-09-25 2010-04-02 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US9412126B2 (en) * 2008-11-06 2016-08-09 At&T Intellectual Property I, Lp System and method for commercializing avatars
KR101129974B1 (ko) * 2008-12-22 2012-03-28 (주)오디즌 객체 기반 오디오 컨텐츠 생성/재생 방법 및 그 장치
US8332229B2 (en) * 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
US8620008B2 (en) 2009-01-20 2013-12-31 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
WO2011013381A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 符号化装置および復号装置
US20110054917A1 (en) * 2009-08-28 2011-03-03 Electronics And Telecommunications Research Institute Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream
BR122019025154B1 (pt) * 2010-01-19 2021-04-13 Dolby International Ab Sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
BR112012021369B1 (pt) * 2010-02-24 2021-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho para gerar um sinal downmix intensificado e método para gerar um sinal downmix intensificado
CN102222503B (zh) 2010-04-14 2013-08-28 华为终端有限公司 一种音频信号的混音处理方法、装置及系统
KR101615776B1 (ko) * 2010-05-28 2016-04-28 한국전자통신연구원 상이한 분석 단계를 사용하는 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
KR101767175B1 (ko) 2011-03-18 2017-08-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩에서의 프레임 요소 길이 전송
CN103050124B (zh) 2011-10-13 2016-03-30 华为终端有限公司 混音方法、装置及系统
IN2014CN03413A (ja) 2011-11-01 2015-07-03 Koninkl Philips Nv
WO2014013294A1 (en) * 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
WO2014023443A1 (en) * 2012-08-10 2014-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and method employing a residual concept for parametric audio object coding
CN103812824A (zh) * 2012-11-07 2014-05-21 中兴通讯股份有限公司 音频多编码传输方法及相应装置
EP3270375B1 (en) 2013-05-24 2020-01-15 Dolby International AB Reconstruction of audio scenes from a downmix
ES2636808T3 (es) 2013-05-24 2017-10-09 Dolby International Ab Codificación de escenas de audio
TWI615834B (zh) 2013-05-31 2018-02-21 Sony Corp 編碼裝置及方法、解碼裝置及方法、以及程式
CN104240711B (zh) * 2013-06-18 2019-10-11 杜比实验室特许公司 用于生成自适应音频内容的方法、系统和装置
EP2830050A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
KR102243395B1 (ko) * 2013-09-05 2021-04-22 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
EP3059732B1 (en) * 2013-10-17 2018-10-10 Socionext Inc. Audio decoding device
KR102294767B1 (ko) * 2013-11-27 2021-08-27 디티에스, 인코포레이티드 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱
KR101536855B1 (ko) * 2014-01-23 2015-07-14 재단법인 다차원 스마트 아이티 융합시스템 연구단 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
KR101511553B1 (ko) * 2014-02-14 2015-04-13 전자부품연구원 다중 단계 오디오 분리 방법 및 이를 적용한 오디오 시스템
EP3143620A1 (en) * 2014-05-15 2017-03-22 Telefonaktiebolaget LM Ericsson (publ) Audio signal classification and coding
KR102144332B1 (ko) 2014-07-01 2020-08-13 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
WO2016049106A1 (en) * 2014-09-25 2016-03-31 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal
CN105898667A (zh) * 2014-12-22 2016-08-24 杜比实验室特许公司 从音频内容基于投影提取音频对象
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
KR102668239B1 (ko) * 2015-06-17 2024-05-22 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
EP3291582A4 (en) * 2015-06-17 2018-05-09 Samsung Electronics Co., Ltd. Device and method for processing internal channel for low complexity format conversion
US10490197B2 (en) 2015-06-17 2019-11-26 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
CN105070304B (zh) * 2015-08-11 2018-09-04 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
RU2722391C2 (ru) * 2015-11-17 2020-05-29 Долби Лэборетериз Лайсенсинг Корпорейшн Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала
KR102829373B1 (ko) 2015-11-17 2025-07-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 파라메트릭 바이너럴 출력 시스템 및 방법을 위한 머리추적
KR102421292B1 (ko) * 2016-04-21 2022-07-18 한국전자통신연구원 오디오 객체 신호 재생 시스템 및 그 방법
CN110419079B (zh) 2016-11-08 2023-06-27 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
WO2018199987A1 (en) * 2017-04-28 2018-11-01 Hewlett-Packard Development Company, L.P. Audio tuning presets selection
GB2578715A (en) * 2018-07-20 2020-05-27 Nokia Technologies Oy Controlling audio focus for spatial audio processing
GB2582748A (en) * 2019-03-27 2020-10-07 Nokia Technologies Oy Sound field related rendering
KR102471718B1 (ko) * 2019-07-25 2022-11-28 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09503105A (ja) * 1993-09-10 1997-03-25 アールシーエー トムソン ライセンシング コーポレイシヨン リアルタイム音声パケットレイヤエンコーダ
JP2003066994A (ja) * 2001-08-27 2003-03-05 Canon Inc データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体
WO2005094125A1 (en) * 2004-03-04 2005-10-06 Agere Systems Inc. Frequency-based coding of audio channels in parametric multi-channel coding systems
WO2005101371A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Method for representing multi-channel audio signals
WO2006027079A1 (de) * 2004-09-08 2006-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
JP2009526467A (ja) * 2006-02-09 2009-07-16 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4190742B2 (ja) 2001-02-09 2008-12-03 ソニー株式会社 信号処理装置及び方法
JP3747806B2 (ja) 2001-06-11 2006-02-22 ソニー株式会社 データ処理装置及びデータ処理方法
JP2003032800A (ja) 2001-07-17 2003-01-31 Nippon Hoso Kyokai <Nhk> スピーカ接続回路装置
EP1341160A1 (en) * 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7698006B2 (en) 2002-10-15 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
KR100923297B1 (ko) 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
EP1647010B1 (de) * 2003-07-21 2017-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiodateiformatumwandlung
DE10344638A1 (de) 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
EP3573055B1 (en) * 2004-04-05 2022-03-23 Koninklijke Philips N.V. Multi-channel decoder
JP4934427B2 (ja) * 2004-07-02 2012-05-16 パナソニック株式会社 音声信号復号化装置及び音声信号符号化装置
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
JP3915804B2 (ja) * 2004-08-26 2007-05-16 ヤマハ株式会社 オーディオ再生装置
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP5106115B2 (ja) * 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
DE102005008366A1 (de) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100880642B1 (ko) * 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
WO2007043843A1 (en) * 2005-10-13 2007-04-19 Lg Electronics Inc. Method and apparatus for processing a signal
CN100561576C (zh) * 2005-10-25 2009-11-18 芯晟(北京)科技有限公司 一种基于量化信号域的立体声及多声道编解码方法与系统
WO2007080212A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Controlling the decoding of binaural audio signals
CN102892070B (zh) * 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
KR20080082917A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09503105A (ja) * 1993-09-10 1997-03-25 アールシーエー トムソン ライセンシング コーポレイシヨン リアルタイム音声パケットレイヤエンコーダ
JP2003066994A (ja) * 2001-08-27 2003-03-05 Canon Inc データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体
WO2005094125A1 (en) * 2004-03-04 2005-10-06 Agere Systems Inc. Frequency-based coding of audio channels in parametric multi-channel coding systems
JP2007526520A (ja) * 2004-03-04 2007-09-13 アギア システムズ インコーポレーテッド パラメトリックマルチチャネル符号化システムにおけるチャネルの周波数ベースの符号化
WO2005101371A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Method for representing multi-channel audio signals
WO2005101370A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation
JP2007531027A (ja) * 2004-04-16 2007-11-01 コーディング テクノロジーズ アクチボラゲット レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2007532960A (ja) * 2004-04-16 2007-11-15 コーディング テクノロジーズ アクチボラゲット マルチチャネルオーディオ信号を表示するための装置と方法
WO2006027079A1 (de) * 2004-09-08 2006-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
JP2008512708A (ja) * 2004-09-08 2008-04-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP2009526467A (ja) * 2006-02-09 2009-07-16 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置

Also Published As

Publication number Publication date
CN102768836B (zh) 2014-11-05
WO2008039038A1 (en) 2008-04-03
JP5451394B2 (ja) 2014-03-26
US20140095179A1 (en) 2014-04-03
EP2100297A1 (en) 2009-09-16
CN102768836A (zh) 2012-11-07
US20100174548A1 (en) 2010-07-08
JP5453514B2 (ja) 2014-03-26
US9257124B2 (en) 2016-02-09
EP2575129A1 (en) 2013-04-03
CN101617360A (zh) 2009-12-30
JP2010521002A (ja) 2010-06-17
US20130110523A1 (en) 2013-05-02
CN102768835A (zh) 2012-11-07
KR20080029940A (ko) 2008-04-03
CN102768835B (zh) 2014-11-05
KR100917843B1 (ko) 2009-09-18
US20140095178A1 (en) 2014-04-03
US8364497B2 (en) 2013-01-29
CN101617360B (zh) 2012-08-22
EP2100297A4 (en) 2011-07-27
JP2013077023A (ja) 2013-04-25
JP5453515B2 (ja) 2014-03-26
US9311919B2 (en) 2016-04-12
EP2575130A1 (en) 2013-04-03
US8670989B2 (en) 2014-03-11

Similar Documents

Publication Publication Date Title
JP5453514B2 (ja) 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
EP3059732B1 (en) Audio decoding device
RU2484543C2 (ru) Способ и устройство для кодирования и декодирования, основывающегося на объектах аудиосигнала
KR100946688B1 (ko) 멀티 채널 오디오 디코더, 멀티 채널 인코더, 오디오 신호 처리 방법 및 상기 처리 방법을 수행하는 프로그램을 기록한 기록매체
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
US20120183148A1 (en) System for multichannel multitrack audio and audio processing method thereof
KR20140028094A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101615776B1 (ko) 상이한 분석 단계를 사용하는 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140106

R150 Certificate of patent or registration of utility model

Ref document number: 5453515

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees