[go: up one dir, main page]

JPH11346362A - リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器 - Google Patents

リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器

Info

Publication number
JPH11346362A
JPH11346362A JP11063139A JP6313999A JPH11346362A JP H11346362 A JPH11346362 A JP H11346362A JP 11063139 A JP11063139 A JP 11063139A JP 6313999 A JP6313999 A JP 6313999A JP H11346362 A JPH11346362 A JP H11346362A
Authority
JP
Japan
Prior art keywords
group
frames
bits
bit rate
bar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11063139A
Other languages
English (en)
Inventor
Mousenian Nader
ネイダー・モウセニアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH11346362A publication Critical patent/JPH11346362A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 高品質ビデオを提供する、リアルタイム単一
パス可変ビット・レート符号化方式の提供。 【解決手段】 ビデオ圧縮システムで可変ビット・レー
ト(VBR)MPEG−2符号化を達成する、リアルタ
イム単一パス可変ビット・レート制御技術が提供され
る。フレームのシーケンスに対して、ビデオ・インタバ
ル(すなわちGOP)の符号化難度のレベルが、知覚レ
ート−量子化(バーC−バーQ)モデルにより決定され
る。このモデルは、各ビデオ・インタバルに合成(バー
C−バーQ)曲線を割当て、そこからビデオ・インタバ
ルに対するビット数が推定される。この推定は、前に符
号化されたビデオ・インタバルから獲得されるパラメー
タを用いる、因果予測モデルにもとづく。解析中のビデ
オ・インタバルの総レートから各ピクチャ・タイプのR
−Q関係が更新され、ピクチャ・ビットが割当てられ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般に、デジタル・
ビデオ圧縮の分野に関して、特に、MPEG−2国際規
格を使用するビデオ圧縮システムにおける、リアルタイ
ム単一パス可変ビット・レート符号化にとって好適なレ
ート制御方式に関する。
【0002】
【従来の技術】放送テレビジョン、通信ネットワーク、
大衆消費電子製品、及びマルチメディア・コンピュータ
などの業界における、様々なデジタル・ビデオ技術の出
現は、凄まじい速さで増加している。アプリケーション
のこの広範に渡る利用は、デジタル情報の信号処理、編
集及びデータ転送が、アナログ表現により同一の作業を
実行することに比較して、多大に容易である事実による
ものである。しかしながら、より重要なことは、デジタ
ル・ビデオがその大衆性を、ここ数年の間にデジタル・
ビデオ圧縮のために作成された幾つかの規格に負ってい
るということである。
【0003】デジタル・ビデオ圧縮ソルーションは、恐
らく、デジタル・ビデオ・プラットフォームの最も重要
な要素である。デジタル・ビデオは非圧縮形式では、膨
大な量の情報を含むことが知れているので、その処理、
記憶及び伝送は、不可能でないにしても、非常に時間を
費やし、高価となる。その結果、内容の知覚的品質を保
ちながら、圧倒的な量のデータを低減するために、デジ
タル・ビデオ圧縮技術が必要とされる。次に、データを
再生のために圧縮解除するために、互換のビデオ伸張方
式が採用される。
【0004】Moving Pictures and Expert Groupにより
形成されたMPEG−2国際規格(ISO/IEC 13818-2、"
Information technology - Generic coding of moving
pictures and associated audio information:Video、
1996"に記載)は、前述の業界の圧縮の必要性を満足す
るために意図されたものである。この規格は、符号化ス
トリームの構文及び復号技術を指定する。これは符号器
の設計者が、自分自身の圧縮パラメータのセットを導出
することを可能にする大きな柔軟性を提供し、従って、
彼ら自身の製品を他の製造業者により開発された残りの
符号器から区別することを可能にする。
【0005】MPEG−2符号化システムの効率は、固
定の通信帯域幅を介して伝送される、またはデジタル媒
体に記憶される知覚ビデオの忠実度により評価される。
デジタル衛星システムなどの一部のアプリケーションで
は、複数のプログラムが単一の大きなストリームに多重
化されて同報され、MPEG−2符号器のバンクが、全
てのプログラムをモニタ及び符号化するために使用され
る一方で、全ての受信チャネルの品質を維持する。MP
EG−2ストリームは、非同期転送モード(ATM)・
ネットワークで見られるように、固定の通信帯域幅また
は動的な帯域幅を介して伝送される。記憶媒体のサイズ
が限られる家庭用ビデオまたはPCアプリケーションで
は、ユーザができるだけ多くの情報を蓄積することが好
ましく、効率的な符号器がこれらの場合では特に有用で
ある。
【0006】ほとんどのMPEG−2符号器は、一定ビ
ット・レート(CBR)・モードで動作するように開発
され、ビデオ・ストリームの平均レートは、終始ほぼ同
一である。ビデオ・ストリームは、様々なタイプの複数
のピクチャまたはフレームを含み、それらにはIピクチ
ャ・タイプ、Bピクチャ・タイプ及びPピクチャ・タイ
プが含まれる。ピクチャはそのタイプに応じて、ビデオ
・ストリームの設定ターゲット・レートよりも多くのビ
ットまたは少ないビットを消費し得る。CBRレート制
御方法は、所望の平均ビット・レートが満足され、高品
質のビデオ・シーケンスが表示されるように、異なるピ
クチャ・タイプのストリーム間でビット比率を維持する
責任を負う。
【0007】他のMPEG−2符号器などの他の符号器
は、可変ビット・レート(VBR)・モードとして定義
される異なるモードで動作する。可変ビット・レート符
号化は、各圧縮ピクチャがイントラ・ピクチャ特性及び
インタ・ピクチャ特性の複雑度にもとづき、異なる量の
ビットを有することを可能にする。例えば、単純なピク
チャ内容(例えば色テスト・パターンなど)を有するシ
ーンの符号化は、複雑なピクチャ内容(例えば混雑した
町並みなど)を有するシーンに比較して、遥かに少ない
ビットの消費により同一のピクチャ品質を達成できる。
【0008】ビデオを特徴づけるために必要とされる情
報の量、及び符号化プロセスを効果的に向上させるため
の情報を解釈するために必要とされるアルゴリズムの複
雑性により、VBR符号化は従来、2つ以上のパスを用
いて非リアルタイムに達成された。第1のパスでは、符
号化が実行され、統計が収集されて分析され、第2のパ
スでは、分析結果を用いて符号化プロセスが制御され
る。これは高品質圧縮ビデオ・ストリームを生成する
が、リアルタイム操作を可能にせず、また単一パス符号
化を可能にしない。
【0009】
【発明が解決しようとする課題】従って、高品質ビデオ
を提供する、リアルタイム単一パス可変ビット・レート
符号化方式が待望される。更に、ハードウェアにより容
易に実現可能な、リアルタイム単一パス可変ビット・レ
ート符号化方式が待望される。
【0010】
【課題を解決するための手段】本発明によれば、フレー
ム・グループを処理する方法の提供により、従来技術の
欠点が克服され、追加の利点が提供される。例えば、本
方法は、入力ストリームの少なくとも1つのフレーム・
グループを符号化するステップと、入力ストリーム全体
を符号化する前に、入力ストリームの別のフレーム・グ
ループに割当てられるビット数を決定するステップとを
含む。別のフレーム・グループは、可変ビット・レート
・モードで符号化される。前記決定するステップは、符
号化から獲得される1つ以上のパラメータ値を使用す
る。
【0011】本発明の別の実施例では、本方法は、別の
フレーム・グループを単一パス可変ビット・レート・モ
ードで符号化するステップを含み、そこでは別のフレー
ム・グループが1つの符号化パスだけにより符号化され
る。
【0012】更に本発明の別の実施例では、前記決定す
るステップが、別のフレーム・グループに対して、所定
の知覚関数の傾きを調節するステップと、調節された傾
きをビット・レート方程式内で使用することにより、割
当てられるビット数を決定するステップとを含む。
【0013】更に本発明の別の実施例では、前記決定す
るステップが、別のフレーム・グループに対して、所定
の知覚関数の変換因子を決定するステップと、変換因子
をビット・レート方程式内で使用することにより、ビッ
ト数を決定するステップとを含む。
【0014】更に本発明の別の実施例では、前記決定す
るステップが、入力ストリームの1つ以上の不安定条件
を補償するステップを含み、更に他の実施例では、前記
決定するステップが、所定の関数を用いてビット数を決
定するステップを含む。
【0015】本発明の別の態様では、フレーム・グルー
プを処理する方法が提供される。例えば、この方法は、
1つ以上の前に符号化されたフレーム・グループから、
複数のパラメータ値を決定するステップと、単一パス可
変ビット・レート・モードで符号化されるフレーム・グ
ループに対して、複数のパラメータ値の1つまたは幾つ
かを用い、所定の関数の傾きを計算するステップと、計
算された傾き及び複数のパラメータ値の1つまたは幾つ
かを用い、符号化されるフレーム・グループに対するビ
ット・レートを獲得するステップとを含む。
【0016】更に本発明の別の態様では、フレーム・グ
ループを処理する方法が提供される。例えば、この方法
は、入力ストリームのフレーム・グループに割当てられ
るビット数を決定するステップを含む。この決定ステッ
プは、フレーム・グループの瞬時レート−量子化動作、
及びフレーム・グループの複雑度を示す知覚モデルを使
用する。この方法は更に、可変ビット・レート・モード
を用い、決定ステップにより定義されるレートにより、
フレーム・グループを符号化するステップを含む。
【0017】更に本発明の別の態様では、単一パス可変
ビット・レート符号器が提供される。例えば、この符号
器は、入力ストリームの少なくとも1つのフレーム・グ
ループを符号化するように適応化された符号化エンジン
と、入力ストリーム全体を符号化する前に、入力ストリ
ームの別のフレーム・グループに割当てられるビット数
を決定する手段とを含む。別のフレーム・グループは、
可変ビット・レート・モードで符号化される。前記決定
する手段は、符号化エンジンから獲得される1つ以上の
パラメータ値を使用する。
【0018】更に本発明の別の態様では、単一パス可変
ビット・レート符号器が提供され、これは例えば、1つ
以上の前に符号化されたフレーム・グループから、複数
のパラメータ値を決定する手段と、単一パス可変ビット
・レート・モードで符号化されるフレーム・グループに
対して、複数のパラメータ値の1つまたは幾つかを用
い、所定の関数の傾きを計算する手段と、計算された傾
き及び複数のパラメータ値の1つまたは幾つかを用い、
符号化されるフレーム・グループに対するビット・レー
トを獲得する手段とを含む。
【0019】更に本発明の別の態様では、単一パス可変
ビット・レート符号器が提供され、これは例えば、フレ
ーム・グループの瞬時レート−量子化動作、及びフレー
ム・グループの複雑度を示す知覚モデルを使用し、入力
ストリームのフレーム・グループに割当てられるビット
数を決定する手段と、可変ビット・レート・モードにお
いて、決定手段により定義されたレートにより、フレー
ム・グループを符号化するように適応化された符号化エ
ンジンとを含む。
【0020】本発明は特に、デジタル・ビデオ・ディス
ク(DVD)、デジタル・ビデオ・カセット・レコーダ
(DVCR)、コンピュータ・マルチメディア、及びデ
ジタル・カムコーダ用に家庭で製作する場合のように、
ビデオを予め分析または符号化できないアプリケーショ
ンにおいて有用である。単一パスVBR符号器は、前に
符号化されたピクチャだけを用いて、符号化されるピク
チャの複雑度に関して推定を行う。これは高性能DVD
マスタリングで使用される、複数パスVBRビデオ圧縮
と対照的であり、そこではビデオ・ソースが予め分析さ
れ、特定の記憶媒体にとって最適な圧縮ストリームを生
成するために、何度か符号化される。従って、単一パス
VBR符号器は因果予測モデルに頼ることにより、スト
リームの平均レートを動的に調整し、高忠実度のビデオ
を生成する。
【0021】
【発明の実施の形態】
【数8】 は、本明細書ではバーXと記載する。
【0022】本発明の原理に従えば、リアルタイム単一
パス可変ビット・レート(VBR)符号化のためのレー
ト制御方法が提供され、これはハードウェアにより容易
に実現可能で、例えばMPEG−2圧縮システムに組み
込まれ得る。
【0023】MPEG−2符号器100のブロック図の
1例が、図1に示される。特に図1は、ビデオ・ストリ
ームを符号化し、圧縮ストリームを復号するために符号
器により使用される、様々なイメージ処理タスク及び信
号処理タスクを示す。
【0024】MPEG−2符号器100は高機能な情報
プロセッサであり、空間的イメージ分析器及び時間的イ
メージ分析器、量子化器、エントロピ符号器、及び選択
アプリケーションの要求に合う完全準拠のビデオ・スト
リームの生成を保証するレート制御ポリシを含む。ビデ
オ・ストリームの各輝度ピクチャが、16×16画素の
非オーバーラップ・ブロックに区分化され、これが更に
8×8ブロックに分割される。2つのクロミナンス・ピ
クチャが、4:2:2または4:2:0クロミナンス・
サンプリングに従い、4つのまたは2つの8×8ブロッ
クを生成する。全ての輝度またはクロミナンス・ブロッ
クを含むセットは、マクロブロック(MB)と呼ばれ
る。4:2:2マクロブロックは8つのブロックを有
し、4:2:0マクロブロックは6つのブロックを有す
る。画素の各8×8ブロックが、2次元離散コサイン変
換(DCT)102を用い、周波数ドメインに変換され
る。DCTは高優先順位の(低)周波数係数、及び低優
先順位の(高)周波数係数のクラスを獲得することによ
り、入力ブロックに対して、エネルギ圧縮を実行するよ
うに意図される。これはイメージ・ブロックの空間的冗
長性の一部を除去するための、高速且つ効率的な方法で
ある。
【0025】時間的冗長性は、動き推定(ME)104
と呼ばれる技術により除去される。この機構により、前
のピクチャに属する一致マクロブロックを探索窓内に移
動することにより、任意の輝度マクロブロックが予測さ
れる。最良のマクロブロック・マッチを探索するプロシ
ージャが、動き推定として定義される。次に、この最良
のマッチ(予測)が考慮中のマクロブロックから減算さ
れ、DCT変換がマクロブロック差分に適用される。更
に、予測されたマクロブロックの位置を指し示す動きベ
クトル106が生成される。動きベクトル(MV)は、
符号器及び復号器の両方により、一致マクロブロックを
動き補償し(108)、最良のマッチを突き止めるため
に使用される。
【0026】動き推定はマクロブロックの輝度部分に対
してだけ実行され、結果の動きベクトルがスケーリング
されて、クロミナンス・ブロック対を動き補償するため
に使用される。動きベクトルの符号化は、差分パルス符
号変調(DPCM)として知られる技術を用いて実行さ
れ、そこでは、動きベクトルが前に符号化されたマクロ
ブロックの動きベクトルを用いて予測され、動きベクト
ルとその予測との差分だけが符号化される。動きベクト
ルの差分は、MPEG−2規格のルックアップ・テーブ
ル内で定義されるコード・ワードにより表される。
【0027】MPEG−2規格は、図2に示されるよう
に、I(イントラ符号化)タイプ・ピクチャ、P(予
測)タイプ・ピクチャ、及びB(双方向予測)タイプ・
ピクチャを使用する。Iタイプは、そのピクチャ内の情
報だけを使用するのに対して、Pタイプは、前に符号化
されたIタイプまたはPタイプに対して実行される動き
推定タスク及び動き補償タスクによりマクロブロック2
00を予測し、符号化される予測誤差を計算する。これ
は効率的な圧縮方法である。なぜなら、動き補償された
マクロブロック差分は、原マクロブロックよりも少ない
情報を含むからである。
【0028】Pタイプはしばしば、前方予測ピクチャと
呼ばれる。なぜなら、それらは前のピクチャを用いて、
時間的に前方の予測を行うからである。例えば図2にお
いて、動きベクトルMVP f202は、ピクチャP内のマ
クロブロック200に対する最良のマッチを、ピクチャ
I内の探索窓204(図2で破線により示される)内で
見い出すために使用される。
【0029】Bタイプ・ピクチャは、前方予測及び後方
予測のために、先行及び将来の両方のIタイプまたはP
タイプからの情報を使用し、特に異なる方向に異なる速
度で移動するオブジェクトを推定するために有用であ
る。更に、Bピクチャにおいて使用される双方向動き推
定方式は、Pタイプで使用される因果予測に比較して、
雑音のある環境においてよりロバストである。これは両
方の予測が、それらの公称値を平均することにより、同
時に使用されるからである。図2の例では、ピクチャB
1内のマクロブロック200に対する動き推定のタスク
が、MVB1 fにより表される前方予測と、MVB1 bにより
表される後方予測とを含む。ピクチャB2では、前方予
測及び後方予測が、それぞれMVB2 f及びMVB2 bにより
表される。
【0030】様々なピクチャ・タイプが、符号器100
により、幾つかのステップにおいて量子化される(図1
の110)。最初に、ピクチャ・タイプに固有の量子化
マトリックスが8×8DCTブロックに適用される。低
周波数係数の方を重要視するように、マトリックスの要
素(重み)が選択される。これらの係数はより多くの情
報を含み、ピクチャの知覚品質により大きく寄与する。
次に、量子化スケーリング・ファクタが計算され、マク
ロブロックがイメージの局所的なアクティビティ、ピク
チャ・タイプの複雑度、及びバッファ充填度にもとづ
き、異なるクラスに分類される。この指標は、ピクチャ
に割当てられるビット数と、その知覚品質とに直接関連
付けられる。実際のビット数は、MPEG−2規格にお
いて定義されるプロシージャに従い、最初に各DCTブ
ロックを走査し(112)、次に量子化された交流(A
C)係数を一緒にグループ化することにより獲得され
る。各グループは、ハフマン・ルックアップ・テーブル
を用いることにより、固有の可変長コード(VLC)に
よりエントロピ符号化される(114)。直流(DC)
係数は、DPCM(MVの符号化に類似)及び一様量子
化を用いて符号化される。
【0031】エントロピ符号器114の出力は、エント
ロピ復号器116に入力される。復号器116の出力
は、逆走査118、逆量子化120、及び逆離散コサイ
ン変換(IDCT)122を介して、差分マクロブロッ
クの有損失バージョンを再構成する。次に、復号された
ピクチャが既知のように、遅延124を介して、動き推
定104及び動き補償108に渡される。
【0032】圧縮ストリームの瞬時レートは時間と共に
変化するので、レートの変動を吸収し、固定チャネル・
レートを圧縮ピクチャ・ビットに変換し、それを実際の
復号器に引き渡して処理するために復号器バッファが使
用される。従って、本発明のレート制御の1実施例で
は、後述のように、ピクチャの複雑度及びイメージ・マ
クロブロックの局所的アクティビティと共に、バッファ
占有レベルが追跡される。
【0033】符号器100は更に、選択アプリケーショ
ンの要求に合った完全準拠のストリームを生成するため
に使用される、レート制御ポリシを含む。本発明の原理
によれば、符号器100のレート制御ポリシは、入力ス
トリーム(例えばビデオ・ストリーム)のフレームを符
号化するために使用される、可変ビット・レート(VB
R)符号化方式を含む。しかしながら、本発明の理解に
役立てるために、本発明のVBR符号化方式について述
べる前に、幾つかのレート制御原理について述べること
にする。これらの原理は、一定ビット・レート(CB
R)符号化方式に関連する。
【0034】1.CBRレート制御原理:MPEG−2
シーケンスは通常、ピクチャのグループ(GOP)また
はフレーム・グループなどの小インタバルに区分化さ
れ、これが更にピクチャ・タイプI、P、Bにより類別
される。1GOP当たりのビット数は、Iピクチャ割当
てが、Pよりも多くなるように分配される。これはPピ
クチャがその内容を推定するために動き推定技術を使用
し、その結果、原ソースよりも低いエントロピを有す
る、動き補償されたフレーム差分(MCFD)が符号化
されるからである。Bピクチャは最も少ない量のビット
を使用する。なぜなら、それらの動き推定技術は、Pの
それよりも集中的であるからである。このことは、異な
るタイプのピクチャが符号化されるときに、GOP内で
同じピクチャ品質を維持するための基本を提供する。更
に、Bピクチャのビット割当ては低減され得る。なぜな
ら、それらは他のピクチャを推定するために使用されな
いからである。符号化されたGOPは、Iピクチャ・タ
イプにより開始する。ピクチャ・タイプx(x∈{I、
P、B})に割当てられるビットの量は、そのタイプの
ピクチャ品質において知覚される歪み量と逆の関係にあ
る。
【0035】文献(すなわちJ. L. Mitchell、W. B. Pe
nnebaker、C. E. Fogg及びD. J. LeGallによる"Mpeg Vi
deo Compression Standard"、Chapman and Hall、New Y
ork、1977)における実験結果は、ソース(またはピク
チャもしくはフレーム)のレートRと量子化因子Qとの
間には、類似の動作が存在することを示唆しており、こ
れは単純化された形式では、次のようになる。
【数9】 RX(QX)=XX/QX 1)
【0036】ここでXXは、各ピクチャ・タイプの複雑
度を示す所定のパラメータである。
【0037】しかしながら、ソースの性質は時間と共に
変化するので、新たな複雑度パラメータが各ピクチャ・
タイプの符号化以前に決定される。このパラメータは通
常、過去の符号化パラメータ、例えばビット、量子化因
子、特定の先取り統計などにもとづき計算される。MP
EG−2ストリームの各GOPに対して、ビット数C k
は次のように設定される。
【数10】
【0038】ここで指数kはGOP番号、xはピクチャ
・タイプ、NxはGOP内のタイプxのピクチャの数、
xはタイプxのターゲット・ピクチャ・ビットであ
る。
【0039】CBRシーケンスではCk=Cgopであり、
ここでCgopは固定GOPビットである。所与のCkに対
して、式2)の条件で量子化スケーラの平均合計
【数11】 を最小化することにより、GOPのビデオ品質が最大化
される。
【0040】式2)の制約でΨを最小化する代わりに、
この条件が除去され、ラグランジュ乗数λがラグランジ
ュ・コストΥを最小化するために使用される。
【数12】 Υ=Ψ−λCk 4)
【0041】式1)で述べられるレート−量子化モデル
の支援により、各ピクチャ・タイプのターゲット・ビッ
トが次のように推論される。
【数13】
【0042】式5)のターゲットは、理想のピクチャ・
ビットを表し、実際のビットはほとんどいつもこれから
逸脱する。累積誤差が計算され、一定ビット・レート制
御方式にフィードバックされ、最終MPEG−2ビット
・ストリームが平均ビット・レートまたは総ビット・バ
ジェット(budget)に適合するように保証する。ここで
k、ideal及びCk、actualが、それぞれGOP kに対
する理想の及び実際のビットを表わし、δk、gop=C
k、actual−Ck、idealが両者間の差を表すものとする。
更に、Ri、ideal及びRi、actualが、それぞれピクチャ
iの理想の及び実際のビットを表し、δi、pic=R
i、actual−Ri、idealが両者間の差を表すものとする。
n個のピクチャが符号化された後、総累積誤差は次のよ
うに計算される。
【数14】
【0043】GOPのサイズがG=Σxxにより与えら
れ、ng=[n/G]は符号化されたGOPの数であ
る。全ての処理されたGOPに対するサブ誤差累積は、
Δn-1、 gopにより与えられ、Δn-1、picは符号化順序の最
後の、しかしまだ終了されていないGOPに対するサブ
誤差累積である。次に、前に符号化されたピクチャから
生じたビットの生成過剰または生成不足に対して、理想
ピクチャ・ターゲットが調整される。GOP(k=
g)に属するピクチャnを符号化する前の新たな理想
ビットは、次のようになる。
【数15】
【0044】ここでCgopはCBR GOPビットの固
定数、αは例えば、1.0、Δn-1=Δn-1、gop+Δ
n-1、picである。αは、この調整がどれくらい積極的に
実行されるかを示す定数である。各ピクチャが符号化さ
れた後、複雑度Xxが更新され、式7)にもとづく新た
なターゲットが次のピクチャに対して計算される。この
ターゲットは後述のように、復号器バッファがオーバー
フロー条件またはアンダーフロー条件に遭遇しないよう
に、特定の制約を満たすべきである。
【0045】最後に、式1)の双曲線上で定義される量
子化スケーラQが獲得される。各ピクチャ・タイプはそ
れ自身の合成(R−Q)曲線を有し、更に、全てのフレ
ームが同様に知覚されるように、各ピクチャ・タイプに
対してQ因子が僅かに調整され得る。マクロブロック・
レベルのレート制御に対して知覚効果が組み込まれる態
様については、符号化タスクの間にQ因子の調節によ
り、理想ターゲットが満足される態様同様、ここでは述
べられない。しかしながら、これらについては、199
3年4月付けのISO/IEC JTC1/SC29/WG11/N0400、"Test
Model 5"で述べられている。
【0046】以上、様々なCBR原理について述べてき
た。次に、VBR及び特に、本発明のリアルタイム単一
パスVBR方式について述べることにする。
【0047】2.VBRビデオ:第1章で述べたCBR
レート制御方式は、固定ターゲットCgopに対して、量
子化パラメータを調節することにより、GOP内で一定
の品質が達成される事実により動機付けされた。時とと
もにCBRレート制御方式を安定化し、所望のレートを
維持するために、任意の統計的変化またはビット派生物
が利用される。更に、MPEG−2CBR符号器は、普
遍定数及び所定の初期複雑度のセットを用いて、異なる
ピクチャ・タイプ間で割当てられるビット量の間の特定
の比率を維持する。しかしながら、GOPセグメントま
たはビデオ・セグメントなどの連続ピクチャのグループ
を、複雑度のハードネスまたはソフトネスに関して、異
なるタイプの時間インタバルに分類する成果は、リアル
タイム単一パスMPEG−2符号化では制限された。高
忠実度の結果を生成することが要求されるビデオのハー
ドネス(ソフトネス)は、多量(少量)のビットにより
定義される。複数パスCBR符号化または複数パスVB
R符号化では、こうした情報は既知であり、従って品質
改善が達成され得る。
【0048】しかしながら、本発明では、GOPビット
をオン・ザ・フライ式に調整することにより、複雑度レ
ベルがCBR符号化のレート制御方法に追加される。こ
の問題は特に挑戦的である。なぜなら、いかなるビデオ
・ソースの統計的性質も事前に知れていないか、時間と
共に変化するので、ソース分散の真の推定が不可能にな
るからである。本発明のリアルタイム単一パスVBR符
号器は、(バーC−バーQ)知覚モデルを用い、各々が
式1)により定義される特定の双曲線に対応するビデオ
・セグメントの、ハードネスまたはソフトネスを区別す
る。この時、実際の(バーC、バーQ)対が、この双曲
線に沿って計算される。
【0049】2.1 レート−量子化知覚モデル:本発
明のVBR方式は、各ビデオ・セグメント(すなわち各
GOP)が符号化難度のレベルに関連付けられる事実に
より、概念的に動機付けされ、この符号化難度は総ピク
チャ・ビット、量子化スケーラ、空間的アクティビテ
ィ、時間的アクティビティ、信号対雑音比、またはこれ
らの組み合わせなどの、様々なソース統計または圧縮パ
ラメータにより測定され得る。より多くのビットが、ハ
イ・レベルの符号化難度を有するビデオ・セグメントに
割当てられるべきである。これは、ソースの複雑度には
関係無しに、固定数のビットが各GOPに割当てられる
CBRレート制御方式とは異なるアプローチである。研
究成果によれば、複雑な、適度な、そして簡単な資料を
含む多数のテスト・ケースにおいて、ビデオ・インタバ
ルのレートと量子化スケーラとの間には、強い相関が存
在することが判明した。この相関については、例えば、
1998年1月26日付けの米国特許出願第09/01
3149号(対応日本国出願は特願平11−6060)
で述べられている。
【0050】特に、この相関は次の式により示される。
【数16】 Raα(a1+a2aβ) 8)
【0051】ここでa1は、知覚ライン301がバーC
軸302と交わるポイント300(図3)であり(例え
ばa1=0.2)、a2は知覚ライン301の傾きであり
(例えばa2=.06)、βは知覚モデルが線形か非線
形かを示す(例えばβ=1は線形を示す)。
【0052】式8)のRa−Qa関係は、全てのタイプの
ビデオ・インタバルが等しく知覚されるべきであるとい
う基準にもとづき推論される。更に、これは大きな量子
化スケーラQを生成する困難なビデオ・セグメントは、
平均ビット・レートの圧縮ストリームよりも多くのビッ
トを消費するべきであり、簡単なセグメントはより少な
い数のビットを使用することを示唆する。この関係は、
ロバストな単一パスVBR符号化方式を公式化する構成
ブロックを提供する。なぜなら、それはビデオ・ソース
の可変性を利用するからである。
【0053】前記の関係を用い、各インタバル(例えば
GOP)に割当てられる実際のビット数が、本発明の原
理に従い、次の知覚モデルの傾きKにより決定される。
【数17】 Ra=K(a1+a2aβ)=KF(Qa) 9)
【0054】特に、本発明の1方式によれば、定数K
(Mビット/秒で測定される)が各ビデオ・インタバル
(すなわちGOP)に対して調節され、圧縮ストリーム
の平均レートが所望のターゲット・レートに合うように
保証する。Kを調節する1方式が後述される。
【0055】2.2 VBRレート制御方式1:単一パ
スVBR符号器の効率は、そのレート制御方式がどのく
らい速く、ビデオ・ストリームのソフトネスまたはハー
ドネスを学習し、自身をそれに調整することができるか
により評価される。イメージの不連続性または特殊効果
が発生する領域では、ピクチャ品質の劣化が最小化され
るべきである。単一パス符号化では、イメージ統計が前
に分析及び符号化されたピクチャにより制限されるの
で、レート制御方式の学習レートは、将来のビデオ・イ
ンタバルの内容を予測するのに十分であるべきである
が、アルゴリズム的な不安定性を生じるほど積極的であ
ってはならない。この2重の問題を解決する1つの方法
は、時間インタバルごとに(すなわちGOPごとに)、
符号化ストリームの品質を調整し、レート制御方式にそ
の時間インタバル内の各ピクチャのローカル内容を学習
させることである。
【0056】本発明の原理に従えば、VBR入力ストリ
ームSvbrは例えば、各々が異なるCBRビット・レー
トで動作する、幾つかの連続ビデオまたは時間インタバ
ル(すなわちGOP)の連結である。各ビデオ・インタ
バルに対する動的ビット・レート調整が、第2.1章で
述べられた知覚モデルにより決定され、実際の(バー
C、バーQ)対が式1)のレート−量子化モデルから計
算される。従って、VBRシーケンスSvbrが、{Sk
m k=0により指定される有限な数のGOPに区分化され
る。GOP Skに対して、平均ビット数(バーCk)及
び平均量子化スケーラ(バーQk)が、[バーCk バー
k]=G-1[Ckk]となるように定義される。式
9)の項が、本発明の原理に従い、次式のようにGOP
kの平均ビットと量子化スケーラとの間の依存性を
形成するように変更される。ここでビデオのフレーム・
レートはfにより定義される。
【数18】
【0057】(バーCk-2、actual、バーQk-2、actual
及び(バーCk-1、actual、バーQk- 1、actual)が、符号
化されたばかりのGOP Sk-2及びSk-1の平均ビット
及び平均量子化スケーラ対を表すものとする。これらの
GOPの符号化のために、CBRまたはVBR MPE
G−2符号器が使用され得る。更に、バーCkとバーQk
との間に、式1)で示されるような双曲型依存性が存在
し、前記の対が本発明において、バーC−バーQ関係の
線形モデルを予測するために、次のように使用されるも
のと仮定する。
【数19】
【0058】ここでξk及びηkは、それぞれ次式で与え
られる。
【数20】
【数21】
【0059】更に、前記式10b)で与えられるξk
分子、分母は、それぞれ次式で与えられる。
【数22】
【数23】
【0060】式10a)は、分析中の特定のGOPの瞬
時レート−量子化動作を定義する。式10a)の線形モ
デル、及びそれと式9a)の知覚モデルとの関係が、図
3に示される。
【0061】最適な動作ポイントを見い出すために、式
10a)は式9a)の知覚モデルと一緒に解かれる。例
えば、理想動作ポイント3は、これらの式を(バー
1、バーQ1)及び(バーC2、バーQ2)で解くことに
より獲得され、理想動作ポイント4は、(バーC2、バ
ーQ2)及び(バーC3、バーQ3)で解くことにより獲
得される。
【0062】特に、次のGOPは次式の平均ビットで符
号化される。
【数24】
【0063】定数Kが各GOPに対して調節され、VB
Rストリームにより生成される総ビット数が、例えばD
VDディスクなどの記憶装置または検索装置のサイズよ
りも大きくならないように保証する。例えば、有効総ビ
ット数がRTOTの場合、入力シーケンスのあらゆるGO
Pが分析され、符号化された後、式9a)の知覚モデル
が、Kを計算するために次のように使用される。
【数25】
【0064】ここでNgopは入力シーケンス内のGOP
の数、GはGOPサイズである。
【0065】式12)の分母は、複数パス符号化方式に
おいて容易に計算され得るが、本発明の場合のように、
単一パス・リアルタイム圧縮方式では使用可能でない。
従って、本発明の原理によれば、代わりに予め符号化さ
れたファントム・シーケンスが、次式により定義される
GOP量子化器のセットと共に使用される。
【数26】
【0066】ここでN* gopは、ファントム・シーケンス
内の符号化GOPの数である。従って、式12)の総和
は、入力シーケンスの各GOPが符号化された後、調整
される。
【0067】ピクチャの数及びビット・バジェットR
TOTが与えられると、本発明の単一パスVBR符号器
は、全ての生成ビットをデジタル媒体に適合させる責任
を負う。オーバーランまたはアンダーランを回避するた
めに、RTOTが各GOPに対して動的に変更される。実
際のビットをRTOTから減算することにより、調整され
たバジェットRk、totが獲得され、次式の新たな傾きを
設定するために使用される。
【数27】
【0068】図3は、ソフトなまたはハードなGOPが
符号化される場合に、知覚モデルが調整される様子を示
す。
【0069】K、特にKの分母は、単一パスVBR符号
化方式では計算され得ないので、本発明の原理に従い、
Kを調節し、各GOPに割当てられるビット数を推定す
る技法が考案された。リアルタイム単一パスVBR方式
は、その進行に伴い特定の情報を学習するので、学習プ
ロシージャと呼ばれる。学習プロシージャの1実施例に
ついて、図4に関連して次に述べる。
【0070】1.Pを、次式で与えられる組により定義
される予め符号化されたファントムとする。
【数28】
【0071】そしてZ0及びN0を次のように設定する
(ステップ400)。
【数29】
【数30】N0=N* gop
【0072】ここでZ0の典型値は108、N0の典型値
は114である。
【0073】2.例えばCBR MPEG−2符号器を
用い、入力シーケンスの最初の2つのGOP、すなわち
0及びS1を、f・(バーCgop)のレートで符号化す
ることにより、VBRレート制御方式を初期化する。f
・(バーCgop)の公称値は、ユーザにより与えられる
VBRストリームの平均レートに対応すべきである(ス
テップ402)。
【0074】3.Sk-1が符号化された後、様々なパラ
メータが更新される(ステップ404)。例えば、符号
化難度の総和を表すZk、及び調整されたGOPの数Nk
が、それぞれ次のように更新される。
【数31】
【数32】Nk=Nk-1+γ
【0075】ここでγは学習アルゴリズムの更新スピー
ドである(例えばγ=2.0)。更に、Ck-1、actual
び総和ΣCj、actual(j=0乃至k−1)が計算され
る。a)ここでk−1=0ならば、kを1増分し、ステ
ップ3に移行する。b)それ以外では、式10b)乃至
式10c)により定義される予測モデルに従い、ξk
びηkなどの他のパラメータを計算する。
【0076】4.ステップ3の総和項を使用し、バジェ
ット内の残りのビットRk、totを決定する。例えば、Σ
j、actual(j=0乃至k−1)をRTOTから減算する
ことにより、Rk、totを獲得する。符号化される残りの
フレームまたはピクチャPkの数を更新する(ステップ
404)。
【0077】5.新たな傾きKkを次式により測定する
(ステップ406)。
【数33】Kk=fRk、totk/Pkk
【0078】6.新たなターゲットのバーCkを、前述
の式11)または後述の式14)により計算する(ステ
ップ408)。
【0079】7.SkをVBRモードで符号化する(ス
テップ410)。
【0080】8.シーケンス内に未完のGOPが存在す
る場合(問い合わせ412)、ステップ3に移行し、そ
れ以外では終了する(ステップ414)。
【0081】項Zkは、それ自身を各GOPのイメージ
内容に適応化させ、VBRビデオの非持久性を平滑化す
ることを目的とする。これは非常に高い(低い)複雑度
のGOPに対する非現実的なビット割当てを禁ずるため
の安全性尺度として作用する。
【0082】以上、符号化されるGOP Skの平均ビ
ットを決定する方式について述べてきた。要するに、こ
のターゲット・ビットは次の式により設定される。
【数34】
【0083】本発明のレート制御方式は、更に図5に関
連して後述される。1実施例では、非圧縮入力ストリー
ム(例えばビデオ・ストリーム)が圧縮エンジン500
に入力される。圧縮エンジン500は、例えば図1に示
され、前述された符号器を含む。圧縮エンジン500は
入力ストリームの事前知識がないので、チップの古い技
術、すなわち既知のCBRまたはVBRアルゴリズムに
より初期化される。その後、最初の2つのGOPが、例
えばCBRモードで符号化される。
【0084】図5では遅延502が提供され、これは情
報が次に符号化されるGOPに当たるGOPkからでは
なく、前に符号化されたGOP(例えばGOPk-1及び
GOP k-2)から獲得されることを示す。
【0085】その後、最後の2つの符号化GOP(例え
ばGOPk-1及びGOPk-2)の各々に対する平均ビッ
ト、すなわちバーC1、バーC2、及びそれらのGOPの
平均Q因子、すなわちバーQ1、バーQ2が計算される
(504)。例えば、最初の2つのGOPに対して、平
均ビット及び平均Q因子が計算される様子が、式1)乃
至式7)に関連して前述された。次に、(バーC1、バ
ーQ1)、(バーC2、バーQ2)の値がバッファされ、
後に、符号化される次のGOP(例えばGOPk)に対
して必要とされるGOPビットを推定するために使用さ
れる。
【0086】新たなGOPビットを推定するために(5
06)、式10)のバーC−バーQ予測モデル(50
8)、及び式9a)のバーC−バーQ知覚モデル(51
0)が、新たなGOPビットの推定において使用され
る。図5に示されるように、学習プロシージャの更新パ
ラメータ、消費する残りのビット、及び符号化するピク
チャの数が、時変知覚モデルに入力される(511)。
予測モデルと知覚モデルが一致するポイントが、GOP
kに対するGOPビットの推定となる。このポイント
は、前述の式14)により定義される。
【0087】更に、GOPビットの推定が、後述のよう
に特殊効果及び不安定性に対して調整され得る(51
2)。
【0088】新たなGOPビットが導出された後、ピク
チャ・ビット割当てモデルを用いて、符号化されるGO
Pの各フレームまたはピクチャに対して、ビット数が割
当てられる(514)。1実施例では、各ピクチャ・タ
イプのターゲット・ビットを調整するために、バーCk
にGOPサイズGが乗算され、次式により各ピクチャに
対する理想ビットが獲得される。
【数35】
【0089】CBRタイプの動作では、1GOP当たり
同一のビット数が消費され、理想GOPターゲット・ビ
ットと実際の値との間に差が存在する場合、長期GOP
誤差が、次に符号化されるGOPに持ち越される。従っ
て、1つのGOP、GOPの集まり、またはシーケンス
全体に対するビデオ・ストリームのビット・レートは同
一である。長期GOP誤差はΔn-1、gopである。しかし
ながら、リアルタイムVBR状況では、長期GOP誤差
を持ち越す必要はない。なぜなら、各GOPが異なるビ
ット・レートで動作し得るからである。VBR方式の責
任は、ビデオ品質に対する総ビット・バジェットを最適
化することである。前記式15)内のパラメータα1
より、長期GOP誤差をスケーリングし、この情報がV
BR符号器のレート制御アルゴリズムに供給されるとき
に、それを制御することが可能である。一旦VBRのG
OPターゲット・ビットがセットされると、α2がGO
P内のビット・バジェットに応えるために使用される。
α1及びα2の典型値は、それぞれ0.05及び0.2で
ある。
【0090】例えば、CBRレートを4.0Mビット/
秒にセットし、最初のGOPを符号化する。ここで3.
9Mビット/秒が消費されるものと仮定する。残りの
0.1Mビット/秒が次のGOP(番号2)に持ち越さ
れ、従ってGOP2は(理想的には)4.1Mビット/
秒を獲得する。しかしながら、GOP2が3.5Mビッ
ト/秒を獲得するだけであれば、最初の2つのGOPに
対して、0.6Mビット/秒のアンダーシュートが存在
することになり、これがGOP3に持ち越され、区分的
な一定ビット・レートを保証する。これはVBRでは必
要とされない。なぜなら、我々はCBRにとって弱点で
ある領域に対して、ビデオ品質を最適化しようとしてい
るからである。余剰ビット(0.6Mビット/秒)を保
存して、符号化が困難(ハード)なシーンに対して、効
率的に使用するべきである。これがα1が非常に小さな
理由である。
【0091】ピクチャに対する理想ビットが決定された
後、各ピクチャに対する量子化因子が、例えば式1)を
用いて導出される(516)。量子化因子は圧縮エンジ
ン500に入力され、現GOPの各フレームまたはピク
チャを圧縮するために使用される。圧縮エンジンの出力
は、本発明の原理に従い、単一パス・リアルタイム可変
ビット・レート・モードで圧縮されたストリームであ
る。
【0092】フレームの符号化に続き、各ピクチャに割
当てられた実際のビット数が、例えば圧縮エンジン50
0内のカウンタから獲得される。これらの値が式6)に
挿入され、実際のビットが理想ビットからどの程度かけ
離れているかを決定する。
【0093】図5では、GOPビットの数を推定するた
めに使用される様々なプロセスが、圧縮エンジン500
とは別々に示されている。すなわち、圧縮エンジン50
0とは独立の処理論理または回路が、プロセスを実現す
るために使用され得る。しかしながら、別の実施例で
は、図5の1つ以上のプロセスが1チップ上に(すなわ
ち圧縮エンジン500内に)含まれる。
【0094】前述の単一パスVBRレート−量子化フレ
ームワークは、伸張エンジン内の復号器バッファが無限
のサイズであり、十分な数のビットが常に使用可能であ
るといった仮定にもとづく。しかしながら、実際の状況
では、バッファ・サイズはMPEG−2規格により制限
され、定義される。従って、本発明の符号化方式は、復
号器バッファが遭遇し得るオーバーフロー条件またはア
ンダーフロー条件を排除する責任がある。これは仮想的
な復号器バッファ、すなわちビデオ・バッファ検証器
(VBV)を調査し、ピクチャ・タイプに割当てられる
ビットの量の上限及び下限を計算することにより達成さ
れる。幸運にも、VBR状況では、復号器バッファにお
いてオーバーフローは発生し得ない。なぜなら、VBV
バッファ占有がその最大レベルに達したとき、復号器バ
ッファを充填するタスクが、即時停止されるからであ
る。従って、ピクチャ限界に対して、0の下限が課せら
れる。更に、復号器バッファが、ユーザにより設定され
たRmax(Mビット/秒)の最大レートで充填される。
【0095】しかしながら、VBR復号器のVBVにお
いて、アンダーフロー条件は発生し得、所定値以下の上
限がこれを避けるために割当てられるべきである。従っ
て、Bn及びBn *を、それぞれピクチャnが除去される
前の、及び後の復号器バッファ充填度とする。Bn *は次
のように計算される。
【数36】 Bn *=Bn−Rn、actual 16)
【0096】更に、次のピクチャを除去する前のバッフ
ァ充填度は、次のようになる。
【数37】 Bn+1=MIN(Bvbv、Bn *+Rmaxn) 17)
【0097】ここでBvbvはビデオ・バッファ検証器の
合計サイズで、Tnはピクチャnの表示期間である(Tn
はfの逆数)。ピクチャnが除去される前は、バッファ
内の全ての情報が使用可能であり、従って上限Unがバ
ッファ占有となる。ピクチャ・ターゲット・ビットを制
限する公称値は、次の下限Ln及び上限Unにより与えら
れる。
【数38】 Un=MIN(Bvbv、Bn-1+Rmaxn-1−Rn-1、actual) 18a)
【数39】 Ln=0 18b)
【0098】従って、理想ピクチャ・ビットは、次のピ
クチャ限界を用いてクリップされる。
【数40】
【0099】これまで述べてきたのは、{RTOT
{Ri、Qii=0..n}により指定される単一パスVBR
MPEG−2符号器である。符号器は、時変知覚モデ
ルと、(バーC−バーQ)モデルのバンクとを連帯的に
解くことにより形成されるポイント集合に従って動作す
る。最初に、このポイント集合内におけるGOPの(バ
ーCk、バーQk)対の相対理想位置が、GOPの"ソフ
トネス"及び"ハードネス"により決定され、次にビット
・バジェットの残りのビット数により調整される。ピク
チャの(Ri、Qi)対のローカル位置は、ピクチャ・タ
イプの(R−Q)モデルにより表される。図3は、(バ
ーCk、バーQk)対のポイント集合が、可変ビット・レ
ート制御方式1を使用するVBR符号器により形成され
る様子を示す。この図において、バーC=バーCgop
より定義される一定の直線は、全ての(バーCk、バー
k)対がCBRモードで符号化されると仮定した場合
の、それらの理想位置を示す。更に図3は、GOPのハ
ードネスが増加すると、平均量子化スケーラが増加する
ことを反映している。理想及び実際の動作ポイントが、
それぞれ白丸及び黒丸により示される。(バーC1、バ
ーQ1)及び(バーC2、バーQ2)を、ビデオ・シーケ
ンスの最初に、VBR符号器の初期化により獲得され
る"ソフト"GOPの最初の2つの対とする。"3"で示さ
れる次の理想動作ポイントは、知覚モデル(実線)と因
果予測モデルとの交点である。ポイント"3"の位置は、
シーケンス平均ビットすなわちバーCgopよりも、小さ
な平均ビットが割当てられることを示す。しかしなが
ら、符号器の出力すなわちポイント(バーC 3、バー
3)は異なり、その結果、ビット・バジェット制約に
適合する新たな知覚モデル(点線で示される)が導出さ
れる。次に、(バーC2、バーQ2)及び(バーC3、バ
ーQ3)の対が、新たな予測モデル(点線で示される)
を獲得し、新たな動作ポイントすなわち"4"を計算する
ために使用される。ビデオ・シーケンスが多数の連続す
る"ソフト"GOPを含む場合、知覚モデルは最終的に
は、CBR出力対(バーC1、バーQ1)及び(バー
2、バーQ2)の近くでバーC=バーCgopの直線と交
差する直線に収束する。
【0100】ビデオ資料が"ハード"GOPで開始する場
合、実際のポイント(バーC3、バーQ3)の位置は、バ
ーC=バーCgopの直線よりも上にある。このことはC
BR符号器が最も弱い領域、すなわち"ハード"GOPに
おいて使用可能なビット・バジェットの最適化を保証す
る。この状況では、新たな知覚モデル(破線により示さ
れる)が、割当てられるGOPビットを次第に少なくし
てビット・バジェット制約に適合するように形成され
る。このモデルは、新たな因果予測モデル(破線で示さ
れる)と共に、"4"で示される次の動作ポイントを決定
する。入来シーケンスが"ハード"GOPだけから成る場
合、知覚モデルは最終的には、(バーC1、バーQ1)ポ
イント及び(バーC2、バーQ2)ポイントの近くの位置
で、バーC=バーCgopの直線と交差する直線に従う。
通常のビデオ・プログラムでは、長い期間同一のGOP
(または前に計算されたポイントの集合)で動作するこ
とはありそうもないが、短時間の後に、あるGOPから
隣接のGOPにジャンプすることはあり得る。従って、
次の動作を推論することができる。知覚モデルが、GO
Pの"ハードネス"または"ソフトネス"を単調に減じ得る
状況に落ち着く前に、レート制御方式は新たなGOPに
移動する。前に符号化されたピクチャ・タイプの実際の
量子化スケーラ値が、"よりハードな"GOPまたは"よ
りソフトな"GOPへの移動を決定する。図3に示され
るように、将来の"よりハードな"("よりソフトな")G
OPの場合は、前に符号化されたGOPの右(左)に移
動する。従って、知覚モデルと交差するところで、前の
GOPにより使用された実際のビットよりも高い(低
い)GOPビットを生成する。この機構は、類似の"符
号化難度"を有する連続するGOPの集合に対して、"ハ
ードネス"(または"ソフトネス")の減少または増大の
効果が、対応するビデオ・インタバルの符号化内容全体
に渡って分散される一方で、最も複雑度の高い(低い)
GOPが依然、その類似のGOPに対して、最大(最
小)のビット割当てを獲得することを保証する。この技
法は知覚モデルの傾きKの調節にもとづくが、別のVB
Rレート制御方式は、ユーザによりセットされた総ビッ
ト数に合うように、知覚モデルを変換することにより公
式化され得る。この可変ビット・レート制御方式につい
て、次に述べる。
【0101】2.3 VBRレート制御方式2:この章
では、符号化される各GOPのターゲット・ビットを計
算する第2の方式について述べる。本発明の原理によれ
ば、(バーC−バーQ)知覚モデルの傾きKを調節する
代わりに、パラメータa1について解くことにより、知
覚モデルの位置が変換される。傾きKは、f・(バーC
gop)のCBRレートに固定され、パラメータa1が次の
ように導出される。
【数41】
【0102】前記式の総和項は、リアルタイム単一パス
VBR符号器では未定義である。従って、予め符号化さ
れたファントム・シーケンス(方式1と同様)が、本発
明のVBRレート制御方式2を初期化するために使用さ
れる。デジタル記憶媒体がオーバーランまたはアンダー
ランに遭遇しないことを保証するために、残りのビット
が周期的にモニタされ、瞬時総ビット・バジェットすな
わちRk、totとして使用される。知覚モデルの変換は、
次のように変化する。
【数42】
【0103】ここで項ra kは、まだ符号化されてないG
OPの長期レートと、ビデオ・ストリームのCBRレー
トとの比率を表し、Yk及びEkは後述される。ハードG
OPでは(バーCk>バーCgop)であり、従って、比率
a kは総ビット・バジェットを満足するために、時間と
共に小さくならなければならない。更に、(バーCk
バーQk)対の位置をポイント集合に沿って下流に移動
し、圧縮ストリームのレートを下げる強制が、Ekによ
り提供される。幾つかのソフトGOPが時間と共に符号
化される場合には、反対の状況が発生する。各GOPの
平均ビットが次のように設定される。
【数43】
【0104】本発明の原理によれば、学習プロシージャ
がVBRレート制御方式2に対しても提供される。この
学習プロシージャの間、Yが初期化され、更新される。
残りの符号化パラメータは、VBRレート制御方式1の
公式化により定義される。
【0105】学習プロシージャ2の1実施例が、図6に
関連して次に述べられる。
【0106】1.Pを、次式で与えられる組により定義
される予め符号化されたファントムとする。
【数44】
【0107】そして、Y0及びN0を次のように設定する
(ステップ600)。
【数45】
【数46】N0=N* gop
【0108】ここでY0の典型値は1869である。
【0109】2.例えばCBR MPEG−2符号器を
用い、ビデオ・シーケンスの最初の2つのGOPすなわ
ちS0及びS1を、f・(バーCgop)のレートで符号化
することにより、VBRレート制御方式を初期化する。
f・(バーCgop)の公称値は、VBRストリームの平
均レートに対応すべきである(ステップ602)。
【0110】3.Sk-1が符号化された後、様々なパラ
メータが更新される(ステップ604)。例えば、フレ
ーム・グループ当たりの平均量子化因子の総和を表すY
k、及びNkが、それぞれ次のように更新される。
【数47】
【数48】Nk=Nk-1+γ
【0111】ここでγは学習アルゴリズムの更新スピー
ドである(例えばγ=2.0)。更に、Ck-1、actual
次に総和ΣCj、actual(j=0乃至k−1)が計算され
る。 a)ここでk−1=0ならば、kを1増分し、ステップ
3に移行する。b)それ以外では、式10b)乃至式1
0c)により定義される予測モデルに従い、パラメータ
ξk及びηkを計算する。
【0112】4.ステップ3の総和項を使用し、バジェ
ット内の残りのビットRk、totを決定する。符号化され
る残りのピクチャPkの数を更新する(ステップ60
4)。
【0113】5.ra k、Ek及び新たな変換因子a1 k
計算する(ステップ606)。
【0114】6.新たなターゲット、バーCkを、例え
ば式22)により計算する(ステップ608)。
【0115】7.SkをVBRモードで符号化する(ス
テップ610)。
【0116】8.シーケンス内に未完のGOPが存在す
る場合(問い合わせ612)、ステップ3に移行する。
それ以外では、終了する(ステップ614)。
【0117】VBVバッファ占有及びターゲット調整に
対する制約が、前章で述べられたように処理される。図
7は、瞬時因果予測モデルが各GOP内で形成され、時
変知覚モデルと共に、可変ビット・レート制御方式2を
使用するVBR符号器の、新たな(バーCk、バーQk
ポイントを推定するために使用される様子を示す。幾つ
かのソフト(またはハード)GOPが時間と共に符号化
される場合、知覚モデルはビット・バジェット制約に適
合するために、上方(または下方)にシフトされる。
【0118】2.4 シーン遷移:符号化プロシージャ
の間、VBRレート制御方式は不安定になり得る。この
原因は通常、特殊効果または自然に発生する現象、例え
ば、シーン・カット、低速移動フェードまたは高速移動
フェード(例えば旧シーンから暗転を経て新シーンへの
フェード)、及び突然の輝度変化(カメラからの高輝度
な光、映画の発砲などの結果)などが、圧縮ビデオ・パ
ラメータの非持久的性質と関連し合うことによる。前述
の時間遷移及び空間遷移では、符号器のパラメータ調整
がほとんど不可能となる。
【0119】本発明の原理によれば、たとえ特殊効果が
圧縮されるときでも、高品質のビデオVBRストリーム
が提供される。これはVBR符号器の(特殊効果の結果
としての)アルゴリズム的不安定性を検出し、GOPタ
ーゲットを前に述べたプロシージャと異なる軌道に沿っ
て設定することにより達成される。
【0120】図8は、ソフトGOPからハードGOPへ
の遷移が、符号化される将来のGOPに対して、不正な
推定を行う場合を示す。この不正な推定は図中、"不良
動作ポイント"で示される。より良好な推定が、慎重に
選択されたパラメータのセットに、3ポイント・メディ
アン(MEDIAN)・フィルタを適用することにより実行さ
れ得る。
【0121】例えば、VBRレート制御方式1におい
て、新たなターゲットが次式により導出される。
【数49】
【0122】別の例として、VBRレート制御方式2に
おいて、新たなターゲットが次式により導出される。
【数50】
【0123】ここでH(k)=a1(N* gop+γk)Nk
-1である。
【0124】メディアン・フィルタは、全てのタイプの
GOP、例えばソフトGOPまたはハードGOP内で発
生し得る、(シーン遷移の結果としての)不安定条件を
補償するために使用される。定数セット{μ1、μ2、μ
3}が、シーン遷移の間に生成されるビット数に対して
限界を強制する。例えば、μ1=1.0、μ2=0.9、
μ3=0.9である。
【0125】式23)及び式24)のGOPターゲット
割当ては、シーン変化が検出されるときにも使用され得
る。シーン・カットの検出方法については、多くの技術
が文献などで述べられているのでここでは述べない。各
GOPの符号化はIピクチャにより開始するので、この
ピクチャの位置がシーケンス内でシーン・カットが発生
する位置に相当する場合、新たなターゲットが式23)
または式24)により設定される。更に、符号器がPピ
クチャに対してシーン変化を検出する場合、このタイプ
のピクチャがIタイプに変更されて、新たなGOPが開
始され、再度、新たなターゲットが式23)または式2
4)に従い設定される。
【0126】2.5 (バーC−バーQ)不安定性:式
1)の(R−Q)関係は、多様なクラスのビデオ・シー
ケンスに対して、かなり良好に作用することが知れてお
り、多くのリアルタイムMPEG圧縮システム及び非M
PEG圧縮システムにおいて使用される基本概念であ
る。しかしながら、本発明の原理によれば、この関係
は、先行GOPの実際の平均GOPビットと平均量子化
因子にもとづき、符号化される現GOPの平均ビットを
推定するための、因果予測モデルを生成するために使用
される。しかしながら、この予測モデルは、たとえ特殊
効果、シーン遷移またはシーン・カットが存在しない場
合でも、特定のビデオ・シーケンスに対して信頼できな
いものになる。この原因は、ビデオ・ソースの非定常的
な性質、例えば、大きな輝度またはクロミナンスのイメ
ージ詳細の背景中をゆっくり移動する幾つかの高度に詳
細なオブジェクト、或いはシーン内の不所望な雑音の存
在などに関係する。
【0127】図9は、符号器により導出される2つのポ
イントの一方が、合成(バーC−バーQ)曲線の外側に
存在する場合を示す。このポイントは、前述の基準の結
果であり、(バーC−バーQ)関係に従わない。更に、
これは"不良動作ポイント"の計算に寄与する。本発明の
VBR符号器は、式23)または式24)で定義される
方法に対して、追加の寄与を行うことにより、この不安
定性を抑制する。特に、GOPビットが下記の条件に従
い設定される。
【数51】
【0128】ここでバーCk、filは次式で与えられる。
【数52】
【0129】ここでω1及びω2はフィルタの重みを表
す。1例では、ω1=1.0、ω2=1.0であり、別の
例では、ω1=1.0、ω2=3.0に設定される。
【0130】前記式25)では、Фは割当てられるビッ
ト数を調節するために使用される定数である。例えば、
MAX Φ=1.1、MIN Φ=0.9である。しき
い値θL(例えば0.1)及びθU(例えば1.0)は、
将来のGOPが既に処理済みのGOPと同一のビデオ・
セグメントに属するとの仮定の下で選択され、バーC
k、filは、前に符号化されたGOPのビットに線形フィ
ルタを適用することにより決定される、平均GOPビッ
トである。この線形フィルタの出力は、新たな動作ポイ
ントである。MAX関数及びMIN関数は、(バーC−
バーQ)不安定性を生じる符号化ビット・パラメータを
除去するために実行される。
【0131】これまで、容易に実現でき、高品質のビデ
オを生成するリアルタイム単一パス可変ビット・レート
符号器を提供する技術について述べてきた。GOPに割
当てられるビット数が推定され、次にその推定が様々な
技術を用いて改善される。
【0132】本発明は、例えばコンピュータ使用可能媒
体を有する製造物(例えば1つ以上のコンピュータ・プ
ログラム製品)内に含まれ得る。媒体は例えば、本発明
の能力を提供し、容易にするためのコンピュータ読出し
可能プログラム・コード手段を実現する。そのような製
造物はコンピュータ・システムの一部として含まれる
か、別々に販売される。
【0133】更に、本発明の能力を実行するために、マ
シンにより実行可能な少なくとも1つの命令プログラム
を実現する、マシンにより読出し可能な少なくとも1つ
のプログラム記憶装置が提供される。
【0134】ここで示されたフロー図は模範例に過ぎな
い。これらの図またはステップ(または動作)には、本
発明の趣旨から逸れることなく多くの変化が存在し得
る。例えば、ステップが異なる順序で実行されたり、ス
テップが追加されたり、消去または変更され得る。これ
らの全ての変化は、本発明の一部と見なされる。
【0135】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0136】(1)フレーム・グループを処理する方法
であって、入力ストリームの少なくとも1つのフレーム
・グループを符号化するステップと、前記入力ストリー
ム全体を符号化する前に、前記符号化するステップから
獲得される1つ以上のパラメータ値を用い、可変ビット
・レート・モードで符号化される、前記入力ストリーム
の別のフレーム・グループに割当てられるビット数を決
定するステップとを含む、方法。 (2)前記別のフレーム・グループを、単一パス可変ビ
ット・レート・モードで、1つの符号化パスだけにより
符号化するステップを含む、前記(1)記載の方法。 (3)前記入力ストリームの他のフレーム・グループに
対して、前記決定するステップ及び前記別のフレーム・
グループを符号化するステップを繰り返すステップを含
み、前記他のフレーム・グループの各々に対して決定す
るステップが、1つ以上の前に符号化されたフレーム・
グループから獲得される1つ以上のパラメータ値を使用
する、前記(2)記載の方法。 (4)前記別のフレーム・グループを符号化するステッ
プが、前記別のフレーム・グループの1つ以上のフレー
ムに割当てられる理想ビット数を決定するステップと、
復号器バッファにおいて、オーバーフローまたはアンダ
ーフローが生じないように、前記理想ビット数を調整す
るステップとを含む、前記(2)記載の方法。 (5)前記調整するステップが、前記1つ以上のフレー
ムに割当てられる前記理想ビット数を制限するために使
用される、1つ以上のピクチャ限界を決定するステップ
を含む、前記(4)記載の方法。 (6)前記決定するステップが、前記別のフレーム・グ
ループに対して、所定の知覚関数の傾きを調節するステ
ップと、調節された傾きをビット・レート方程式内で用
い、前記ビット数を決定するステップとを含む、前記
(1)記載の方法。 (7)前記所定の知覚関数が、
【数53】 で与えられ、ここでF(バーQk)=a1+a2(バーQk
β)であり、a1、a2、βは定数、バーQkは量子化因
子、及びKは傾きの値をそれぞれ表す、前記(6)記載
の方法。 (8)前記ビット・レート方程式が、
【数54】 で与えられ、ここでRk、totはビット・バジェット内の
残りのビット数、Nkは入力ストリーム内のフレーム・
グループの調整された数、Pkは符号化される前記別の
フレーム・グループの残りのフレームの数、Zkは符号
化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
(バーQk)であり、バーCkは平均ビット、バーQk
平均量子化因子を表し、ηk=バーCk-1、actual+ξ
k(バーQk-1、act ual)であり、a1及びa2が定数であ
る、前記(6)記載の方法。 (9)前記決定するステップが、前記別のフレーム・グ
ループに対して、所定の知覚関数の変換因子を決定する
ステップと、前記変換因子をビット・レート方程式内で
使用し、前記ビット数を決定するステップとを含む、前
記(1)記載の方法。 (10)前記変換因子を決定するステップが、
【数55】 を使用し、ここでPkは符号化される前記別のフレーム
・グループの残りのフレームの数、Rk、totはビット・
バジェット内の残りのビット数、バーCgopは前記入力
ストリームのレート、Ykは1フレーム・グループ当た
りの平均量子化因子の総和、Nkは入力ストリーム内の
フレーム・グループの調整された数をそれぞれ表し、a
2は定数である、前記(9)記載の方法。 (11)前記符号化するステップが、前記入力ストリー
ムの第1のフレーム・グループ及び第2のフレーム・グ
ループを符号化するステップを含み、前記1つ以上のパ
ラメータ値が、前記第1のフレーム・グループに対する
第1のビット・レート及び第1の量子化因子と、前記第
2のフレーム・グループに対する第2のビット・レート
及び第2の量子化因子とを含む、前記(1)記載の方
法。 (12)前記決定するステップが、前記第1のビット・
レート、前記第2のビット・レート、前記第1の量子化
因子、及び前記第2の量子化因子を用いる所定の関数に
より、割当てられる前記ビット数を決定するステップを
含む、前記(11)記載の方法。 (13)前記所定の関数が、
【数56】 で与えられ、ここでRk、totはビット・バジェット内の
残りのビット数、Nkは入力ストリーム内のフレーム・
グループの調整された数、Pkは符号化される前記別の
フレーム・グループの残りのフレームの数、Zkは符号
化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
(バーQk)であり、バーCkは平均ビット、バーQk
平均量子化因子を表し、ηk=バーCk-1、actual+ξ
k(バーQk-1、act ual)であり、a1及びa2が定数であ
る、前記(12)記載の方法。 (14)フレーム・グループを処理する方法であって、
1つ以上の前に符号化されたフレーム・グループから、
複数のパラメータ値を決定するステップと、単一パス可
変ビット・レート・モードで符号化されるフレーム・グ
ループに対して、前記複数のパラメータ値の1つ以上を
用い、所定の関数の傾きを計算するステップと、計算さ
れた傾き及び前記1つ以上のパラメータ値を用い、符号
化される前記フレーム・グループのビット・レートを獲
得するステップとを含む、方法。 (15)前記可変ビット・レート・モードで符号化され
る前記フレーム・グループを、当該グループに対して獲
得された前記ビット・レートで符号化するステップを含
む、前記(14)記載の方法。 (16)前記入力ストリームの他のフレーム・グループ
に対して、前記決定するステップ、前記計算するステッ
プ、前記獲得するステップ、及び前記符号化するステッ
プを繰り返すステップを含む、前記(15)記載の方
法。 (17)前記傾きを計算するステップが、次の関数 Kk=fRk、totk/Pkk を使用し、ここでfは前記入力ストリームのフレーム・
レート、Rk、totはビット・バジェット内の残りの数、
kは入力ストリーム内のフレーム・グループの調整さ
れた数、Pkは符号化される前記別のフレーム・グルー
プの残りのフレームの数、Zkは符号化難度の総和をそ
れぞれ表わす、前記(14)記載の方法。 (18)前記獲得するステップが、所定の関数を用い、
前記ビット・レートを獲得するステップを含む、前記
(14)記載の方法。 (19)前記所定の関数が、
【数57】 で与えられ、ここでRk、totはビット・バジェット内の
残りのビット数、Nkは入力ストリーム内のフレーム・
グループの調整された数、Pkは符号化される前記別の
フレーム・グループの残りのフレームの数、Zkは符号
化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
(バーQk)であり、バーCkは平均ビット、バーQk
平均量子化因子を表し、ηk=バーCk-1、actual+ξ
k(バーQk-1、act ual)であり、a1及びa2が定数であ
る、前記(18)記載の方法。 (20)前記所定の関数が、前記別のフレーム・グルー
プの瞬時レート−量子化動作、及び前記別のフレーム・
グループの複雑度を示す知覚モデルを表わす、前記(1
8)記載の方法。 (21)前記レート−量子化動作が、
【数58】 により定義され、ここでバーCkは平均ビット、バーQk
は平均量子化スケーラ、ξk=Δ(バーCk)/Δ(バー
k)であり、Δ(バーCk)=バーCk-1、actual−バー
k-2、actual、Δ(バーQk)=バーQk-2、actual−バ
ーQk-1、actualであり、ηk=バーCk-1、actual+ξ
k(バーQk-1、actual)である、前記(20)記載の方
法。 (22)前記知覚モデルが、
【数59】 により定義され、ここでF(バーQk)=a1+a2(バ
ーQkβ)であり、a1、a2、βは定数、バーQkは量子
化因子、及びKは傾きの値をそれぞれ表す、前記(2
0)記載の方法。 (23)フレーム・グループを処理する方法であって、
入力ストリームの1つのフレーム・グループに割当てら
れるビット数を、前記フレーム・グループの瞬時レート
−量子化動作、及び前記フレーム・グループの複雑度を
示す知覚モデルを用い、決定するステップと、前記フレ
ーム・グループを可変ビット・レート・モードにより、
前記決定するステップにより定義されたレートで符号化
するステップとを含む、方法。 (24)単一パス可変ビット・レート符号器であって、
入力ストリームの少なくとも1つのフレーム・グループ
を符号化するように適応化された符号化エンジンと、前
記入力ストリーム全体を符号化する前に、前記少なくと
も1つのフレーム・グループの符号化から獲得された1
つ以上のパラメータ値を用い、可変ビット・レート・モ
ードで符号化される、前記入力ストリームの別のフレー
ム・グループに割当てられるビット数を決定する手段と
を含む、符号器。 (25)前記別のフレーム・グループを符号化するため
に前記符号化エンジンが、前記別のフレーム・グループ
の1つ以上のフレームに割当てられる理想ビット数を決
定する手段と、復号器バッファにおいて、オーバーフロ
ーまたはアンダーフローが生じないように、前記理想ビ
ット数を調整する手段とを含む、前記(24)記載の符
号器。 (26)前記調整する手段が、前記1つ以上のフレーム
に割当てられる前記理想ビット数を制限するために使用
される、1つ以上のピクチャ限界を決定する手段を含
む、前記(25)記載の符号器。 (27)前記決定する手段が、前記別のフレーム・グル
ープに対して、所定の知覚関数の傾きを調節する手段
と、調節された傾きをビット・レート方程式内で用い、
前記ビット数を決定する手段とを含む、前記(24)記
載の符号器。 (28)前記決定する手段が、前記別のフレーム・グル
ープに対して、所定の知覚関数の変換因子を決定する手
段と、前記変換因子をビット・レート方程式内で用い、
前記ビット数を決定する手段とを含む、前記(24)記
載の符号器。 (29)前記少なくとも1つのフレーム・グループが、
前記入力ストリームの第1のフレーム・グループ及び第
2のフレーム・グループを含み、前記1つ以上のパラメ
ータ値が、前記第1のフレーム・グループに対する、第
1のビット・レート及び第1の量子化因子と、前記第2
のフレーム・グループに対する、第2のビット・レート
及び第2の量子化因子とを含む、前記(24)記載の符
号器。 (30)前記決定する手段が、前記第1のビット・レー
ト、前記第2のビット・レート、前記第1の量子化因
子、及び前記第2の量子化因子を用いる所定の関数によ
り、割当てられる前記ビット数を決定する手段を含む、
前記(29)記載の符号器。 (31)単一パス可変ビット・レート符号器であって、
1つ以上の前に符号化されたフレーム・グループから、
複数のパラメータ値を決定する手段と、単一パス可変ビ
ット・レート・モードで符号化されるフレーム・グルー
プに対して、前記複数のパラメータ値の1つ以上を用
い、所定の関数の傾きを計算する手段と、計算された傾
き及び前記1つ以上のパラメータ値を用い、符号化され
る前記フレーム・グループのビット・レートを獲得する
手段とを含む、符号器。 (32)前記可変ビット・レート・モードで符号化され
る前記フレーム・グループを、当該グループに対して獲
得された前記ビット・レートで符号化する手段を含む、
前記(31)記載の符号器。 (33)前記獲得する手段が、所定の関数を用い、前記
ビット・レートを獲得する手段を含む、前記(31)記
載の符号器。 (34)単一パス可変ビット・レート符号器であって、
入力ストリームの1つのフレーム・グループに割当てら
れるビット数を、前記フレーム・グループの瞬時レート
−量子化動作、及び前記フレーム・グループの複雑度を
示す知覚モデルを用い、決定する手段と、前記フレーム
・グループを可変ビット・レート・モードにより、前記
決定する手段により定義されたレートで符号化するよう
に適応化された符号化エンジンとを含む、符号器。 (35)フレーム・グループの処理をコンピュータに指
示するコンピュータ読出し可能プログラム・コード手段
を有する、少なくとも1つのコンピュータ使用可能媒体
を含む装置であって、前記コンピュータ読出し可能プロ
グラム・コード手段が、入力ストリームの少なくとも1
つのフレーム・グループを符号化するように、前記コン
ピュータに指示する手段と、前記入力ストリーム全体を
符号化する前に、前記符号化から獲得された1つ以上の
パラメータ値を用い、可変ビット・レート・モードで符
号化される、前記入力ストリームの別のフレーム・グル
ープに割当てられるビット数を決定するように、前記コ
ンピュータに指示する手段とを含む、装置。 (36)前記別のフレーム・グループを単一パス可変ビ
ット・レート・モードで1つの符号化パスだけにより符
号化するように、前記コンピュータに指示する手段を含
む、前記(35)記載の装置。 (37)前記ビット数を決定するように前記コンピュー
タに指示する手段が、前記別のフレーム・グループに対
して、所定の知覚関数の傾きを調節するように、前記コ
ンピュータに指示する手段と、調節された傾きをビット
・レート方程式内で用い、前記ビット数を決定するよう
に、前記コンピュータに指示する手段とを含む、前記
(35)記載の装置。 (38)前記ビット数を決定するように前記コンピュー
タに指示する手段が、前記別のフレーム・グループに対
して、所定の知覚関数の変換因子を決定するように、前
記コンピュータに指示する手段と、前記変換因子をビッ
ト・レート方程式内で用い、前記ビット数を決定するよ
うに、前記コンピュータに指示する手段とを含む、前記
(35)記載の装置。 (39)前記ビット数を決定するように前記コンピュー
タに指示する手段が、所定の関数を用い、前記ビット数
を決定するように、前記コンピュータに指示する手段を
含む、前記(35)記載の装置。 (40)フレーム・グループの処理をコンピュータに指
示するコンピュータ読出し可能プログラム・コード手段
を有する、少なくとも1つのコンピュータ使用可能媒体
を含む装置であって、前記コンピュータ読出し可能プロ
グラム・コード手段が、入力ストリームの1つのフレー
ム・グループに割当てられるビット数を、前記フレーム
・グループの瞬時レート−量子化動作、及び前記フレー
ム・グループの複雑度を示す知覚モデルを用い、前記コ
ンピュータに決定するように指示する手段と、前記フレ
ーム・グループを可変ビット・レート・モードにより、
前記手段により定義されたレートで符号化するように、
前記コンピュータに指示する手段とを含む、装置。
【図面の簡単な説明】
【図1】本発明のリアルタイム単一パス可変ビット・レ
ート制御方法を組み込み、使用するMPEG−2符号器
のブロック図の1例を示す図である。
【図2】Pピクチャ・タイプ及びBピクチャ・タイプの
動き推定のブロック図の1例を示す図である。
【図3】バーC−バーQモデルの1例、及び本発明の可
変ビット・レート制御方式の動作ポイントを示す図であ
る。
【図4】本発明の原理に従い、ピクチャのグループ(G
OP)に割当てられるビット数を推定する1例に関連付
けられる論理の1実施例である。
【図5】本発明の可変ビット・レート制御方法の1実施
例のブロック図の1例を示す図である。
【図6】本発明の原理に従い、ピクチャのグループ(G
OP)に割当てられるビット数を推定する別の例に関連
付けられる論理の1実施例である。
【図7】バーC−バーQモデルの1例、及び本発明の別
の可変ビット・レート制御方式の動作ポイントを示す図
である。
【図8】本発明のメディアン・フィルタリング技術を用
いるシーン遷移の間の、GOPビット調整の1例を示す
図である。
【図9】本発明の原理に従う、レート制御不安定性のG
OPビット調整の1例を示す図である。
【符号の説明】
100 符号器 102 2次元離散コサイン変換(DCT) 104 動き推定(ME) 106、202 動きベクトル(MV) 108 動き補償(MC) 114 エントロピ符号器 116 エントロピ復号器 118 逆走査 120 逆量子化 122 逆離散コサイン変換 124、502 遅延 200 マクロブロック 204 探索窓 301 知覚ライン 500 圧縮エンジン

Claims (40)

    【特許請求の範囲】
  1. 【請求項1】フレーム・グループを処理する方法であっ
    て、 入力ストリームの少なくとも1つのフレーム・グループ
    を符号化するステップと、 前記入力ストリーム全体を符号化する前に、前記符号化
    するステップから獲得される1つ以上のパラメータ値を
    用い、可変ビット・レート・モードで符号化される、前
    記入力ストリームの別のフレーム・グループに割当てら
    れるビット数を決定するステップとを含む、方法。
  2. 【請求項2】前記別のフレーム・グループを、単一パス
    可変ビット・レート・モードで、1つの符号化パスだけ
    により符号化するステップを含む、請求項1記載の方
    法。
  3. 【請求項3】前記入力ストリームの他のフレーム・グル
    ープに対して、前記決定するステップ及び前記別のフレ
    ーム・グループを符号化するステップを繰り返すステッ
    プを含み、前記他のフレーム・グループの各々に対して
    決定するステップが、1つ以上の前に符号化されたフレ
    ーム・グループから獲得される1つ以上のパラメータ値
    を使用する、請求項2記載の方法。
  4. 【請求項4】前記別のフレーム・グループを符号化する
    ステップが、 前記別のフレーム・グループの1つ以上のフレームに割
    当てられる理想ビット数を決定するステップと、 復号器バッファにおいて、オーバーフローまたはアンダ
    ーフローが生じないように、前記理想ビット数を調整す
    るステップとを含む、請求項2記載の方法。
  5. 【請求項5】前記調整するステップが、前記1つ以上の
    フレームに割当てられる前記理想ビット数を制限するた
    めに使用される、1つ以上のピクチャ限界を決定するス
    テップを含む、請求項4記載の方法。
  6. 【請求項6】前記決定するステップが、 前記別のフレーム・グループに対して、所定の知覚関数
    の傾きを調節するステップと、 調節された傾きをビット・レート方程式内で用い、前記
    ビット数を決定するステップとを含む、請求項1記載の
    方法。
  7. 【請求項7】前記所定の知覚関数が、 【数1】 で与えられ、ここでF(バーQk)=a1+a2(バーQk
    β)であり、a1、a2、βは定数、バーQkは量子化因
    子、及びKは傾きの値をそれぞれ表す、請求項6記載の
    方法。
  8. 【請求項8】前記ビット・レート方程式が、 【数2】 で与えられ、ここでRk、totはビット・バジェット内の
    残りのビット数、Nkは入力ストリーム内のフレーム・
    グループの調整された数、Pkは符号化される前記別の
    フレーム・グループの残りのフレームの数、Zkは符号
    化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
    (バーQk)であり、バーCkは平均ビット、バーQk
    平均量子化因子を表し、ηk=バーCk-1、actual+ξ
    k(バーQk-1、act ual)であり、a1及びa2が定数であ
    る、請求項6記載の方法。
  9. 【請求項9】前記決定するステップが、 前記別のフレーム・グループに対して、所定の知覚関数
    の変換因子を決定するステップと、 前記変換因子をビット・レート方程式内で使用し、前記
    ビット数を決定するステップとを含む、請求項1記載の
    方法。
  10. 【請求項10】前記変換因子を決定するステップが、 【数3】 を使用し、ここでPkは符号化される前記別のフレーム
    ・グループの残りのフレームの数、Rk、totはビット・
    バジェット内の残りのビット数、バーCgopは前記入力
    ストリームのレート、Ykは1フレーム・グループ当た
    りの平均量子化因子の総和、Nkは入力ストリーム内の
    フレーム・グループの調整された数をそれぞれ表し、a
    2は定数である、請求項9記載の方法。
  11. 【請求項11】前記符号化するステップが、前記入力ス
    トリームの第1のフレーム・グループ及び第2のフレー
    ム・グループを符号化するステップを含み、前記1つ以
    上のパラメータ値が、前記第1のフレーム・グループに
    対する第1のビット・レート及び第1の量子化因子と、
    前記第2のフレーム・グループに対する第2のビット・
    レート及び第2の量子化因子とを含む、請求項1記載の
    方法。
  12. 【請求項12】前記決定するステップが、前記第1のビ
    ット・レート、前記第2のビット・レート、前記第1の
    量子化因子、及び前記第2の量子化因子を用いる所定の
    関数により、割当てられる前記ビット数を決定するステ
    ップを含む、請求項11記載の方法。
  13. 【請求項13】前記所定の関数が、 【数4】 で与えられ、ここでRk、totはビット・バジェット内の
    残りのビット数、Nkは入力ストリーム内のフレーム・
    グループの調整された数、Pkは符号化される前記別の
    フレーム・グループの残りのフレームの数、Zkは符号
    化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
    (バーQk)であり、バーCkは平均ビット、バーQk
    平均量子化因子を表し、ηk=バーCk-1、actual+ξ
    k(バーQk-1、act ual)であり、a1及びa2が定数であ
    る、請求項12記載の方法。
  14. 【請求項14】フレーム・グループを処理する方法であ
    って、 1つ以上の前に符号化されたフレーム・グループから、
    複数のパラメータ値を決定するステップと、 単一パス可変ビット・レート・モードで符号化されるフ
    レーム・グループに対して、前記複数のパラメータ値の
    1つ以上を用い、所定の関数の傾きを計算するステップ
    と、 計算された傾き及び前記1つ以上のパラメータ値を用
    い、符号化される前記フレーム・グループのビット・レ
    ートを獲得するステップとを含む、方法。
  15. 【請求項15】前記可変ビット・レート・モードで符号
    化される前記フレーム・グループを、当該グループに対
    して獲得された前記ビット・レートで符号化するステッ
    プを含む、請求項14記載の方法。
  16. 【請求項16】前記入力ストリームの他のフレーム・グ
    ループに対して、前記決定するステップ、前記計算する
    ステップ、前記獲得するステップ、及び前記符号化する
    ステップを繰り返すステップを含む、請求項15記載の
    方法。
  17. 【請求項17】前記傾きを計算するステップが、次の関
    数 Kk=fRk、totk/Pkk を使用し、ここでfは前記入力ストリームのフレーム・
    レート、Rk、totはビット・バジェット内の残りの数、
    kは入力ストリーム内のフレーム・グループの調整さ
    れた数、Pkは符号化される前記別のフレーム・グルー
    プの残りのフレームの数、Zkは符号化難度の総和をそ
    れぞれ表わす、請求項14記載の方法。
  18. 【請求項18】前記獲得するステップが、所定の関数を
    用い、前記ビット・レートを獲得するステップを含む、
    請求項14記載の方法。
  19. 【請求項19】前記所定の関数が、 【数5】 で与えられ、ここでRk、totはビット・バジェット内の
    残りのビット数、Nkは入力ストリーム内のフレーム・
    グループの調整された数、Pkは符号化される前記別の
    フレーム・グループの残りのフレームの数、Zkは符号
    化難度の総和をそれぞれ表し、ξk=Δ(バーCk)/Δ
    (バーQk)であり、バーCkは平均ビット、バーQk
    平均量子化因子を表し、ηk=バーCk-1、actual+ξ
    k(バーQk-1、act ual)であり、a1及びa2が定数であ
    る、請求項18記載の方法。
  20. 【請求項20】前記所定の関数が、前記別のフレーム・
    グループの瞬時レート−量子化動作、及び前記別のフレ
    ーム・グループの複雑度を示す知覚モデルを表わす、請
    求項18記載の方法。
  21. 【請求項21】前記レート−量子化動作が、 【数6】 により定義され、ここでバーCkは平均ビット、バーQk
    は平均量子化スケーラ、ξk=Δ(バーCk)/Δ(バー
    k)であり、Δ(バーCk)=バーCk-1、actual−バー
    k-2、actual、Δ(バーQk)=バーQk-2、actual−バ
    ーQk-1、actualであり、ηk=バーCk-1、actual+ξ
    k(バーQk-1、actual)である、請求項20記載の方
    法。
  22. 【請求項22】前記知覚モデルが、 【数7】 により定義され、ここでF(バーQk)=a1+a2(バ
    ーQkβ)であり、a1、a2、βは定数、バーQkは量子
    化因子、及びKは傾きの値をそれぞれ表す、請求項20
    記載の方法。
  23. 【請求項23】フレーム・グループを処理する方法であ
    って、 入力ストリームの1つのフレーム・グループに割当てら
    れるビット数を、前記フレーム・グループの瞬時レート
    −量子化動作、及び前記フレーム・グループの複雑度を
    示す知覚モデルを用い、決定するステップと、 前記フレーム・グループを可変ビット・レート・モード
    により、前記決定するステップにより定義されたレート
    で符号化するステップとを含む、方法。
  24. 【請求項24】単一パス可変ビット・レート符号器であ
    って、 入力ストリームの少なくとも1つのフレーム・グループ
    を符号化するように適応化された符号化エンジンと、 前記入力ストリーム全体を符号化する前に、前記少なく
    とも1つのフレーム・グループの符号化から獲得された
    1つ以上のパラメータ値を用い、可変ビット・レート・
    モードで符号化される、前記入力ストリームの別のフレ
    ーム・グループに割当てられるビット数を決定する手段
    とを含む、符号器。
  25. 【請求項25】前記別のフレーム・グループを符号化す
    るために前記符号化エンジンが、 前記別のフレーム・グループの1つ以上のフレームに割
    当てられる理想ビット数を決定する手段と、 復号器バッファにおいて、オーバーフローまたはアンダ
    ーフローが生じないように、前記理想ビット数を調整す
    る手段とを含む、請求項24記載の符号器。
  26. 【請求項26】前記調整する手段が、前記1つ以上のフ
    レームに割当てられる前記理想ビット数を制限するため
    に使用される、1つ以上のピクチャ限界を決定する手段
    を含む、請求項25記載の符号器。
  27. 【請求項27】前記決定する手段が、 前記別のフレーム・グループに対して、所定の知覚関数
    の傾きを調節する手段と、 調節された傾きをビット・レート方程式内で用い、前記
    ビット数を決定する手段とを含む、請求項24記載の符
    号器。
  28. 【請求項28】前記決定する手段が、 前記別のフレーム・グループに対して、所定の知覚関数
    の変換因子を決定する手段と、 前記変換因子をビット・レート方程式内で用い、前記ビ
    ット数を決定する手段とを含む、請求項24記載の符号
    器。
  29. 【請求項29】前記少なくとも1つのフレーム・グルー
    プが、前記入力ストリームの第1のフレーム・グループ
    及び第2のフレーム・グループを含み、前記1つ以上の
    パラメータ値が、前記第1のフレーム・グループに対す
    る、第1のビット・レート及び第1の量子化因子と、前
    記第2のフレーム・グループに対する、第2のビット・
    レート及び第2の量子化因子とを含む、請求項24記載
    の符号器。
  30. 【請求項30】前記決定する手段が、前記第1のビット
    ・レート、前記第2のビット・レート、前記第1の量子
    化因子、及び前記第2の量子化因子を用いる所定の関数
    により、割当てられる前記ビット数を決定する手段を含
    む、請求項29記載の符号器。
  31. 【請求項31】単一パス可変ビット・レート符号器であ
    って、 1つ以上の前に符号化されたフレーム・グループから、
    複数のパラメータ値を決定する手段と、 単一パス可変ビット・レート・モードで符号化されるフ
    レーム・グループに対して、前記複数のパラメータ値の
    1つ以上を用い、所定の関数の傾きを計算する手段と、 計算された傾き及び前記1つ以上のパラメータ値を用
    い、符号化される前記フレーム・グループのビット・レ
    ートを獲得する手段とを含む、符号器。
  32. 【請求項32】前記可変ビット・レート・モードで符号
    化される前記フレーム・グループを、当該グループに対
    して獲得された前記ビット・レートで符号化する手段を
    含む、請求項31記載の符号器。
  33. 【請求項33】前記獲得する手段が、所定の関数を用
    い、前記ビット・レートを獲得する手段を含む、請求項
    31記載の符号器。
  34. 【請求項34】単一パス可変ビット・レート符号器であ
    って、 入力ストリームの1つのフレーム・グループに割当てら
    れるビット数を、前記フレーム・グループの瞬時レート
    −量子化動作、及び前記フレーム・グループの複雑度を
    示す知覚モデルを用い、決定する手段と、 前記フレーム・グループを可変ビット・レート・モード
    により、前記決定する手段により定義されたレートで符
    号化するように適応化された符号化エンジンとを含む、
    符号器。
  35. 【請求項35】フレーム・グループの処理をコンピュー
    タに指示するコンピュータ読出し可能プログラム・コー
    ド手段を有する、少なくとも1つのコンピュータ使用可
    能媒体を含む装置であって、前記コンピュータ読出し可
    能プログラム・コード手段が、 入力ストリームの少なくとも1つのフレーム・グループ
    を符号化するように、前記コンピュータに指示する手段
    と、 前記入力ストリーム全体を符号化する前に、前記符号化
    から獲得された1つ以上のパラメータ値を用い、可変ビ
    ット・レート・モードで符号化される、前記入力ストリ
    ームの別のフレーム・グループに割当てられるビット数
    を決定するように、前記コンピュータに指示する手段と
    を含む、装置。
  36. 【請求項36】前記別のフレーム・グループを単一パス
    可変ビット・レート・モードで1つの符号化パスだけに
    より符号化するように、前記コンピュータに指示する手
    段を含む、請求項35記載の装置。
  37. 【請求項37】前記ビット数を決定するように前記コン
    ピュータに指示する手段が、 前記別のフレーム・グループに対して、所定の知覚関数
    の傾きを調節するように、前記コンピュータに指示する
    手段と、 調節された傾きをビット・レート方程式内で用い、前記
    ビット数を決定するように、前記コンピュータに指示す
    る手段とを含む、請求項35記載の装置。
  38. 【請求項38】前記ビット数を決定するように前記コン
    ピュータに指示する手段が、 前記別のフレーム・グループに対して、所定の知覚関数
    の変換因子を決定するように、前記コンピュータに指示
    する手段と、 前記変換因子をビット・レート方程式内で用い、前記ビ
    ット数を決定するように、前記コンピュータに指示する
    手段とを含む、請求項35記載の装置。
  39. 【請求項39】前記ビット数を決定するように前記コン
    ピュータに指示する手段が、所定の関数を用い、前記ビ
    ット数を決定するように、前記コンピュータに指示する
    手段を含む、請求項35記載の装置。
  40. 【請求項40】フレーム・グループの処理をコンピュー
    タに指示するコンピュータ読出し可能プログラム・コー
    ド手段を有する、少なくとも1つのコンピュータ使用可
    能媒体を含む装置であって、前記コンピュータ読出し可
    能プログラム・コード手段が、 入力ストリームの1つのフレーム・グループに割当てら
    れるビット数を、前記フレーム・グループの瞬時レート
    −量子化動作、及び前記フレーム・グループの複雑度を
    示す知覚モデルを用い、前記コンピュータに決定するよ
    うに指示する手段と、 前記フレーム・グループを可変ビット・レート・モード
    により、前記手段により定義されたレートで符号化する
    ように、前記コンピュータに指示する手段とを含む、装
    置。
JP11063139A 1998-03-19 1999-03-10 リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器 Pending JPH11346362A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/044642 1998-03-19
US09/044,642 US6278735B1 (en) 1998-03-19 1998-03-19 Real-time single pass variable bit rate control strategy and encoder

Publications (1)

Publication Number Publication Date
JPH11346362A true JPH11346362A (ja) 1999-12-14

Family

ID=21933502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11063139A Pending JPH11346362A (ja) 1998-03-19 1999-03-10 リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器

Country Status (5)

Country Link
US (1) US6278735B1 (ja)
JP (1) JPH11346362A (ja)
KR (1) KR100305941B1 (ja)
SG (1) SG80615A1 (ja)
TW (1) TW404132B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7535959B2 (en) 2003-10-16 2009-05-19 Nvidia Corporation Apparatus, system, and method for video encoder rate control

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999020051A1 (en) * 1997-10-15 1999-04-22 Sony Corporation Video data multiplexer, video data multiplexing control method, method and apparatus for multiplexing encoded stream, and encoding method and apparatus
GB2333657B (en) 1998-01-22 2002-08-21 Snell & Wilcox Ltd Video signal compression
GB2333656B (en) * 1998-01-22 2002-08-14 British Broadcasting Corp Compressed signals
GB2335104B (en) 1998-03-06 2002-01-30 British Broadcasting Corp Cascading of up conversion and down conversion
GB2337389B (en) 1998-05-15 2002-05-29 Snell & Wilcox Ltd Video signal processing
GB9822094D0 (en) 1998-10-09 1998-12-02 Snell & Wilcox Ltd Improvements in data compression
GB9822087D0 (en) 1998-10-09 1998-12-02 Snell & Wilcox Ltd Improvements in data compression
GB9822092D0 (en) 1998-10-09 1998-12-02 Snell & Wilcox Ltd Analysis of compression decoded sequences
GB9824061D0 (en) 1998-11-03 1998-12-30 Snell & Wilcox Ltd Film sequence detection (nt4)
US6700623B1 (en) 1998-12-10 2004-03-02 Snell & Wilcox Limited Video signal processing using triplets of pixels
GB2346282B (en) * 1999-01-28 2003-02-19 Snell & Wilcox Ltd Bit rate control in compression encoding
US6453424B1 (en) * 1999-03-31 2002-09-17 International Business Machines Corporation System and method for temporally controlling instruction execution
FR2792798B1 (fr) * 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
EP1061750A3 (en) * 1999-06-18 2010-05-05 THOMSON multimedia Picture compression process, especially of the MPEG2 type
DE19946267C2 (de) * 1999-09-27 2002-09-26 Harman Becker Automotive Sys Digitales Transcodiersystem
GB2361126B (en) * 2000-04-05 2004-04-21 Snell & Wilcox Ltd Spatial video processing
WO2002005121A2 (en) * 2000-07-11 2002-01-17 Mediaflow, Llc System and method for calculating an optimum display size for a visual object
JP4256574B2 (ja) * 2000-08-04 2009-04-22 富士通株式会社 画像信号符号化方法および画像信号符号化装置
US6741648B2 (en) * 2000-11-10 2004-05-25 Nokia Corporation Apparatus, and associated method, for selecting an encoding rate by which to encode video frames of a video sequence
US6990144B2 (en) * 2000-12-11 2006-01-24 Sony Corporation System and method for overrun catch-up in a real-time software
KR100394014B1 (ko) * 2001-06-23 2003-08-09 엘지전자 주식회사 영상 변환 부호화 장치
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
US6947598B2 (en) * 2001-04-20 2005-09-20 Front Porch Digital Inc. Methods and apparatus for generating, including and using information relating to archived audio/video data
US7206453B2 (en) * 2001-05-03 2007-04-17 Microsoft Corporation Dynamic filtering for lossy compression
US6859494B2 (en) * 2001-07-27 2005-02-22 General Instrument Corporation Methods and apparatus for sub-pixel motion estimation
US6941017B2 (en) * 2001-09-18 2005-09-06 Tektronix, Inc. Temporal processing for realtime human vision system behavior modeling
FR2831742B1 (fr) * 2001-10-25 2004-02-27 Cit Alcatel Procede de transmission de paquets par l'intermediaire d'un reseau de telecommunications utilisant le protocole ip
FR2832582A1 (fr) * 2001-11-21 2003-05-23 Canon Kk Procede et dispositif de determination d'au moins un parametre de codage de donnees multimedia
US7356079B2 (en) * 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
US7403564B2 (en) * 2001-11-21 2008-07-22 Vixs Systems, Inc. System and method for multiple channel video transcoding
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US6847682B2 (en) * 2002-02-01 2005-01-25 Hughes Electronics Corporation Method, system, device and computer program product for MPEG variable bit rate (VBR) video traffic classification using a nearest neighbor classifier
US20040057465A1 (en) * 2002-09-24 2004-03-25 Koninklijke Philips Electronics N.V. Flexible data partitioning and packetization for H.26L for improved packet loss resilience
US7609767B2 (en) * 2002-05-03 2009-10-27 Microsoft Corporation Signaling for fading compensation
US7277486B2 (en) 2002-05-03 2007-10-02 Microsoft Corporation Parameterization for fading compensation
KR100848457B1 (ko) * 2002-05-06 2008-07-28 주식회사 케이티 비디오 인코더의 비트발생 제한 및 버퍼넘침 방지 방법
US7543326B2 (en) * 2002-06-10 2009-06-02 Microsoft Corporation Dynamic rate control
US20030235250A1 (en) * 2002-06-24 2003-12-25 Ankur Varma Video deblocking
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
US7042943B2 (en) 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
FR2851397B1 (fr) * 2003-02-14 2005-05-13 Canon Europa Nv Procede et dispositif d'analyse de sequences video dans un reseau de communication
US8194751B2 (en) * 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
CN101390296A (zh) * 2003-06-26 2009-03-18 汤姆森特许公司 多通路视频速率控制以匹配滑动窗口信道限制
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7609763B2 (en) 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US7343291B2 (en) 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US8009739B2 (en) * 2003-09-07 2011-08-30 Microsoft Corporation Intensity estimation/compensation for interlaced forward-predicted fields
FR2867291B1 (fr) * 2004-03-08 2006-05-19 Canon Kk Procede et dispositif d'acces a une image numerique stockee sur un ordinateur serveur
US7801383B2 (en) 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US7590059B2 (en) * 2004-05-21 2009-09-15 Broadcom Corp. Multistandard video decoder
US8005139B2 (en) * 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
US8406293B2 (en) * 2004-06-27 2013-03-26 Apple Inc. Multi-pass video encoding based on different quantization parameters
JP4988567B2 (ja) * 2004-06-27 2012-08-01 アップル インコーポレイテッド マルチパスのビデオ符号化
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
US9781433B2 (en) * 2005-01-26 2017-10-03 Avago Technologies General Ip (Singapore) Pte. Ltd. Systems, methods, and apparatus for real-time video encoding
US20060227870A1 (en) * 2005-03-10 2006-10-12 Tao Tian Context-adaptive bandwidth adjustment in video rate control
AR052604A1 (es) * 2005-03-10 2007-03-21 Qualcomm Inc Control de velocidad de calidad cuasi-constante con prevision
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US8208536B2 (en) * 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US8792555B2 (en) 2006-01-31 2014-07-29 Qualcomm Incorporated Methods and systems for resizing multimedia content
JP4795223B2 (ja) * 2006-01-31 2011-10-19 キヤノン株式会社 画像処理装置
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
JP5087627B2 (ja) * 2006-09-28 2012-12-05 トムソン ライセンシング 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8750390B2 (en) * 2008-01-10 2014-06-10 Microsoft Corporation Filtering and dithering as pre-processing before encoding
US8160132B2 (en) 2008-02-15 2012-04-17 Microsoft Corporation Reducing key picture popping effects in video
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
US7949775B2 (en) 2008-05-30 2011-05-24 Microsoft Corporation Stream selection for enhanced media streaming
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
WO2010056327A1 (en) * 2008-11-13 2010-05-20 Thomson Licensing Multiple thread video encoding using hrd information sharing and bit allocation waiting
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US20100223396A1 (en) * 2009-02-27 2010-09-02 Yahoo! Inc. Intelligent status polling
WO2011050997A1 (en) 2009-10-29 2011-05-05 Thomas Sikora Method and device for processing a video sequence
US8331709B2 (en) * 2010-04-14 2012-12-11 Newport Media, Inc. Fixed buffer real-time image compression technique
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
EP2472868A1 (en) 2010-12-29 2012-07-04 British Telecommunications Public Limited Company Video coding
US9271005B2 (en) * 2011-02-24 2016-02-23 Vixs Systems, Inc. Multi-pass video encoder and methods for use therewith
US9159139B2 (en) * 2011-07-14 2015-10-13 Technische Universitat Berlin Method and device for processing pixels contained in a video sequence
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
WO2013095448A1 (en) 2011-12-21 2013-06-27 Intel Corporationu Dram compression scheme to reduce power consumption in motion compensation and display refresh
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US20130279882A1 (en) 2012-04-23 2013-10-24 Apple Inc. Coding of Video and Audio with Initialization Fragments
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法
US9552384B2 (en) 2015-06-19 2017-01-24 HGST Netherlands B.V. Apparatus and method for single pass entropy detection on data transfer
US10152389B2 (en) 2015-06-19 2018-12-11 Western Digital Technologies, Inc. Apparatus and method for inline compression and deduplication
JP6537396B2 (ja) * 2015-08-03 2019-07-03 キヤノン株式会社 画像処理装置、撮像装置および画像処理方法
EP3376766B1 (en) * 2017-03-14 2019-01-30 Axis AB Method and encoder system for determining gop length for encoding video
US10750175B2 (en) * 2017-05-04 2020-08-18 Sony Corporation Quantization partitioning for enhanced image compression
US10602147B2 (en) * 2018-07-10 2020-03-24 Samsung Display Co., Ltd. Efficient entropy coding group grouping methodology for transform mode
US10863179B1 (en) * 2018-09-05 2020-12-08 Amazon Technologies, Inc. Overlapped rate control for high-quality segmented video encoding
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质
TWI806707B (zh) * 2022-07-13 2023-06-21 緯創資通股份有限公司 通訊方法及其通訊裝置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5134476A (en) * 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
JPH04358486A (ja) 1991-06-04 1992-12-11 Toshiba Corp 高能率符号化信号処理装置
US5231484A (en) 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5241383A (en) 1992-05-13 1993-08-31 Bell Communications Research, Inc. Pseudo-constant bit rate video coding with quantization parameter adjustment
US5426463A (en) 1993-02-22 1995-06-20 Rca Thomson Licensing Corporation Apparatus for controlling quantizing in a video signal compressor
US5703646A (en) 1993-04-09 1997-12-30 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
BR9406469A (pt) * 1993-11-08 1996-01-23 Sony Corp Processo e aparelho para codificar/decodificar sinais de imagem e suporte para gravação de sinais de imagem
JP3224465B2 (ja) * 1993-12-22 2001-10-29 シャープ株式会社 画像符号化装置
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
JPH07212710A (ja) 1994-01-21 1995-08-11 Hitachi Ltd 画像送信方法および画像送信装置および画像受信方法および画像受信装置および可変速度対応蓄積装置
EP0670663A1 (fr) * 1994-03-02 1995-09-06 Laboratoires D'electronique Philips S.A.S. Procédé et dispositif de codage de signaux numériques représentatifs d'une séquence d'images
US5566208A (en) 1994-03-17 1996-10-15 Philips Electronics North America Corp. Encoder buffer having an effective size which varies automatically with the channel bit-rate
US5877814A (en) * 1994-04-20 1999-03-02 Thomson Consumer Electronics, Inc. Asynchronous control signal generating apparatus
TW374283B (en) * 1994-05-25 1999-11-11 Sony Corp A multiple coding device
EP0710033A3 (en) * 1994-10-28 1999-06-09 Matsushita Electric Industrial Co., Ltd. MPEG video decoder having a high bandwidth memory
US5606369A (en) 1994-12-28 1997-02-25 U.S. Philips Corporation Buffering for digital video signal encoders using joint bit-rate control
US5539469A (en) * 1994-12-30 1996-07-23 Daewoo Electronics Co., Ltd. Apparatus for determining motion vectors through the use of an adaptive median filtering technique
FR2736743B1 (fr) 1995-07-10 1997-09-12 France Telecom Procede de controle de debit de sortie d'un codeur de donnees numeriques representatives de sequences d'images
JPH0937242A (ja) 1995-07-21 1997-02-07 Nippon Telegr & Teleph Corp <Ntt> 可変ビットレート画像信号符号化装置
JPH0970041A (ja) 1995-08-30 1997-03-11 Kokusai Denshin Denwa Co Ltd <Kdd> 可変ビットレート符号化装置
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
JPH0993537A (ja) 1995-09-27 1997-04-04 Mitsubishi Electric Corp ディジタル映像信号記録再生装置及びディジタル映像信号符号化方法
US5675384A (en) 1995-10-03 1997-10-07 Nec Usa, Inc. VBR MPEG video encoding for ATM networks with dynamic bandwidth renegotiation
US5764805A (en) * 1995-10-25 1998-06-09 David Sarnoff Research Center, Inc. Low bit rate video encoder using overlapping block motion compensation and zerotree wavelet coding
US5682204A (en) 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
KR970057960A (ko) 1995-12-27 1997-07-31 구자홍 디지탈 동영상 압축장치
US5715176A (en) 1996-01-23 1998-02-03 International Business Machines Corporation Method and system for locating a frame position in an MPEG data stream
WO1997032436A1 (en) 1996-03-02 1997-09-04 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding or decoding digital video data
FR2748623B1 (fr) 1996-05-09 1998-11-27 Thomson Multimedia Sa Encodeur a debit variable
US5987179A (en) * 1997-09-05 1999-11-16 Eastman Kodak Company Method and apparatus for encoding high-fidelity still images in MPEG bitstreams

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7535959B2 (en) 2003-10-16 2009-05-19 Nvidia Corporation Apparatus, system, and method for video encoder rate control

Also Published As

Publication number Publication date
SG80615A1 (en) 2001-05-22
KR100305941B1 (ko) 2001-09-26
US6278735B1 (en) 2001-08-21
TW404132B (en) 2000-09-01
KR19990077445A (ko) 1999-10-25

Similar Documents

Publication Publication Date Title
JPH11346362A (ja) リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器
US7474701B2 (en) Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
KR100343352B1 (ko) 일정 비트 레이트 혹은 가변 비트 레이트를 위한 디지털 동영상 시퀀스 2-패스 부호화 방법
US6907069B2 (en) Picture coding apparatus, picture coding method, and recording medium having picture coding program recorded thereon
US7426309B2 (en) Method of controlling encoding rate, method of transmitting video data, encoding rate controller for video encoder, and video data transmission system using the encoding rate controller
US6801572B2 (en) Method and apparatus for image signal encoding
US6678322B1 (en) Video data coding device, video data coding method, video data transmitting device, and video data recording medium
US20060269156A1 (en) Image processing apparatus and method, recording medium, and program
EP1445958A1 (en) Quantization method and system, for instance for video MPEG applications, and computer program product therefor
EP1869895B1 (en) Scene-by-scene digital video processing
US6982762B1 (en) Sequence adaptive bit allocation for pictures encoding
US7373004B2 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
US20100111180A1 (en) Scene change detection
US6226326B1 (en) Coding device and coding method
KR100950525B1 (ko) 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법
JP2001028753A (ja) 動画像符号化装置及びその方法
JP4362794B2 (ja) 動画像符号化装置及びその方法
JP3858520B2 (ja) 動画像符号化装置及びその方法
KR100394014B1 (ko) 영상 변환 부호화 장치
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP4073541B2 (ja) 動画像再符号化装置
JP2001238215A (ja) 動画像符号化装置及びその方法
Kim et al. An accurate bit-rate control for real-time MPEG video encoder
JP2006295449A (ja) レート変換方法及びレート変換装置
Xin et al. Bit-allocation for transcoding pre-encoded video streams

Legal Events

Date Code Title Description
RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20041012