[go: up one dir, main page]

JP2007522724A - アダプティブレートコントロールによるエンコーダ - Google Patents

アダプティブレートコントロールによるエンコーダ Download PDF

Info

Publication number
JP2007522724A
JP2007522724A JP2006551124A JP2006551124A JP2007522724A JP 2007522724 A JP2007522724 A JP 2007522724A JP 2006551124 A JP2006551124 A JP 2006551124A JP 2006551124 A JP2006551124 A JP 2006551124A JP 2007522724 A JP2007522724 A JP 2007522724A
Authority
JP
Japan
Prior art keywords
video encoder
macroblock
frame
image
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006551124A
Other languages
English (en)
Inventor
イン,ペン
ボイス,ジル,マクドナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2007522724A publication Critical patent/JP2007522724A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

マクロブロックに分割可能な画像フレームを符号化するビデオエンコーダが開示される。ビデオエンコーダは、画像フレームのマクロブロックのQP推定を生成する手段を有する。ビデオエンコーダはさらに、マクロブロックのQP推定の平均、中間値及びモードの1つを用いて画像フレームのフレームレベル量子化パラメータ(QP)を選択する手段を有する。マクロブロックに分割可能な画像フレームを符号化する映像符号化方法が開示される。本方法は、画像フレームのマクロブロックの量子化パラメータ(QP)推定を生成し、マクロブロックのQP推定の平均、中間値及びモードの1つを用いて、画像フレームのフレームレベルQPを選択する。

Description

発明の詳細な説明
[関連出願の相互参照]
本出願は、そのすべてが参照することによってここに含まれる、2004年1月30日に出願された米国仮出願第60/540,634号(代理人整理番号PU040035)「ENCODER WITH ADAPTIVE RATE CONTROL」の利益を主張する。
[発明の技術分野]
本発明は、一般にビデオエンコーダに関し、より詳細には、アダプティブレートコントロールによるビデオエンコーダに関する。
[発明の背景]
レートコントロールは、限られたバッファサイズを有する固定されたチャネル帯域幅アプリケーションについて必要とされるとき、ある一定のビットレートを達成するためJVT(Joint Video Team)ビデオエンコーダにおいて必要である。バッファオーバフロー及びアンダフローを回避することは、シーン変更及び消散を有するセクションなど、異なる複雑さ特性を有するセクションを有する映像コンテンツに対してより困難なことである。
レートコントロールは、以前の映像圧縮規格について研究されてきた。TMN8は、H.263+について提案されたものである。TMN8レートコントロールは、フレームレイヤレートコントロールを用いて、現在フレームのターゲットビット数を選択し、マクロブロックレイヤレートコントロールを用いて、当該マクロブロックの量子化パラメータ(QP)の値を選択する。
フレームレイヤレートコントロールでは、現在フレームのターゲットビット数は、
Figure 2007522724
によって決定される。ここで、Bはあるフレームのターゲットビット数であり、Rは1秒当たりのビット数によるチャネルレートであり、Fは1秒当たりのフレーム数によるフレームレートであり、Wはエンコーダバッファのビット数であり、Mは最大バッファサイズであり、Wprevはバッファの前のビット数であり、B’は前フレームを符号化するのに用いられる実際のビット数であり、Z=0.1は低い遅延を実現するためデフォルトに設定される。
マクロブロックレイヤレートコントロールは、マクロブロックビットの合計がフレームターゲットビット数Bに近づくように、フレームのすべてのマクロブロックについて量子化ステップサイズの値を選択する。フレームのマクロブロックiの最適な量子化ステップサイズQ は、
Figure 2007522724
によって決定することが可能である。ここで、Kはモデルパラメータであり、Aはマクロブロックの画素数であり、Nはフレームにおいて符号化されるよう維持されるマクロブロック数であり、σはi番目のマクロブロックの残差の標準偏差であり、αはi番目のマクロブロックの歪みウェートであり、Cはオーバヘッドレートであり、βは初期化段階においてβ=Bと設定することによってフレームを符号化するのに残されるビット数である。
TMN8スキームは、シンプルなものであり、高いクオリティと正確なビットレートの両方を実現可能であると知られているが、H.264には良好には適さない。レート歪み最適化(RDO)(例えば、レート制限された動き推定及びモード決定など)は、RDO実行前に量子化パラメータ(QP)(ラグランジェ最適化におけるλを決定するのに用いられる)が決定される必要があるモード決定及び動き推定のためのH.264の広範に受け入れられているアプローチである。しかし、TMN8モデルは、予測エラー信号(残差)の統計量がQPを推定することを要求し、このことは、動き推定及びモード決定がQPを決定する前に実行される必要があり、これにより、何れの従属パラメータが最初に計算されねばならないかのジレンマが生じ、各値が当該決定の基礎となる他の計算されていない値に関する知識を要することを意味する。
上述のジレンマを解消するため、H.264について提案され、JVT JMリファレンスソフトウェアリリースJM7.4に含まれる方法は(以降において、「第1の従来方法」)、同じタイプの直近に符号化された画像の連結したマクロブロックの残差を利用して、現在のマクロブロックのものを予測する。さらに、ジレンマを解消するため、H.264レートコントロールについて提案される他の方法は(以降において、「第2の従来方法」)、前画像のQP(QPprev)がまず残差を生成するため利用され、その後に現在のマクロブロックのQPがこの残差に基づき推定される二段階符号化を利用する。前者のアプローチ(すなわち、第1の従来方法)はシンプルであるが、それは正確さを欠いている。後者のアプローチ(すなわち、第2の従来方法)はより正確であるが、それは複数の符号化を要し、大きな複雑さを追加する。
[発明の概要]
従来技術の上記及び他の欠点及び問題点は、アダプティブレートコントロールによるエンコーダに関する本発明によって解決される。
本発明の特徴によると、マクロブロックに分割可能な画像フレームを符号化するビデオエンコーダが提供される。ビデオエンコーダは、画像フレームのマクロブロックについて量子化パラメータ(QP)推定を生成する手段を有する。ビデオエンコーダはさらに、当該マクロブロックのQP推定の平均、中間値及びモードの1つを用いて画像フレームのフレームレベルQPを選択する手段を有する。
本発明の他の特徴によると、マクロブロックに分割可能な画像フレームを符号化する方法が提供される。本方法は、画像フレームのマクロブロックについて量子化パラメータ推定を生成するステップを有する。本方法はさらに、当該マクロブロックのQP推定の平均、中間値及びモードの1つを用いて画像フレームのフレームレベルQPを選択するステップを有する。
本発明の上記及び他の特徴及び効果は、添付された図面と共に読まれる実施例の以下の詳細な説明から明らかとなるであろう。
[好適な実施例の詳細な説明]
本発明は、アダプティブレートコントロールによるエンコーダに関する。効果的には、本発明は、特に異なる複雑さ特性を有するセクションを含む映像コンテンツの場合において、ビデオエンコーダのバッファオーバフロー及びアンダフローを回避する。
本記載は、本発明の原理を示す。従って、当業者はここで明示的に記載又は図示されていなくても、本発明の原理を実現し、その趣旨及び範囲内の含まれる様々な構成を考案することができるであろうということは理解されるであろう。ここで記載されるすべての具体例及び条件言語は、読者が本発明の原理及び発明者によってさらなる技術に貢献するコンセプトを理解するための教育的な目的のためのものであり、具体的に記載された具体例及び条件に限定されることなく解釈されるべきである。
さらに、本発明の原理、特徴及び実施例と共にその特定の具体例を記載するすべての記述は、それの構造的及び機能的均等物を含むことが意図される。さらに、このような均等物は、現在知られている均等物と将来開発される均等物、すなわち、構成に関係なく同一の機能を実行する開発される任意の要素をも含む。
従って例えば、ここで与えられるブロック図は、本発明の原理を実現する例示的な回路の概念的視野を表すことは、当業者によって理解されるであろう。同様に、フローチャート、フロー図、状態遷移図、擬似コードなどは、コンピュータ可読媒体により実質的に表され、明示的に示されてはいないが、コンピュータ又はプロセッサによって実行される各種プロセスを表すことは理解されるであろう。
図に示される各種要素の機能は、専用のハードウェア及び適切なソフトウェアに関連してソフトウェアを実行可能なハードウェアを使用することにより提供されるかもしれない。プロセッサによって提供されるとき、当該機能は単一の専用プロセッサ、単一の共有プロセッサ又はその一部が共有されている複数の各プロセッサによって提供されるかもしれない。さらに、「プロセッサ」又は「コントローラ」という用語の明示的使用は、ソフトウェアを実行可能なハードウェアのみを表していると解釈されるべきではなく、限定されることなく、デジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを格納するためのROM(Read−Only Memory)、RAM(Random Access Memory)及び不揮発性ストレージを暗黙的に含むかもしれない。
他のハードウェア、従来及び/慣用的なハードウェアもまた含まれてもよい。同様に、図に示される任意のスイッチは、単なる概念的なものである。それらの機能は、プログラムロジックの処理、専用ロジック、プログラムコントロールと専用ロジックのやりとり、又は文脈からより具体的に理解されるような実現形態により選択可能な特定の技術を介し実行されてもよい。
その請求項では、指定された機能を実行する手段として表される任意の要素は、a)当該機能を実行する回路要素の組み合わせ、又はb)当該機能を実行するソフトウェアを実行するための適切な回路と組み合わされるファームウェア、マイクロコードなどを含む任意の形式によるソフトウェアなどを含む当該機能を実行する任意の方法を含むことが意図される。このような請求項によって規定されるような本発明は、実際には、記載される各種手段によって提供される機能が、当該請求項が求める方法により組み合わせ及びもたらされることを備える。従って、出願人は上記機能を備えることが可能な任意の手段をここで示されるものに均等なものとみなす。
図1において、加算接合部110の非反転入力との信号通信において接続されるエンコーダ100の入力を有するビデオエンコーダが示される。加算接合部110の出力は、ブロック変換装置120と信号通信により接続される。当該変換装置120は、量子化装置130の第1入力と信号通信により接続される、量子化装置130の出力は、可変長符号化装置(VLC)140と信号通信により接続され、VLC140の出力はエンコーダ100の外部利用可能な出力である。レートコントローラ177の第1入力は、加算接合部110の出力と信号通信により接続され、レートコントローラ177の第2入力は、VLC140の出力と信号通信により接続され、レートコントローラ177の出力は、量子化装置130の第2入力と信号通信により接続される。
量子化装置130の出力はさらに、逆量子化装置150と信号通信により接続される。逆量子化装置150は、逆ブロック変換装置160と信号通信により接続され、逆ブロック変換装置160は基準画像ストア170と信号通信により接続される。基準画像ストア170の第1出力は、動き推定装置180の第1入力と信号通信により接続される。エンコーダ100への入力はさらに、動き推定装置180の第2入力と信号通信により接続される。動き推定装置180の出力は、動き補償装置190の第1入力と信号通信により接続される。基準画像ストア170の第2出力は、動き補償装置190の第2入力と信号通信により接続される。動き補償装置190の出力は、加算接合部110の反転入力と信号通信により接続される。
図2に戻って、レートコントロールにより画像ブロックを符号化する一例となるプロセスが、参照番号200によって全体的に示される。当該プロセスは、バッファを初期化し、平均ターゲットフレームビット又は平均ターゲットGOP(Group Of Picture)ビットを計算し、すべてのレートコントロールに関連するパラメータの初期値を設定などする初期化ブロック205を含む。この初期化ブロック205は、第1ループを開始し、i=0(0〜frame_number−1の範囲)と設定し、制御を判定ブロック125にわたすループリミットブロック210に制御をわたす。
判定ブロック215では、バッファフルネス(buffer_fullness)が第1閾値T1より大きいか、フレームを符号化するのに利用可能なビット(bit_budget)が第2閾値T2より小さいか(現在フレームについて)判断される。 buffer_fullnessがT1より大きく、及び/又はbit_budgetがT2より小さい場合、制御はバーチャルフレームスキップを実行し、次フレームについてエンドループブロック275に制御をわたし(i<frame_number)又は第1ループを終了する(i==frame_number)機能ブロック220にわたされる。そうでない場合、buffer_fullnessがT1以下であり、かつbit_budgetがT2以上である場合、制御は機能ブロック225にわたされる。
機能ブロック225は、予測残差の推定を取得するため、画像タイプに応じたフレームの前処理を実行し、制御を機能ブロック230にわたす。I画像について機能ブロック225によって実行される前処理は、許容されるイントラ予測モードの一部を用いて予測を構成するイントラ符号化を有し、当該部分を用いて構成される予測の予測残差に関する平均二乗誤差を利用して、許容されるイントラ予測モードの一部からベストモードを決定するようにしてもよい。P画像について機能ブロック225によって実行される前処理は、16×16ブロックタイプと1つの基準画像のみによる動き推定を実行することを含むものであってもよい。ここで使用されるように、「ベストモード」という用語は、与えられたフレーム及び/又は画像ブロックについて最も正確な予測をもたらす予測モードを表すということは理解されるべきである。
機能ブロック230は、前処理ブロック225によって生成される統計量に基づき、フレーム量子化パラメータ(QP)の推定を実行し、制御をループリミットブロック235にわたす。このループリミットブロック235は、第2ループを開始し、j=0(0〜MB_number−1の範囲)を設定し、制御を判定ブロック240にわたす。
判定ブロック240は、マクロブロックレベルレートコントロールが可能であるか判断する。マクロブロックレベルレートコントロールが可能でない場合、制御は機能ブロック260にわたされ、機能ブロック260は、フレームQPによりフレームのすべてのマクロブロックを符号化し、制御を第2ループを終了させるエンドループブロック265にわたす。マクロブロックレベルレートコントロールが可能である場合、制御は機能ブロック245にわたされ、機能ブロック245は、RD(Rate Distortion)モデルに従って各マクロブロックについてQPを推定し、制御を機能ブロック250にわたす。
機能ブロック250は、現在のマクロブロックを符号化し、制御を機能ブロック255にわたす。1つのマクロブロックが符号化された後に実行される機能ブロック255は、他の統計量と共にRDモデルを更新し、制御をエンドループブロック265にわたす。
エンドループブロック265は、機能ブロック270に制御をわたし、機能ブロック270は、フレーム符号化が完了すると、バッファフルネス及び他の統計量(例えば、次フレームのターゲットビット及びRDモデルのパラメータなど)を更新し、エンドブロック275に制御をわたし、エンドループブロック275は、すべてのフレームが符号化された後、エンドブロック280に制御をわたす。
映像データを符号化するためのアダプティブレートコントロールを提供する本発明によって解消される多数の問題の一部が説明される。本発明は、H.263+のTMN8において使用されるモデルを構築する。このモデルは、ラグランジェ最適化を利用して、ターゲットビットレート制約の下で歪みを最小化する。当該モデルをITU−T(International Telecommunication Union,Telecommunication Sector)H.264規格に適応化し、さらにパフォーマンスを向上させるため、いくつかの問題が検討される必要がある。第1に、レート歪み最適化(RDO)(レート制約動き推定及びモード決定など)は、モード決定及び動き推定についてH.264の広範に受け入れられているアプローチであり、そこでは、量子化パラメータ(ラグランジェ最適化においてλを決定するのに用いられる)が、RDO実行前に決定される必要がある。しかしながら、TMN8モデルは、予測誤差信号(残差)の統計量がQPを推定することを要求し、このことは、動き推定及びモード決定がQPの実行前に実行される必要があり、これにより、従属パラメータがまず計算される必要があるというジレンマを生じさせ、各値は当該決定の基礎となる他の計算されていない値に関する知識を要することを意味する。
第2に、TMN8は低い遅延アプリケーションを対象とするが、H.264は各種用途に利用可能である。従って、各種コンテンツに対して、新たなビット割当て及びバッファ管理スキームが必要とされる。第3に、TMN8は、マクロブロックレベルにおいてQPを適応化する。現在のマクロブロックと直近に符号化されたマクロブロックとの間のQP差分(DGUANT)について制約がなされるが、同一画像内の大きなQP変動の主観的効果が観察でき、負の主観的効果を有する。さらに、画像全体について一定のQPを利用することは、DQUANTの符号化のためのさらなるビットを節約し、これにより、大変低いビットレートについてより高いPSNRを実現できることが知られている。最後に、H.264は4×4整数変換を利用し、コーデックがJMリファレンスソフトウェアなどある閾値処理技術を利用する場合、詳細が失われるかもしれない。従って、詳細を維持するため、レートコントロールにおいて知覚モデルを採用することが有用である。
・前処理段階
式(4)から、TMN8モデルは、QPを推定するのに残差の標準偏差の知識を必要とすることが理解できる。しかしながら、RDOは、残差を生成するため、動き推定及びモード決定を実行するため、QPの知識を必要とする。このジレンマを解消するため、上述の第1の従来方法は、同一のタイプの直近に符号化された画像の連結されているマクロブロックの残差を利用して、現在マクロブロックのものを予測し、上述の第2の従来方法は、残差を生成するためまず前画像のQP(QPprev)が利用され、その後、現在マクロブロックのQPが当該残差に基づき推定される2段階符号化を利用する。前者のアプローチは(すなわち、第1の従来方法)はシンプルであるが、それは精度を欠く。後者のアプローチは(すなわち、第2の従来方法)はより正確であるが、それは複数の符号化を要し、このため大きすぎる複雑さを追加する。
本発明によると、残差を推定する異なるアプローチが採用され、これは、上述の第2の従来方法よりシンプルであるが、上述の第1の従来方法より正確である。実験は、シンプルな前処理段階が残差の良好な推定を与えることができることを示している。I画像について、3つの最も可能性のあるイントラ16×16モード(垂直、水平及び離散コサイン(DC)モード)しかテストされず、予測残差のMSE(Mean Square Error)がベストモードを選択するのに利用される。複雑さを低減するため、3つのモードしかテストされない。しかしながら、本発明の他の実施例では、本発明の趣旨を維持しながら、より多く又はより少ないモードをテストすることが可能である。その後、空間残差がベストモードを用いて生成される。再構成された画素は利用可能でないため、再構成された画素の代わりに、元の画素値がイントラ予測に利用されることに留意すべきである。
P画像については、16×16ブロックタイプと1つのリファレンス画像のみを用いて、レート制限された動き検索が実行される。時間残差が、このモードにおいてベストな動きベクトルを用いて生成される。前に符号化された画像の平均QPは、レート制限された動き検索についてλを決定するのに利用される。実験は、前に符号化された画像と現在画像との間のQPの差分を制限することによって、QPprevに基づくλが動き推定について小さな影響しか有しないことを示している。このアプローチの副次的効果は、前処理ステップにおける結果として得られる動きベクトルが、符号化処理中に動き推定の初期的な動きベクトルとして利用可能であるということである。
・フレームレイヤレートコントロール
TMN8は、低い遅延と低いビットレートアプリケーションを対象とし、最初のI画像の後のP画像のみを符号化すると仮定され、従って、式(1)に示されるようなビット割当てモデルが、より頻繁なI画像を使用する各種アプリケーションに適応するよう再規定されるべきである。式(4)によるQP推定モデルは、1つの画像内の大きなQP変動をもたらす可能性があり、これにより、フレームレベルQPはまず、マクロブロック(MB)QPの変化に関する制約を置くのにより良好に推定される。さらに、大変低いビットレートについて、DQUANTを符号化するオーバヘッドにより、一定の画像QPを使用することがより効率的であるかもしれない。従って、良好なレートコントロールスキームが、フレームレベルとMBレベルの両方においてレートコントロールを可能にすべきである。
本発明の原理による新たなビット割当てスキームが説明される。その後、本発明の原理によってフレームレベルQPを決定するシンプルなスキームが説明される。
リアルタイムエンコーダなど多くのアプリケーションにおいて、エンコーダは、予め符号化される必要があるフレームの総数、又はシーン変更が行われるときを知らない。従って、GOP(Group Of Picture)レイヤレートコントロールは、各画像についてターゲットビットを割り当てるのに採用される。H.264規格は、実際にはGOPを有しないが、I画像間の距離を表すのに当該用語が使用される。GOPの長さは、NGOPによって示される。NGOP→∞である場合、NGOP=Fと設定され、これはフレームの1つの第2長さに対応する。
Figure 2007522724
に等しい画像j−1を符号化した後、GOPiの残りのビットを示すのに、BGi,jが使用される。
上の式において、RGi−1は、
Figure 2007522724
によって与えられるGOPi−1の符号化後の残りのビットのビット数であり、Bcodedは使用されるビットであり、NcodedはGOPiの完了後の符号化された画像の個数である。Bi,jとBi,j’はそれぞれ、GOPiのフレームjのターゲットビットと実際に使用されるビットである。式(5)において、コンテンツの複雑さレベルが1つのGOPから他のGOPに劇的に変化するときのバッファオーバフローを回避するため、1つの制約がGOPiについて割り当てられたビットの総数について制約が加えられる。例えば、前のGOPがすべて黒色などの大変低い複雑さしか有せず、バッファフルネスレベルが大変低くなるシナリオを検討する。前のGOPからの使用されていないビットのすべてを現在のGOPに割り当てる代わりに、使用されていないビットが、各GOPへの0.2M以上の追加的なビットを許可しないことによって、複数の後続するGOPに分布される。その後、ターゲットフレームビットBi,jが画像タイプに従って割り当てられる。j番目の画像がPである場合、ターゲットビットは、
Figure 2007522724
となる。ただし、KはI画像とP画像との間のビットレシオであり、スライドするウィンドウアプローチを用いて推定可能であり、NはGOPiのI画像の残りの個数であり、NはP画像の残りの個数である。そうでない場合には、
Figure 2007522724
である。P画像が同一のGOPiのI画像の以降のP画像によってリファレンスとして使用されるため、以降のP画像がより良好なクオリティのリファレンスから予測可能であり、符号化クオリティを向上させることが可能であることを保証するため、GOPの始めにあるP画像について、より多くの ターゲットビットが使用される。リニア加重P画像ターゲットビット割当ては、以下のように使用される。
Figure 2007522724
以下のような他の制約が、GOPのターゲットビットをより良好に満たすよう追加される。
Figure 2007522724
ここで、
Figure 2007522724
Figure 2007522724
である。
本発明による一例となるレートコントロールとして、50%のバッファ占有が求められる。バッファオーバフロー又はアンダフローを回避するため、ターゲットビットはバッファレベルと結合して適応化される必要がある。バッファレベルWは、式(3)によって各画像の符号化の終了時に更新される。本発明の原理によると、ターゲットビットを調整するよう実際のバッファレベルを利用する代わりに、W’=max(W,0.4M)により与えられるバーチャルバッファレベルW’が提案される。これは、以前に符号化された画像が黒色のシーンなどの大変低い複雑さしか有さず、大変少ないビットしか使用しない場合、バッファレベルが大変低くなるというシナリオを回避する。実際のバッファレベルが式(7)と同様にターゲットフレームビットを調整するのに使用される場合、多すぎるビットが割り当てられ、そのことはQPを大変急激に低下させるであろう。しばらくした後、当該シーンが通常に戻ると、低いQPは容易にバッファをオーバフローさせるであろう。従って、QPを劇的に増大させ、又はフレームをスキップする必要がある。これは、時間クオリティを大きく変動させる。その後、当該ビットは以下のようにバッファコントロールによって調整される。
Figure 2007522724
最小のクオリティレベルを保証するため、Bi,j=max(0.6*R/F,Bi,j)に設定される。バッファオーバフローとアンダフローをさらに回避するため、I画像のバッファセーフティトップマージンWとボトムマージンWは、W =0.75MとW =0.25Mとして設定される。P画像に関して、式(5)に従って、次のGOPの次のI画像について十分なバッファを可能にするため、
Figure 2007522724
と設定される。最終的なターゲットビットは、以下のように決定される。
Figure 2007522724
もしWVT<Wである場合には、B−=WVT―Wであり、そうではなくWVB<Wである場合には、B+=W−WVBとなる。
シーン変更検出装置が使用される場合、シーン変更の画像はI画像となるよう符号化され、当該I画像から新たなGOPがスタートする。上記スキームは依然として利用可能である。
本発明の原理による新しいアプローチは、式(4)において求められるマクロブロックレベルQPに基づき、フレームレベルQPを決定するのに提案される。式(4)は、以下のように変更される。
Figure 2007522724
ここで、
Figure 2007522724
は同一タイプの直近に符号化された画像からのオーバヘッドであり、σは上述の前処理段階において推定される。本発明の原理による2つのアプローチは、QPと表されるフレームレベル定数QPを取得するのに利用可能である。第1のアプローチは、α=σと設定することであり、この結果、すべてのMB QPは等しくなる。第2のアプローチは、以降で規定されるようなMBレベルのものと同じαを使用し、その後、QPを求めるため、
Figure 2007522724
のヒストグラムの平均、中間値又はモードを利用するというものである。
本発明の好適な実施例では、QPを取得するための第2のアプローチは、MB QPにより良好に一致させるのに利用される。フレームレベル量子化ステップサイズは、
Figure 2007522724
の値の平均によって決定される。
Figure 2007522724
Q=2(QP−6)/6による量子化ステップサイズQと量子化パラメータQPとの間の変換が存在するということに留意されたい。隣接画像間の時間クオリティ変動を低減するため、
Figure 2007522724
と設定される。ここで、QP’は直近に符号化されたフレームのフレームQPであり、
Figure 2007522724
である。シーン変更は通常はバッファレベルをより高くするため、時間マスキング効果を利用し、シーン変更が生じたとき、Dはより大きな値に設定される。
・MBレイヤレートコントロール
MBレイヤレートコントロールの第1の主要な特徴は、より良好な知覚クオリティを取得するため、重み付けされた歪みαの適応的選択に関する。第2の主要な特徴は、同一画像におけるMB QPの変動を低減することである。
海の波などの低い詳細コンテンツについて、詳細を保持するためより低いQPが求められる。しかしながら、RDOの観点から、低い詳細コンテンツはより高いPSNRを与える傾向があるため、より高いQPが好ましい。バランスを維持するため、αの異なる設定がI及びP画像のそれぞれについて採用される。I画像については、詳細がより良好に維持可能となるように、より高い歪みウェートが低い詳細を有するMBに与えられる。従って、
Figure 2007522724
が設定される。
P画像については、より高い歪みウェートが、より大きな残差誤差を有するMBに与えられる。従って、
Figure 2007522724
となる。
このように、I画像についてより良好な知覚クオリティが維持され、より高い客観的クオリティを依然と維持しながら、後続のP画像に伝搬可能である。1つの画像の内部のクオリティの大きな変動を回避するため、
Figure 2007522724
が設定される。フレームレベルレートコントロールが利用される場合、QP=QPとなる。
・バーチャルフレームスキップ
1つの画像の符号化後、Wが式(3)によって更新される。W>0.9Mである場合、次フレームはバッファレベルが0.9M以下になるまでバーチャルにスキップされる。バーチャルフレームスキップは、SKIPモードとなるようにP画像のすべてのMBを符号化する。このように、一定のフレームレートが構造的に維持可能である。現在のフレームがバーチャルスキップされたフレームであると判断されると、QP=QP’+2となるよう設定される。
要約すると、本発明によるレートコントロールスキームは、以下の各ステップ、すなわち、前処理、フレームターゲットビット割当て及びフレームレベル定数QP推定、MBレベルQP推定、バッファ更新及びバーチャルフレームスキップコントロールを含む。効果的には、本発明は、フレームレベルとMBレベルのレートコントロールを可能にする。
本発明の各種例示的な実施例による本発明の多数の付随する効果/特徴の一部が説明される。例えば、1つの効果/特徴は、フレームレベルQPを選択するため、初期的なマクロブロックQP推定の平均/中間値/モードを利用することである。他の効果/特徴は、選択されたフレームレベルQPが、各マクロブロックQPの計算において利用されるときである。さらなる他の効果/特徴は、許容されるイントラ予測モードの一部を用いて、QO選択プロセスにおいて利用される残差を構成するイントラ予測を実行するときである。さらに、他の効果/特徴は、少数のイントラ予測モードを利用することである(例えば、式(3)など)。また、他の効果/特徴は、前のGOPが、現在のGOPに割り当てられた追加的なビットを所定の閾値に制限する多数の未使用ビットにより符号化されたときである。さらなる他の効果/特徴は、実際のバッファレベルの代わりに、バーチャルバッファレベルがバッファコントロールに利用されるときである。
本発明の上記及び他の特徴及び効果は、ここでの教示に基づき関連技術の当業者によって容易に確認されるかもしれない。本発明の教示は、ハードウェア、ソフトウェア、ファームウェア、特定用途向けプロセッサ又はこれらの組み合わせの各種形式により実現されてもよい。
最も好ましくは、本発明の教示は、ハードウェアとソフトウェアの組み合わせとして実現される。さらに、ソフトウェアは、好ましくは、プログラム格納ユニット上に具体的に実現されるアプリケーションプログラムとして実現される。このアプリケーションプログラムは、何れか適切なアーキテクチャを有するマシーンによって実行及びアップロードされるかもしれない。好ましくは、マシーンは1以上の中央処理ユニット(CPU)、RAM及び入出力(I/O)インタフェースなどのハードウェアを有するコンピュータプラットフォーム上で実現される。このコンピュータプラットフォームは、オペレーティングシステムとマイクロ命令コードをも有するものであってもよい。ここで記載される各種プロセス及び機能は、マイクロ命令コードの一部又はアプリケーションプログラムの一部、又はCPUによって実行可能な上記の任意の組み合わせであってもよい。さらに、他の各種周辺ユニットは、追加的なデータ格納ユニットと印刷ユニットなどのコンピュータプラットフォームに接続されてもよい。
添付した図面に示されるシステムコンポーネント及び方法の一部は、好ましくは、ソフトウェアにより実現されるため、システムコンポーネント間の実際の接続又はプロセス機能ブロックは、本発明がプログラムされる方法に応じて異なるかもしれないということが、さらに理解されるべきである。ここでの教示が与えられると、当業者は、本発明の上記及び類似の実現形態又は構成を想到可能であろう。
例示的な実施例が添付した図面を参照して説明されたが、本発明は、これら正確な実施例に限定されず、本発明の範囲又は趣旨から逸脱することなく、当業者によって様々な変更及び改良が可能であるというということが理解されるべきである。このようなすべての変更及び改良は、添付された請求項により与えられる本発明の範囲内に含まれることが意図される。
図1は、ビデオエンコーダのブロック図を示す。 図2は、本発明の原理によるレートコントロールによる符号化プロセスのフローチャートを示す。

Claims (33)

  1. マクロブロックに分割可能な画像フレームを符号化するビデオエンコーダであって、
    画像フレームのマクロブロックについて量子化パラメータ(QP)推定を生成する手段と、
    前記マクロブロックのQP推定の平均、中間値及びモードの1つを用いて、前記画像フレームのフレームレベルQPを選択する手段と、
    から構成されることを特徴とするビデオエンコーダ。
  2. 請求項1記載のビデオエンコーダであって、
    前記画像フレームは、ITU−T(International Telecommunication Union,Telecommunication Sector)のH.264規格に準拠した映像データを有することを特徴とするビデオエンコーダ。
  3. 請求項1記載のビデオエンコーダであって、さらに、
    前記フレームレベルQPを選択する手段と信号通信し、前記選択されたフレームレベルQPを用いて各マクロブロックQPを計算するマクロブロックQP計算装置を有することを特徴とするビデオエンコーダ。
  4. 請求項3記載のビデオエンコーダであって、
    前記マクロブロックQP計算装置は、画像タイプに基づき前記各マクロブロックQPを調整することを特徴とするビデオエンコーダ。
  5. 請求項4記載のビデオエンコーダであって、
    前記マクロブロックQP計算装置は、インター符号化された画像よりイントラ符号化された画像についてより多くの詳細を維持し、前記インター符号化された画像より前記イントラ符号化された画像についてより低い平均二乗誤差を実現するよう前記各マクロブロックQPを調整することを特徴とするビデオエンコーダ。
  6. 請求項1記載のビデオエンコーダであって、さらに、
    許容されるイントラ予測モードの一部を用いて前記マクロブロックの予測を構成する、前記マクロブロックをイントラ予測するイントラ予測手段と、
    前記イントラ予測手段と前記マクロブロックQP推定手段と信号通信し、前記予測について予測残差を計算する予測残差計算手段と、
    を有し、
    前記マクロブロックQP推定手段は、前記QP推定を生成する予測残差計算手段によって計算される前記残差の少なくとも1つを利用することを特徴とするビデオエンコーダ。
  7. 請求項6記載のビデオエンコーダであって、さらに、
    前記予測残差計算手段と信号通信し、前記予測残差の平均二乗誤差を用いて前記一部のモードの1つを選択するモード選択手段を有することを特徴とするビデオエンコーダ。
  8. 請求項7記載のビデオエンコーダであって、
    前記一部のモードの選択された1つは、前記一部のモードの他のものより現在フレームについて最も正確な予測を提供することを特徴とするビデオエンコーダ。
  9. 請求項6記載のビデオエンコーダであって、
    前記一部は、3つのイントラ予測モードを含むことを特徴とするビデオエンコーダ。
  10. 請求項9記載のビデオエンコーダであって、
    前記3つのイントラ予測モードは、垂直イントラ予測モード、水平イントラ予測モード及び(DC)イントラ予測モードであることを特徴とするビデオエンコーダ。
  11. 請求項1記載のビデオエンコーダであって、
    前記画像フレームのそれぞれは、1つの画像を表し、
    当該ビデオエンコーダはさらに、前記フレームレベルQP選択手段と信号通信し、GOP(Group Of Picture)の以降の画像より前記GOPの始めの画像についてより多くのターゲットビットを割り当てるビット割当て手段を有する、
    ことを特徴とするビデオエンコーダ。
  12. 請求項1記載のビデオエンコーダであって、
    前記画像フレームのそれぞれは、1つの画像を表し、
    当該ビデオエンコーダはさらに、前記フレームレベルQP選択手段と信号通信し、前のGOPのI画像が所定の最小閾値以下であって、所定の最大閾値以上のいくつかのビットにより符号化されたとき、現在のGOPに割り当てられたトータルのビット数を制限するビット割当て手段を有する、
    ことを特徴とするビデオエンコーダ。
  13. 請求項12記載のビデオエンコーダであって、
    前記ビット割当て手段は、線形重み付けされた割当てスキームを用いて前記トータルのビット数を制限することを特徴とするビデオエンコーダ。
  14. 請求項12記載のビデオエンコーダであって、
    前記ビット割当て手段は、実際に使用されているバッファのフルネスをシミュレートし、前記実際に使用されているバッファに関してキャパシティが制限されるバーチャルバッファレベルに基づき、前記トータルのビット数を制限することを特徴とするビデオエンコーダ。
  15. 請求項12記載のビデオエンコーダであって、
    前記ビット割当て手段は、最小クオリティ、及びバッファオーバフローに関するバッファセーフティトップマージンとバッファアンダフローに関するバッファセーフティボトムマージンの少なくとも1つに関して、前記トータルのビット数を制限することを特徴とするビデオエンコーダ。
  16. 請求項1記載のビデオエンコーダであって、さらに、
    前記フレームレベルQP選択手段と信号通信し、現在のバッファレベルが所定の最大閾値以上となると、符号化される次フレームをバーチャルにスキップするバーチャルフレームスキップ手段を有することを特徴とするビデオエンコーダ。
  17. マクロブロックに分割可能な画像フレームを符号化する方法であって、
    画像フレームのマクロブロックについて量子化パラメータ(QP)推定を生成するステップと、
    前記マクロブロックのQP推定の平均、中間値及びモードの1つを用いて、前記画像フレームのフレームレベルQPを選択するステップと、
    から構成されることを特徴とする方法。
  18. 請求項17記載の方法であって、
    前記画像フレームは、ITU−T(International Telecommunication Union,Telecommunication Sector)のH.264規格に準拠した映像データを有することを特徴とする方法。
  19. 請求項17記載の方法であって、さらに、
    前記選択されたフレームレベルQPを用いて各マクロブロックQPを計算するステップを有することを特徴とする方法。
  20. 請求項19記載の方法であって、さらに、
    画像タイプに基づき前記各マクロブロックQPを調整するステップを有することを特徴とする方法。
  21. 請求項20記載の方法であって、
    前記マクロブロックQPは、インター符号化された画像よりイントラ符号化された画像についてより多くの詳細を維持し、前記インター符号化された画像より前記イントラ符号化された画像についてより低い平均二乗誤差を実現するよう調整されることを特徴とする方法。
  22. 請求項17記載の方法であって、さらに、
    許容されるイントラ予測モードの一部を用いて前記マクロブロックの予測を構成する、前記マクロブロックをイントラ予測するステップと、
    前記予測について予測残差を計算するステップと、
    を有し、
    前記生成するステップは、前記QP推定を生成する計算ステップによって計算される前記残差の少なくとも1つを利用することを特徴とする方法。
  23. 請求項22記載の方法であって、さらに、
    前記予測残差の平均二乗誤差を用いて前記一部のモードの1つを選択するステップを有することを特徴とする方法。
  24. 請求項23記載の方法であって、
    前記一部のモードの選択された1つは、前記一部のモードの他のものより現在フレームについて最も正確な予測を提供することを特徴とする方法。
  25. 請求項22記載の方法であって、
    前記一部は、3つのイントラ予測モードを含むことを特徴とする方法。
  26. 請求項25記載の方法であって、
    前記3つのイントラ予測モードは、垂直イントラ予測モード、水平イントラ予測モード及び(DC)イントラ予測モードであることを特徴とする方法。
  27. 請求項17記載の方法であって、
    前記画像フレームのそれぞれは、1つの画像を表し、
    当該方法はさらに、GOP(Group Of Picture)の以降の画像より前記GOPの始めの画像についてより多くのターゲットビットを割り当てるステップを有する、
    ことを特徴とする方法。
  28. 請求項17記載の方法であって、
    前記画像フレームのそれぞれは、1つの画像を表し、
    当該方法はさらに、前のGOPのI画像が所定の最小閾値以下であって、所定の最大閾値以上のいくつかのビットにより符号化されたとき、現在のGOPに割り当てられたトータルのビット数を制限するステップを有する、
    ことを特徴とする方法。
  29. 請求項28記載の方法であって、
    前記制限するステップは、線形重み付けされた割当てスキームを用いて前記トータルのビット数を制限することを特徴とする方法。
  30. 請求項28記載の方法であって、
    前記制限するステップは、実際に使用されているバッファのフルネスをシミュレートし、前記実際に使用されているバッファに関してキャパシティが制限されるバーチャルバッファレベルに基づき、前記トータルのビット数を制限することを特徴とする方法。
  31. 請求項28記載の方法であって、
    前記制限するステップは、最小クオリティ、及びバッファオーバフローに関するバッファセーフティトップマージンとバッファアンダフローに関するバッファセーフティボトムマージンの少なくとも1つに関して、前記トータルのビット数を制限することを特徴とする方法。
  32. 請求項17記載の方法であって、さらに、
    現在のバッファレベルが所定の最大閾値以上となると、符号化される次フレームをバーチャルにスキップするステップを有することを特徴とする方法。
  33. マクロブロックに分割可能な画像フレームを符号化するビデオエンコーダであって、
    画像フレームのマクロブロック量子化パラメータ(QP)推定を生成し、前記マクロブロックのQP推定の平均、中間値及びモードの1つを用いて、前記画像フレームのフレームレベルQPを選択する量子化装置を有することを特徴とするビデオエンコーダ。
JP2006551124A 2004-01-30 2005-01-11 アダプティブレートコントロールによるエンコーダ Pending JP2007522724A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US54063404P 2004-01-30 2004-01-30
PCT/US2005/000755 WO2005076632A2 (en) 2004-01-30 2005-01-11 Encoder with adaptive rate control for h.264

Publications (1)

Publication Number Publication Date
JP2007522724A true JP2007522724A (ja) 2007-08-09

Family

ID=34837408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006551124A Pending JP2007522724A (ja) 2004-01-30 2005-01-11 アダプティブレートコントロールによるエンコーダ

Country Status (7)

Country Link
US (1) US9071840B2 (ja)
EP (1) EP1745653B1 (ja)
JP (1) JP2007522724A (ja)
KR (1) KR101169108B1 (ja)
CN (1) CN1910934B (ja)
BR (1) BRPI0506846B1 (ja)
WO (1) WO2005076632A2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9055298B2 (en) 2005-07-15 2015-06-09 Qualcomm Incorporated Video encoding method enabling highly efficient partial decoding of H.264 and other transform coded information
US20070025441A1 (en) * 2005-07-28 2007-02-01 Nokia Corporation Method, module, device and system for rate control provision for video encoders capable of variable bit rate encoding
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability
WO2008077119A2 (en) * 2006-12-19 2008-06-26 Ortiva Wireless Intelligent video signal encoding utilizing regions of interest information
EP2210421A4 (en) 2007-10-16 2013-12-04 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A VIDEO SIGNAL
US9285134B2 (en) * 2007-12-14 2016-03-15 Honeywell International Inc. Configurable wall module system
FR2944936A1 (fr) * 2009-04-23 2010-10-29 Thomson Licensing Procedes de codage et de decodage d'un bloc de donnees images, dispositifs de codage et de decodage implementant lesdits procedes
EP2249571A1 (en) * 2009-05-04 2010-11-10 Thomson Licensing SA Method and device for encoding an image frame comprising macroblocks
WO2010134079A1 (en) * 2009-05-20 2010-11-25 Nissimyan, Nissim Video encoding
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
KR101752418B1 (ko) * 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR101677480B1 (ko) * 2010-09-07 2016-11-21 에스케이 텔레콤주식회사 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치
KR101736793B1 (ko) 2010-12-29 2017-05-30 삼성전자주식회사 비디오 프레임 인코딩 장치, 그것의 인코딩 방법 및 그것을 포함하는 비디오 신호 송수신 시스템의 동작 방법
US8902982B2 (en) * 2011-01-17 2014-12-02 Samsung Electronics Co., Ltd. Depth map coding and decoding apparatus and method
CN102647586B (zh) * 2011-02-16 2015-07-08 富士通株式会社 用在视频编码系统中的码率控制方法和装置
JP5875236B2 (ja) * 2011-03-09 2016-03-02 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US8792550B2 (en) * 2011-08-04 2014-07-29 Qualcomm Incorporated Color/gray patch prevention for video coding
KR101965388B1 (ko) * 2011-11-04 2019-04-04 주식회사 골드피크이노베이션즈 양자화 계수 부/복호화 방법 및 이러한 방법을 사용하는 장치
KR101491591B1 (ko) * 2012-11-05 2015-02-09 주식회사 케이티 웹앱 가상화 서비스를 제공하는 가상화 서버 및 웹앱 가상화 서비스 제공을 위한 데이터 전송방법
KR20140110221A (ko) * 2013-03-06 2014-09-17 삼성전자주식회사 비디오 인코더, 장면 전환 검출 방법 및 비디오 인코더의 제어 방법
US20150063461A1 (en) * 2013-08-27 2015-03-05 Magnum Semiconductor, Inc. Methods and apparatuses for adjusting macroblock quantization parameters to improve visual quality for lossy video encoding
US10356405B2 (en) 2013-11-04 2019-07-16 Integrated Device Technology, Inc. Methods and apparatuses for multi-pass adaptive quantization
US10567765B2 (en) * 2014-01-15 2020-02-18 Avigilon Corporation Streaming multiple encodings with virtual stream identifiers
US10805635B1 (en) * 2016-03-22 2020-10-13 NGCodec Inc. Apparatus and method for coding tree unit bit size limit management
US10462459B2 (en) * 2016-04-14 2019-10-29 Mediatek Inc. Non-local adaptive loop filter
US10511853B2 (en) * 2016-11-24 2019-12-17 Ecole De Technologie Superieure Method and system for parallel rate-constrained motion estimation in video coding
WO2019104635A1 (en) 2017-11-30 2019-06-06 SZ DJI Technology Co., Ltd. System and method for controlling video coding at frame level
CN110832856A (zh) * 2017-11-30 2020-02-21 深圳市大疆创新科技有限公司 用于减小视频编码波动的系统及方法
WO2020258256A1 (zh) * 2019-06-28 2020-12-30 深圳市大疆创新科技有限公司 一种图像处理的方法、装置和无人机
KR102415309B1 (ko) * 2020-06-16 2022-07-01 에스케이하이닉스 주식회사 인터페이스 장치 및 그 동작 방법
US11546128B2 (en) 2020-06-16 2023-01-03 SK Hynix Inc. Device and computing system including the device
US12375667B2 (en) * 2021-06-11 2025-07-29 Comcast Cable Communications, Llc Processing video using masking windows
CN115190309B (zh) * 2022-06-30 2023-05-30 北京百度网讯科技有限公司 视频帧处理方法、训练方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09331531A (ja) * 1996-06-13 1997-12-22 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2000287212A (ja) * 1999-03-31 2000-10-13 Victor Co Of Japan Ltd 画像符号化装置
JP2000287210A (ja) * 1999-03-31 2000-10-13 Nec Ic Microcomput Syst Ltd 画像圧縮方法及び装置
JP2001028753A (ja) * 1999-07-13 2001-01-30 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2002058038A (ja) * 2001-06-12 2002-02-22 Matsushita Electric Ind Co Ltd 画像符号化方法および装置
JP2003009156A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 動画像符号化装置、動画像符号化方法、記録媒体、および動画像復号方法
JP2003092759A (ja) * 2001-09-17 2003-03-28 Toshiba Corp 動画像符号化装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US6366614B1 (en) * 1996-10-11 2002-04-02 Qualcomm Inc. Adaptive rate control for digital video compression
KR100227336B1 (ko) * 1997-02-20 1999-11-01 서평원 고정 전송율 mpeg 영상 송신기용 전송율 제어 방법 및 그 장치
WO1998038800A1 (en) * 1997-02-25 1998-09-03 British Broadcasting Corporation Digital signal compression encoding with improved quantisation
DE69826823T2 (de) * 1997-07-29 2005-10-20 Koninklijke Philips Electronics N.V. Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
TW501022B (en) * 1998-03-16 2002-09-01 Mitsubishi Electric Corp Moving picture coding system
US6990151B2 (en) * 2001-03-05 2006-01-24 Intervideo, Inc. Systems and methods for enhanced error concealment in a video decoder
JP3866538B2 (ja) * 2001-06-29 2007-01-10 株式会社東芝 動画像符号化方法及び装置
US6975680B2 (en) * 2001-07-12 2005-12-13 Dolby Laboratories, Inc. Macroblock mode decision biasing for video compression systems
US6891889B2 (en) * 2001-09-05 2005-05-10 Intel Corporation Signal to noise ratio optimization for video compression bit-rate control
US6763068B2 (en) * 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
US20030123539A1 (en) * 2001-12-28 2003-07-03 Hyung-Suk Kim Method and apparatus for video bit-rate control
JP2003274410A (ja) * 2002-03-13 2003-09-26 Hitachi Ltd 監視映像の符号化装置及び復号装置並びに符号化方法
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
CN1206864C (zh) * 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
CN100456832C (zh) * 2003-01-29 2009-01-28 Nxp股份有限公司 用于手持装置的视频编码方法及编码器
KR20040076034A (ko) * 2003-02-24 2004-08-31 삼성전자주식회사 동 영상의 가변 비트율 부호화 방법 및 장치
CN1190969C (zh) * 2003-03-08 2005-02-23 华中科技大学 一种视频编码比特率控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09331531A (ja) * 1996-06-13 1997-12-22 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2000287212A (ja) * 1999-03-31 2000-10-13 Victor Co Of Japan Ltd 画像符号化装置
JP2000287210A (ja) * 1999-03-31 2000-10-13 Nec Ic Microcomput Syst Ltd 画像圧縮方法及び装置
JP2001028753A (ja) * 1999-07-13 2001-01-30 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2002058038A (ja) * 2001-06-12 2002-02-22 Matsushita Electric Ind Co Ltd 画像符号化方法および装置
JP2003009156A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 動画像符号化装置、動画像符号化方法、記録媒体、および動画像復号方法
JP2003092759A (ja) * 2001-09-17 2003-03-28 Toshiba Corp 動画像符号化装置

Also Published As

Publication number Publication date
CN1910934B (zh) 2011-07-06
KR20070001112A (ko) 2007-01-03
KR101169108B1 (ko) 2012-07-26
EP1745653A2 (en) 2007-01-24
BRPI0506846B1 (pt) 2018-12-11
BRPI0506846A (pt) 2007-06-12
WO2005076632A2 (en) 2005-08-18
CN1910934A (zh) 2007-02-07
WO2005076632A3 (en) 2005-12-29
US20070153892A1 (en) 2007-07-05
EP1745653B1 (en) 2017-10-18
US9071840B2 (en) 2015-06-30

Similar Documents

Publication Publication Date Title
JP2007522724A (ja) アダプティブレートコントロールによるエンコーダ
KR100484148B1 (ko) 개선된 비트율 제어 방법과 그 장치
JP6862633B2 (ja) レート制御方法及びレート制御装置
US8223836B2 (en) Constant-quality rate control system and algorithm for regions of interest
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
JP4388877B2 (ja) ビデオエンコーダレート制御用装置、システムおよび方法
JP4390112B2 (ja) ビデオシーケンスのレートを制御する方法及び装置並びにビデオ符号化装置
KR100790986B1 (ko) 가변 비트율 비디오 코딩에서 비트율을 제어하는 장치 및방법
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP5198869B2 (ja) ビデオエンコーダのレート制御のための量子化パラメータの決定
JP4795223B2 (ja) 画像処理装置
CN113286145A (zh) 视频编码方法、装置和电子设备
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
JP5649296B2 (ja) 画像符号化装置
KR101868270B1 (ko) 싱글 패스 일관 화질 제어를 기반으로 하는 컨텐츠 인식 비디오 인코딩 방법, 컨트롤러 및 시스템
KR100950275B1 (ko) 모델 파라미터 기반의 비디오 인코딩 비트율 제어장치와 방법 및 이를 수록한 저장매체
JP4788653B2 (ja) 画像データトランスコーディング装置及びトランスコーディング方法
KR101197094B1 (ko) H.264/avc를 위한 통계 모델 기반의 비트율 제어 방법 및 장치
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
JP4375143B2 (ja) 動画像符号化装置
KR100949755B1 (ko) 비디오 시퀀스의 레이트를 제어하는 방법 및 장치, 비디오부호화 장치
JP2005303576A (ja) 画像信号処理装置および方法、記録媒体、プログラム、並びにビデオカメラ
JP4747109B2 (ja) 演算量調整装置
JP4273385B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
MXPA06008288A (en) Encoder with adaptive rate control for h.264

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100906

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110413

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120124