JP5423469B2 - Quantization apparatus, program and method, and moving picture encoding apparatus - Google Patents
Quantization apparatus, program and method, and moving picture encoding apparatus Download PDFInfo
- Publication number
- JP5423469B2 JP5423469B2 JP2010037845A JP2010037845A JP5423469B2 JP 5423469 B2 JP5423469 B2 JP 5423469B2 JP 2010037845 A JP2010037845 A JP 2010037845A JP 2010037845 A JP2010037845 A JP 2010037845A JP 5423469 B2 JP5423469 B2 JP 5423469B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- quantization
- amount
- coefficient level
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、量子化装置、プログラム及び方法、並びに、動画像符号化装置に関し、例えば、H.264等の動画像符号化技術による動画像圧縮符号の処理に適用できる。 The present invention relates to a quantization apparatus, a program and method, and a moving picture encoding apparatus. The present invention can be applied to processing of a moving image compression code by a moving image encoding technique such as H.264.
H.264(ITU-T Rec.H264|ISO/IEC 14496-10)等に代表される動画像符号化技術による動画像情報の圧縮符号化処理は、入力された画像を分割した処理単位毎に、動き補償予測等を行った予測画像と、入力された画像との差分である予測残差信号に、離散コサイン変換等の直交変換を施した変換係数を量子化して、これを可変長符号等のエントロピー符号化することによって高効率の動画像圧縮を実現している。 H. H.264 (ITU-T Rec.H264 | ISO / IEC 14496-10) and other moving image information compression coding processing using moving image coding technology is performed for each processing unit obtained by dividing an input image. The prediction residual signal, which is the difference between the predicted image that has undergone compensated prediction and the input image, is quantized with a transform coefficient that has been subjected to orthogonal transform such as discrete cosine transform, and this is then entropy such as variable-length code. Encoding realizes highly efficient video compression.
この時、量子化処理により量子化雑音が発生し、復号側で再生される復号画像に歪が生じる。一方で、量子化することによって、符号化すべき情報量が削減され高効率の圧縮が実現される。 At this time, quantization noise is generated by the quantization process, and distortion occurs in the decoded image reproduced on the decoding side. On the other hand, by quantizing, the amount of information to be encoded is reduced, and highly efficient compression is realized.
このような歪とレート(符号量)のトレードオフを評価し、符号化モード選択等に利用する技術としてレート歪最適化技術がある。 There is a rate distortion optimization technique as a technique for evaluating such a trade-off between distortion and rate (code amount) and using it for coding mode selection or the like.
すなわち、複数の符号化モード等の選択肢について、その選択肢を選択した場合に得られる復号画像の歪Dと、その選択肢で符号化したときに発生する符号量Rと、ラグランジュ乗数λで表されるRDコストJ(J=D+λR)を最小化するような選択をすることによって、レートと歪のトレードオフが最適な符号化をする方法である。 That is, for options such as a plurality of encoding modes, the distortion D of the decoded image obtained when the option is selected, the code amount R generated when the option is encoded, and the Lagrange multiplier λ In this method, encoding is performed with an optimum trade-off between rate and distortion by making a selection that minimizes the RD cost J (J = D + λR).
通常、歪Dは復号画素値と入力画素値との2乗誤差の和で評価される。 Usually, the distortion D is evaluated by the sum of square errors between the decoded pixel value and the input pixel value.
         
  非特許文献1には、このレート歪最適化技術を変換係数の量子化に利用する方法が開示されている。
  Non-Patent 
非特許文献1の方法(従来のRDOQ(Rate Distortion Optimized Quantization))では、H.264符号化処理の量子化処理において、歪Dを画素値の2乗誤差の和で評価する場合、直交変換の性質により、画素値領域での2乗誤差の和を、変換係数領域での2乗誤差の和で近似できること利用して、与えられたブロックのRDコスト(以下の(1)式のように示すことができる)を最小化する方法として定式化している。 In the method of Non-Patent Document 1 (conventional RDOQ (Rate Distortion Optimized Quantization)) In the quantization process of the H.264 encoding process, when distortion D is evaluated as the sum of square errors of pixel values, the sum of square errors in the pixel value area is calculated as 2 in the transform coefficient area due to the nature of orthogonal transformation. Utilizing the fact that it can be approximated by the sum of multiplication errors, it is formulated as a method for minimizing the RD cost (which can be expressed as the following equation (1)) of a given block.
         
  J(λ)=ΣiΣjJ(λ,cij,lij)  …(1)
  (1)式において、J(λ,cij,lij)は、変換係数cijを係数レベルlijに量子化して符号化する場合のRDコストであり、以下の(2)式にように示すことができる。
J (λ) = Σ i Σ j J (λ, c ij , l ij ) (1) 
 In the equation (1), J (λ, c ij , l ij ) is an RD cost when the transform coefficient c ij is quantized to the coefficient level l ij and encoded, as in the following equation (2) Can show.
      
         
  J(λ,cij,lij)=err(cij,lij)
                      +λbits(lij)  …(2)
  (2)式において、量子化誤差err(cij,lij)は、以下の(3)式のように示すことができる。
J (λ, c ij , l ij ) = err (c ij , l ij ) 
 + Λbits (l ij ) (2) 
 In the equation (2), the quantization error err (c ij , l ij ) can be expressed as the following equation (3).
      
         
  err(cij,lij)=N(QP%6,i,j)(rij−cij)2  …(3)
  (3)式において、rijは、係数レベルlijを逆量子化することによって得られる値であり、以下の(4)式のように示すことができる。
err (c ij , l ij ) = N (QP% 6, i, j) (r ij −c ij ) 2 (3) 
 In the equation (3), r ij is a value obtained by dequantizing the coefficient level l ij and can be expressed as the following equation (4).
      
         
  rij=lijR(QP%6,i,j)  …(4)
  (3)式及び(4)式において、N(QP%6,i,j),R(QP%6,i,j)はそれぞれH.264で用いられる整数変換の、正規化マトリックス、逆量子化スケールマトリックスであり、QPは量子化パラメータである。なお、QP/6,QP%6は、QPを6で割った商と余りを表す。
r ij = l ij R (QP% 6, i, j) (4) 
 In the equations (3) and (4), N (QP% 6, i, j) and R (QP% 6, i, j) are respectively H. The normalization matrix and the inverse quantization scale matrix of the integer transform used in H.264, and QP is a quantization parameter. Note that QP / 6 and QP% 6 represent the quotient and remainder obtained by dividing QP by 6.
      
また、(2)式において、bits(lij)はlijをCAVLC(Context−based Adaptive Variable Length Coding)もしくはCABAC(Context−based Adaptive Binary Arithmetic Coding)でエントロピー符号化するときに必要となる符号量である。 Also, in the expression (2), bits (l ij ) is an encoding amount that is required when l ij is encoded by CAVLC (Context-based Adaptive Length Coding) or CABAC (Context-based Adaptive Binary Coding). It is.
         
  さらに、非特許文献1では、使用されるエントロピー符号がCABACの場合とCAVLCの場合について、与えられたcijからlijの複数の候補から上記RDコストを最小化する候補を選択していくアルゴリズムが開示されている。
Further, in 
そして、|lij|の候補を、以下の(5)〜(8)式のようにおいて、CABACのアルゴリズムでは、主に0,lij floor,lij ceilの3通りからの選択を、主に高周波側から順に、CAVLCのアルゴリズムでは、主に0,1,lij roundの3通りから、主に係数の絶対値が小さい順に、上記RDコストJ(λ)を各係数成分の各係数レベル候補ごとに評価して、その最小値を与える係数レベルを選択している。 In the CABAC algorithm, candidates for | l ij | are mainly selected from three types of 0, l ij floor , and l ij ceil in the following equations (5) to (8). In order from the high frequency side, in the CAVLC algorithm, the above-mentioned RD cost J (λ) is set to each coefficient component candidate for each coefficient component mainly in the order of the absolute value of the coefficient from the three types of 0, 1, and l ij round. Each coefficient level is evaluated and the coefficient level that gives the minimum value is selected.
         
  lij float=|cij|Q(QP%6,i,j)/215+QP/6  …(5)
  lij floor=floor(lij float)  …(6)
  lij ceil=lij floor+1  …(7)
  lij round=
    floor{(|cij|Q(QP%6,i,j)+0.5)/215+QP/6}  …(8)
l ij float = | c ij | Q (QP% 6, i, j) / 2 15 + QP / 6 (5) 
    l ij floor = floor (l ij    float) ... (6) 
 l ij ceil = l ij floor +1 (7) 
 l ij round = 
 floor {(| c ij | Q (QP% 6, i, j) +0.5) / 2 15 + QP / 6 } (8)
      
          
しかしながら、非特許文献1(従来のRDOQ)では、量子化の最適化処理をするための演算量が非常に多く、十分な処理性能で最適な量子化結果を求めることができないという課題があった。 However, Non-Patent Document 1 (conventional RDOQ) has a problem that the amount of calculation for performing the optimization process of quantization is very large, and an optimal quantization result cannot be obtained with sufficient processing performance. .
すなわち、例えば、量子化誤差err(cij,lij)を求めるために乗算2回と、λとの乗算1回と、少なくとも3回の乗算が、ある係数レベル候補のRDコストを評価するために必要であり、3通りの候補を評価する場合には、係数1個あたり、9回程度の乗算が必要となる。 That is, for example, in order to obtain the quantization error err (c ij , l ij ), two multiplications, one multiplication with λ, and at least three multiplications evaluate the RD cost of a certain coefficient level candidate. If three candidates are evaluated, about nine multiplications are required for each coefficient.
また、例えば、CAVLCの場合にlij roundは評価しているが、lij roundと異なる、lij floor、もしくは、lij ceilを評価していないため、比較的高い可能性をもつRDコストが小さくなる係数レベルを選択できていない場合があるという課題があり、例えば単純に選択候補を増やしたとしても、処理量の増大を招いてしまうおそれがある。 In addition, for example, in the case of CAVLC, l ij round is evaluated, but ij floor or l ij ceil, which is different from l ij round , is not evaluated, so the RD cost with a relatively high possibility is high. There is a problem that the coefficient level to be decreased may not be selected. For example, even if the number of selection candidates is simply increased, the processing amount may be increased.
そのため、動画像符号化に係る量子化処理において、処理量を低減させることができる量子化装置、プログラム及び方法、並びに、動画像符号化装置が望まれている。 Therefore, a quantization device, a program and a method, and a moving image encoding device that can reduce the amount of processing in the quantization processing related to moving image encoding are desired.
第1の本発明は、動画像符号化処理において、符号化対象の動画像を構成する入力画像と上記入力画像の予測画像との誤差信号に係る変換係数を、量子化する量子化装置において、(1)上記変換係数に対して量子化のためのスケーリングを施すスケーリング手段と、(2)スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する係数レベル候補決定手段と、(3)上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出手段と、(4)上記レート歪コスト変化量算出手段の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択手段とを有することを特徴とする。 The first aspect of the present invention is a quantization apparatus that quantizes a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image in the moving image encoding process. (1) scaling means for performing scaling for quantization on the transform coefficient; and (2) a first coefficient level compensation obtained by rounding the absolute value of the scaled transform coefficient into an integer by rounding off the decimal point. , A coefficient level candidate determining means for determining a second coefficient level candidate having an absolute value one larger than that of the first coefficient level candidate, (3) when the first coefficient level compensation is selected, and the second When a coefficient level candidate is selected, a scaled distortion change amount corresponding to the difference in quantization error and a code amount change amount necessary for entropy coding are obtained, and the obtained distortion change is obtained. The amount of change in the rate distortion cost between the case where the first coefficient level compensation is applied and the case where the second coefficient level compensation is applied is calculated using the amount and the change amount of the code amount. Rate distortion cost change amount calculation means; and (4) depending on the calculation result of the rate distortion cost change amount calculation means, either the first coefficient level candidate or the second coefficient level candidate is converted to the conversion coefficient. And coefficient level selection means for selecting a coefficient level to be applied to the quantization.
第2の本発明は、動画像符号化処理において、符号化対象の動画像を構成する入力画像と上記入力画像の予測画像との誤差信号に係る変換係数を、量子化する量子化プログラムにおいて、コンピュータを、(1)上記変換係数に対して量子化のためのスケーリングを施すスケーリング手段と、(2)スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する係数レベル候補決定手段と、(3)上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出手段と、(4)上記レート歪コスト変化量算出手段の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択手段として機能させることを特徴とする。 The second aspect of the present invention is a quantization program for quantizing a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image in the moving image encoding process. (1) scaling means for performing scaling for quantization on the transform coefficient; and (2) a first coefficient level obtained by converting the absolute value of the scaled transform coefficient into an integer by rounding off a decimal point. Compensation, coefficient level candidate determination means for determining a second coefficient level candidate whose absolute value is one greater than that of the first coefficient level candidate, and (3) when the first coefficient level compensation is selected. When the second coefficient level candidate is selected, the scaled distortion change amount corresponding to the difference in quantization error and the change in the code amount required for entropy coding are used. A rate between the case where the first coefficient level compensation is applied and the case where the second coefficient level compensation is applied using the obtained distortion change amount and code amount change amount Rate distortion cost change amount calculating means for calculating the distortion cost change amount; and (4) the first coefficient level candidate or the second coefficient level candidate according to the calculation result of the rate distortion cost change amount calculating means. Any one of the above is functioned as coefficient level selection means for selecting a coefficient level to be applied to quantization of the transform coefficient.
           
  第3の本発明は、動画像符号化処理において、符号化対象の動画像を構成する入力画像と上記入力画像の予測画像との誤差信号に係る変換係数を、量子化する量子化方法において、(1)上記変換係数に対して量子化のためのスケーリングを施すスケーリング工程と、(2)スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する上記係数レベル候補決定工程と、(3)上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出工程と、(4)上記レート歪コスト変化量算出工程の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択工程とを有することを特徴とする。
A third aspect of the present invention is a quantization method for quantizing a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image in the moving image encoding process. (1) a scaling step for performing scaling for quantization on the transform coefficient; and (2) a first coefficient level compensation obtained by converting the absolute value of the scaled transform coefficient into an integer by rounding down the decimal point. The coefficient level candidate determination step for determining a second coefficient level candidate whose absolute value is one greater than that of the first coefficient level candidate; (3) when the first coefficient level candidate is selected; When a coefficient level candidate of 2 is selected, the scaled distortion change amount corresponding to the difference in quantization error and the change amount of the code amount necessary for entropy coding are obtained and obtained. Using the change amount and the change amount of the code amount, the change amount of the rate distortion cost between the case where the first coefficient level compensation is applied and the case where the second coefficient level compensation is applied is calculated. A rate distortion cost change amount calculating step, and (4) converting the first coefficient level candidate or the second coefficient level candidate into the conversion according to the calculation result of the rate distortion cost change amount calculating step. And a coefficient level selection step of selecting as a coefficient level to be applied to coefficient quantization. 
 
        
第4の本発明は、動画像符号化装置において、符号化対象の動画像を構成する入力画像と上記入力画像の予測画像との誤差信号に係る変換係数を、量子化する量子化装置を備え、上記量子化装置として、第1の本発明の量子化装置を適用したことを特徴とする。 According to a fourth aspect of the present invention, there is provided a quantization device that quantizes a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image in the moving image encoding device. The quantization apparatus according to the first aspect of the present invention is applied as the quantization apparatus.
本発明によれば、動画像符号化に係る量子化処理において、処理量を低減させることができる。 According to the present invention, it is possible to reduce the amount of processing in the quantization processing related to moving image coding.
        
         
(A)第1の実施形態
  以下、本発明による量子化装置、プログラム及び方法、並びに、動画像符号化装置の第1の実施形態を、図面を参照しながら詳述する。なお、第1の実施形態の量子化装置は、量子化部であるものとして説明する。
(A) First Embodiment Hereinafter, a first embodiment of a quantization apparatus, a program and a method, and a moving picture coding apparatus according to the present invention will be described in detail with reference to the drawings. Note that the quantization apparatus according to the first embodiment will be described as a quantization unit.
      
         
(A−1)第1の実施形態の構成
(A−1−1)動画像符号化装置の全体構成について
  図2は、この実施形態の動画像符号化装置10の全体構成を示すブロック図である。
(A-1) Configuration of First Embodiment (A-1-1) Overall Configuration of Video Encoding Device FIG. 2 is a block diagram showing the overall configuration of the video encoding device 10 of this embodiment. is there.
      
         
  動画像符号化装置10は、予測差信号生成器11、変換部12、量子化部13、エントロピー符号化部14、逆量子化・逆変換部15、復号画像生成部16、フレームバッファ17、予測部18を有している。なお、量子化部13以外の構成要素については、例えば、既存のH.264に準拠した動画像符号化装置と同様のものを適用することができる。
  The moving image encoding apparatus 10 includes a prediction 
動画像符号化装置10は、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成を有する装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、動画像符号化プログラム(実施形態の量子化プログラムを含む)等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図2のように示すことができる。 The moving image encoding apparatus 10 is an apparatus having a program execution configuration such as a CPU, ROM, RAM, EEPROM, and hard disk (not limited to one, but may be configured to be capable of distributed processing of a plurality of units. )) May be constructed by installing a moving picture encoding program (including the quantization program of the embodiment) or the like, and even in that case, it can be functionally shown as in FIG. .
         
  予測差信号生成器11は、供給された原画像の画像データと予測部18から供給される予測画像とから、予測誤差信号を得て、変換部12に供給する。
  The prediction 
         
  変換部12は、予測誤差信号の直交変換処理を行い、周波数成分等の変換係数に変換された予測誤差信号を得て、量子化部13に供給する。
  The 
         
  量子化部13は、周波数成分等の変換係数に変換された予測誤差信号を量子化し、量子化された予測誤差信号を得て、エントロピー符号化部14及び逆量子化・逆変換部15に供給する。
  The 
         
  エントロピー符号化部14は、量子化された予測誤差信号についてエントロピー符号化(例えば、可変長符号化等)を行って、その他の符号化情報とともにストリームのデータを生成する。このストリームのデータが、動画像符号化装置10の出力となる。
  The 
         
  逆量子化・逆変換部15は、量子化された予測誤差信号を逆量子化および逆直交変換を行い、量子化誤差を伴う予測誤差信号を得て、復号画像生成部16に供給する。
  The inverse quantization / 
         
  復号画像生成部16は、量子化誤差を伴う予測誤差信号と予測画像より復号画像を得る。
  The decoded 
         
  フレームバッファ17は、既に符号化され、局所復号された復号画像を参照画像として記憶する。なお、H.264/AVC標準の場合、動き補償で参照する画像は、現在符号化を行おうとしている画像の直前画像に限定されず、複数の時刻の画像が参照画像となり得る。
  The 
         
  予測部18は、現在符号化を行おうとしている対象時刻の画像データと、その対象時刻と異なる時刻の参照画像から動きベクトル等の予測情報を得て予測画像データを生成し、予測差信号生成器11及び復号画像生成部16に供給する。なお、H.264の場合、対象時刻の既に符号化され、局所復号された復号画像を用いる、イントラ予測による予測画像を供給する場合もある。
  The 
         
(A−1−2)量子化部の処理概要について
  次に、量子化部13による処理の概要について説明する。
(A-1-2) Processing Outline of Quantization Unit Next, an outline of processing by the 
         
  量子化部13では、変換係数(例えば、離散コサイン変換等の直交変換を施した変換係数)に対して、量子化のためにスケーリングを施し、スケールされた値ciの絶対値をai、ciの符号をsiとする。そして、aiを小数点以下の切り捨てにより整数化したtiと、ti+1の少なくとも2つを、量子化された係数レベルliの絶対値uiの候補とする。さらに、uiとして、tiを選択した場合と、ti+1を選択した場合の、量子化誤差の差に相当するスケールされた歪の変化量△Eを求める(以下単に歪の変化量と記載する)。さらにまた、uiとして、tiもしくはti+1を選択した場合をエントロピー符号化するのに必要となる、符号量の変化量△Rを求める。
The 
また、ラグランジュ乗数λを係数レベル領域での比較用にスケールしたラグランジュ乗数μをもちいて、tiを選択した場合から、ti+1を選択した場合へのスケールされたRDコストの変化量(以下単にRDコストの変化量と記載する)を、以下の(9)式により求める。そして、その求めた結果における正負の判断によって、tiもしくは、ti+1を、係数レベル領域にスケールされたciに対する量子化された係数レベルliの絶対値uiとして選択するよう構成する。なお、説明の簡単化のため、添字iは個々の係数成分を表すものとし、例えば、4×4変換の場合は16個の係数成分をわたるものとする。また以下の説明で、特に断りがなければ、Zig−Zagスキャン等のスキャン順に番号づけされているものとする。 Also, the amount of change in the scaled RD cost from the selection of t i to the selection of t i +1 using the Lagrange multiplier μ scaled for comparison in the coefficient level region of the Lagrangian multiplier λ (hereinafter referred to as “r i”). Simply described as the amount of change in RD cost) by the following equation (9). Then, it is configured to select t i or t i +1 as the absolute value u i of the quantized coefficient level l i with respect to c i scaled in the coefficient level region based on the positive / negative determination in the obtained result. . For simplification of explanation, the subscript i represents each coefficient component. For example, in the case of 4 × 4 conversion, 16 coefficient components are crossed. In the following description, it is assumed that numbers are assigned in the order of scanning such as Zig-Zag scanning unless otherwise specified.
         
  △J=△E+μ△R  …(9)
  ここで、△J,△E,μ,△Rの意味について説明する。
ΔJ = ΔE + μΔR (9) 
 Here, the meanings of ΔJ, ΔE, μ, and ΔR will be described.
      
H.264の復号処理で用いられる逆量子化、逆変換は、その演算過程の整数演算の切り捨て等を無視した実数演算と見なした場合、入力する係数レベル領域の値ciと出力される画素値領域の値diの間には、量子化パラメータをQPとして、q=(21/6)(QP−4)とおくと(ただし21/6は実数としての2の6乗根)、以下の(10)式の関係がほぼ満たされる線形変換となるよう定義されている。 H. When the inverse quantization and inverse transform used in the H.264 decoding process are regarded as real number operations ignoring truncation of integer operations in the calculation process, the value c i of the input coefficient level region and the pixel value to be output If the quantization parameter is QP between the region values d i and q = (2 1/6 ) (QP−4) (where 2 1/6 is the sixth root of 2 as a real number), The linear transformation is defined so that the relationship of the following expression (10) is substantially satisfied.
         
  Σidi 2=Σiq2ci 2  …(10)
  すなわち、量子化ステップサイズq倍された正規直交変換の近似変換と見なすことができる。
Σ i d i 2 = Σ i q 2 c i 2 (10) 
 That is, it can be regarded as an approximate transformation of orthonormal transformation multiplied by the quantization step size q.
      
したがって、変換係数を係数レベル領域にスケールした値ciを整数値のある係数レベルliに量子化した場合に、復号画像の画素値の領域に生じる量子化誤差e(ci,li)は、以下の(11)式で近似できる。 Therefore, when the value c i that scale factor level region transform coefficient is quantized in the coefficient level l i with integer values, the quantization error e occurring in the region of the pixel values of the decoded image (c i, l i) Can be approximated by the following equation (11).
         
    e(ci,li)=q2(ci−li)2  …(11)
  ciとliは同符号で、2乗されているので、符号を無視して絶対値のみで評価してもよく、それぞれの絶対値をai,uiで表すと、以下の(12)式のようになる。
e (c i , l i ) = q 2 (c i −l i ) 2 (11) 
 Since c i and l i have the same sign and are squared, the sign may be ignored and the evaluation may be performed using only the absolute value. When each absolute value is represented by a i and u i , the following (12 )
      
         
  e(ai,ui)=q2(ai−ui)2  …(12)
  そして、uiとしてtiとti+1を選んだ場合の量子化誤差の変化量は、以下の(13)式のようになる。
    e (a i, u i)    = q 2 (a i -u i) 2 ... (12) 
 The amount of change in quantization error when t i and t i +1 are selected as u i is expressed by the following equation (13).
      
         
  △e(ai,ti)=e(ai,ti+1)−e(ai,ti)
                  =2q2(1/2−(ai−ti))  …(13)
  そして、全体を1/(2q2)倍にスケールして評価すれば、以下の(14)式のように乗算無しで評価できる。
Δe (a i , t i ) = e (a i , t i +1) −e (a i , t i ) 
 = 2q 2 (1 / 2− (a i −t i )) (13) 
 If the whole is scaled to 1 / (2q 2 ) and evaluated, it can be evaluated without multiplication as in the following equation (14).
      
         
  △E(ai,ti)=△e(ai,ti)/(2q2)
                            =1/2−(ai−ti)  …(14)
  この時、μを以下の(15)式のようにおけば、RDコストJの変化量を1/(2q2)でスケールした値△Jが、上述の(9)式で評価できる。
ΔE (a i , t i ) = Δe (a i , t i ) / (2q 2 ) 
  = 1 / 2- (a i -t  i) ... (14) 
 At this time, if μ is set as in the following equation (15), the value ΔJ obtained by scaling the change amount of the RD cost J by 1 / (2q 2 ) can be evaluated by the above equation (9).
      
         
  μ=λ/(2q2)  …(15)
  このとき、△Rは、符号量の変化量なので、uiとしてtiもしくはti+1を選択したときに、符号量の変化するシンタックスエレメントのみの符号量の変化量を求めれば良い。
μ = λ / (2q 2 ) (15) 
 At this time, since ΔR is the amount of change in the code amount, when t i or t i +1 is selected as u i , the amount of change in the code amount of only the syntax element whose code amount changes may be obtained.
      
△Jが負(△J<0)のばあいは、uiとしてti+1を選択する方がRDコストが減少するとを表し、△Jの正負を判定することにより、tiとti+1の選択をすることが可能となる。 △ If J is negative (△ J <0), it represents the person to select a t i +1 as u i is RD cost is reduced, △ by determining the sign of J, t i and t i +1 Can be selected.
         
  ここで、H.264の符号化器を例にすると、入力された原画像と、動き補償等によって求められた予測画像との差である残差信号に対して、以下の(16)式に示すH.264の整数変換を、2次元に適用して得られた変換係数を入力とし、所定の量子化パラメータQPを用いて量子化して得られる係数レベルとして、レート歪的に最適となるような係数レベル値を選択して出力する。量子化処理により得られた係数レベル値は、符号化モード等の選択の上、CABAC,CAVLCといったエントロピー符号化器によりエントロピー符号化され、動画像ストリームとして出力される。また得られた係数レベルは、逆量子化・逆変換して予測画像に加えることで復号画像を再生し、次の予測画像の生成のために使用される。
 
         
  以下では、量子化部13において、入力が変換係数、出力が係数レベルである処理として説明する。
  Hereinafter, the 
なお、H.264においても、上述の4×4変換のほか、8×8変換や、DC係数を集めたブロックに対するアダマール変換等もあるが、同様に構成可能であるので、以下、4×4変換を例に説明する。 H. In H.264, in addition to the above 4 × 4 transform, there are 8 × 8 transform and Hadamard transform for a block in which DC coefficients are collected. However, since it can be similarly configured, 4 × 4 transform is taken as an example below. explain.
         
(A−1−3)量子化部の内部構成について
  図1は、量子化部13の機能的構成について示したブロック図である。
(A-1-3) Internal Configuration of Quantization Unit FIG. 1 is a block diagram showing a functional configuration of the 
         
  量子化部13は、スケール計算部131、歪変化量計算部132、レート変化量計算部133、係数レベル選択部134を有している。
  The 
         
  量子化部13(量子化装置)は、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成を有する装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、実施形態の量子化プログラム等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図1のように示すことができる。この実施形態においては、量子化部13は、動画像符号化装置10に搭載されるものとして示しているが、単独の装置(量子化装置)として構成するようにしても良い。動画像符号化装置10が、上述の情報処理装置に動画像符号化プログラムをインストールすることにより構成される場合には、量子化部13は、その動画像符号化プログラムの一部の量子化プログラムとして構築するようにしても良い。
  The quantization unit 13 (quantization device) is a device having a program execution configuration such as a CPU, ROM, RAM, EEPROM, hard disk, etc. (not limited to one, but capable of distributed processing of a plurality of devices). May be constructed by installing the quantization program or the like of the embodiment, and even in that case, it can be functionally shown as in FIG. In this embodiment, the 
         
  量子化部13では、スケール計算部131により、整数変換によって求められた変換係数に対して、量子化パラメータQPに応じたスケーリングを施す。すなわち、変換係数gjkに対して、スケールされた係数cjkの各要素(以下、「係数成分」ともいう)を以下の(17)式により求める。
In the 
         
  cjk=gjkQ(QP%6,j,k)/215+QP/6  …(17)
  ここで、Q(QP%6,j,k)は、量子化時のスケールマトリックス、QP/6,QP%6はそれぞれ、QPを6で割った商と余り、215+QP/6による除算は、実数としての除算である。
c jk = g jk Q (QP% 6, j, k) / 2 15 + QP / 6 (17) 
 Here, Q (QP% 6, j, k) is a scale matrix at the time of quantization, and QP / 6 and QP% 6 are the quotient obtained by dividing QP by 6, respectively, and the division by 215 + QP / 6 is Division as a real number.
      
なお、この除算は、cjkを適当な精度の固定少数で表現すれば、15+QP/6から小数点以下のビット数を引いた数による右シフト演算で行うことができる。例えば、cjkを小数点以下11ビットの固定少数で表現する場合は、4+QP/6ビットの右シフトとなる。 Note that this division can be performed by a right shift operation using a number obtained by subtracting the number of bits after the decimal point from 15 + QP / 6 if c jk is expressed by a fixed decimal number with appropriate accuracy. For example, when c jk is expressed by a fixed decimal having 11 bits after the decimal point, it is a 4 + QP / 6 bit right shift.
4×4以外の変換では、スケールマトリックス、シフト量等が異なるが、変換係数領域の値を、係数レベル領域の整数化されていない値ヘスケールする同様の処理を行う。 In conversions other than 4 × 4, the scale matrix, the shift amount, and the like are different, but the same processing is performed to scale the values in the conversion coefficient region to values that are not integerized in the coefficient level region.
ここでは、以下の説明の簡単化のため、スケールされた係数cijを、Zig−Zagスキャン順に、改めて、ciと記述することとし、以下の(18)式に示すように、その絶対値をai、(19)式に示すように符号をsiと記述する。ただし、i=0、…、Mであり、Mは、対象係数ブロックの係数成分数−1とする。 Here, for simplification of the following description, the scaled coefficient c ij will be described again as c i in the Zig-Zag scan order, and its absolute value as shown in the following equation (18). A i , and the code as s i as shown in equation (19). However, i = 0,..., M, where M is the number of coefficient components of the target coefficient block−1.
         
  ai=|ci|  …(18)
  si=sign(ci)  …(19)
  また以下の説明で、これらの値に対する演算を実数演算のように記述するが、適当な精度の固定少数表現によって、整数演算器で処理することも可能である。なお、上記スケーリング時の右シフトは、gjkの絶対値に対して行うようにしてもよい。
a i = | c i | (18) 
 s i = sign (c i ) (19) 
 In the following description, operations for these values are described as real number operations, but can be processed by an integer arithmetic unit using a fixed decimal representation with appropriate precision. The right shift at the time of scaling may be performed on the absolute value of g jk .
      
絶対値aiの整数部分(aiを超えない最大の整数)をtiとおくと、tiは以下の(20)式のように示される。 If the integer part of the absolute value a i (the maximum integer not exceeding a i ) is set to t i , t i is expressed as in the following equation (20).
         
  ti=floor(ai)  …(20)
  そして、スケールされた係数ciに対する係数レベルliの絶対値uiの候補として、tiと、ti+1の少なくとも2つを候補とする(△Rの評価をスキップして、tiを選択する場合も含む)。
t i = floor (a i ) (20) 
 Then, as a candidate of the absolute value u i of the coefficient levels l i relative to the scale coefficients c i, and t i,  and at least two candidates for t i +1 (△ skipping evaluation of R, a t i Including the case of selection).
      
         
  歪変化量計算部132では、以下の(21)式について求める。
  The distortion change 
         
  △E(ai,ti)=1/2−(ai−ti)  …(21)
  レート変化量計算部133では、CABAC、CAVLC等のそれぞれのエントロピー符号化器によって両候補に対して発生するであろう符号量の変化量△Rを求める。レート変化量計算部133の処理については、後述する動作説明において詳述する。
ΔE (a i , t i ) = 1 / 2− (a i −t i ) (21) 
 The rate change 
         
  係数レベル選択部134は、あらかじめ計算しておいたスケールされたラグランジュ乗数μを用いて、RDコストの変化量の評価式(上述の(9)式)の符号の判定に相当する判断により、最適な係数レベルの選択を行い係数レベル値liを出力する。
The coefficient 
         
(A−2)第1の実施形態の動作
  次に、以上のような構成を有する第1の実施形態の動画像符号化装置10について、量子化部13の動作を中心に説明する。
(A-2) Operation of the First Embodiment Next, the video encoding device 10 of the first embodiment having the above configuration will be described focusing on the operation of the 
         
  第1の実施形態では、エントロピー符号化部14によるエントロピー符号化がCABACである場合に、量子化部13における処理で、非特許文献1と同様な処理手順(係数成分の決定順)で、与えられた係数ブロックの、個々の成分の係数レベルを選択していく例について説明する。CABACによるエントロピー符号化では、変換係数における係数成分のスキャン順で最終非ゼロ係数であることを表すシンタックスを有するため、第1の実施形態では、このCABACの特性を考慮した量子化処理が行われる。
  In the first embodiment, when the entropy encoding performed by the 
         
  図3は、第1の実施形態の量子化部13における量子化処理の処理手順を示す図である。
  FIG. 3 is a diagram illustrating a processing procedure of a quantization process in the 
         
  まず、量子化部13では、入力された変換係数を量子化パラメータQPに応じてスケーリングを施した、スケールされた係数ciが求められる(S101)。ただしi=0,…,MはZig−Zagスキャン等のスキャン順であるものとする。
First, the 
         
  次に、量子化部13では、ciの絶対値aiについて、係数レベルliの絶対値uiの侯補として、上記の(20)式によりtiが求められる(S102)。
Then, the 
         
  そして、量子化部13では、上記の(21)式により、歪変化量△Eiが求められる。ここで、△Ei≧0であるiについては、ui=tiとし、以降の処理では、ti+1は候補としないものとする。
Then, the 
         
  次に、量子化部13では、非ゼロの係数レベルを選択する変換係数の内、スキャン順でもっとも最後となる(もっとも番号の大きな)係数の位置kが決定される(S103)。
  Next, the 
図4は、ステップS103における最終非ゼロ係数位置の決定処理の詳細について示したフローチャートである。 FIG. 4 is a flowchart showing details of the final non-zero coefficient position determination process in step S103.
図4では、kの候補としては、i0,…i1を考慮する。ただし、i1はai>0.5であるiの最大値であり、i0はai>1であるiの最大値(なければ−1)であるものとする。 In FIG. 4, i 0 ,... I 1 are considered as k candidates. Here, i 1 is the maximum value of i for which a i > 0.5, and i 0 is the maximum value of i for which a i > 1 (-1 if not).
以下の説明において、bits()はかっこ内の情報をCABACで符号化するのに必要となるビット数の近似値(符号化するシンタックスのコンテクストにおける確率状態変数を用いて計算、算術符号であるのでビット数は整数とは限らない)であるものとする。また、codedは、coded_block_flagであり、lastiはlast_significant _coeff_flagであり、uiは付随する符号siとあわせた係数レベルliに関するシンタックス、significant_coeff_flag,coeff_abs_level_minus1、coeff_sign_flagの略記とする。 In the following description, bits () is an approximate value of the number of bits necessary to encode information in parentheses with CABAC (calculated using a probability state variable in the context of the syntax to be encoded, an arithmetic code. Therefore, the number of bits is not necessarily an integer). Also, coded is coded_block_flag, last i is last_significant_coeff_flag, and u i is a syntax related to coefficient level l i combined with associated code s i , significant_coeff_flag_
まず、候補範囲として、i0、…、i1が設定されたものとする(S201)。 First, it is assumed that i 0 ,..., I 1 are set as candidate ranges (S201).
次に、以下の(22)式〜(25)式により、各変数の初期化が行われる。 Next, each variable is initialized by the following formulas (22) to (25).
         
  k=i0  …(22)
  e=0    …(23)
  r=bits(coded=1)−bits(coded=0)
                                  (i0==−1のとき)  …(24)
  r=bits(lastk=0)−bits(lastk=1)
                                      (i0≧0のとき)  …(25)
  次に、候補範囲内(i=i0+1,…,i1)で、k、e、rの更新を繰り返す(S203、S204)。
k = i 0 (22) 
 e = 0 (23) 
 r = bits (coded = 1) −bits (coded = 0) 
 (When i 0 == − 1) (24) 
 r = bits (last k = 0) −bits (last k = 1) 
 (When i 0 ≧ 0) (25) 
 Next, updating of k, e, r is repeated within the candidate range (i = i 0 +1,..., I 1 ) (S203, S204).
      
ステップS203、S204では、まず、p及びbを、それぞれ、以下の(26)式及び(27)式により求める。そして、p及びbの結果に応じて、k、e、rの更新を行う。 In steps S203 and S204, first, p and b are obtained by the following equations (26) and (27), respectively. Then, k, e, and r are updated according to the results of p and b.
         
  p=△Ei+μ(bits(ui=1,lasti=0)
                                        −bits(ui=0))…(26)
  b=e+△Ei+μ(r+bits(ui=1,lasti=1)  …(27)
[b<0の場合について]
  k=iに更新する。
p = ΔE i + μ (bits (u i = 1, last i = 0) 
 -Bits (u i = 0)) (26) 
 b = e + ΔE i + μ (r + bits (u i = 1, last i = 1) (27) 
 [For b <0] 
 Update to k = i.
      
p<0の場合には、e及びrについて、以下の(28)式及び(29)式のように求める。 In the case of p <0, e and r are obtained as in the following equations (28) and (29).
         
  e=0  …(28)
  r=bits(lastk=0)−bits(lastk=1)…(29)
  p≧0の場合には、e及びrについて、以下の(30)式及び(31)式のように求める。
e = 0 (28) 
 r = bits (last k = 0) −bits (last k = 1) (29) 
 In the case of p ≧ 0, e and r are obtained as in the following equations (30) and (31).
      
         
  e=−△Ei  …(30)
  r=bits(ui=0)−bits(ui=1,lasti=0)  …(31)
[b≧0の場合について]
  p<0の場合には、e及びrについて、以下の(32)式及び(33)式のように求める。
e = −ΔE i (30) 
 r = bits (u i = 0) −bits (u i = 1, last i = 0) (31) 
 [For b ≧ 0] 
 In the case of p <0, e and r are obtained as in the following equations (32) and (33).
      
         
  e=e+△Ei  …(32)
  r=r+bits(ui=1,lasti=0)  …(33)
  p≧0の場合には、rについて以下の(34)式のように求める。
e = e + ΔE i (32) 
 r = r + bits (u i = 1, last i = 0) (33) 
 In the case of p ≧ 0, r is obtained as in the following equation (34).
      
         
  r=r+bits(ui=0)  …(34)
  上述のように、ステップS203、S204によるk、e、rの更新が行われた後、得られたkを最終非ゼロ係数位置とする(S205)。ただし、k=−1の場合は、対象ブロックは係数なしとする。
r = r + bits (u i = 0) (34) 
 As described above, after k, e, and r are updated in steps S203 and S204, the obtained k is set as the final non-zero coefficient position (S205). However, when k = −1, the target block has no coefficient.
      
ここで、上述の図4に示すフローチャートで用いられている変数について説明する。 Here, the variables used in the flowchart shown in FIG. 4 will be described.
「k」は上記処理過程の、暫定の最終非ゼロ係数位置である(k=−1は非ゼロ係数なしを表す)。 “K” is a provisional final non-zero coefficient position in the above process (k = −1 indicates no non-zero coefficient).
「e」はkが最終非ゼロ係数位置であった場合から、kを最終とはしない場合への歪の変化量をiまで累積した値である。 “E” is a value obtained by accumulating the amount of change in distortion from the case where k is the final non-zero coefficient position to the case where k is not the final position up to i.
「r」はkが最終非ゼロ係数位置であった場合から、kを最終とはしない場合への符号量の変化量をiまで累積した値である。 “R” is a value obtained by accumulating the amount of change in the code amount from when k is the final non-zero coefficient position to when i is not the final position up to i.
b<0の意味は、iの位置を最終非ゼロ係数位置としたほうが、kであった場合よりもRDコストが減少することを表す。 The meaning of b <0 indicates that the RD cost is reduced when the position of i is the final non-zero coefficient position than when k is set.
p<0の意味は、iよりもスキャン順の大きな位置が最終非ゼロ係数位置となると仮定した場合に、iの位置の係数レベルの絶対値として0よりも1を選択するほうがRDコストが減少することを表す。 The meaning of p <0 means that if it is assumed that the position in the scanning order larger than i is the final non-zero coefficient position, selecting 1 as the absolute value of the coefficient level at the position of i reduces RD cost. Represents what to do.
         
  次に、係数レベル選択部134では、上述の図4の処理により、得られたkを用いて、i=k.…,0について、係数レベルを選択していく(S104)。すなわち、kからスキャンの逆順に、各iについて、符号量の変化量△Riは、以下の(35)式のように求め、以下の(36)式に示すRDコストの変化量の符号の判断により、tiもしくは、ti+1から係数レベルを選択していく。すなわち、△Ji<0の場合にti+1を選択する。  なお、上述したように、△Ei≧0であるiについては、ui=tiとし、この判断をスキップする。
Next, the coefficient 
         
    △Ri=bits(ui=ti+1)−bits(ui=ti)  …(35)
    △Ji=△Ei+μ△Ri  …(36)
  ここで、さらに符号量の変化量△Riについては、CABACでの係数レベルの表現方法に依存して、tiの大きさに応じて、以下の4つの場合ごとに、効率的に求めることができる。CABACの算術符号による符号量は、確率状態変数に依存し、繰り返し使用される確率状態変数については、正確には状態遷移させつつ評価したほうがよいが、状態遷移なしで近似してもよい。
ΔR i = bits (u i = t i +1) −bits (u i = t i ) (35) 
 ΔJ i = ΔE i + μΔR i (36) 
 Here, the change amount ΔR i of the code amount is further efficiently obtained for each of the following four cases depending on the magnitude of t i depending on the coefficient level expression method in CABAC. Can do. The code amount by the CABAC arithmetic code depends on the probability state variable, and it is better to evaluate the state variable repeatedly used while performing state transition, but it may be approximated without state transition.
      
         
[ti>14の場合]
  この場合、△Riは、確率状態変数に依存しなくなり、coeff_abs_level_minus1のsuffix部分長さの違いのみとなり、△Riは0もしくは2となる。
[If t i > 14] 
 In this case, ΔR i does not depend on the probability state variable, only the difference of the suffix part length of coeff_abs_level_minus1 is obtained, and ΔR i is 0 or 2.
      
         
[2≦ti≦14の場合]
  この場合、△Riは、coeff_abs_level_minus1に関する1つの確率状態変数のみに依存し、tiが13通り、確率状態変数が、128通りの、△Riのテーブルをあらかじめ作成しておくことができる。
[When 2 ≦ t i ≦ 14] 
 In this case, ΔR i depends on only one probability state variable related to coeff_abs_level_minus1, and a table of ΔR i can be created in advance with t i having 13 patterns and 128 probability state variables.
      
また、CABACでは、この1つの確率状態変数が一つのcoeff_abs_level_minus1の符号化中に状態遷移しつつ繰り返し使用されるため、状態遷移させた上での符号量差をテーブル化することもできる。 Also, in CABAC, this one probability state variable is repeatedly used while performing state transition during the encoding of one coeff_abs_level_minus1, so that the code amount difference after state transition can also be tabulated.
         
[ti=1の場合]
  この場合、△Riは、coeff_abs_level_minus1に関する2つの確率状態変数に依存するが、2つのbinの符号量差のみを求めればよい。
[When t i = 1] 
 In this case, ΔR i depends on two probability state variables related to coeff_abs_level_minus1, but it is only necessary to obtain the code amount difference between the two bins.
      
         
[ti=0]
  この場合、△Riは、significant_coeff_flagとcoeff_abs_level_minus1の最初のbinのみに関係し、これに関する2つの確率状態変数から求めることができる。
[t i = 0] 
 In this case, ΔR i is related only to the first bin of the significant_coeff_flag and coeff_abs_level_minus1, and can be obtained from two probability state variables related thereto.
      
以上の処理により、従来のRDOQのCABACアルゴリズムと同等にレート歪的に最適な係数レベルの選択を、より少ない演算量、処理量で行うことが可能となる。 With the above processing, it is possible to select a coefficient level that is optimal in terms of rate distortion equivalent to the conventional RDOQ CABAC algorithm with a smaller amount of computation and processing.
         
(A−3)第1の実施形態の効果
  第1の実施形態によれば、非特許文献1に記載のRDOQのCABACアルゴリズムと同様にレート歪み的に最適な係数レベルの選択を、より少ない処理量(演算量)で行うことができる。
(A-3) Effect of First Embodiment According to the first embodiment, the coefficient level that is optimal in terms of rate distortion can be selected with less processing as in the RDOQ CABAC algorithm described in 
         
(B)第2の実施形態
  以下、本発明による量子化装置、プログラム及び方法、並びに、動画像符号化装置の第2の実施形態を、図面を参照しながら詳述する。なお、第2の実施形態の量子化装置は、量子化部であるものとして説明する。
(B) Second Embodiment Hereinafter, a second embodiment of a quantization apparatus, a program and a method, and a moving picture coding apparatus according to the present invention will be described in detail with reference to the drawings. Note that the quantization apparatus according to the second embodiment will be described as a quantization unit.
      
         
(B−1)第2の実施形態の構成及び動作
  第2の実施形態の量子化部及び動画像符号化装置も、図1により示すことができる。
(B-1) Configuration and Operation of Second Embodiment The quantization unit and the moving image encoding device of the second embodiment can also be shown in FIG.
      
         
  第2の実施形態では、エントロピー符号化部14がCAVLCに対応しており、量子化部13において、非特許文献1と同様な処理手順(係数成分の決定順)で、与えられた係数ブロックの、個々の成分の係数レベルを選択していく点で第1の実施形態と異なっている。それ以外の構成については、第1の実施形態と同様であるので詳しい説明を省略し、以下では、第2の実施形態について、第1の実施形態との差異を中心に説明を行う。
  In the second embodiment, the 
CAVLCによるエントロピー符号化処理では、ゼロ係数のランレングス符号化が含まれるため、第2の実施形態では、CAVLCのこの特性を考慮した量子化が行われる。 Since entropy encoding processing by CAVLC includes run-length encoding of zero coefficients, in the second embodiment, quantization is performed in consideration of this characteristic of CAVLC.
         
  図5は、第2の実施形態の量子化部13の処理について示したフローチャートである。
  FIG. 5 is a flowchart illustrating the processing of the 
         
  まず、量子化部13では、入力された変換係数を量子化パラメータQPに応じてスケーリングを施した、スケールされた係数ciを求める(S301)。ただし、i=0,…,Mは、第1の実施形態とは異なり、スケールされた係数cjkをその絶対値の小さい順にソートした順に番号付けされるものとする(S302)。すなわち、c0が絶対値最小の係数とする。
First, the 
         
  次に、量子化部13では、ciの絶対値aiについて、係数レベルliの絶対値uiの初期値として、以下の(37)式により、初期化する(S303)。ここで、係数レベルの初期値の選択は、例えば、(37)式のfとして、従来のRDOQと同様、イントラピクチャではf=1/3、インターピクチャではf=1/6とする場合や、その他の、さまざまな簡易な量子化方法を用いるなどとしてもよい。
Next, the 
         
  ui=floor(ai+f)  …(37)
  また、量子化部13では、係数レベルliの絶対値ui候補として、以下の(38)によりtiを求め、以下の(39)により歪変化量△Eiを求める。
u i = floor (a i + f) (37) 
 Also, the 
         
  ti=floor(ai)  …(38)
  △Ei=△E(ai,ti)=1/2−(ai−ti)  …(39)
  ここで、△Ei≧0であるiについては、ui=tiとし、以降の処理では、ti+1は候補としない。
t i = floor (a i ) (38) 
 ΔE i = ΔE (a i , t i ) = 1 / 2− (a i −t i ) (39) 
 Here, for i where ΔE i ≧ 0, u i = t i, and in the subsequent processing, t i +1 is not a candidate.
      
         
  以上の準備の下、量子化部13では、スケールされた係数ciの絶対値が小さい順i=0,…,Mに、係数レベルliを選択していく(S304)。すなわち、絶対値最小のc0から順に、各iについて、uiとしてtiを選択した場合とti+1を選択した場合の符号量の変化量△Riをもとめ、以下の(40)式に示すRDコストの変化量の符号の判断により、tiもしくは、ti+1から係数レベルを選択していく。すなわち、△Ji<0の場合にti+1を選択する。選択されたui用いて、係数レベルliを順次更新していく。
With the above preparation, the quantizing 
         
    △Ji=△Ei+μ△Ri  …(40)
  なお、上述したように、△Ei≧0であるiについては、ui=tiとし、この判断をスキップする。
ΔJ i = ΔE i + μΔR i (40) 
 As described above, for i for which ΔE i ≧ 0, u i = t i and this determination is skipped.
      
符号量の変化量△Riの算出時には必要に応じて、初期値のままの、あるいは、上記処理により更新された場合は、更新された係数レベルliを参照して算出する。 When calculating the amount of change ΔR i of the code amount, if necessary, the initial value is maintained, or if it is updated by the above processing, it is calculated with reference to the updated coefficient level l i .
ここで、さらに符号量の変化量△Riについては、tiを選択した場合と、ti+1を選択した場合の間で、符号量に変化のあるシンタックスエレメントのみを考慮すればよい。すなわち、以下のような場合ごとに、効率的に△Riの計算処理に関連するシンタックスエレメントを絞り込むことができる。 Here, regarding the amount of change ΔR i of the code amount, only the syntax element having a change in the code amount between the case where t i is selected and the case where t i +1 is selected may be considered. That is, the syntax elements related to the calculation process of ΔR i can be efficiently narrowed for each of the following cases.
         
[第1の要件]
  ti>1の場合は、coeff−tokenに影響しないので、無視できる。
[First requirement] 
 When t i > 1, it does not affect the coeff-token and can be ignored.
      
         
[第2の要件]
  ti>0の場合は、total_zeros,run_beforeに影響しないので、無視できる。
[Second requirement] 
 When t i > 0, total_zeros and run_before are not affected and can be ignored.
      
         
[第3の要件]
  suffixLengthの更新に影響がなければ、i番目以外の係数レベルに関するtrailing_ones_sign_flag,level_prefix,level_suffix等は無視できる。なお、suffixLengthへの影響を無視して、常にi番目以外の係数レベルに関するシンタックスを無視する処理としてもよい。
[Third requirement] 
 If there is no effect on the update of suffixLength, trailing_ones_sign_flag, level_prefix, level_suffix, etc. relating to coefficient levels other than the i-th coefficient can be ignored. In addition, it is good also as a process which ignores the influence on suffixLength and always ignores the syntax regarding coefficient levels other than the i-th.
      
         
[第4の要件]
  level_prefixに変化がなければ、△Ri=0である。
[Fourth requirement] 
 If there is no change in level_prefix, ΔR i = 0.
      
         
(B−2)第2の実施形態の効果
  第2の実施形態によれば、以下のような効果を奏することができる。
(B-2) Effects of Second Embodiment According to the second embodiment, the following effects can be achieved.
      
         
  非特許文献1に記載された従来のRDOQのCAVLCアルゴリズムと同等にレート歪的に最適な係数レベルの選択を、より少ない演算量、処理量で行うことができる。
  Selection of the optimum coefficient level in terms of rate distortion can be performed with a smaller amount of calculation and processing amount as in the conventional RDOQ CAVLC algorithm described in 
         
  また、非特許文献1に記載された従来のRDOQのCAVLCアルゴリズムでは評価漏れしていた、レート歪的に最適となる可能性の高い、切り上げ、切り捨ての両候補を評価できているので、より符号化効率が向上させることができる。
  In addition, since the conventional RDOQ CAVLC algorithm described in 
         
(C)第3の実施形態
  以下、本発明による量子化装置、プログラム及び方法、並びに、動画像符号化装置の第3の実施形態を、図面を参照しながら詳述する。なお、第3の実施形態の量子化装置は、量子化部であるものとして説明する。
(C) Third Embodiment Hereinafter, a third embodiment of a quantization device, a program and a method, and a moving image coding device according to the present invention will be described in detail with reference to the drawings. Note that the quantization apparatus according to the third embodiment will be described as a quantization unit.
      
         
(C−1)第3の実施形態の構成及び動作
  第3の実施形態の量子化部及び動画像符号化装置も、図1により示すことができる。
(C-1) Configuration and Operation of Third Embodiment A quantization unit and a moving image encoding apparatus of the third embodiment can also be shown in FIG.
      
         
  第3の実施形態では、エントロピー符号化部14がCABACに対応しており、量子化部13において、第1の実施形態とは異なる処理手順(係数成分の決定順)で、与えられた係数ブロックの、個々の成分の係数レベルを選択していく点で、第1の実施形態と異なっている。それ以外の構成については、第1の実施形態と同様であるので詳しい説明を省略し、以下では、第3の実施形態について、第1の実施形態との差異を中心に説明を行う。
  In the third embodiment, the 
         
  図6は、第3の実施形態の量子化部13の処理について示したフローチャートである。
  FIG. 6 is a flowchart illustrating the processing of the 
         
  まず、量子化部13では、入力された変換係数を量子化パラメータQPに応じてスケーリングを施した、スケールされた係数ciが求められる(S401)。(ただし、i=0,…,MはZig−Zagスキャン等のスキャン順)
  次に、量子化部13では、ciの絶対値aiについて、係数レベルliの絶対値uiの候補として、以下の(41)式によりtiを求め、さらに、以下の(41)式により歪変化量△Eiが求められる。
First, the 
 Then, the 
         
  ti=floor(ai)  …(41)
  △Ei=△E(ai,ti)=1/2−(ai−ti)  …(42)
  ここで、△Ei≧0であるiについては、ui=tiとし、以降の処理では、ti+1は候補としない。
t i = floor (a i ) (41) 
 ΔE i = ΔE (a i , t i ) = 1 / 2− (a i −t i ) (42) 
 Here, for i where ΔE i ≧ 0, u i = t i, and in the subsequent processing, t i +1 is not a candidate.
      
次に、非ゼロの係数レベルを選択する変換係数の内、スキャン順でもっとも最後となる(もっとも番号の大きな)係数の位置kを決定する(S402、S403)。 Next, the position k of the last coefficient (the largest number) in the scan order among the transform coefficients for selecting the non-zero coefficient level is determined (S402, S403).
第1の実施形態(上述の図4)との違いは、スキャンの逆順に処理を行うことである。すなわち、第1の実施形態では、kの候補範囲であるi0,…,i1について、kを決定するために順方向に処理を行っているが、第3の実施形態では、i=Mからスキャンの逆順に、i1の位置を求め(S402)、i0に相当する位置まで、kの位置を探索する(S403)。 The difference from the first embodiment (FIG. 4 described above) is that processing is performed in the reverse order of scanning. In other words, in the first embodiment, i 0 ,..., I 1 that are candidate ranges of k are processed in the forward direction to determine k, but in the third embodiment, i = M In the reverse order of scanning, the position of i 1 is obtained (S402), and the position of k is searched for up to the position corresponding to i 0 (S403).
         
  量子化部13では、kの候補としては、i1,…,i0を考慮する。ただし、i1はai>0.5であるiの最大値とし、i0はai>1であるiの最大値(なければ−1)とする。そして、このようなi1がなければ、対象ブロックは係数なしとして以下の処理は行わないものとする。
The 
         
  すなわち、量子化部13は、上述のステップS402の処理として、i1の位置を設定するが、ai>0.5であるiがなければ、対象ブロックは係数なしとして、以下のステップS403の処理は行わない。
That is, the 
         
  図7は、第3の実施形態の量子化部13における、上述のステップS403の処理の詳細について示したフローチャートである。
  FIG. 7 is a flowchart showing details of the processing in step S403 described above in the 
         
    量子化部13では、図7に示す処理により、i0の位置を探索しつつkを決定する。ただし、以下でbits()の意味は第1の実施形態と同様とする。
The 
まず、kの初期値をk=i1として、このときのak>1の場合は、i0=i1であるので、以下のkおよびi0の探索処理は行わず、i0以下の処理(S404)のみ行う。 First, assuming that the initial value of k is k = i 1 and a k > 1 at this time, i 0 = i 1 , so the following search processing of k and i 0 is not performed, and i 0 or less Only the process (S404) is performed.
         
  そして、量子化部13は、各変数(k、e、r)の初期化を、以下の(43)、(44)、(45)式により行う(S501)。
  Then, the 
         
    k=i1  …(43)
    e=△Ek  …(44)
    r=bits(uk=1,lastk=1)  …(45)
  次に、量子化部13は、i=i1−1、…、0について、それぞれ△Ei、p、bを求め、その結果に応じてui、k、e、rの更新し、i0がみつかるまで繰り返す(S502、S503)。ただし、ti>1ならこのときのiを、i0=iとしてi0がみつかったものとし(S504),後述するステップS507に進む。
k = i 1 (43) 
 e = ΔE k (44) 
 r = bits (u k = 1, last k = 1) (45) 
 Next, the 
次に、上述のステップS502、S503において、△Ei、p、bの結果に応じてui、k、e、rを更新する際の場合分けについて説明する。 Next, the case classification when updating u i , k, e, and r according to the results of ΔE i , p, and b in steps S502 and S503 described above will be described.
         
[△Ei>0の場合]
  uiを以下の(46)式により更新し、rを以下の(47)式により更新し、次のiの処理に進む。
[If △ E i > 0] 
 u i is updated by the following equation (46), r is updated by the following equation (47), and the process proceeds to the next i.
      
         
  ui=0  …(46)
  r=r+bits(ui=0)  …(47)
[△Ei≦0の場合]
  この場合、まずpを以下の(48)とおき、p及び後述するbの結果に応じた処理が行われる。
u i = 0 (46) 
 r = r + bits (u i = 0) (47) 
 [If △ E i ≦ 0] 
 In this case, first, p is set as (48) below, and processing corresponding to the result of p and b described later is performed.
      
         
  p=△Ei+μ(bits(ui=1,lasti=0)
                      −bits(ui=0))  …(48)
[△Ei≦0、かつ、p<0の場合]
  まず、uiを下記の(49)式により更新し、bを以下の(50)式とおくものとする。
p = ΔE i + μ (bits (u i = 1, last i = 0) 
 −bits (u i = 0)) (48) 
 [If ΔE i ≦ 0 and p <0] 
 First, u i is updated by the following equation (49), and b is assumed to be the following equation (50).
      
         
    ui=1  …(49)
    b=e+μ(r+bits(lasti=0)
                    −bits(lasti=1))  …(50)
  そして、b>0の場合には、k、e、rを、それぞれ以下の、(51)式、(52)式、(53)式により更新する。
u i = 1 (49) 
 b = e + μ (r + bits (last i = 0) 
 -Bits (last i = 1)) (50) 
 When b> 0, k, e, and r are updated by the following expressions (51), (52), and (53), respectively.
      
         
    k=i  …(51)
    e=△Ek  …(52)
    r=bits(uk=1,lastk=1)  …(53)
  一方、b<=0の場合には、e、rをそれぞれ以下の(54)式、(55)式により更新する。
k = i (51) 
 e = ΔE k (52) 
 r = bits (u k = 1, last k = 1) (53) 
 On the other hand, when b <= 0, e and r are updated by the following equations (54) and (55), respectively.
      
         
    e=e+△Ei  …(54)
    r=r+bits(ui=1,lasti=0)  …(55)
[△Ei≦0、かつ、p≧0の場合]
  まず、uiを下記の(56)式により更新し、bを以下の(57)式とおくものとする。
e = e + ΔE i (54) 
 r = r + bits (u i = 1, last i = 0) (55) 
 [If ΔE i ≦ 0 and p ≧ 0] 
 First, u i is updated by the following equation (56), and b is set by the following equation (57).
      
         
  ui=0  …(56)
  b=e+△Ei+μ(r+bits(ui=0)
                −bits(uk=1,lasti=1))  …(57)
  そして、b>0の場合には、k、e、rを、それぞれ以下の、(58)式、(59)式、(60)式により更新する。
u i = 0 (56) 
 b = e + ΔE i + μ (r + bits (u i = 0) 
  -Bits (u k = 1, last  i = 1)) ... (57) 
 When b> 0, k, e, and r are updated by the following equations (58), (59), and (60), respectively.
      
         
    k=i  …(58)
    e=△Ek  …(59)
    r=bits(uk=1,lastk=1)  …(60)
  一方、b<=0の場合には、rを以下の(61)により更新する。
k = i (58) 
 e = ΔE k (59) 
 r = bits (u k = 1, last k = 1) (60) 
 On the other hand, when b <= 0, r is updated by the following (61).
      
         
    r=r+bits(ui=0)  …(61)
  以上のように、ステップS502、S503の繰り返しにより、i0の探索が行われると、量子化部13では、その処理結果について判定が行われ(S504)、i0がみつかった場合(ti>1がみつかった場合)には、後述するステップS507の処理が行われ、i0が見つからなかった場合(ti>1がみつからなかった場合)には、後述するステップS505の処理が行われる。
r = r + bits (u i = 0) (61) 
 As described above, when the search for i 0 is performed by repeating steps S502 and S503, the 
上述のステップS502、S503により、i0がみつからなかったと判定された場合には、量子化部13では、i0、bについて、それぞれ、以下の(62)式、(63)式のようにおき、bの算出結果について判定が行われる(S505)。 In step S502, S503 described above, if i 0 is determined to not be found is the quantization unit 13, for i 0, b, respectively, the following equation (62), placed as (63) below , B is determined (S505).
         
       i0 = -1  …(62)
       b = e + μ(r + bits(coded=1) - bits(coded=1))   …(63)
そして、b>0ならば、対象ブロックは係数なしとして(S506)、図7の処理を終了し、そうでなければ後述するステップS508の処理に進む。
i 0 = -1 (62) 
 b = e + μ (r + bits (coded = 1)-bits (coded = 1)) (63) 
 If b> 0, the target block has no coefficient (S506), and the process of FIG. 7 ends. Otherwise, the process proceeds to step S508, which will be described later.
      
上述のステップS505において、b>0でない場合には、さらにkとi1が比較され、k<i1の場合には、i=k+1,…,i1の範囲はui=0にクリアし(S508)、図7の処理を終了する。 In the above step S505, if b> 0 is not satisfied, k and i 1 are further compared, and if k <i 1 , the range of i = k + 1,..., I 1 is cleared to u i = 0. (S508), the process of FIG.
一方、上述のステップS502、S503により、i0がみつかったと判定された場合には、bを以下の(64)式のようにおいて、b>0である場合にはk=iと更新する(S507)、一方b ≦0 の場合は k の更新は行わない(S507)。つまり、b ≦0の場合、 i0よりも大きな位置を指し示したままである。その後、bの判断に関わらず、k<i1の場合には、i=k+1,…,i1の範囲はui=0にクリアし(S508)、図7の処理を終了する。 On the other hand, in step S502, S503 described above, when it is determined that i 0 is found, b at as follows (64) formula, when a b> 0 is updated with k = i (S507 On the other hand, if b ≦ 0, k is not updated (S507). That is, when b ≦ 0, the position larger than i 0 is still indicated. Thereafter, regardless of the determination of b, if k <i 1 , the range of i = k + 1,..., I 1 is cleared to u i = 0 (S508), and the process of FIG.
         
  b=e+μ(r+bits(lasti=0)
          −bits(lasti=1)…(64)
  次に、図7の処理において用いられている変数について説明する。
b = e + μ (r + bits (last i = 0) 
 -Bits (last i = 1) (64) 
 Next, variables used in the process of FIG. 7 will be described.
      
kは上記処理過程の、暫定の最終非ゼロ係数位置である(k=−1は非ゼロ係数なしを表す)。 k is a provisional final non-zero coefficient position in the above process (k = −1 indicates no non-zero coefficient).
eはkが最終非ゼロ係数位置ではない場合から、kが最終である場合への歪の変化量をiまで累積した値である。 e is a value obtained by accumulating the amount of change in distortion from the case where k is not the final non-zero coefficient position to the case where k is the final position up to i.
rはkが最終非ゼロ係数位置ではない場合から、kが最終である場合への符号量の変化量をiまで累積した値である。 r is a value obtained by accumulating the amount of change in the code amount from the case where k is not the final non-zero coefficient position to the case where k is the final position up to i.
b>0の意味は、iの位置を最終非ゼロ係数位置としたほうが、kであった場合よりもRDコストが減少することを表す。 The meaning of b> 0 indicates that the RD cost is reduced when the position of i is the final non-zero coefficient position than when k is set.
p<0の意味は、iよりもスキャン順の大きな位置kが最終非ゼロ係数位置となると仮定した場合に、iの位置の係数レベルの絶対値として0よりも1を選択するほうがRDコストが減少することを表す。 The meaning of p <0 is that if it is assumed that the position k in the scanning order larger than i is the final non-zero coefficient position, it is more RD cost to select 1 than 0 as the absolute value of the coefficient level at the position of i. Represents a decrease.
         
  次に、上述のステップS403の処理(図7の処理)が終了すると、量子化部13では、i0が見つかった場合に、i=i0.…,0について、係数レベルを選択していく。すなわち、i0(例えば、探索停止位置)から順に、各iについて、符号量の変化量△Riを、以下の(65)式として、以下の(66)式に示すRDコストの変化量の符号の判断により、tiもしくは、ti+1から係数レベルを選択していく。すなわち、△Ji<0の場合にti+1を選択する。
Next, the process of step S403 described above (the processing in FIG. 7) is completed, the 
         
  △Ri=bits(ui=ti+1)−bits(ui=ti)  …(65)
  △Ji=△Ei+μ△Ri    …(66)
  なお、上述したように、△Ei≧0であるiについては、ui=tiとし、この判断をスキップするようにしても良い。
ΔR i = bits (u i = t i +1) −bits (u i = t i ) (65) 
 ΔJ i = ΔE i + μΔR i (66) 
 As described above, for i is △ E i ≧ 0, and u i = t i, may be skip this determination.
      
また、符号量の変化量△Riについては、第1の実施形態と同様、符号量に変化のあるbinのみに関する計算処理とすることで、効率的に求めることができる。 Also, the code amount change ΔR i can be efficiently obtained by performing calculation processing only on bins having a change in the code amount, as in the first embodiment.
         
(C−2)第3の実施形態の効果
  第3の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
(C-2) Effects of Third Embodiment According to the third embodiment, the following effects can be achieved in addition to the effects of the first embodiment.
      
第1の実施形態では係数を順方向、逆方向と、複数回スキャンする必要があるが、第3の実施形態では、i=Mから逆方向のみに、i1が見つかるまで、i0見つかるまで、i=0までのスキャンをするだけでよくなり、処理が簡単になり処理量を低減するとともに、メモリアクセスが削減できるなどの効果が得られる。 In the first embodiment, the coefficients need to be scanned a plurality of times in the forward direction and in the reverse direction. In the third embodiment, until i 1 is found in i = M only in the reverse direction, until i 0 is found. , It is only necessary to scan up to i = 0, so that the processing is simplified, the processing amount is reduced, and the memory access can be reduced.
         
(D)第4の実施形態
  以下、本発明による量子化装置、プログラム及び方法、並びに、動画像符号化装置の第4の実施形態を、図面を参照しながら詳述する。なお、第4の実施形態の量子化装置は、量子化部であるものとして説明する。
(D) Fourth Embodiment Hereinafter, a fourth embodiment of a quantization device, a program and a method, and a moving image coding device according to the present invention will be described in detail with reference to the drawings. Note that the quantization apparatus according to the fourth embodiment will be described as a quantization unit.
      
         
(D−1)第4の実施形態の構成及び動作
  第4の実施形態の量子化部及び動画像符号化装置も、図1により示すことができる。
(D-1) Configuration and Operation of Fourth Embodiment A quantization unit and a moving image encoding device of the fourth embodiment can also be shown in FIG.
      
         
  第4の実施形態では、エントロピー符号化部14がCAVLCに対応しており、第2の実施形態とは異なる処理手順(係数成分の決定順)で、与えられた係数ブロックの、個々の成分の係数レベルを選択していく点で、第2実施形態と異なっている。それ以外の構成については、第2の実施形態と同様であるので詳しい説明を省略し、以下では、第4の実施形態について、第2の実施形態との差異を中心に説明を行う。
  In the fourth embodiment, the 
         
  図8は、第4の実施形態の量子化部13の処理について示したフローチャートである。
  FIG. 8 is a flowchart illustrating processing of the 
         
  まず、量子化部13では、入力された変換係数を量子化パラメータQPに応じてスケーリングを施した、スケールされた係数ciが求められる(S601)。ただし、i=0,…,Mは、第2の実施形態とは異なり、第1、第3の実施形態と同様、Zig−Zagスキャン等のスキャン順に番号付けされているものとする。すなわち、第4の実施形態では、絶対値の大きさによるソートは行わない。
First, the quantizing 
         
  次に、量子化部13では、スキャンの逆順i=M,…,0に、最終非ゼロ係数の候補位置i1が探索され、設定される(S602)。すなわち、i1はai>T0であるiの最大値となるi1を探索する。ここで、T0は係数レベル値0を選択する閾値であり、T0=0.5、あるいは、T0=0.5+μなどとしてもよい。また、外部から制御可能としてもよい。このようなi1がなければ、対象ブロックは係数なしとして以降の処理は行わずに終了するようにしても良い。
Then, the 
         
  次に、量子化部13では、スキャンの逆順i=i1,…,0に、係数レベルの候補として、0を含めないような係数について、係数レベルliを選択していく(S603、S604)。すなわち、ciの絶対値aiについて、係数レベルliの絶対値uiの候補として、以下の(67)式によりtiを求め、さらに、以下の(68)式により歪変化量△Eiを求める。
Next, the 
         
  ti=floor(ai)  …(67)
  △Ei=△E(ai,ti)=1/2−(ai−ti)…(68)
  ここで、△Ei≧0であるiについては、ui=tiとし、以降の処理では、ti+1は候補としないようにしても良い(ただし、△Ei≧0であっても、ti=0の場合は、未選択とし、後の未選択係数レベルの選択時に処理することとしてもよい)。
t i = floor (a i ) (67) 
 ΔE i = ΔE (a i , t i ) = 1 / 2− (a i −t i ) (68) 
 Here, for i where ΔE i ≧ 0, u i = t i, and in the subsequent processing, t i +1 may not be a candidate (however, even if ΔE i ≧ 0) , T i = 0, it may be unselected and processed at the time of selecting an unselected coefficient level later).
      
一方、△Ei<0であるiについては、uiとしてtiを選択した場合とti+1を選択した場合の符号量の変化量△Riをもとめ、以下の(69)式のRDコストの変化量の符号の判断により、tiもしくは、ti+1から係数レベルを選択していく。 On the other hand, for i where ΔE i <0, the amount of change ΔR i in the code amount when t i is selected as u i and when t i +1 is selected, and RD in the following equation (69) is obtained. The coefficient level is selected from t i or t i +1 by judging the sign of the amount of change in cost.
         
    △Ji=△Ei+μ△Ri…(69)
  すなわち、△Ji<0の場合にti+1を選択する.選択されたui用いて、係数レベルliを順次更新していく。
ΔJ i = ΔE i + μΔR i (69) 
 That is, t i +1 is selected when ΔJ i <0. The coefficient level li is successively updated using the selected u i .
      
ただし、ti=0の場合は、未選択とし、後の未選択係数レベルの選択時に処理することとし、ここでは、いったん、以下の(70)式のように初期化する。ここでの、未選択係数レベルli初期値は、例えば、上記fとして、イントラピクチャではf=1/3、インターピクチャではf=1/6とする場合や、その他の、さまざまな簡易な量子化方法を用いるなどとしてもよい。 However, when t i = 0, the selection is not performed, and processing is performed when a subsequent unselected coefficient level is selected. Here, initialization is performed once as in the following expression (70). Here, the initial value of the unselected coefficient level l i is, for example, f, where f = 1/3 for an intra picture and f = 1/6 for an inter picture. It is also possible to use a method of making it.
         
  ui=floor(ai+f)…(70)
  一方、ti>0の場合は、変数suffixLengthが確定していれば、△Riは、suffixLengthで選択される可変長符号のテーブルにおける符号長の差として、効率的に求めることができる。
u i = floor (a i + f) (70) 
 On the other hand, in the case of t i > 0, if the variable suffixLength is determined, ΔR i can be efficiently obtained as a code length difference in the variable length code table selected by the suffix Length.
      
なお、ここでの△Riは、係数レベルliに関する符号長のみの差であるが、第2の実施例と同様、「level_prefixに変化がなければ、△Ri=0である」となるため、この場合には、△Ei<0の判断のみで選択可能である。 Here, the △ R i is the difference code lengths only relates coefficient levels l i, as in the second embodiment, the "if there is no change in level_prefix, a △ R i = 0" Therefore, in this case, the selection can be made only by the determination of ΔE i <0.
ここで、変数suffixLengthは、係数レベルをCAVLC符号化する際の、可変長符号のテーブルを選択する変数であり、スキャンの逆順に、係数レベルの絶対値の大きさに応じて遷移する。したがって、スキャンの逆順に係数レベルを選択していくことにより、suffixLengthも確定していく。未選択係数レベルについては、上記初期値にしたがってsuffixLengthを更新する。なお、trailingOnesの個数が3に満たない場合等、suffixLengthの確度が低い場合の係数レベルを未選択として、後の未選択係数レベルの選択時に処理することとしてもよい。 Here, the variable suffixLength is a variable for selecting a variable-length code table when the coefficient level is CAVLC encoded, and changes in the reverse order of scanning according to the magnitude of the absolute value of the coefficient level. Therefore, by selecting coefficient levels in the reverse order of scanning, suffixLength is also determined. For the unselected coefficient level, the suffixLength is updated according to the initial value. Note that the coefficient level when the accuracy of the suffixLength is low, such as when the number of trailingOnes is less than 3, may be set as unselected and processed when selecting an unselected coefficient level later.
         
  上述のステップS603、604の処理が終了すると、量子化部13は、以上の処理(上述のステップS603、604の処理)で、未選択のままである係数について、スキャンの逆順i=i1,…,0に、係数レベルliを選択していく(S605、S606)。ここまでの処理で、選択済みの係数成分の処理は、スキップする。
When the processes in steps S603 and 604 described above are completed, the 
         
  すなわち、スキャンの逆順i=i1,…,0に、各iについて、uiとしてtiを選択した場合とti+1を選択した場合の符号量の変化量△Riをもとめ、以下の(71)式のRDコストの変化量の符号の判断により、tiもしくは、ti+1から係数レベルを選択していく。すなわち、△Ji<0の場合にti+1を選択する。選択されたui用いて、係数レベルliを順次更新していく。
That is, 
         
    △Ji=△Ei+μ△Ri…(71)
  符号量の変化量△Riの算出時には必要に応じて、初期値のままの、あるいは、それまでの処理により更新された場合は更新された係数レベルliを参照して算出する。△Riの計算は、第2の実施形態で記載したのと同様に、tiを選択した場合と、ti+1を選択した場合の間で、符号量に変化のあるシンタックスエレメントのみを考慮すればよく、効率的に△Riの計算処理に関連するシンタックスエレメントを絞り込むことができる。
ΔJ i = ΔE i + μΔR i (71) 
 When calculating the change amount ΔR i of the code amount, it is calculated with reference to the updated coefficient level l i as it is, if necessary, or if it is updated by the processing so far. △ calculation of R i, similar to that described in the second embodiment, as selecting t i, between when selecting t i +1, only syntax element with a change in the amount of codes may be considered, it is possible to narrow the syntax elements associated with the calculation processing efficiently △ R i. 
      
         
(D−2)第4の実施形態の効果
  第4の実施形態によれば、第2の実施形態の効果に加えて、以下のような効果を奏することができる。
(D-2) Effects of Fourth Embodiment According to the fourth embodiment, the following effects can be achieved in addition to the effects of the second embodiment.
      
第2の実施形態に必要であった、係数のソート処理が不要となり、さらに、係数レベルの初期値の設定時に、suffixLengthにしたがって係数レベルの符号長差のみで選択可能な係数については、選択を行ってしまうため、ブロック全体の符号量変化を見ながら選択する係数の個数を削減でき、第2の実施形態と比べてもさらに少ない演算量、処理用で、量子化処理を行うことができる。 The coefficient sorting process, which was necessary in the second embodiment, is no longer necessary. Further, when setting the initial value of the coefficient level, the coefficient that can be selected only by the code length difference of the coefficient level according to suffixLength is selected. Therefore, the number of coefficients to be selected can be reduced while observing the change in the code amount of the entire block, and the quantization process can be performed with a smaller amount of computation and processing than in the second embodiment.
         
(E)第5の実施形態
  以下、本発明による量子化装置、プログラム及び方法、並びに、動画像符号化装置の第5の実施形態を、図面を参照しながら詳述する。なお、第5の実施形態の量子化装置は、量子化部であるものとして説明する。
(E) Fifth Embodiment Hereinafter, a fifth embodiment of a quantization device, a program and a method, and a moving image coding device according to the present invention will be described in detail with reference to the drawings. Note that the quantization apparatus according to the fifth embodiment will be described as a quantization unit.
      
         
(E−1)第5の実施形態の構成及び動作
  第5の実施形態では、第1〜第4の実施形態のような、係数ブロック単位での量子化処理ののち、複数の係数ブロックを含む、より大きな単位での量子化結果の最適化処理を行う。
(E-1) Configuration and Operation of Fifth Embodiment In the fifth embodiment, after a quantization process in units of coefficient blocks as in the first to fourth embodiments, a plurality of coefficient blocks are included. Optimize the quantization result in a larger unit.
      
例えば、H.264の4×4変換係数の場合、coded_block_patternにより、4×4ブロックを4つ集めた8×8の単位で、係数の有無(なしの場合は対象となるブロックのすべての係数レベルが0であることを表す)を制御でき、この制御によるレート歪コストの変化量を評価して量子化の最適化処理を行う。 For example, H.M. In the case of H.264 4 × 4 transform coefficients, the presence / absence of coefficients in the unit of 8 × 8 obtained by collecting four 4 × 4 blocks by coded_block_pattern (in the case of none, all coefficient levels of the target block are 0) The amount of rate distortion cost change due to this control is evaluated, and the quantization optimization process is performed.
         
  第5の実施形態は、第1の実施形態における量子化部13が、量子化部13Aに置き換わっているだけであるので、量子化部13A以外の構成については説明を省略する。
  In the fifth embodiment, since the 
図9は、第5の実施形態の量子化部13A内部の機能的構成について示したブロック図である。 FIG. 9 is a block diagram illustrating a functional configuration inside the quantization unit 13A of the fifth embodiment.
         
  量子化部13Aは、量子化処理部135、歪変化量総和計算部136、レート変化量計算部137、係数レベル選択部138を有している。
  The quantization unit 13A includes a 
         
  量子化処理部135では、変換係数をブロック単位に受け取り、所定の量子化パラメータQPにしたがって、第1〜4の実施形態のようなブロック単位での、RD最適な係数レベルの選択による量子化処理を行い、得られたブロック単位の係数レベルと、絶対値が1である係数レベルに関しては、△Eiを出力する。
The 
以下では、例として、coded_block_patternで表現される、ある8×8ブロックに関して、そこに含まれる4×4ブロック4個の係数レベルを同時に最適化する例について記載するが、この例に限定されず、複数の係数ブロックを同時に係数なしと制御することが可能なそのほかの制御方法の場合も、同様に構成可能である。 Hereinafter, as an example, an example of simultaneously optimizing the coefficient levels of four 4 × 4 blocks included in a certain 8 × 8 block expressed by coded_block_pattern will be described. However, the present invention is not limited to this example. The other control methods that can control a plurality of coefficient blocks at the same time without coefficients can be similarly configured.
         
  以下の処理は、coded_block_patternで制御可能な8×8ブロックに含まれる4×4ブロックの係数レベルが、絶対値1よりも大きな係数レベル値を有しない時、すなわち、係数レベル値が−1,0,1のみからなる時に行う。また、すべての係数レベル値が0である場合も、処理は行わない。
  The following processing is performed when the coefficient level of the 4 × 4 block included in the 8 × 8 block that can be controlled by coded_block_pattern does not have a coefficient level value larger than the 
         
  歪変化量総和計算部136は、歪の変化量△Eとして、係数レベル値の絶対値が1である係数成分に関する歪の変化量△Eiをすべて加算して求める。
The distortion change amount 
すなわち、係数ブロックjに関する非ゼロ係数の歪の変化量△Eiの和であるejを以下の(72)式により求める。このとき係数レベル値が0であるiに関する△Eiは加算しない。 That is, obtaining the e j is the sum of the distortion change amount △ E i nonzero coefficient related coefficient blocks j by the following (72) below. The time for the i coefficient level value is 0 △ E i is not added.
         
  ej=Σi(li≠0)△Ei  …(72)
  歪変化量総和計算部136は、対象ブロック全体にわたる歪の変化量の総和△Eを、以下の(73)式により求める。△Eは、対象係数ブロックをすべて係数なしとした場合から、ブロック単位での量子化結果の状態(絶対値1の係数が含まれる)へのスケールされた歪の変化量となる。
e j = Σ i (li ≠ 0) ΔE i (72) 
 The distortion change amount 
         
  △E=Σjej  …(73)
  レート変化量計算部137は、符号量の変化量として、係数ブロックjを、CABACもしくはCAVLC等のエントロピー符号化器で符号化する場合の符号量をrjとして求める。そして、レート変化量計算部137は、△Rをこれらの総和と、coded_block_patternにより、これらすべての符号語を符号化しない場合の差として、以下の(74)式により求める。ただし、(74)式の第2項のbits()の差は、coded_block_patternの、対象としている8×8領域全体の係数の有無を制御した場合の符号量の差であり、使用するCABAC,CAVLC等のエントロピー符号化によって決まる値である。また、この符号量の差が非常に小さいものとみなして無視(計算しない)する構成としてもよい。
ΔE = Σ j e j (73) 
 The rate change 
         
  △R=Σjrj+(bits(CBP=1)−bits(CBP=0))  …(74)
  そして、係数レベル選択部138は、得られた△Eと△Rと、スケールされたラグランジュ乗数μを用いて、複数ブロックを同時に係数なしとする場合と、ブロックごとの量子化処理による係数レベルを使用する場合のRDコストの変化量△Jを、以下の(75)式により求め、△J≧0の場合は、対象ブロックをすべて係数なしとする。△J<0の場合、もしくは、上記で処理対象としなかった、絶対値2以上の係数レベルを含む場合等は、ブロックごとの量子化処理結果をそのまま出力する。
ΔR = Σ j r j + (bits (CBP = 1) −bits (CBP = 0)) (74) 
 Then, the coefficient 
         
  △J=△E+μ△R  …(75)
(E−2)第5の実施形態の効果
  第5の実施形態によれば、以下のような効果を奏することができる。
ΔJ = ΔE + μΔR (75) 
 (E-2) Effects of Fifth Embodiment According to the fifth embodiment, the following effects can be achieved.
      
複数ブロックを含むより大きな単位での量子化結果の最適化処理を、行うことができ、符号化効率が向上できる。また、このときのRDコストの評価をスケールされた係数レベルの領域で行い、また、変化量のみを評価しているので、歪の変化量の評価を乗算なしで行うことができ、軽微な処理負荷で実現できる。 Optimization processing of the quantization result in a larger unit including a plurality of blocks can be performed, and coding efficiency can be improved. Further, since the evaluation of the RD cost at this time is performed in the scaled coefficient level region and only the change amount is evaluated, the distortion change amount can be evaluated without multiplication, and the processing is small. Can be realized with load.
         
(F)他の実施形態
  本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(F) Other Embodiments The present invention is not limited to the above-described embodiments, and may include modified embodiments as exemplified below.
      
(F−1)上記の各実施形態では、本発明の動画像符号化装置(量子化装置)をH.264に適用する場合の例について説明したが、本発明は上記実施形態に限定されず、変換係数の量子化と、エントロピー符号化を含むようなさまざまな動画像符号化処理における量子化処理に適用可能である。 (F-1) In each of the above embodiments, the moving picture coding apparatus (quantization apparatus) of the present invention is the H.264 standard. However, the present invention is not limited to the above-described embodiment, and is applied to quantization processing in various moving image encoding processes including transform coefficient quantization and entropy encoding. Is possible.
10…動画像符号化装置、11…予測差信号生成器、12…変換部、13…量子化部、14…エントロピー符号化部、15…逆量子化・逆変換部、16…復号画像生成部、17…フレームバッファ、18…予測部、131…スケール計算部、132…歪変化量計算部、133…レート変化量計算部、134…係数レベル選択部。 DESCRIPTION OF SYMBOLS 10 ... Moving image encoding device, 11 ... Prediction difference signal generator, 12 ... Conversion part, 13 ... Quantization part, 14 ... Entropy encoding part, 15 ... Dequantization / inverse conversion part, 16 ... Decoded image generation part , 17 ... Frame buffer, 18 ... Prediction unit, 131 ... Scale calculation unit, 132 ... Distortion change amount calculation unit, 133 ... Rate change amount calculation unit, 134 ... Coefficient level selection unit.
Claims (9)
上記変換係数に対して量子化のためのスケーリングを施すスケーリング手段と、
スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する係数レベル候補決定手段と、
上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出手段と、
上記レート歪コスト変化量算出手段の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択手段と
を有することを特徴とする量子化装置。 In a moving image encoding process, in a quantization device that quantizes a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image,
Scaling means for performing scaling for quantization on the transform coefficient;
A first coefficient level compensation obtained by converting the absolute value of the scaled conversion coefficient into an integer by rounding off the decimal point, and a coefficient for determining a second coefficient level candidate whose absolute value is 1 larger than the first coefficient level candidate Level candidate determination means,
When the first coefficient level compensation is selected and when the second coefficient level candidate is selected, the scaled distortion change amount corresponding to the difference in quantization error and entropy encoding are performed. The amount of change in the amount of code required for the above is obtained, and when the first coefficient level compensation is applied using the obtained amount of change in distortion and the amount of change in the amount of code, the second coefficient level 係数Rate distortion cost change amount calculating means for calculating a change amount of the rate distortion cost when the complement is applied; and
A coefficient that selects either the first coefficient level candidate or the second coefficient level candidate as a coefficient level to be applied to quantization of the transform coefficient according to the calculation result of the rate distortion cost change amount calculation means. And a level selection means.
上記スケーリング手段は、上記変換係数を量子化パラメータにしたがってスケーリングし、
上記レート歪コスト変化量算出手段は、上記変換係数の各係数成分で、最終非ゼロ係数成分位置を探索する範囲を決定し、この範囲について、スキャンの順方向に、ある最終非ゼロ係数成分位置を選択した場合と、別の最終非ゼロ係数成分位置を選択した場合のレート歪コストの変化量を求め、このレート歪コストの変化量の符号に応じて、最終非ゼロ係数成分位置を決定し、決定した最終非ゼロ係数成分位置から、スキャンの逆方向に各係数成分について、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を求め、
上記係数レベル選択手段は、上記レート歪コスト変化量算出手段が算出したレート歪コストの変化量の符号に応じて、上記変換係数の各係数成分に適用する係数レベルを選択する
ことを特徴とする請求項1に記載の量子化装置。 The quantization apparatus entropy-encodes the quantized transform coefficient in the moving image encoding process, and represents that the coefficient is a final non-zero coefficient in the scan order of the transform coefficient. Supplying the quantized transform coefficient to the encoding means having the syntax;
The scaling means scales the transform coefficient according to a quantization parameter,
The rate distortion cost change amount calculation means determines a range for searching for a final non-zero coefficient component position in each coefficient component of the conversion coefficient, and a certain final non-zero coefficient component position in the forward direction of the scan with respect to this range. And the amount of change in rate distortion cost when another final non-zero coefficient component position is selected, and the final non-zero coefficient component position is determined according to the sign of the rate distortion cost change amount. The rate when the first coefficient level compensation is applied and the second coefficient level compensation is applied to each coefficient component in the reverse direction of scanning from the determined final non-zero coefficient component position. Find the amount of change in distortion cost,
The coefficient level selection means selects a coefficient level to be applied to each coefficient component of the transform coefficient according to the sign of the rate distortion cost change amount calculated by the rate distortion cost change amount calculation means. The quantization apparatus according to claim 1.
上記スケーリング手段は、上記変換係数を量子化パラメータにしたがってスケーリングし、
上記レート歪コスト変化量算出手段は、上記スケーリング手段によりスケール化された上記変換係数の各係数成分を絶対値の小さい順にソートし、上記第1の係数レベル候補及び上記第2の係数レベル候補を、所定の量子化処理で量子化した値に初期化し、上記変換係数の各係数成分について、ソートされた順番で、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を求め、 上記係数レベル選択手段は、上記レート歪コスト変化量算出手段が算出したレート歪コストの変化量の符号に応じて、上記変換係数の各係数成分に適用する係数レベルを選択する
ことを特徴とする請求項1に記載の量子化装置。 The quantization apparatus entropy-encodes the quantized transform coefficient in the moving image encoding process, and the quantized transform is performed to an encoding unit including run-length encoding of a zero coefficient. Supply coefficient,
The scaling means scales the transform coefficient according to a quantization parameter,
The rate distortion cost change amount calculating means sorts the coefficient components of the transform coefficients scaled by the scaling means in ascending order of absolute values, and selects the first coefficient level candidates and the second coefficient level candidates. , When the first coefficient level compensation is applied to each coefficient component of the transform coefficient in the sorted order for each coefficient component of the transform coefficient, and the second coefficient level. The amount of change in rate distortion cost with respect to the case where compensation is applied is obtained, and the coefficient level selection means determines the conversion coefficient according to the sign of the amount of change in rate distortion cost calculated by the rate distortion cost change amount calculation means. 2. The quantization apparatus according to claim 1, wherein a coefficient level to be applied to each coefficient component is selected.
上記スケーリング手段は、上記変換係数を量子化パラメータにしたがってスケーリングし、
上記レート歪コスト変化量算出手段は、上記変換係数の各係数成分のスキャンの逆順に最終非ゼロ係数位置の探索開始位置を決定し、上記探索開始位置からスキャンの逆順に0を係数レベル候補としない係数成分まで、ある最終非ゼロ係数成分位置を選択した場合と、別の最終非ゼロ係数成分位置を選択した場合のレート歪コストの変化量を求め、このレート歪コストの変化量の符号判断によって、適用する最終非ゼロ係数成分位置を決定し、探索範囲の係数レベルを決定し、探索の停止位置から、スキャンの逆方向に各係数成分について、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を求め、
上記係数レベル選択手段は、上記レート歪コスト変化量算出手段が算出したレート歪コストの変化量の符号に応じて、上記変換係数の各係数成分に適用する係数レベルを選択する
ことを特徴とする請求項1に記載の量子化装置。 The quantization apparatus performs entropy encoding on the quantized transform coefficient, and has encoding syntax indicating that it is a final non-zero coefficient in the scan order of each coefficient component of the transform coefficient To supply the quantized conversion coefficient,
The scaling means scales the transform coefficient according to a quantization parameter,
The rate distortion cost change amount calculating means determines a search start position of the final non-zero coefficient position in the reverse order of scanning of each coefficient component of the transform coefficient, and sets 0 as a coefficient level candidate in the reverse order of the scan from the search start position. Determine the rate distortion cost change amount when selecting a certain final non-zero coefficient component position and another final non-zero coefficient component position up to the coefficient component that is not, and determine the sign of this rate distortion cost change amount The final non-zero coefficient component position to be applied is determined, the coefficient level of the search range is determined, and the first coefficient level compensation is applied to each coefficient component in the reverse direction of the scan from the search stop position. The amount of change in the rate distortion cost between the case and the case where the second coefficient level compensation is applied,
The coefficient level selection means selects a coefficient level to be applied to each coefficient component of the transform coefficient according to the sign of the rate distortion cost change amount calculated by the rate distortion cost change amount calculation means. The quantization apparatus according to claim 1.
上記スケーリング手段は、上記変換係数を量子化パラメータにしたがってスケーリングし、
上記レート歪コスト変化量算出手段は、上記変換係数の各係数成分について係数レベルの符号化順に、当該係数成分に対応する上記第1の係数レベル候補又は上記第2の係数レベル候補のうちいずれかの係数レベルが0である場合には、当該係数成分に適用する係数レベルを、所定の量子化処理で量子化した値に初期化し、当該係数成分の符号化に使用する符号が確定する場合には、当該係数成分について、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を求めて係数レベルを選択し、さらに、以上の処理で、まだレート歪コストの変化量が求められていない係数成分についても、レート歪コストの変化量を求め、
上記係数レベル選択手段は、上記レート歪コスト変化量算出手段が算出したレート歪コストの変化量の符号に応じて、上記変換係数の各係数成分に適用する係数レベルを選択する
ことを特徴とする請求項1に記載の量子化装置。 The quantization device entropy-encodes the transform coefficient quantized by the quantization device, and includes zero-length run-length coding and absolute coefficient level appearing in the order of quantization coefficient level coding. Depending on the magnitude of the value, the quantized transform coefficient is supplied to an encoding means including encoding in which the code used for encoding of the non-zero coefficient level is changed,
The scaling means scales the transform coefficient according to a quantization parameter,
The rate distortion cost change amount calculation means is either the first coefficient level candidate or the second coefficient level candidate corresponding to the coefficient component in the coding order of the coefficient level for each coefficient component of the transform coefficient. When the coefficient level is zero, the coefficient level applied to the coefficient component is initialized to a value quantized by a predetermined quantization process, and the code used to encode the coefficient component is determined. For the coefficient component, the coefficient level is selected by obtaining the amount of change in the rate distortion cost when the first coefficient level compensation is applied and when the second coefficient level compensation is applied, Further, for the coefficient component for which the rate distortion cost change amount has not yet been obtained by the above processing, the rate distortion cost change amount is obtained,
The coefficient level selection means selects a coefficient level to be applied to each coefficient component of the transform coefficient according to the sign of the rate distortion cost change amount calculated by the rate distortion cost change amount calculation means. The quantization apparatus according to claim 1.
当該量子化装置は、量子化した結果をエントロピー符号化するものであって、複数の変換係数ブロックにわたって、係数レベルが全てゼロであることを表現できる符号化を含む符号化手段へ、量子化した上記変換係数を供給し、
量子化対象となる複数の変換係数ブロックを構成する各変換係数ブロックについて、請求項1〜5のいずれかに記載の量子化装置により量子化する単位量子化手段と、
上記単位量子化手段により、量子化された変換係数ブロックのうち、係数レベルが非ゼロのものについて、係数レベル0を適用する場合からのスケールされた歪変化量の総和を求める歪変化量総和計算手段と、
上記単位量子化手段により量子化された変換係数ブロックを、エントロピー符号化する場合に必要となる符号量と、上記各変換係数ブロックの係数レベルが全てゼロであることを表現する場合の符号量との変化量を求める符号量変化量算出手段と、
上記歪変化量総和計算手段により求められた歪変化量の総和と、上記符号量変化量算出手段により求められた符号量の変化量とを用いて、上記単位量子化手段により量子化された変換係数ブロックと、上記各変換係数ブロックの係数レベルが全てゼロである場合とのレート歪コストの変化量を求め、このレート歪コストの変化量に応じて、上記各変換係数ブロックの量子化結果について、係数レベルを全てゼロとするか、上記単位量子化手段の量子化結果とするかを決定する係数レベル選択手段と、
を有することを特徴とする量子化装置。 In a moving image encoding process, in a quantization device that quantizes a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image,
The quantization apparatus performs entropy coding on the quantized result and quantizes the coding means including coding capable of expressing that the coefficient levels are all zero over a plurality of transform coefficient blocks. Supply the above conversion factor,
Unit quantization means for quantizing by the quantizing device according to any one of claims 1 to 5 for each transform coefficient block constituting a plurality of transform coefficient blocks to be quantized,
A distortion change amount sum calculation for obtaining a sum of scaled strain change amounts from the case where coefficient level 0 is applied to a transform coefficient block quantized by the unit quantization means and having a coefficient level of non-zero. Means,
A code amount required for entropy encoding the transform coefficient block quantized by the unit quantization means, and a code amount for expressing that the coefficient levels of the transform coefficient blocks are all zero. A code amount change amount calculating means for obtaining a change amount of
The transform quantized by the unit quantization means using the total distortion change amount obtained by the distortion change amount summation calculating means and the code amount change amount obtained by the code amount change amount calculating means. The amount of change in the rate distortion cost between the coefficient block and the case where the coefficient levels of each of the transform coefficient blocks are all zero is obtained, and the quantization result of each of the transform coefficient blocks is determined according to the amount of change in the rate distortion cost. , Coefficient level selection means for determining whether the coefficient levels are all zero or the quantization result of the unit quantization means;
A quantization apparatus comprising:
コンピュータを、
上記変換係数に対して量子化のためのスケーリングを施すスケーリング手段と、
スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する係数レベル候補決定手段と、
上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出手段と、
上記レート歪コスト変化量算出手段の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択手段と
して機能させることを特徴とする量子化プログラム。 In a moving image encoding process, in a quantization program for quantizing a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image,
Computer
Scaling means for performing scaling for quantization on the transform coefficient;
A first coefficient level compensation obtained by converting the absolute value of the scaled conversion coefficient into an integer by rounding off the decimal point, and a coefficient for determining a second coefficient level candidate whose absolute value is 1 larger than the first coefficient level candidate Level candidate determination means,
When the first coefficient level compensation is selected and when the second coefficient level candidate is selected, the scaled distortion change amount corresponding to the difference in quantization error and entropy encoding are performed. The amount of change in the amount of code required for the above is obtained, and when the first coefficient level compensation is applied using the obtained amount of change in distortion and the amount of change in the amount of code, the second coefficient level 係数Rate distortion cost change amount calculating means for calculating a change amount of the rate distortion cost when the complement is applied; and
A coefficient that selects either the first coefficient level candidate or the second coefficient level candidate as a coefficient level to be applied to quantization of the transform coefficient according to the calculation result of the rate distortion cost change amount calculation means. A quantization program that functions as a level selection means.
上記変換係数に対して量子化のためのスケーリングを施すスケーリング工程と、
スケーリングされた上記変換係数の絶対値について小数点以下の切り捨てにより整数化した第1の係数レベル侯補と、第1の係数レベル候補よりも絶対値が1大きい第2の係数レベル候補を決定する上記係数レベル候補決定工程と、
上記第1の係数レベル侯補を選択した場合と、上記第2の係数レベル候補を選択した場合の、量子化誤差の差に相当するスケール化された歪変化量、及び、エントロピー符号化する場合に必要となる符号量の変化量を求め、求めた歪変化量と符号量の変化量とを利用して、上記第1の係数レベル侯補を適用した場合と、上記第2の係数レベル侯補を適用した場合とのレート歪コストの変化量を算出するレート歪コスト変化量算出工程と、
上記レート歪コスト変化量算出工程の算出結果に応じて、上記第1の係数レベル候補又は上記第2の係数レベル候補のいずれかを、上記変換係数の量子化に適用する係数レベルとして選択する係数レベル選択工程と
を有することを特徴とする量子化方法。 In a moving image encoding process, in a quantization method for quantizing a transform coefficient related to an error signal between an input image constituting a moving image to be encoded and a predicted image of the input image,
A scaling step for scaling the transform coefficient for quantization;
The first coefficient level compensation obtained by converting the absolute value of the scaled conversion coefficient into an integer by rounding down the decimal point, and the second coefficient level candidate having a larger absolute value than the first coefficient level candidate by 1 A coefficient level candidate determination step;
When the first coefficient level compensation is selected and when the second coefficient level candidate is selected, the scaled distortion change amount corresponding to the difference in quantization error and entropy encoding are performed. The amount of change in the amount of code required for the above is obtained, and when the first coefficient level compensation is applied using the obtained amount of change in distortion and the amount of change in the amount of code, the second coefficient level 係数A rate distortion cost change amount calculating step for calculating a change amount of the rate distortion cost when the supplement is applied; and
A coefficient for selecting either the first coefficient level candidate or the second coefficient level candidate as a coefficient level to be applied to quantization of the transform coefficient according to the calculation result of the rate distortion cost change amount calculating step. And a level selection step.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2010037845A JP5423469B2 (en) | 2010-02-23 | 2010-02-23 | Quantization apparatus, program and method, and moving picture encoding apparatus | 
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2010037845A JP5423469B2 (en) | 2010-02-23 | 2010-02-23 | Quantization apparatus, program and method, and moving picture encoding apparatus | 
Publications (2)
| Publication Number | Publication Date | 
|---|---|
| JP2011176483A JP2011176483A (en) | 2011-09-08 | 
| JP5423469B2 true JP5423469B2 (en) | 2014-02-19 | 
Family
ID=44688961
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| JP2010037845A Expired - Fee Related JP5423469B2 (en) | 2010-02-23 | 2010-02-23 | Quantization apparatus, program and method, and moving picture encoding apparatus | 
Country Status (1)
| Country | Link | 
|---|---|
| JP (1) | JP5423469B2 (en) | 
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US9270986B2 (en) * | 2012-04-13 | 2016-02-23 | Qualcomm Incorporated | Level decision in rate distortion optimized quantization | 
| US10230956B2 (en) * | 2012-09-26 | 2019-03-12 | Integrated Device Technology, Inc. | Apparatuses and methods for optimizing rate-distortion of syntax elements | 
| US10277907B2 (en) | 2012-10-25 | 2019-04-30 | Integrated Device Technology, Inc. | Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components | 
| WO2014103182A1 (en) * | 2012-12-27 | 2014-07-03 | 日本電気株式会社 | Video coding device, video coding method, and video coding program | 
| JP6476900B2 (en) * | 2015-01-21 | 2019-03-06 | 富士通株式会社 | Moving picture coding apparatus, moving picture coding method, and computer program for moving picture coding | 
| CN108322749B (en) * | 2018-03-15 | 2021-03-16 | 北京数码视讯科技股份有限公司 | RDOQ coefficient optimization method, RDOQ acceleration method and device | 
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| EP1830573A1 (en) * | 2006-03-02 | 2007-09-05 | Thomson Licensing | Method and apparatus for determining in picture signal encoding the bit allocation for groups of pixel blocks in a picture | 
| US9008171B2 (en) * | 2008-01-08 | 2015-04-14 | Qualcomm Incorporated | Two pass quantization for CABAC coders | 
| US8902972B2 (en) * | 2008-04-11 | 2014-12-02 | Qualcomm Incorporated | Rate-distortion quantization for context-adaptive variable length coding (CAVLC) | 
- 
        2010
        - 2010-02-23 JP JP2010037845A patent/JP5423469B2/en not_active Expired - Fee Related
 
Also Published As
| Publication number | Publication date | 
|---|---|
| JP2011176483A (en) | 2011-09-08 | 
Similar Documents
| Publication | Publication Date | Title | 
|---|---|---|
| TWI813126B (en) | Dependent quantization | |
| KR102613155B1 (en) | Efficient coding of transform coefficients using or suitable for a combination with dependent scalar quantization | |
| KR102314801B1 (en) | Selective Blending for Entropy Coding in Video Compression | |
| JP5409909B2 (en) | How to decode a bitstream | |
| JP5492206B2 (en) | Image encoding method and image decoding method, and image encoding device and image decoding device | |
| JP4787100B2 (en) | Image encoding device | |
| JP3679083B2 (en) | Image encoding method, image decoding method, image encoding device, image decoding device, image encoding program, image decoding program | |
| TWI705700B (en) | Apparatus and method for decoding and encoding a significance map, and related decoder, data stream and computer readable digital storage medium | |
| CN100392671C (en) | Method and system for context-based adaptive variable length coding for adaptive block transforms | |
| JP5566529B2 (en) | How to code a video using a dictionary | |
| KR102020101B1 (en) | Method and apparatus for syntax element encoding in a video codec | |
| JP6197496B2 (en) | Quantization apparatus, quantization method, and quantization program | |
| JP2014523186A (en) | Entropy encoding / decoding method and apparatus | |
| US20080219578A1 (en) | Method and apparatus for context adaptive binary arithmetic coding and decoding | |
| WO2010119757A1 (en) | Image encoding apparatus, method, and program, and image decoding apparatus, method, and program | |
| JP5423469B2 (en) | Quantization apparatus, program and method, and moving picture encoding apparatus | |
| JP2011024066A (en) | Image processing apparatus and method | |
| KR20090097013A (en) | Video Encoding Device and Video Decoding Device | |
| KR20120009693A (en) | Apparatus and method for contention-based intra prediction encoding / decoding using multiple prediction filters | |
| US20080144721A1 (en) | Video coding apparatus | |
| JP4855417B2 (en) | Video encoding device, video decoding device | |
| CN105453566B (en) | Data encoding and data decoding | |
| KR20110048004A (en) | Motion vector encoding / decoding method and apparatus using motion vector resolution limitation and image encoding / decoding method using same | |
| KR102327323B1 (en) | Method and apparatus for encoding and decoding a data stream representing at least one image | |
| JP2023117786A (en) | Encoding device, program, and model generation method | 
Legal Events
| Date | Code | Title | Description | 
|---|---|---|---|
| A621 | Written request for application examination | Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121115 | |
| A977 | Report on retrieval | Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130416 | |
| A131 | Notification of reasons for refusal | Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130430 | |
| A521 | Request for written amendment filed | Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 | |
| A131 | Notification of reasons for refusal | Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 | |
| A521 | Request for written amendment filed | Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 | |
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 | |
| A61 | First payment of annual fees (during grant procedure) | Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131111 | |
| R150 | Certificate of patent or registration of utility model | Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5423469 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 | |
| LAPS | Cancellation because of no payment of annual fees |