[go: up one dir, main page]

JP2000165857A - Hierarchical moving picture evaluation device and moving picture communication system - Google Patents

Hierarchical moving picture evaluation device and moving picture communication system

Info

Publication number
JP2000165857A
JP2000165857A JP33476698A JP33476698A JP2000165857A JP 2000165857 A JP2000165857 A JP 2000165857A JP 33476698 A JP33476698 A JP 33476698A JP 33476698 A JP33476698 A JP 33476698A JP 2000165857 A JP2000165857 A JP 2000165857A
Authority
JP
Japan
Prior art keywords
image
hierarchical
code
moving image
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33476698A
Other languages
Japanese (ja)
Inventor
Yoshizo Honda
芳三 本多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ando Electric Co Ltd
Original Assignee
Ando Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ando Electric Co Ltd filed Critical Ando Electric Co Ltd
Priority to JP33476698A priority Critical patent/JP2000165857A/en
Publication of JP2000165857A publication Critical patent/JP2000165857A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a hierarchical moving picture evaluation device where number of times of coding, number of times of communication and a scale of decoding processing in the case of evaluating a hierarchical moving picture code can be reduced and that evaluates image quality when a hierarchical moving picture repeater transmits a hierarchical stream with a reduced hierarchical number. SOLUTION: When a moving picture code transmission section 40 transmits a hierarchical moving picture code hierarchically processed depending on resolution to a moving picture code reception section 60 via a transmission line 20, the hierarchical moving picture code is received by a hierarchical moving picture evaluation device 110. A hierarchical separate section 111 reconfigures a received hierarchical moving picture code for each layer and gives each moving picture stream of layers A-C to decoding sections 112a-112c. The decoding sections decode the received moving picture stream to obtain each picture of the layers A-C and give the result to evaluation sections 113a-113c. The evaluation sections calculate the image quality evaluation value of the received picture and feed back the result to the moving picture code transmission section 40. The moving picture code transmission section 40 properly selects a coding mode and a coding parameter of the hierarchical moving picture code to be sent on the basis of the received image quality evaluation value.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、符号化されたディ
ジタル動画像の画質が原画像からどの程度劣化している
かを評価する動画評価装置及びこの動画評価装置が適用
される動画通信装置に関し、特に、解像度に応じて階層
化された動画符号を対象とした画質評価を行う階層動画
評価装置及び動画通信装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a moving picture evaluation apparatus for evaluating the degree of deterioration of the quality of an encoded digital moving picture from an original picture, and a moving picture communication apparatus to which the moving picture evaluation apparatus is applied. In particular, the present invention relates to a hierarchical moving image evaluation device and a moving image communication device that perform image quality evaluation on moving image codes hierarchized according to resolution.

【0002】[0002]

【従来の技術】ディジタル動画は「フレーム」と呼ばれ
る瞬間の映像の連なりで構成されている。そして各フレ
ームは表示器の画面を格子状をした多数の点に分解した
「画素」ないし「ドット」で構成されており、各画素に
はその色および明るさ(階調とも言う)を表すディジタ
ルデータが割り当てられている。一般に、ディジタル動
画の単位時間当たりの情報量を[bit/sec](ビット毎
秒)で表すと、典型値でさえ数百メガ[bit/sec]にも
達し、音声などと比べるとその情報量は膨大である。こ
のため、ディジタル動画を通信したり記録したりする場
合には「動画符号化」と呼ばれる情報圧縮が行われるの
が通常である。なお、こうした動画復号化により生成さ
れるデータは「動画符号」と呼ばれている。動画符号の
各部はもともと映像として定められた時間に従って再生
・表示されることが期待されていることから、これら各
部は画面走査およびフレームの順(つまり、時間経過の
順)で一列に並べられることになる。本明細書ではこう
したビット列のことを「動画ストリーム」と呼ぶことに
する。
2. Description of the Related Art Digital moving pictures are composed of a series of pictures at a moment called a "frame". Each frame is composed of "pixels" or "dots" obtained by decomposing a display screen into a number of grid-like points, and each pixel has a digital value representing its color and brightness (also called gradation). Data is allocated. In general, when the amount of information per unit time of a digital moving image is expressed in [bit / sec] (bits per second), even a typical value reaches several hundred megabits [bit / sec]. It is huge. For this reason, when communicating or recording a digital moving image, it is usual that information compression called “moving image encoding” is performed. It should be noted that data generated by such moving image decoding is called a “moving image code”. Since each part of the moving picture code is expected to be reproduced and displayed according to the time originally set as a video, these parts must be arranged in a line in the order of screen scanning and frames (that is, the time lapse). become. In the present specification, such a bit string is referred to as a “moving image stream”.

【0003】動画符号の国際標準としては、国際標準化
機構であるISO(InternationalOrganization for St
andardization)およびIEC(International Electro
technical Commission)によるMPEG(Moving Pictu
re Experts Group)-1(ISO/IEC-11172),MPEG−
2(ISO/IEC-13818),MPEG−4(ISO/IEC-14496)
や、ITU(International Telecommunication Unio
n)勧告によるH.261,H.263などの方式があ
る。こうした動画符号化方式では、同じ動画のドットデ
ータから得られる動画符号の符号量の大小を可変させる
ことができる。例えば、上述した動画符号化方式ではい
ずれも「DCT(Discrete Cosine Transform;離散コサ
イン変換)係数」と呼ばれる階調値の空間分布の周波数
成分値を用いて符号化を行うが、その際に、DCT係数
の量子化(ディジタル符号化)の幅ないし粗さ(以下、
単に「量子化幅」という)を数十〜数百の段階の中から
選んで符号化を行っている。ここで、単位時間当たりの
符号量を「符号化レート」と呼んでいる。量子化幅を粗
くするほど符号化レートが低下し、逆に量子化幅を精細
にするほど符号化レートが増大することから、量子化幅
を変えることによって動画の圧縮率を可変できることに
なる。
[0003] International standards for video codes include ISO (International Organization for Statis- tics) which is an international standardization organization.
andardization) and IEC (International Electro
Technical Commission) MPEG (Moving Pictu)
re Experts Group) -1 (ISO / IEC-11172), MPEG-
2 (ISO / IEC-13818), MPEG-4 (ISO / IEC-14496)
And ITU (International Telecommunication Unio
n) Recommendation H.264. 261, H .; 263 and the like. In such a moving image encoding method, the size of the moving image code obtained from the dot data of the same moving image can be varied. For example, in each of the above-described moving image coding methods, encoding is performed using a frequency component value of a spatial distribution of gradation values called “DCT (Discrete Cosine Transform) coefficient”. The width or roughness of the coefficient quantization (digital coding)
The coding is performed by selecting a "quantization width" from tens to hundreds of stages. Here, the code amount per unit time is called an “encoding rate”. The coding rate decreases as the quantization width decreases, and the coding rate increases as the quantization width decreases. Therefore, the compression rate of a moving image can be changed by changing the quantization width.

【0004】上述したようにDCT係数は空間周波数成
分値であるから、量子化幅を粗くするほど復号される画
像と原画像との違いは大きくなり、一方で、量子化幅を
精細にするほど復号される画像は原画像に近づいてより
忠実なものになる。このほか上述した圧縮率は、DCT
係数の最低次成分であるDC(直流)成分の予測方式,
双方向予測・順方向予測といったフレーム間予測方式,
動きベクトル予測方式など、幾つかの標準化された方式
のうちの何れを選択するかにも依存している。このよう
に、動画符号化方式では量子化幅といった数値や予測方
式などを適宜選ぶことによって所望の動画符号を得るこ
とができる。なお、本明細書では、符号化の際の選択肢
としての前者を「符号化パラメータ」と呼び、後者を
「符号化モード」と呼ぶことにする。
As described above, since the DCT coefficient is a spatial frequency component value, the difference between the decoded image and the original image increases as the quantization width increases, while as the quantization width increases, the difference increases. The decoded image becomes closer to the original image and becomes more faithful. In addition, the compression ratio mentioned above is DCT
Prediction method of DC (direct current) component which is the lowest order component of coefficient,
Inter-frame prediction methods such as bidirectional prediction and forward prediction,
It also depends on which of several standardized schemes to choose, such as a motion vector prediction scheme. As described above, in the moving picture coding method, a desired moving picture code can be obtained by appropriately selecting a numerical value such as a quantization width and a prediction method. In the present specification, the former as an option at the time of encoding is referred to as “encoding parameter”, and the latter is referred to as “encoding mode”.

【0005】また、動画通信を行う場合、符号化レート
に比べて伝送路の帯域幅が不十分なことが主な原因とな
って、動画の遅延や揺らぎが発生したり、動画を再生表
示すべき時間が正しくなくなったり、動画のバッファリ
ング量が増大したり、動画符号の一部が廃棄されたり、
フレームが跳ばされて再生されたり、再生表示画像が乱
れたりするなど、再生表示に様々な悪影響を及ぼすこと
になる。しかも、符号化パラメータや符号化モードの選
び方によって符号化レートが変化し、それに伴って再生
画像に対する影響の度合いも異なってくる。以上のよう
なことに鑑み、動画通信においては再生表示画像の画質
が原画像からどの程度劣化しているかを評価することが
重要となり、そのために「動画評価装置」と呼ばれる装
置が必要となってくる。
[0005] In addition, when performing moving image communication, delays and fluctuations of moving images occur and moving images are reproduced and displayed mainly due to an insufficient bandwidth of a transmission path compared with an encoding rate. Time is incorrect, video buffering increases, some video code is discarded,
This has various adverse effects on playback display, such as skipped frames being played back and a playback display image being disturbed. In addition, the coding rate changes depending on the selection of the coding parameter and the coding mode, and accordingly, the degree of influence on the reproduced image also changes. In view of the above, in moving image communication, it is important to evaluate how much the image quality of the reproduced display image has deteriorated from the original image, and therefore, a device called a “moving image evaluation device” is required. come.

【0006】この種の動画評価装置としては、例えば、
本出願人が既に出願している特願平9−216814号
に開示されている「動画通信管理装置」が挙げられる。
そこで以下、この先願に開示されている従来の動画評価
装置について簡潔に説明することとする。図4はこの動
画評価装置が適用された動画通信装置についてその構成
の要部を示したものである。図中、動画符号送信部10
は動画サーバコンピュータ,動画エンコーダなどであ
る。また、伝送路20を介して動画符号送信部10に接
続された動画符号受信部30は、パーソナルコンピュー
タ,セットトップボックス,画像表示機器などである。
なお、セットトップボックスとは、家庭用テレビを利用
してビデオオンデマンドサービスといった双方向サービ
スを利用するための装置であって、利用者側の要求をサ
ーバコンピュータ側に伝達する機能やディジタル情報を
映像・音声に変換する機能などを持っている。
[0006] As this kind of moving picture evaluation device, for example,
A "moving image communication management device" disclosed in Japanese Patent Application No. 9-216814 filed by the present applicant has been mentioned.
Therefore, the conventional moving image evaluation device disclosed in the prior application will be briefly described below. FIG. 4 shows a main part of the configuration of a video communication device to which the video evaluation device is applied. In the figure, a moving image code transmission unit 10
Is a moving image server computer, a moving image encoder, and the like. The moving image code receiving unit 30 connected to the moving image code transmitting unit 10 via the transmission path 20 is a personal computer, a set-top box, an image display device, or the like.
Note that a set-top box is a device for using a two-way service such as a video-on-demand service using a home television, and a function for transmitting a request from a user to a server computer and digital information. It has functions to convert video and audio.

【0007】さて、動画符号送信部10が伝送路20を
通じて動画符号受信部30に動画符号(即ち、動画スト
リーム)を送信すると、送られてきた動画符号は動画評
価部100に入力される。ここで、動画符号を動画評価
部100に入力するための方法には、動画符号受信部3
0が動画符号送信部10から動画符号を受信した後にこ
れを動画評価部100に出力する方法のほか、図示を省
略した分配器や収集器などを用いて伝送路20から動画
符号を取り出して動画評価部100に出力する方法など
がある。次に、動画評価部100に入力された動画符号
は復号部101へ供給されて、復号部101はこの動画
符号を動画に復号して評価部102に出力し、評価部1
02は復号された動画の画質を評価してその画質評価値
を動画符号送信部10にフィードバックする。
When the moving picture code transmitting section 10 transmits a moving picture code (that is, a moving picture stream) to the moving picture code receiving section 30 through the transmission line 20, the sent moving picture code is input to the moving picture evaluation section 100. Here, the method for inputting the moving image code to the moving image evaluation unit 100 includes the moving image code receiving unit 3.
0 receives the moving image code from the moving image code transmitting unit 10 and then outputs the moving image code to the moving image evaluation unit 100. Alternatively, the moving image code is extracted from the transmission path 20 using a distributor or a collector (not shown). There is a method of outputting to the evaluation unit 100 and the like. Next, the moving image code input to the moving image evaluation unit 100 is supplied to the decoding unit 101, and the decoding unit 101 decodes the moving image code into a moving image and outputs the moving image to the evaluation unit 102.
02 evaluates the image quality of the decoded moving image and feeds back the image quality evaluation value to the moving image code transmission unit 10.

【0008】ここで言う「画質評価値」は、例えば、評
価部102が予め取得しておいた原画像と復号部101
で復号された画像(以下「復号画像」という)の間の差
異を数値化したものである。例えば、画質評価値はdB
(デシベル)表示のSNR(Signal to Noise Ratio;信
号対雑音比)値であって、その算出手順は次のようにな
る。すなわち、まず原画像上および復号画像上で互いに
対応する画素の階調値の差を各画素について求め、それ
ら各々について自乗値を求める。次に、これら差の自乗
値について全ての画素の平均値を求めたものをノイズパ
ワーと見なす。次いで、階調の全振幅を自乗したものを
求めてこの自乗値とノイズパワーとの比を求め、算出さ
れた比の常用対数をとった値を10倍したものをdB表
示のSNR値として決定する。なお、ここで言う「階調
の全振幅」とは次のようなものである。すなわち、いま
例えば各画素の階調が8ビットで表現されている場合を
考えると、その階調値が最小値“0”のときが「黒」,
最大値“255”(10進数)のときが「白」になり、
最大値“255”の階調値が階調の全振幅に相当する。
ちなみに、画質評価値の算出方法はいま述べた方法に限
られるものではなく、他の算出方法を使用することもで
きる。
[0008] The "image quality evaluation value" referred to here is, for example, the original image acquired by the evaluation unit 102 in advance and the decoding unit 101
The difference between the images (hereinafter, referred to as “decoded images”) decoded in step (1) is quantified. For example, the image quality evaluation value is dB
The SNR (Signal to Noise Ratio) value in (decibel) display, and the calculation procedure is as follows. That is, first, the difference between the gradation values of the pixels corresponding to each other on the original image and the decoded image is obtained for each pixel, and the square value is obtained for each of them. Next, the average value of all pixels for the square values of these differences is regarded as noise power. Next, the squared value of the total amplitude of the gradation is obtained, the ratio between the squared value and the noise power is obtained, and the value obtained by multiplying the common logarithm of the calculated ratio by 10 is determined as the SNR value in dB display. I do. Here, the “total amplitude of the gray scale” is as follows. That is, for example, when the gradation of each pixel is represented by 8 bits, for example, the case where the gradation value is the minimum value “0” is “black”,
When the maximum value is "255" (decimal number), it becomes "white",
The gradation value of the maximum value “255” corresponds to the full amplitude of the gradation.
Incidentally, the calculation method of the image quality evaluation value is not limited to the method just described, and another calculation method can be used.

【0009】そして、動画符号送信部10は符号化モー
ド,符号化パラメータの複数の組み合わせについて符号
化された動画ストリームを伝送路20に送信し、動画評
価部100を用いて各動画ストリームについてSNR値
といった画質評価値を得て、それら画質評価値を互いに
比較することによって最も高い画質を与える符号化モー
ド,符号化パラメータの組み合わせを決定する。以上説
明したように、動画ストリームの画質評価結果を動画評
価部100から動画符号送信部10へフィードバックす
ることで、動画符号送信部10の行う動画符号の符号化
の運用を支援することが可能となる。
[0009] Then, the moving picture code transmitting section 10 transmits the moving picture stream coded for a plurality of combinations of the coding mode and the coding parameter to the transmission line 20, and uses the moving picture evaluation section 100 to calculate the SNR value for each moving picture stream. The image quality evaluation values are obtained, and the image quality evaluation values are compared with each other to determine the combination of the encoding mode and the encoding parameter that gives the highest image quality. As described above, by feeding back the image quality evaluation result of the video stream from the video evaluation unit 100 to the video code transmission unit 10, it is possible to support the operation of the video code encoding performed by the video code transmission unit 10. Become.

【0010】ところで、動画符号を構成する方法の一つ
に「階層化動画符号」と呼ばれるものがある。この方法
に関する文献の一例として、「笠井裕之,児玉明,前田
鏡二,富永英義、早稲田大学理工学部電子通信学科、
“動画像階層符号化方式を用いた視覚情報モデル記述方
式に関する一検討”、1996年電子情報通信学会総合
大会講演論文集,第7分冊D−301,p89、電子情
報通信学会」がある。そこで以下、図5〜図7を参照し
ながらこの階層化動画符号について簡潔に説明すること
にする。
Incidentally, there is a method called "hierarchical moving image code" as one of the methods of forming the moving image code. Examples of literature on this method include “Hiroyuki Kasai, Akira Kodama, Kyoji Maeda, Hideyoshi Tominaga, Waseda University, Department of Electronic Communication,
"A Study on Visual Information Model Description Method Using Hierarchical Video Coding", Proc. Of the 1996 IEICE General Conference, Vol. 7, D-301, p89, IEICE. Therefore, the layered moving image code will be briefly described below with reference to FIGS.

【0011】よく知られているように、動画を送信する
際の状況は実に多様であって、例えば伝送路は電話回線
であったり、ローカルエリアネットワーク(以下「LA
N」という)であったり、無線による通信を用いるもの
であったりするほか、これら異種の様々な通信手段を次
々につないでそれらの両端で送受信したりする形態など
もある。また、動画ストリームを伝送する伝送路の特性
などが時間的に変動する場合もある。例えば、無線通信
ではフェージング・マルチパスと呼ばれる原因で伝送可
能な帯域幅が変化するほか、LANでは複数のユーザに
よるトラフィック変動のために一つの通信チャンネルに
割り当てられるスループットが変化することがある。ま
た、複数の受信端末に向けて動画を送信する場合などで
は、それぞれの受信端末に至る伝送経路の特性は多様な
ものになりうる。例えば、前述したような無線,LA
N,異種接続網といった多様性があるほか、同じ電話回
線であっても或る端末は最大帯域64キロbps(ビッ
ト毎秒)で接続され、別の端末は最大帯域28.8キロ
bpsで接続されることもよくある。さらに、各送受信
端末の処理性能も多様であって、汎用CPU(中央処理
装置)と専用集積回路の分担や構成,CPUの処理速
度,キャッシュメモリサイズ,動画復号性能などに応じ
て様々な性能となる。
[0011] As is well known, the situation when transmitting a moving image is quite diverse. For example, the transmission path is a telephone line or a local area network (hereinafter referred to as "LA").
N "), using wireless communication, and connecting these various kinds of communication means one after another to transmit and receive at both ends. Further, the characteristics of the transmission path for transmitting the moving image stream may fluctuate over time. For example, in wireless communication, the bandwidth that can be transmitted changes due to a factor called fading multipath, and in LAN, the throughput allocated to one communication channel may change due to traffic fluctuation by a plurality of users. Also, when a moving image is transmitted to a plurality of receiving terminals, the characteristics of a transmission path to each of the receiving terminals may be various. For example, wireless and LA as described above
N, heterogeneous connection networks, and even in the same telephone line, one terminal is connected at a maximum bandwidth of 64 kbps (bits per second), and another terminal is connected at a maximum bandwidth of 28.8 kbps. It often happens. In addition, the processing performance of each transmitting / receiving terminal is also diverse, and various performances are required depending on the sharing and configuration of a general-purpose CPU (central processing unit) and a dedicated integrated circuit, the processing speed of the CPU, the cache memory size, the video decoding performance, and the like. Become.

【0012】以上のような動画送信における状況の多様
性のゆえに、各受信端末で実現可能な最高画質の動画を
再生するために如何なる動画ストリームを送信すれば良
いかが問題となり、それぞれの状況に応じた最適な符号
化レート,符号化パラメータ,符号化モード等を決める
仕様も存在している。例えば、伝送路に割り当てられた
最大帯域幅によって動画の符号化レートが決まるため、
画面の解像度,毎秒のフレーム(コマ)数,量子化の粗
さなどの最適パラメータの仕様が最大帯域幅に応じて決
められている。
[0012] Because of the variety of situations in the above-described moving picture transmission, what kind of moving picture stream should be transmitted in order to reproduce the highest quality moving picture achievable by each receiving terminal becomes a problem. There is also a specification for determining an optimum coding rate, coding parameter, coding mode, and the like according to the specification. For example, the maximum bandwidth allocated to the transmission path determines the video encoding rate,
The specifications of the optimal parameters such as the screen resolution, the number of frames (frames) per second, and the roughness of quantization are determined according to the maximum bandwidth.

【0013】ところが、同じコンテンツを多様な受信端
末へ一度に配信するためには、各受信端末にとって最適
の符号化パラメータに従って動画ストリームをこれら受
信端末へ同時に送信する必要がある。そのため、例えば
1端末当たり64キロbpsの符号化レートを持つ動画
符号を8端末へ同時に送信するには、64×8=512
キロbpsの伝送路容量が必要となってくる。つまり、
このような方法では受信端末数が増えると、動画送信端
末の直後の伝送路に対して要求される帯域幅が膨大なも
のになってしまう。こうしたことから、階層化動画符号
と呼ばれる符号送出方法に従って「階層化された動画ス
トリーム」を送出することによって前述した問題が回避
され、動画送信端末が共通の動画ストリームを重複する
こと無く送出できるようになって、多様な伝送や受信端
末に対応可能となる。
However, in order to distribute the same content to various receiving terminals at once, it is necessary to simultaneously transmit a moving image stream to these receiving terminals in accordance with an encoding parameter optimal for each receiving terminal. Therefore, for example, to simultaneously transmit a video code having a coding rate of 64 kbps per terminal to eight terminals, 64 × 8 = 512.
A transmission capacity of kilo bps is required. That is,
In such a method, as the number of receiving terminals increases, the bandwidth required for the transmission path immediately after the moving image transmitting terminal becomes enormous. For this reason, by transmitting the “layered video stream” according to a code transmission method called a hierarchical video code, the above-described problem is avoided, and the video transmission terminal can transmit the common video stream without duplication. Thus, it becomes possible to support various transmission and receiving terminals.

【0014】ここで言う階層化されたストリーム(以下
「階層ストリーム」という)とは、一本の動画ストリー
ムの中に画質の異なる幾つかのストリームを含めたもの
であって、これら画質の異なるストリームを階層ストリ
ームの中に含め或いは取り出すことができる。例えば、
図5(a)〜図5(c)はいずれも三角形状をした同一
の物体を映した画像であって、解像度の高低に応じて区
別して示したものである。すなわち、同図(a)は高解
像度の階層A画像,同図(b)は中程度の解像度を持っ
た階層B画像,同図(c)は低解像度の階層C画像であ
る。また、図6(a)〜図6(c)は階層ストリームの
構成例を示したものであって、それぞれが上述した階層
A〜階層Cに対応した階層ストリームである。図示した
ように、階層ストリームは、それぞれの階層に必要な動
画符号を一旦分離したのちに、これらを例えばフレーム
単位で一列に繋げるようにしている。
[0014] The layered stream (hereinafter referred to as "hierarchical stream") as used herein includes a single moving picture stream including several streams having different image qualities. Can be included or extracted from the hierarchical stream. For example,
5 (a) to 5 (c) are images showing the same object having a triangular shape, and are distinguished according to the level of the resolution. That is, FIG. 10A is a high-resolution hierarchical A image, FIG. 10B is a hierarchical B image having a medium resolution, and FIG. 10C is a low-resolution hierarchical C image. FIGS. 6A to 6C show configuration examples of the layered streams, each of which is a layered stream corresponding to the layers A to C described above. As shown in the figure, in the hierarchical stream, after moving picture codes necessary for each layer are once separated, they are connected in a line in frame units, for example.

【0015】これらのうち、低解像度の階層Cにあるフ
レーム画像は、図6(c)に示す階層Cストリームの
「階層C符号41」を復号することで直ちに得られる。
一方、中解像度の階層Bストリームは「階層B付加符号
42」と「階層C符号41」が連結されて構成される。
この階層B付加符号42は階層B画像と階層C画像の差
画像を符号化したものである。こうした差画像を用いる
ことによって、画像の多くの部分において両画像間の差
がゼロになって符号量が少なくて済むという利点があ
る。なお、差画像の算出方法は良く知られているが、一
言で説明すれば、対象となっている両画像上で対応して
いる(即ち、同じ位置にある)2つの画素の階調値の差
分を全画素について求めることによって差画像が得られ
る。
Of these, the frame image in the low-resolution layer C is immediately obtained by decoding the “layer C code 41” of the layer C stream shown in FIG.
On the other hand, the middle-resolution layer B stream is formed by connecting the “layer B additional code 42” and the “layer C code 41”.
The layer B additional code 42 is obtained by encoding a difference image between the layer B image and the layer C image. By using such a difference image, there is an advantage that the difference between the two images becomes zero in many parts of the image and the code amount is small. Although the calculation method of the difference image is well known, in a nutshell, the gradation value of two pixels corresponding to (ie, located at the same position on) both images of interest. Is obtained for all pixels to obtain a difference image.

【0016】そして、階層Bのフレーム画像は階層C符
号41および階層B付加符号42を復号することで得ら
れる。すなわち、階層Cを復号した画像に対して階層B
付加符号42を復号して得られる差画像を付加的に加算
合成することで階層Bの画像が得られる。他方、高解像
度の階層Aストリームは「階層A付加符号43」,「階
層B付加符号42」,「階層C符号41」の連結によっ
て構成されている。階層A付加符号43は階層A画像と
階層B画像の差画像を符号化したものであって、階層B
付加符号42と同様に符号量が少なくて済むという利点
がある。階層Aのフレーム画像は階層C符号41,階層
B付加符号42,階層A付加符号43を復号することに
よって得られる。すなわち、階層C符号41および階層
B付加符号42から得られる前述の階層Bのフレーム画
像に対して、階層A付加符号43を復号して得られる差
画像を付加的に加算合成することで階層Aのフレーム画
像が得られる。ちなみに、本明細書では、上述したそれ
ぞれの差画像のもとになる2つの画像のうち、解像度の
低い方の画像(例えば、階層B付加符号42を作成する
際の階層C画像)を「基準画像」と呼ぶことにする。
The frame image of the layer B is obtained by decoding the layer C code 41 and the layer B additional code 42. That is, for the image obtained by decoding the layer C, the layer B
A layer B image is obtained by additionally adding and combining the difference image obtained by decoding the additional code 42. On the other hand, the high-resolution layer A stream is formed by concatenation of “layer A additional code 43”, “layer B additional code 42”, and “layer C code 41”. The layer A additional code 43 encodes the difference image between the layer A image and the layer B image,
As with the additional code 42, there is an advantage that the code amount is small. The frame image of the layer A is obtained by decoding the layer C code 41, the layer B additional code 42, and the layer A additional code 43. That is, a difference image obtained by decoding the layer A additional code 43 is additionally added to the frame image of the layer B obtained from the layer C code 41 and the layer B additional code 42 to synthesize the layer A Is obtained. Incidentally, in the present specification, the image having the lower resolution (for example, the hierarchical C image at the time of creating the hierarchical B additional code 42) among the two images that are the basis of the above-described difference images is referred to as a “standard I will call it an "image."

【0017】ここで、階層の構成方法としてはいま述べ
た空間解像度で分離する方法以外にも、図7に示すよう
に画像をフレームレート(即ち、単位時間当たりのフレ
ーム枚数)で分けて、時間解像度で階層を構成する方法
もある。すなわち、図7(a)に示した高解像度の階層
A画像(#1,#2,#3,……,)から偶数番目のフ
レーム(#2,#4)を除いたものを低解像度の階層B
画像(#1,#3,#5,……,)とする方法である。
視覚上からすると、階層A画像は映っている物体の動き
が滑らかに見えるのに対して、階層B画像はちょうどコ
マ送りをしたときのように物体の動きがぎこちなく見え
ることになる。
Here, as a method of forming a hierarchy, in addition to the method of separating at the spatial resolution described above, as shown in FIG. 7, images are divided by a frame rate (that is, the number of frames per unit time), There is also a method of forming a hierarchy by resolution. That is, the high-resolution hierarchical A images (# 1, # 2, # 3,...) Shown in FIG. Tier B
This is a method of forming images (# 1, # 3, # 5,...).
From a visual point of view, the layer A image looks smooth in the movement of the reflected object, whereas the layer B image looks like the movement of the object is awkward, just as in frame advance.

【0018】このほか、図7(b)に示した階層B画像
を基準として偶数番目のフレームの符号を階層A付加符
号とする方法や、偶数番目のフレームとその直前にある
奇数番目のフレームの差画像の符号を階層A付加符号と
する方法などもある。これらのうちの後者の方法は、前
述した動画符号化方式の国際標準では「フレーム間予測
符号化」と呼ばれている。そして、この方法で符号化さ
れたフレームを「Pフレーム」,他のフレームを参照し
ないで符号化されたフレームを「Iフレーム」,直前だ
けでなく前後のフレームから予測残差を求めて符号化さ
れたフレームを「Bフレーム」と呼んでおり、これら
P,I,Bフレームを用いることで階層を構成すること
が可能である。例えば、フレームの順序が「IBBPB
BPBB,IBBPBBPBB,……,」といった繰り
返しになっている場合、Iフレームのみで階層Cを構成
し、Iフレーム及びPフレームで階層Bを構成し、I,
P,Bの全てのフレームで階層Aを構成することにな
る。
In addition, a method of setting even-numbered frame codes based on the hierarchical B image shown in FIG. 7B as a hierarchical A additional code, or a method of coding even-numbered frames and odd-numbered frames immediately before them. There is also a method of setting the code of the difference image as a layer A additional code. The latter of these methods is called “inter-frame predictive coding” in the international standard for the moving picture coding method described above. Then, a frame coded by this method is referred to as a “P frame”, a frame coded without referring to other frames is referred to as an “I frame”, and a prediction residual is obtained not only from the immediately preceding frame but also from the preceding and succeeding frames. The resulting frame is called a “B frame”, and a hierarchy can be formed by using these P, I, and B frames. For example, if the frame order is "IBBPB
, BPBB, IBBPBBPBB,..., ", The layer C is composed only of I frames, and the layer B is composed of I frames and P frames.
All frames P and B constitute the hierarchy A.

【0019】以上の他にも次に述べるような階層の構成
方法が考えられる。すなわち、前述した国際標準で用い
られているDCT係数は最低次数から最高次数まで64
個の係数で構成されていることから、例えば最低次数か
ら或る中間の次数までの係数のみを用い,かつ,それ以
上の次数の係数を全てゼロにして逆DCT変換で画像を
復号するようにすれば、解像度の比較的低い画像が得ら
れることになる。このことを利用して、最低次数の係数
のみから得られる画像で階層Cを構成し、最低次数〜或
る中間の次数までの係数で階層Bを構成し、最低次数〜
最高次数までの全ての係数で階層Aを構成するようなこ
とが可能となる。
In addition to the above, the following hierarchical configuration method can be considered. That is, the DCT coefficients used in the above-mentioned international standard are 64 from the lowest order to the highest order.
Since it is composed of a number of coefficients, for example, only the coefficients from the lowest order to a certain intermediate order are used, and the coefficients of the higher orders are all set to zero to decode the image by inverse DCT transform. Then, an image having a relatively low resolution can be obtained. Utilizing this, the layer C is composed of images obtained from only the coefficients of the lowest order, and the layer B is composed of coefficients from the lowest order to a certain intermediate order.
It is possible to configure the hierarchy A with all coefficients up to the highest order.

【0020】以上詳述したような階層ストリームを実現
するには、ネットワーク上に設置された交換機や集線機
器等に階層ストリームを中継するための中継機能を実装
しておくようにすれば良い。そして、ネットワーク上の
トラフィックが増大した場合、この中継機能は、送られ
てくる階層ストリームの中から混雑の程度に見合う転送
可能な符号化レートの階層ストリームを取り出し、階層
数が減らされた階層ストリームを再構成してから送り先
へ転送するようにする。このほか、送出すべき経路が複
数存在するような場合には、各経路とそれら各経路につ
ながる端末に応じて階層ストリームの階層数を減らして
から各経路へ転送するようにする。こうした機能を持つ
交換機や集線機器を本明細書では「階層動画中継装置」
と呼ぶことにする。以上のように、多様な受信経路およ
び受信端末に対応させて様々な階層動画符号化方式が用
いられる。
In order to realize the hierarchical stream as described in detail above, a relay function for relaying the hierarchical stream may be mounted on an exchange or a line concentrator installed on the network. When the traffic on the network increases, this relay function extracts a hierarchical stream having a transferable coding rate corresponding to the degree of congestion from the transmitted hierarchical streams and reduces the number of hierarchical streams. Is reconfigured before forwarding to the destination. In addition, when there are a plurality of routes to be transmitted, the number of hierarchical streams in the hierarchical stream is reduced according to each route and the terminal connected to each route, and then the stream is transferred to each route. In the present specification, an exchange or a line concentrator having such a function is referred to as a “hierarchical video relay device”.
I will call it. As described above, various hierarchical video coding schemes are used corresponding to various reception paths and reception terminals.

【0021】次に、図4に示した従来の動画評価装置を
用いて階層ストリームの画質を評価する際の手順につ
き、図8に示すフローチャートに沿って説明を行う。こ
こでは、図8に示したように、階層A,階層B,階層C
の3つの階層を持つ動画ストリームの画質を解像度の高
い階層から低い階層に向かって順に評価してゆく場合を
例に挙げて説明する。まず、動画符号送信部10は動画
符号受信部30に対して階層A動画符号を送信する(ス
テップS1)。この階層A動画符号は動画評価部100
に入力されて復号部101に供給され、復号部101は
階層Aの動画を復号し、評価部102は復号された動画
の画質評価値を算出する(ステップS2)。同様にし
て、動画符号送信部10が動画符号受信部30に階層B
動画符号を送信する(ステップS3)と、復号部101
はこの階層B動画符号から階層Bの動画を復号して評価
部102がこの動画の画質評価値を算出する(ステップ
S4)。さらに、動画符号送信部10が動画符号受信部
30に階層C動画符号を送信する(ステップS5)と、
復号部101はこれから階層Cの動画を復号して評価部
102がこの動画の画質評価値を算出する(ステップS
6)。この後、動画評価部100は階層A〜階層Cの各
階層における画質評価値を総合評価してその結果を動画
符号送信部10にフィードバックする(ステップS
7)。
Next, a procedure for evaluating the image quality of a hierarchical stream using the conventional moving picture evaluation apparatus shown in FIG. 4 will be described with reference to a flowchart shown in FIG. Here, as shown in FIG. 8, layer A, layer B, layer C
The following describes an example in which the image quality of a moving image stream having three layers is evaluated in order from the layer having the highest resolution to the layer having the lowest resolution. First, the moving image code transmitting unit 10 transmits the hierarchical A moving image code to the moving image code receiving unit 30 (Step S1). This layer A moving image code is a moving image evaluation unit 100
Is supplied to the decoding unit 101, and the decoding unit 101 decodes the moving image of the layer A, and the evaluation unit 102 calculates the image quality evaluation value of the decoded moving image (step S2). Similarly, the moving image code transmitting unit 10 sends the moving image code
When the moving image code is transmitted (step S3), the decoding unit 101
Decodes the moving image of the layer B from the layer B moving image code, and the evaluation unit 102 calculates the image quality evaluation value of the moving image (step S4). Further, when the moving image code transmitting unit 10 transmits the hierarchical C moving image code to the moving image code receiving unit 30 (Step S5),
The decoding unit 101 decodes the moving image of the layer C from now on, and the evaluation unit 102 calculates the image quality evaluation value of this moving image (step S
6). Thereafter, the moving image evaluation unit 100 comprehensively evaluates the image quality evaluation values in each of the layers A to C and feeds back the result to the moving image code transmission unit 10 (step S).
7).

【0022】[0022]

【発明が解決しようとする課題】このように、従来の動
画評価装置では、全ての階層の動画符号を評価するため
には、それぞれの階層について動画ストリームを送信し
てこれを復号したのちに画質評価値を算出するという処
理を繰り返し行う必要がある。つまり、評価対象となる
階層数が多くなるにつれて、各階層の動画符号の符号化
処理,伝送路20を使った通信処理,送信された動画符
号の復号化処理といった一連の処理手順を多数回にわた
って実施しなければならない。こうしたことから、ネッ
トワークに負担がかかるのに加えて、動画符号送信部1
0,動画評価部100でそれぞれ符号化処理,復号処理
を多数回行わねばならないという負担が生じてくる。
As described above, in the conventional moving image evaluation apparatus, in order to evaluate moving image codes of all layers, a moving image stream is transmitted for each layer, and after decoding this, the image quality is reduced. It is necessary to repeat the process of calculating the evaluation value. In other words, as the number of hierarchies to be evaluated increases, a series of processing procedures such as encoding processing of a moving image code of each layer, communication processing using the transmission path 20, and decoding processing of a transmitted moving image code are performed many times. Must be implemented. For this reason, a load is imposed on the network, and in addition, the moving image code transmitting unit 1
0, there is a burden that the encoding process and the decoding process must be performed many times in the moving image evaluation unit 100, respectively.

【0023】また、前述したMPEG−4を動画評価装
置へ適用するとさらに処理が複雑になるという問題もあ
る。すなわち、MPEG−4は各画面をその中に存在す
る物体や背景などに分割し、それらの個々について符号
化・復号処理を行う方式である。なお、これらの物体や
背景等をそれぞれ「ビデオオブジェクト」と呼んでい
る。いま例えば動画として人物,四角形の物体,背景と
いう3つのビデオオブジェクトが合成されて映っている
映像を想定し、背景の前に人物と四角形の物体が配置さ
れているものとする。ここで、人物は例えば無地の背景
で撮像したディジタル動画像から背景部分を削除した合
成ディジタル画像,四角形の物体は例えばコンピュータ
グラフィクスを使って実在しない箱の映像を生成した合
成ディジタル画像,背景は例えばビデオカメラを用いて
予め別の場所で撮像しておいた風景の遠景映像などが考
えられる。いま仮に四角形の物体をビデオオブジェクト
#0,人物をビデオオブジェクト#1,背景をビデオオ
ブジェクト#2とすると、これらビデオオブジェクトは
それぞれ別々の符号化パラメータや符号化モードが設定
され、個別に階層符号化されて送信側から受信側へと送
信される。そして、受信側では受信された動画符号につ
いてビデオオブジェクト毎に復号処理を行うことで、背
景の前に人物と四角形の物体が配置された合成画像が得
られる。
Further, when the above-described MPEG-4 is applied to a moving picture evaluation apparatus, there is a problem that the processing is further complicated. That is, MPEG-4 is a system in which each screen is divided into objects, backgrounds, and the like existing therein, and encoding and decoding processes are performed on each of them. Note that these objects, backgrounds, and the like are each called a “video object”. For example, it is assumed that a moving image is a video in which three video objects of a person, a square object, and a background are combined and reflected, and a person and a square object are arranged in front of the background. Here, a person is, for example, a composite digital image obtained by removing a background portion from a digital moving image captured with a plain background, a square object is a composite digital image that generates a non-existent box image using computer graphics, and a background is, for example, a composite digital image. For example, a distant view image of a landscape that has been captured in another place using a video camera can be considered. Now, assuming that a rectangular object is a video object # 0, a person is a video object # 1, and a background is a video object # 2, these video objects are respectively set with different coding parameters and coding modes, and are individually hierarchically coded. The data is transmitted from the transmitting side to the receiving side. Then, the receiving side performs a decoding process on the received moving image code for each video object, thereby obtaining a composite image in which a person and a rectangular object are arranged in front of the background.

【0024】ところが、従来の動画評価装置を用いなが
ら、符号化や階層符号化の行われる多様な動画符号をビ
デオオブジェクト毎に評価しようとすると、各ビデオオ
ブジェクトの持つ階層数分だけビデオオブジェクト毎に
動画ストリームを送信して画質評価値を算出する必要が
生じる。そのため、前述したのと同様の問題が発生し
て、ネットワークにかかる負担や符号化・復号処理に要
する負担がますます増大してしまうことになる。このほ
か、上述した階層動画中継装置を用いる場合、この階層
動画中継装置が階層ストリームの階層数を減らして特定
の伝送路や受信端末に階層ストリームを送出したとき
に、これら伝送路や受信端末に送られる動画の画質がど
のように変化しあるいは維持されるのかを把握しておく
ことが有用であると考えられる。
However, when various moving image codes subjected to encoding and hierarchical coding are to be evaluated for each video object using the conventional moving image evaluation apparatus, the number of layers for each video object is equal to the number of layers of each video object. It becomes necessary to transmit the moving image stream and calculate the image quality evaluation value. For this reason, the same problem as described above occurs, and the load on the network and the load required for the encoding / decoding processing are further increased. In addition, when the above-described hierarchical moving image relay device is used, when the hierarchical moving image relay device transmits the hierarchical stream to a specific transmission path or a receiving terminal by reducing the number of layers of the hierarchical stream, the transmission path or the receiving terminal It may be useful to know how the image quality of the sent moving image changes or is maintained.

【0025】本発明は上述した事情に鑑みてなされたも
のであり、その目的は、複数の階層や複数のビデオオブ
ジェクトで構成される動画を評価するのに要する負担を
軽減できる階層動画評価装置を提供することにある。ま
た、本発明の他の目的は、階層動画中継装置によって階
層数の減らされた階層ストリームが伝送路や受信端末に
送出された場合に、送出された動画の画質がどのように
変化しあるいは維持されているかを評価するための階層
動画評価装置を実現することにある。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a hierarchical moving image evaluation apparatus capable of reducing a load required for evaluating a moving image composed of a plurality of layers and a plurality of video objects. To provide. Another object of the present invention is to provide a method for changing or maintaining the image quality of a transmitted moving image when a hierarchical stream whose number of layers has been reduced by the hierarchical moving image relay apparatus is transmitted to a transmission path or a receiving terminal. An object of the present invention is to realize a hierarchical moving image evaluation device for evaluating whether or not a moving image has been evaluated.

【0026】[0026]

【課題を解決するための手段】以上の課題を解決するた
めに、請求項1記載の発明は、画像の解像度に応じて区
分された複数の階層の動画を符号化した階層ストリーム
を評価する階層動画評価装置において、前記階層ストリ
ームを前記階層毎の動画符号に分解する分解手段と、前
記階層毎の動画符号をそれぞれ復号して階層毎の画像を
求める復号手段と、前記階層毎の画像をもとにして各画
像の画質評価値を算出する評価手段とを具備することを
特徴としている。また、請求項2記載の発明は、画像の
解像度に応じて区分された複数の階層の動画を符号化し
た階層ストリームを評価する階層動画評価装置におい
て、前記階層ストリームに含まれる動画符号のうち、最
低解像度の階層の動画符号は該階層の画像を符号化した
動画符号であり、該最低解像度の階層以外の各階層の動
画符号はこれら各階層の画像と、該各階層よりも低い解
像度の階層の画像である基準画像との間の差画像を符号
化して得られる付加符号であって、前記階層ストリーム
を前記階層毎の動画符号に分解する分解手段と、前記階
層毎の動画符号をそれぞれ復号して階層毎の画像を求め
る復号手段と、前記階層毎の画像をもとにして各画像の
画質評価値を算出する評価手段とを具備することを特徴
としている。
In order to solve the above-mentioned problems, the invention according to claim 1 is a layer for evaluating a layer stream obtained by encoding a plurality of layers of moving images divided according to the resolution of an image. In the moving image evaluation device, a decomposing unit that decomposes the hierarchical stream into moving image codes for each layer, a decoding unit that decodes the moving image code for each layer to obtain an image for each layer, and an image for each layer are also provided. And an evaluation means for calculating an image quality evaluation value of each image. The invention according to claim 2 is a hierarchical moving image evaluation device that evaluates a hierarchical stream obtained by encoding moving images of a plurality of layers divided according to the resolution of an image. The moving image code of the lowest resolution layer is a moving image code obtained by encoding the image of the lowest layer. The moving image code of each layer other than the lowest resolution layer includes the image of each layer and the lower layer layer. An additional code obtained by encoding a difference image between the reference image and the reference image, and a decoding unit for decomposing the hierarchical stream into a moving image code for each of the layers, and decoding the moving image code for each of the layers. Decoding means for calculating an image for each layer, and evaluation means for calculating an image quality evaluation value of each image based on the image for each layer.

【0027】また、請求項3記載の発明は、請求項2記
載の発明において、前記復号手段は、前記最低解像度の
階層の動画符号を復号して該階層の画像を求める画像復
号手段と、前記付加符号をそれぞれ復号して前記最低解
像度の階層以外の各階層に対応する差画像を求める付加
符号復号手段と、該付加符号復号手段で復号された差画
像と該差画像のもとになる前記基準画像とに基づいて前
記最低解像度の階層以外の各階層の画像を求める合成手
段とを具備することを特徴としている。また、請求項4
記載の発明は、請求項1〜3の何れかの項記載の発明に
おいて、前記分解手段,前記復号手段,前記評価手段の
組が前記階層ストリームに含まれている動画中のビデオ
オブジェクト毎に設けられ、前記各ビデオオブジェクト
の階層ストリームをそれぞれ前記ビデオオブジェクト毎
に設けられた前記分解手段に与えて、前記ビデオオブジ
ェクト毎に評価を行うことを特徴としている。
According to a third aspect of the present invention, in the second aspect, the decoding means decodes the moving picture code of the lowest resolution hierarchy to obtain an image of the hierarchy, An additional code decoding unit that decodes the additional code to obtain a difference image corresponding to each layer other than the lowest resolution layer, and a difference image decoded by the additional code decoding unit and a source of the difference image. Combining means for obtaining an image of each layer other than the lowest resolution layer based on the reference image. Claim 4
In the invention described in any one of claims 1 to 3, a set of the decomposing means, the decoding means, and the evaluation means is provided for each video object in a moving image included in the hierarchical stream. The hierarchical stream of each video object is provided to the decomposing means provided for each video object, and evaluation is performed for each video object.

【0028】また、請求項5記載の発明は、請求項1〜
4の何れかの項記載の階層動画評価装置と、前記階層ス
トリームを送信する動画符号送信手段と、送信された前
記階層ストリームを伝送路を介して受信する動画符号受
信手段とを具備し、前記動画符号送信手段は、前記階層
動画評価装置の算出する画質評価値に基づいて前記階層
ストリームを符号化して送信することを特徴としてい
る。また、請求項6記載の発明は、請求項5記載の発明
において、前記動画符号送信手段,前記動画符号受信手
段の少なくとも一方は、前記階層ストリームを所定の送
り先に転送可能な階層ストリームへ再構成して前記送り
先へ転送する階層動画中継機能を有しており、中継前後
の階層ストリームをそれぞれ前記階層動画評価装置に出
力し、前記評価手段は、前記階層動画中継機能を有する
前記動画符号送信手段又は前記動画符号受信手段の指示
に従い、入力される前記中継前後の階層ストリームから
それぞれ得られる画像の差画像の画質評価値を算出する
ことを特徴としている。
Further, the invention described in claim 5 is the same as that in claim 1
4. The hierarchical moving image evaluation device according to any one of items 4, a moving image code transmitting unit that transmits the hierarchical stream, and a moving image code receiving unit that receives the transmitted hierarchical stream via a transmission path, The moving image code transmitting means encodes and transmits the hierarchical stream based on an image quality evaluation value calculated by the hierarchical moving image evaluation device. According to a sixth aspect of the present invention, in the invention of the fifth aspect, at least one of the moving picture code transmitting means and the moving picture code receiving means reconfigures the hierarchical stream into a hierarchical stream that can be transferred to a predetermined destination. And has a hierarchical video relay function of transferring to the destination, and outputs the hierarchical streams before and after the relay to the hierarchical video evaluation device, respectively, and the evaluation means includes the video code transmitting means having the hierarchical video relay function. Alternatively, an image quality evaluation value of a difference image of an image obtained from each of the input and output hierarchical streams before and after the relay is calculated according to an instruction of the moving image code receiving unit.

【0029】[0029]

【発明の実施の形態】以下、図面を参照して本発明の各
実施形態について説明する。 〔第1実施形態〕図1は本実施形態による階層動画評価
装置が適用された動画通信装置の構成を示すブロック図
であって、図中、図4に示したものと同じ構成要素につ
いては同一の符号を付してある。また、図2は本実施形
態による評価手順の概要を示したフローチャートであ
る。図1において、動画符号送信部40は伝送路20を
介して動画符号を階層ストリームの形式で動画符号受信
部60へ送信する。動画符号受信部60は動画符号送信
部40から送信される動画符号を受信する。なお、本実
施形態では送信される階層ストリームとして図6(a)
に示す階層Aストリームを想定しているが、階層Bスト
リーム,階層Cストリームなどの他の構成による階層ス
トリームであっても良い。また、本実施形態では、動画
符号送信部40,動画符号受信部60の一方又は双方が
前述した階層動画中継装置の機能を備えていても良い。
また、動画符号送信部40又は動画符号受信部60は、
入力された階層ストリームに種々の変換を施したものを
出力しても良く、また、こうした変換を行わなくても良
い。
Embodiments of the present invention will be described below with reference to the drawings. [First Embodiment] FIG. 1 is a block diagram showing the configuration of a video communication device to which a hierarchical video evaluation device according to the present embodiment is applied. In the drawing, the same components as those shown in FIG. 4 are the same. Are attached. FIG. 2 is a flowchart showing an outline of the evaluation procedure according to the present embodiment. In FIG. 1, a moving image code transmitting unit 40 transmits a moving image code to a moving image code receiving unit 60 via a transmission path 20 in the form of a hierarchical stream. The moving image code receiving unit 60 receives the moving image code transmitted from the moving image code transmitting unit 40. Note that, in the present embodiment, the hierarchical stream to be transmitted is shown in FIG.
Is assumed, but a hierarchical stream having another configuration such as a hierarchical B stream or a hierarchical C stream may be used. In the present embodiment, one or both of the moving image code transmitting unit 40 and the moving image code receiving unit 60 may have the function of the hierarchical moving image relay device described above.
In addition, the moving image code transmitting unit 40 or the moving image code receiving unit 60
A stream obtained by performing various conversions on the input hierarchical stream may be output, or such a conversion may not be performed.

【0030】次に、階層動画評価装置110は階層スト
リームを入力とし、当該階層ストリームの再生表示画像
の画質が原画像からどの程度劣化しているかを各階層に
ついてそれぞれ評価する。なお、階層ストリームを階層
動画評価装置110に入力するための手段としては従来
技術で説明したのと同様な手段が考えられる。すなわ
ち、動画符号受信部60が伝送路20から受信した階層
ストリームを階層動画評価装置110に送信する方法,
伝送路20に図示しない分配器や収集器を設置して階層
動画評価装置110に取り込む方法,動画符号送信部4
0が階層動画評価装置110に直接送信する方法などが
ある。動画符号受信部60を通じて階層動画評価装置1
10に階層ストリームを送信するようにすれば、動画符
号送信部40,伝送路20,動画符号受信部60の全て
を含めた経路について画質評価を行うことになる。一
方、分配器や収集器を設置して階層ストリームを取り込
むようにすれば、当該設置地点までの伝送路を含めた画
質評価を行うことができる。他方、動画符号送信部40
から階層動画評価装置110に階層ストリームを直接送
信するようにすれば、伝送路20や動画符号受信部60
を除外した経路について画質評価を行うことになる。つ
まり伝送路20から先については評価の対象外とするこ
とができる。
Next, the hierarchical moving image evaluation device 110 receives the hierarchical stream as input, and evaluates, for each layer, how much the image quality of the reproduced display image of the hierarchical stream has deteriorated from the original image. As means for inputting the hierarchical stream to the hierarchical moving image evaluation device 110, the same means as described in the related art can be considered. That is, a method in which the video code receiving unit 60 transmits the hierarchical stream received from the transmission path 20 to the hierarchical video evaluation device 110,
A method of installing a distributor or a collector (not shown) on the transmission path 20 and taking it into the hierarchical moving image evaluation device 110;
0 is directly transmitted to the hierarchical moving image evaluation device 110. Hierarchical moving image evaluation device 1 through moving image code receiver 60
If the hierarchical stream is transmitted to 10, the image quality evaluation is performed on the path including all of the moving picture code transmitting unit 40, the transmission path 20, and the moving picture code receiving unit 60. On the other hand, if a distributor or a collector is installed and a hierarchical stream is taken in, image quality evaluation including a transmission path to the installation point can be performed. On the other hand, the moving image code transmitting section 40
If the layer stream is transmitted directly to the layer moving image evaluation device 110 from the
The image quality is evaluated for the route excluding. That is, the portion beyond the transmission path 20 can be excluded from the evaluation.

【0031】次に、階層動画評価装置110において、
階層分解部111は与えられた階層ストリームを階層別
に再構成したのちに、階層毎に設けられた復号部112
a〜112cへ階層別のストリームを送出する。復号部
112a,112b,112cの各々は階層Aストリー
ム,階層Bストリーム,階層Cストリーム(図6を参
照)を入力とし、それら階層ストリームを復号して各階
層の画像を階層毎に設けられた評価部113a〜113
cにそれぞれ出力する。なお、復号部112a〜112
cが入力された階層ストリームに基づいて画像を復号す
るための手順は、図6に係わる従来技術の説明で既に述
べているので、ここでは繰り返して説明することはしな
い。そして、上記評価部113a〜113cは対応する
復号部から入力される画像の画質評価値を算出して動画
符号送信部40にフィードバックする。これら評価部1
13a〜113cは、画質評価値を算出するにあたって
予め階層毎の原画像を取得しておき、この原画像と入力
される階層毎の復号画像との差異から前述したSNR値
を算出している。もっとも、画質評価値としてはSNR
値以外のものであっても良いのは勿論である。
Next, in the hierarchical moving image evaluation device 110,
The layer decomposition unit 111 reconstructs the given layer stream for each layer, and then decodes the decoding unit 112 provided for each layer.
The stream for each layer is transmitted to a to 112c. Each of the decoding units 112a, 112b, and 112c receives the layer A stream, the layer B stream, and the layer C stream (see FIG. 6) as input, decodes these layer streams, and evaluates the image of each layer for each layer. Parts 113a to 113
c. Note that the decoding units 112a to 112
Since the procedure for decoding an image based on the hierarchical stream to which c has been input has already been described in the description of the related art shown in FIG. 6, it will not be repeated here. Then, the evaluation units 113a to 113c calculate the image quality evaluation value of the image input from the corresponding decoding unit, and feed back to the moving image code transmission unit 40. These evaluation units 1
In calculating the image quality evaluation value, 13a to 113c acquire an original image for each layer in advance, and calculate the above-described SNR value from a difference between the original image and a decoded image for each layer input. However, the image quality evaluation value is SNR
Of course, it may be something other than the value.

【0032】次に、上記構成による階層動画評価装置1
10の動作について説明する。先に例示した3通りの手
法などを用いて階層Aストリーム〔図6(a)〕が階層
動画評価装置110に入力されると、階層分解部111
は与えられた階層Aストリームを階層A〜階層Cの各ス
トリームに再構成したのち、復号部112aに階層Aス
トリームを出力し、復号部112bに階層Bストリーム
〔図6(b)〕を出力し、復号部112cに階層Cスト
リーム〔図6(c)〕を出力する。すると、復号部11
2a〜112cはそれぞれ階層Aストリーム〜階層Cス
トリームを復号して階層A〜階層Cの画像を得て、これ
ら画像をそれぞれ対応する評価部113a〜113cに
出力する(以上、図2のステップS11)。評価部11
3a〜113cは上述した評価手順に従って階層A〜階
層Cの画質評価値をそれぞれ算出して動画符号送信部4
0に送信する(同ステップS12)。動画符号送信部4
0は送られてきた3つの画質評価値に基づき、階層動画
評価装置110へ送信すべき階層ストリームの符号化モ
ードや符号化パラメータを適宜選択して、送信すべき階
層ストリームの符号化を行って画質の最適化を図るよう
にする(同ステップS13)。
Next, the hierarchical moving image evaluation apparatus 1 having the above configuration
The operation of No. 10 will be described. When the layer A stream [FIG. 6 (a)] is input to the layer moving image evaluation device 110 using the three methods exemplified above, the layer decomposition section 111
Reconstructs a given layer A stream into layers A to C, outputs a layer A stream to the decoding unit 112a, and outputs a layer B stream (FIG. 6B) to the decoding unit 112b. , And outputs the layer C stream [FIG. 6 (c)] to the decoding unit 112c. Then, the decryption unit 11
2a to 112c respectively decode the layer A stream to the layer C stream to obtain images of the layer A to the layer C, and output these images to the corresponding evaluation units 113a to 113c, respectively (the above, step S11 in FIG. 2). . Evaluation unit 11
3a to 113c calculate the image quality evaluation values of layers A to C in accordance with the above-described evaluation procedure, and
0 (step S12). Video code transmitter 4
0 is based on the three transmitted image quality evaluation values, and appropriately selects an encoding mode and an encoding parameter of the hierarchical stream to be transmitted to the hierarchical moving image evaluation device 110, and encodes the hierarchical stream to be transmitted. The image quality is optimized (step S13).

【0033】以上のように本実施形態では、階層A〜階
層Cの各動画符号が含まれた階層Aストリームを階層動
画評価装置110に送信し、階層動画評価装置110は
入力された階層Aストリームから階層A,階層B,階層
Cの画像をそれぞれ復号して各々の画質を評価したの
ち、得られた画質評価値を動画符号送信部40にフィー
ドバックするようにしている。こうした手順によって、
図8に示した従来の手順に比べて、符号化の回数,送信
回数,復号処理規模などを軽減することが可能となって
いる。
As described above, in the present embodiment, the layer A stream including the moving image codes of layers A to C is transmitted to the layer moving image evaluation device 110, and the layer moving image evaluation device 110 After decoding the images of the layers A, B, and C to evaluate the image quality of each, the obtained image quality evaluation value is fed back to the moving image code transmission unit 40. Through these steps,
Compared with the conventional procedure shown in FIG. 8, the number of times of encoding, the number of times of transmission, the scale of decoding processing, and the like can be reduced.

【0034】ところで、動画符号送信部40又は動画符
号受信部60が階層動画中継装置と同等の機能を有して
いる場合には、階層動画評価装置110を用いることに
よって、こうした階層動画中継機能が画質に与える影響
を評価することが可能となる。例えば、動画符号送信部
40が階層動画中継機能を有しているとした場合、動画
符号送信部40はまず自身に入力された階層ストリーム
をそのまま階層動画評価装置110へ入力する。これに
よって、この階層ストリームに含まれている各階層A〜
階層Cの画像が前述したようにそれぞれ評価部113a
〜113cに供給される。その際、動画符号送信部40
は図示しない経路を使用してこれら評価部113a〜1
13cに対し、供給される画像が中継前の階層ストリー
ムに含まれるものであることを通知する。すると評価部
113a〜113cは復号部112a〜112cから供
給された画像をそれぞれ内部に記憶しておく。
When the moving picture code transmitting section 40 or the moving picture code receiving section 60 has the same function as the hierarchical moving picture relay apparatus, the hierarchical moving picture evaluation function The effect on image quality can be evaluated. For example, assuming that the moving image code transmitting unit 40 has a hierarchical moving image relay function, the moving image code transmitting unit 40 first inputs the hierarchical stream input thereto to the hierarchical moving image evaluation device 110 as it is. Thereby, each layer A to A included in this layer stream
As described above, the images of the hierarchy C are respectively evaluated by the evaluation units 113a.
To 113c. At that time, the moving image code transmitting unit 40
These evaluation units 113a to 113a
13c is notified that the supplied image is included in the hierarchical stream before relay. Then, the evaluation units 113a to 113c store therein the images supplied from the decoding units 112a to 112c, respectively.

【0035】次に、動画符号送信部40は入力された階
層ストリームの階層数を上述したように伝送路等の状況
に応じて減らしたものを階層動画評価装置110に入力
する。これによって、当該階層ストリームに含まれる階
層A〜階層Cの画像がそれぞれ評価部113a〜113
cに供給される。その際、動画符号送信部40は上述し
た図示しない経路を使用してこれら評価部113a〜1
13cに対し、供給される画像が中継後の階層ストリー
ムに含まれるものであることを通知する。そこで評価部
113a〜113cは、原画像と各復号部112a〜1
12cで復号された画像との間の差画像を求める代わり
に、中継前の画像と中継後の画像の間の差画像を求めて
当該差画像について画質評価値をそれぞれ算出し、得ら
れた評価結果を動画符号送信部40にフィードバックす
る。こうして、動画符号送信部40は自身の備えている
階層動画中継機能が画質に与える影響を評価することが
可能となる。
Next, the moving picture code transmitting section 40 inputs the reduced number of layers of the input hierarchical stream according to the conditions of the transmission path and the like as described above to the hierarchical moving picture evaluation device 110. As a result, the images of layers A to C included in the layer stream are evaluated by the evaluation units 113a to 113c, respectively.
c. At this time, the moving picture code transmitting section 40 uses these paths (not shown) to evaluate these evaluation sections 113a to 113a.
13c is notified that the supplied image is included in the relayed hierarchical stream. Therefore, the evaluation units 113a to 113c determine whether the original image and the decoding units 112a to 112a
Instead of calculating a difference image between the image decoded in step 12c and the image before relaying, a difference image between the image before relaying and the image after relaying is calculated, and image quality evaluation values are calculated for the difference images. The result is fed back to the moving image code transmission unit 40. In this way, the moving picture code transmitting section 40 can evaluate the effect of the hierarchical moving picture relay function of the moving picture code transmitting section 40 on the image quality.

【0036】なお、動画符号受信部60が階層動画中継
機能を備える場合も動画符号送信部40の場合と同様の
動作となる。すなわち、動画符号受信部60はまず中継
前の階層ストリームを階層動画評価装置110に入力し
て各階層の画像を評価部113a〜113cに入力して
記憶させておく。次いで、動画符号受信部60は中継後
の階層ストリームを階層動画評価装置110に入力して
各階層の画像を評価部113a〜113cに入力する。
そこで、評価部113a〜113cは中継前後の画像の
差画像から階層別の画質評価値をそれぞれ算出して動画
符号送信部40にフィードバックする。
When the moving picture code receiving section 60 has a hierarchical moving picture relay function, the operation is the same as that of the moving picture code transmitting section 40. That is, the moving picture code receiving unit 60 first inputs the hierarchical stream before relaying to the hierarchical moving picture evaluation device 110, and inputs and stores the images of each layer to the evaluation units 113a to 113c. Next, the moving image code receiving unit 60 inputs the layer stream after the relay to the hierarchical moving image evaluation device 110 and inputs the image of each layer to the evaluation units 113a to 113c.
Therefore, the evaluation units 113 a to 113 c calculate the image quality evaluation value for each layer from the difference image between the images before and after the relay and feed back to the moving image code transmission unit 40.

【0037】〔第2実施形態〕本実施形態は、ネットワ
ークにかかる負担や符号化,復号処理に伴う負担をさら
に軽減させるためのものである。図3は本実施形態によ
る階層動画評価装置が適用された動画通信装置の構成を
示すブロック図であって、図中、図1に示したものと同
じ構成要素については同一の符号を付してある。また、
本実施形態の動作の概要を示すフローチャートは第1実
施形態と同じであって、図2に示した通りである。さ
て、図3において階層動画評価装置110は動画符号送
信部40が送信する階層ストリームに含まれているビデ
オオブジェクト数に相当する個数の階層動画評価部で構
成されている。もっとも、図3ではビデオオブジェクト
#1,#2の階層ストリームが入力される階層動画評価
部110-1,110-2のみを示してある。また、これら
階層動画評価部は図示しないものも含めて全て同一の構
成および機能を有しているため、同図では階層動画評価
部110-1についてのみその詳細な構成を示してある。
なお、階層ストリームを階層動画評価装置110に入力
するための方法は第1実施形態の場合と全く同じものが
使える。
[Second Embodiment] This embodiment is intended to further reduce the load on the network and the load associated with the encoding and decoding processes. FIG. 3 is a block diagram showing a configuration of a moving image communication device to which the hierarchical moving image evaluation device according to the present embodiment is applied. In the drawing, the same components as those shown in FIG. is there. Also,
The flowchart showing the outline of the operation of this embodiment is the same as that of the first embodiment, and is as shown in FIG. Now, in FIG. 3, the hierarchical moving image evaluation device 110 includes a number of hierarchical moving image evaluating units corresponding to the number of video objects included in the hierarchical stream transmitted by the moving image code transmitting unit 40. However, FIG. 3 shows only the hierarchical moving image evaluation units 110-1 and 110-2 to which the hierarchical streams of the video objects # 1 and # 2 are input. Further, since these hierarchical moving image evaluation units all have the same configuration and function including those not shown, only the detailed structure of the hierarchical moving image evaluating unit 110-1 is shown in FIG.
Note that a method for inputting a hierarchical stream to the hierarchical moving image evaluation device 110 can be exactly the same as that in the first embodiment.

【0038】この階層動画評価部110-1において、階
層付加符号分解部114は入力される階層Aストリーム
から階層A付加符号43,階層B付加符号42,階層C
符号〔図6(a)〜(c)を参照〕をそれぞれ抽出して
各々を付加符号復号部115a,付加符号復号部115
b,復号部112cに出力する。一方、付加符号復号部
115aは階層Aストリームから抽出された階層A付加
符号43を復号することで階層A画像と階層B画像の差
画像を求める。また、付加符号復号部115bは階層A
ストリームから抽出された階層B付加符号42を復号す
ることで階層B画像と階層C画像の差画像を求める。他
方、復号部116aは、付加符号復号部115aで復号
された階層A画像と階層B画像の間の差画像と、復号部
116b(後述)から出力される階層B画像を加算合成
することで階層A画像を求めて、この階層A画像を評価
部113aに出力する。同様にして復号部116bは、
付加符号復号部115bで復号された階層B画像と階層
C画像の間の差画像と、復号部112cから出力される
階層C画像を加算合成することで階層B画像を求めて、
この階層B画像を評価部113b及び復号部116aに
出力する。
In the hierarchical moving picture evaluation section 110-1, the hierarchical additional code decomposition section 114 converts the input hierarchical A stream into the hierarchical A additional code 43, the hierarchical B additional code 42, the hierarchical C
Each of the codes (see FIGS. 6A to 6C) is extracted, and the extracted codes are respectively added to the additional code decoder 115a and the additional code decoder 115.
b, output to the decoding unit 112c. On the other hand, the additional code decoding unit 115a obtains a difference image between the hierarchical A image and the hierarchical B image by decoding the hierarchical A additional code 43 extracted from the hierarchical A stream. In addition, the additional code decoding unit 115b
The difference image between the layer B image and the layer C image is obtained by decoding the layer B additional code 42 extracted from the stream. On the other hand, the decoding unit 116a adds and combines the difference image between the layer A image and the layer B image decoded by the additional code decoding unit 115a and the layer B image output from the decoding unit 116b (described later), An A image is obtained, and this hierarchical A image is output to the evaluation unit 113a. Similarly, the decoding unit 116b
A layer B image is obtained by adding and combining the difference image between the layer B image and the layer C image decoded by the additional code decoding unit 115b and the layer C image output from the decoding unit 112c,
This layer B image is output to the evaluation unit 113b and the decoding unit 116a.

【0039】次に、上記構成による階層動画評価装置1
10を用いた評価手順についてその動作を説明する。な
お、本実施形態では各ビデオオブジェクトの階層ストリ
ームとして、第1実施形態と同じく階層Aストリーム
〔図6(a)〕を想定しているが、他の構成による階層
ストリームであっても良い。さて、動画符号送信部40
が複数のビデオオブジェクトから成る動画符号を階層ス
トリームの形式で伝送路20に送信すると、第1実施形
態において例示した方法等を用いてこの階層ストリーム
が階層動画評価装置110に入力される。
Next, the hierarchical moving image evaluation apparatus 1 having the above configuration
The operation of the evaluation procedure using No. 10 will be described. In the present embodiment, a layer A stream (FIG. 6A) is assumed as the layer stream of each video object as in the first embodiment, but a layer stream having another configuration may be used. Now, the moving image code transmitting unit 40
Transmits a moving image code composed of a plurality of video objects to the transmission path 20 in the form of a hierarchical stream, the hierarchical stream is input to the hierarchical moving image evaluation device 110 using the method exemplified in the first embodiment.

【0040】以下では、複数のビデオオブジェクトの階
層ストリームを代表させて、ビデオオブジェクト#1の
階層ストリームが階層動画評価部110-1に入力される
場合を取り上げて説明することにする。まず、階層付加
符号分解部114は入力された階層Aストリームを階層
A〜階層Cの動画符号にそれぞれ分解して、付加符号復
号部115aには階層A付加符号43を出力し、付加符
号復号部115bには階層B付加符号42を出力し、復
号部112cには階層C符号41を出力する。これによ
って、付加符号復号部115aは階層A付加符号43を
復号して得られる階層A画像と階層B画像の差画像を復
号部116aに出力する。また、付加符号復号部115
bは階層B付加符号42を復号して得られる階層B画像
と階層C画像の差画像を復号部116bに出力する。さ
らに、復号部112cは階層C符号41を復号して得ら
れる階層C画像を復号部116b及び評価部113cに
出力する。
In the following, a case where a hierarchical stream of the video object # 1 is input to the hierarchical moving image evaluation unit 110-1 as a representative of a hierarchical stream of a plurality of video objects will be described. First, the layer additional code decomposition unit 114 decomposes the input layer A stream into the moving image codes of layers A to C, and outputs the layer A additional code 43 to the additional code decoding unit 115a. The layer B additional code 42 is output to 115b, and the layer C code 41 is output to the decoding unit 112c. As a result, the additional code decoding unit 115a outputs the difference image between the layer A image and the layer B image obtained by decoding the layer A additional code 43 to the decoding unit 116a. Also, additional code decoding section 115
“b” outputs the difference image between the layer B image and the layer C image obtained by decoding the layer B additional code 42 to the decoding unit 116b. Further, the decoding unit 112c outputs the layer C image obtained by decoding the layer C code 41 to the decoding unit 116b and the evaluation unit 113c.

【0041】こうして階層C画像が供給されると、復号
部116bは付加符号復号部115bから出力される階
層B画像−階層C画像間の差画像と復号部112cから
供給される階層C画像を加算合成して階層B画像を求
め、これを復号部116aおよび評価部113bに出力
する。そして階層B画像が供給されると、復号部116
aは付加符号復号部115aから出力される階層A画像
−階層B画像間の差画像と復号部116bから供給され
る階層B画像を加算合成して階層A画像を求め、これを
評価部113aに出力する。以上によって、階層A画像
〜階層C画像がそれぞれ評価部113a〜113cに入
力されたことになる(以上、図2のステップS11)。
そこで、評価部113a〜113cはそれぞれ階層A画
像〜階層C画像を入力として、第1実施形態と全く同様
に画質評価値を算出してそれぞれ動画符号送信部40に
送信する(同ステップS12)。そして、以上で述べた
動作は例えばビデオオブジェクト#2が階層動画評価部
110-2に入力される場合も全く同様であり、さらに
は、図示しないビデオオブジェクトの階層ストリームが
入力される階層動画評価部についても同様である。こう
して、動画符号送信部40に対して全てのビデオオブジ
ェクトに関する各階層の画質評価値が送信されるので、
動画符号送信部40はこれら画質評価値を総合評価し
て、動画ストリームの持つ符号化モードや符号化パラメ
ータを選択して動画の画質の最適化を図る(同ステップ
S13)。
When the hierarchical C image is supplied in this way, the decoding unit 116b adds the difference image between the hierarchical B image and the hierarchical C image output from the additional code decoding unit 115b and the hierarchical C image supplied from the decoding unit 112c. The images are combined to obtain a layer B image, and this is output to the decoding unit 116a and the evaluation unit 113b. When the layer B image is supplied, the decoding unit 116
a obtains a layer A image by adding and combining the difference image between the layer A image and the layer B image output from the additional code decoding unit 115a and the layer B image supplied from the decoding unit 116b, and sends this to the evaluation unit 113a. Output. As described above, the hierarchy A image to the hierarchy C image are input to the evaluation units 113a to 113c, respectively (the above, step S11 in FIG. 2).
Then, the evaluation units 113a to 113c receive the hierarchy A image to the hierarchy C image, respectively, calculate the image quality evaluation value in exactly the same way as in the first embodiment, and transmit each to the moving image code transmission unit 40 (step S12). The above-described operation is exactly the same when, for example, the video object # 2 is input to the hierarchical moving image evaluation unit 110-2. Further, the hierarchical moving image evaluation unit to which the hierarchical stream of the video object (not shown) is input. The same applies to. In this way, the image quality evaluation value of each layer for all video objects is transmitted to the moving image code transmission unit 40.
The moving picture code transmission unit 40 comprehensively evaluates these image quality evaluation values, and selects a coding mode and a coding parameter of the moving picture stream to optimize the picture quality of the moving picture (step S13).

【0042】以上のように、本実施形態でも第1実施形
態と同じく図2に示した手順に従って画質の評価がなさ
れるため、図8に示した従来の場合に比べて、符号化の
回数,送信回数,復号処理規模などを軽減させることが
可能となる。また、動画符号送信部40又は動画符号受
信部60の何れか又は双方が階層動画中継機能を有して
いる場合には、第1実施形態の場合と同様の手順に従
い、所望の階層動画評価部110-1,110-2,……,
に対して階層ストリームを入力することで、階層動画中
継機能が画質に与える影響をビデオオブジェクト毎に評
価することができるようになる。
As described above, in the present embodiment, the image quality is evaluated according to the procedure shown in FIG. 2 as in the first embodiment. It is possible to reduce the number of transmissions, the decoding processing scale, and the like. When either or both of the moving image code transmitting unit 40 and the moving image code receiving unit 60 have a hierarchical moving image relay function, a desired hierarchical moving image evaluation unit is performed according to the same procedure as in the first embodiment. 110-1,110-2, ...,
By inputting a hierarchical stream, the effect of the hierarchical moving image relay function on the image quality can be evaluated for each video object.

【0043】なお、上述した各実施形態では、階層A〜
階層Cの3階層の場合についてのみ階層動画評価装置の
構成およびその動作を説明したが、本発明が任意の階層
数について適用可能であることは上述した説明から明ら
かである。また、第1実施形態において、第2実施形態
と同様にビデオオブジェクト毎に階層動画評価部を設
け、各階層動画評価部にそれぞれビデオオブジェクト#
1,#2,……,を入力してこれら各ビデオオブジェク
トの画質をそれぞれ評価させるようにしても良い。
In each of the above embodiments, the layers A to
Although the configuration and operation of the hierarchical moving image evaluation apparatus have been described only for the three layers of the layer C, it is clear from the above description that the present invention is applicable to an arbitrary number of layers. In the first embodiment, a hierarchical moving image evaluator is provided for each video object as in the second embodiment.
1, # 2,... May be input to evaluate the image quality of each of these video objects.

【0044】[0044]

【発明の効果】以上説明したように、請求項1記載の発
明では、階層ストリームを階層毎の動画符号に分解し、
これら各動画符号をそれぞれ復号して階層毎の画像を求
めて、これら階層毎の画像の画質評価値を算出してい
る。これにより、階層ストリームの符号化および階層動
画評価装置への送信をそれぞれ一度行うだけで、当該階
層ストリームに含まれている複数の階層の画像の全てに
ついて画質評価を行うことが可能となる。したがって、
従来、階層ストリームに含まれている階層数に相当する
回数分必要であった符号化処理や送信処理に要する負担
が1回分に低減されて、ネットワーク等にかかる負担を
大幅に軽減することができる。
As described above, according to the first aspect of the present invention, a hierarchical stream is decomposed into moving image codes for each layer,
Each of the moving image codes is decoded to obtain an image for each layer, and an image quality evaluation value of the image for each layer is calculated. This makes it possible to perform image quality evaluation on all of the images of a plurality of layers included in the hierarchical stream by encoding the hierarchical stream and transmitting it to the hierarchical moving image evaluation device only once. Therefore,
Conventionally, the load required for the encoding process and the transmission process required for the number of times corresponding to the number of layers included in the layer stream is reduced to one time, and the load on the network and the like can be greatly reduced. .

【0045】また、請求項2又は3記載の発明では、最
低解像度の階層の動画符号だけを画像から直接符号化し
て動画符号とし、それ以外の各階層については当該階層
の画像と当該階層よりも低解像度の階層の基準画像から
得られる差画像を符号化した付加符号を動画符号として
いる。そして、階層ストリームを階層毎の動画符号に分
解してそれらの各々を復号して階層毎の画像を求めて、
これら階層毎の画像の画質評価値を算出している。これ
により、最低解像度以外の各階層については符号量の少
ない付加符号を復号すれば良くなるので、従来のように
階層数に相当する回数だけ各階層の画像全体に対応する
動画符号の復号処理を行っていた場合に比して、復号処
理の負担を軽減することができる。
According to the second or third aspect of the present invention, only the moving picture code of the lowest resolution layer is directly encoded from an image to be a moving picture code. The additional code obtained by encoding the difference image obtained from the reference image of the low resolution hierarchy is a moving image code. Then, the hierarchical stream is decomposed into moving image codes for each layer, and each of them is decoded to obtain an image for each layer,
The image quality evaluation value of the image for each layer is calculated. As a result, for each layer other than the lowest resolution, it is sufficient to decode an additional code having a small code amount. It is possible to reduce the load of the decoding process as compared with the case where it has been performed.

【0046】また、請求項4記載の発明では、階層動画
評価装置を構成する各手段をそれぞれビデオオブジェク
ト毎に設けて、これら各ビデオオブジェクトに関する画
質の評価を独立に行うようにしている。これにより、ビ
デオオブジェクト数に階層数を乗じた回数だけ画質評価
に係わる処理をそれぞれ行っていた従来の手順と比較し
た場合に、符号化回数,通信回数,復号処理規模をそれ
ぞれ軽減することが可能となる。また、請求項5記載の
発明では、動画符号送信手段が階層動画評価装置の算出
する画質評価値に基づいて階層ストリームを符号化して
送信することが可能となるため、動画符号送信手段が階
層ストリームの符号化モードや符号化パラメータ等を適
宜選択することによって、当該動画符号送信手段から送
信される階層ストリームの画質の最適化を図ることがで
きるようになる。また、請求項6記載の発明では、動画
符号送信手段,動画符号受信手段の何れか一方又は双方
に階層ストリームの階層動画中継機能を持たせ、中継前
後の階層ストリームをそれぞれ階層動画評価装置へ出力
するようにしている。そして、階層動画評価装置内の評
価手段は、階層動画中継機能を持つ動画符号送信手段又
は動画符号受信手段の指示に従って、中継前後の階層ス
トリームの差画像の画質評価値を算出している。これに
より、動画符号送信手段や動画符号受信手段の備える階
層動画中継機能が画質に与える影響を評価する仕組みを
提供することが可能となる。
According to the fourth aspect of the present invention, each means constituting the hierarchical moving image evaluation device is provided for each video object, and the image quality of each video object is independently evaluated. This makes it possible to reduce the number of times of encoding, the number of times of communication, and the scale of decoding processing, respectively, when compared with the conventional procedure in which the processing related to image quality evaluation is performed by the number of video objects multiplied by the number of layers. Becomes According to the fifth aspect of the present invention, the moving picture code transmitting means can encode and transmit the hierarchical stream based on the image quality evaluation value calculated by the hierarchical moving picture evaluation device. By appropriately selecting the encoding mode, the encoding parameter, and the like, the image quality of the hierarchical stream transmitted from the moving image code transmission unit can be optimized. According to the sixth aspect of the present invention, one or both of the moving image code transmitting means and the moving image code receiving means have a hierarchical moving image relay function of a hierarchical stream, and output the hierarchical streams before and after the relay to the hierarchical moving image evaluation device. I am trying to do it. Then, the evaluation means in the hierarchical moving image evaluation device calculates the image quality evaluation value of the difference image of the hierarchical stream before and after the relay according to the instruction of the moving image code transmitting means or the moving image code receiving means having the hierarchical moving image relay function. This makes it possible to provide a mechanism for evaluating the effect of the hierarchical moving image relay function of the moving image code transmitting unit and the moving image code receiving unit on the image quality.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の第1実施形態による階層動画評価装
置が適用された動画通信装置の構成を示すブロック図で
ある。
FIG. 1 is a block diagram illustrating a configuration of a moving image communication device to which a hierarchical moving image evaluation device according to a first embodiment of the present invention is applied.

【図2】 本発明の各実施形態による階層動画評価装置
が適用された動画通信装置の動作の概略を示すフローチ
ャートである。
FIG. 2 is a flowchart illustrating an outline of an operation of a moving image communication device to which the hierarchical moving image evaluation device according to each embodiment of the present invention is applied.

【図3】 本発明の第2実施形態による階層動画評価装
置が適用された動画通信装置の構成を示すブロック図で
ある。
FIG. 3 is a block diagram illustrating a configuration of a moving image communication device to which a hierarchical moving image evaluation device according to a second embodiment of the present invention is applied.

【図4】 従来の技術による動画評価装置が適用された
動画通信装置の構成を示すブロック図である。
FIG. 4 is a block diagram showing a configuration of a moving image communication device to which a moving image evaluation device according to a conventional technique is applied.

【図5】 画像の空間解像度に応じて階層を構成する方
法の一例を示した説明図であって、(a)は高解像度の
階層A画像についての説明図,(b)は中程度の解像度
を持つ階層B画像についての説明図,(c)は低解像度
の階層C画像についての説明図である。
5A and 5B are explanatory diagrams showing an example of a method of forming a hierarchy according to the spatial resolution of an image, wherein FIG. 5A is an explanatory diagram of a high-resolution hierarchical A image, and FIG. FIG. 3C is an explanatory diagram of a layer B image having a lower layer, and FIG.

【図6】 階層ストリームの構成を示す説明図であっ
て、(a)〜(c)はそれぞれ図5(a)〜(c)に示
した階層A画像〜階層C画像に対応した階層ストリーム
である。
FIG. 6 is an explanatory diagram showing a configuration of a hierarchical stream, wherein (a) to (c) are hierarchical streams corresponding to the hierarchical A image to the hierarchical C image shown in FIGS. 5 (a) to (c), respectively. is there.

【図7】 画像の時間解像度に応じて階層を構成する方
法の一例を示した説明図であって、(a)は高解像度の
階層A画像についての説明図,(b)は階層A画像より
も低い解像度の階層B画像についての説明図である。
FIGS. 7A and 7B are explanatory diagrams showing an example of a method of forming a hierarchy according to the temporal resolution of an image. FIG. 7A is an explanatory diagram of a high-resolution hierarchical A image, and FIG. FIG. 7 is an explanatory diagram of a hierarchy B image having a lower resolution.

【図8】 従来の技術による動画評価装置が適用された
動画通信装置の動作の概略を示すフローチャートであ
る。
FIG. 8 is a flowchart schematically showing an operation of a moving image communication device to which a moving image evaluation device according to a conventional technique is applied.

【符号の説明】[Explanation of symbols]

20 伝送路 40 動画符号送信部 60 動画符号受信部 110 階層動画評価装置 110-1,110-2 階層動画評価部 111 階層分解部 112a〜112c,116a,116b 復号部 113a〜113c 評価部 114 階層付加符号分解部 115a,115b 付加符号復号部 Reference Signs List 20 transmission path 40 moving image code transmitting unit 60 moving image code receiving unit 110 hierarchical moving image evaluation device 110-1, 110-2 hierarchical moving image evaluating unit 111 layer decomposing unit 112a to 112c, 116a, 116b decoding unit 113a to 113c evaluating unit 114 additional layer Code decomposition section 115a, 115b additional code decoding section

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 画像の解像度に応じて区分された複数の
階層の動画を符号化した階層ストリームを評価する階層
動画評価装置において、 前記階層ストリームを前記階層毎の動画符号に分解する
分解手段と、 前記階層毎の動画符号をそれぞれ復号して階層毎の画像
を求める復号手段と、 前記階層毎の画像をもとにして各画像の画質評価値を算
出する評価手段とを具備することを特徴とする階層動画
評価装置。
1. A hierarchical moving image evaluation device that evaluates a hierarchical stream obtained by encoding moving images of a plurality of layers divided according to the resolution of an image, comprising: a decomposing unit that decomposes the hierarchical stream into moving image codes for each layer; A decoding unit that decodes the moving image code for each layer to obtain an image for each layer; and an evaluation unit that calculates an image quality evaluation value of each image based on the image for each layer. Hierarchical video evaluation device.
【請求項2】 画像の解像度に応じて区分された複数の
階層の動画を符号化した階層ストリームを評価する階層
動画評価装置において、 前記階層ストリームに含まれる動画符号のうち、最低解
像度の階層の動画符号は該階層の画像を符号化した動画
符号であり、該最低解像度の階層以外の各階層の動画符
号はこれら各階層の画像と、該各階層よりも低い解像度
の階層の画像である基準画像との間の差画像を符号化し
て得られる付加符号であって、 前記階層ストリームを前記階層毎の動画符号に分解する
分解手段と、 前記階層毎の動画符号をそれぞれ復号して階層毎の画像
を求める復号手段と、 前記階層毎の画像をもとにして各画像の画質評価値を算
出する評価手段と を具備することを特徴とする階層動画評価装置。
2. A hierarchical moving image evaluation device that evaluates a hierarchical stream obtained by encoding moving images of a plurality of layers divided according to the resolution of an image, comprising: The moving image code is a moving image code obtained by encoding the image of the layer, and the moving image code of each layer other than the lowest resolution layer is an image of each layer and an image of a layer having a lower resolution than each layer. An additional code obtained by encoding a difference image between the image and the image, and a decomposing unit that decomposes the hierarchical stream into a moving image code for each layer; A hierarchical moving image evaluation device, comprising: decoding means for obtaining an image; and evaluation means for calculating an image quality evaluation value of each image based on the image for each layer.
【請求項3】 前記復号手段は、 前記最低解像度の階層の動画符号を復号して該階層の画
像を求める画像復号手段と、 前記付加符号をそれぞれ復号して前記最低解像度の階層
以外の各階層に対応する差画像を求める付加符号復号手
段と、 該付加符号復号手段で復号された差画像と該差画像のも
とになる前記基準画像とに基づいて前記最低解像度の階
層以外の各階層の画像を求める合成手段とを具備するこ
とを特徴とする請求項2記載の階層動画評価装置。
3. The decoding means comprises: an image decoding means for decoding the moving image code of the lowest resolution hierarchy to obtain an image of the hierarchy; and each hierarchy other than the lowest resolution hierarchy by decoding the additional code. Additional code decoding means for obtaining a difference image corresponding to the difference image decoded by the additional code decoding means and the reference image based on which the difference image is based. 3. The hierarchical moving image evaluation device according to claim 2, further comprising a synthesizing unit for obtaining an image.
【請求項4】 前記分解手段,前記復号手段,前記評価
手段の組が前記階層ストリームに含まれている動画中の
ビデオオブジェクト毎に設けられ、 前記各ビデオオブジェクトの階層ストリームをそれぞれ
前記ビデオオブジェクト毎に設けられた前記分解手段に
与えて、前記ビデオオブジェクト毎に評価を行うことを
特徴とする請求項1〜3の何れかの項記載の階層動画評
価装置。
4. A set of the decomposing means, the decoding means, and the evaluating means is provided for each video object in a moving image included in the hierarchical stream, and a hierarchical stream of each video object is provided for each video object. The hierarchical moving image evaluation device according to any one of claims 1 to 3, wherein the evaluation is performed for each of the video objects by giving the evaluation result to the disassembly means provided in (1).
【請求項5】 請求項1〜4の何れかの項記載の階層動
画評価装置と、 前記階層ストリームを送信する動画符号送信手段と、 送信された前記階層ストリームを伝送路を介して受信す
る動画符号受信手段とを具備し、 前記動画符号送信手段は、前記階層動画評価装置の算出
する画質評価値に基づいて前記階層ストリームを符号化
して送信することを特徴とする動画通信装置。
5. The hierarchical moving image evaluation device according to claim 1, a moving image code transmitting unit that transmits the hierarchical stream, and a moving image that receives the transmitted hierarchical stream via a transmission path. A moving image communication device, comprising: a code receiving unit; and the moving image code transmitting unit encodes and transmits the hierarchical stream based on an image quality evaluation value calculated by the hierarchical moving image evaluation device.
【請求項6】 前記動画符号送信手段,前記動画符号受
信手段の少なくとも一方は、前記階層ストリームを所定
の送り先に転送可能な階層ストリームへ再構成して前記
送り先へ転送する階層動画中継機能を有しており、中継
前後の階層ストリームをそれぞれ前記階層動画評価装置
に出力し、 前記評価手段は、前記階層動画中継機能を有する前記動
画符号送信手段又は前記動画符号受信手段の指示に従
い、入力される前記中継前後の階層ストリームからそれ
ぞれ得られる画像の差画像の画質評価値を算出すること
を特徴とする請求項5記載の動画通信装置。
6. At least one of the moving picture code transmitting means and the moving picture code receiving means has a hierarchical moving picture relay function of reconstructing the hierarchical stream into a hierarchical stream that can be transferred to a predetermined destination and transferring the hierarchical stream to the destination. The hierarchical stream before and after the relay is output to the hierarchical video evaluation device, respectively, and the evaluation unit is input according to an instruction of the video code transmission unit or the video code reception unit having the hierarchical video relay function. The moving image communication apparatus according to claim 5, wherein an image quality evaluation value of a difference image of an image obtained from each of the hierarchical streams before and after the relay is calculated.
JP33476698A 1998-11-25 1998-11-25 Hierarchical moving picture evaluation device and moving picture communication system Pending JP2000165857A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33476698A JP2000165857A (en) 1998-11-25 1998-11-25 Hierarchical moving picture evaluation device and moving picture communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33476698A JP2000165857A (en) 1998-11-25 1998-11-25 Hierarchical moving picture evaluation device and moving picture communication system

Publications (1)

Publication Number Publication Date
JP2000165857A true JP2000165857A (en) 2000-06-16

Family

ID=18281001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33476698A Pending JP2000165857A (en) 1998-11-25 1998-11-25 Hierarchical moving picture evaluation device and moving picture communication system

Country Status (1)

Country Link
JP (1) JP2000165857A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008028707A (en) * 2006-07-21 2008-02-07 Sony Corp Picture quality evaluating device, encoding device, and picture quality evaluating method
JP2008147797A (en) * 2006-12-07 2008-06-26 Nippon Telegr & Teleph Corp <Ntt> Subjective quality estimation formula derivation method, video parameter determination method, subjective quality estimation formula derivation apparatus, video parameter determination apparatus, subjective quality estimation formula derivation program, video parameter determination program, and computer-readable recording medium recording these programs
JP2009533008A (en) * 2006-04-05 2009-09-10 クゥアルコム・インコーポレイテッド Temporal quality metrics for video coding.
JP2014229931A (en) * 2013-05-17 2014-12-08 日本電信電話株式会社 Video quality evaluation apparatus, video quality evaluation method and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009533008A (en) * 2006-04-05 2009-09-10 クゥアルコム・インコーポレイテッド Temporal quality metrics for video coding.
US9025673B2 (en) 2006-04-05 2015-05-05 Qualcomm Incorporated Temporal quality metric for video coding
JP2008028707A (en) * 2006-07-21 2008-02-07 Sony Corp Picture quality evaluating device, encoding device, and picture quality evaluating method
JP2008147797A (en) * 2006-12-07 2008-06-26 Nippon Telegr & Teleph Corp <Ntt> Subjective quality estimation formula derivation method, video parameter determination method, subjective quality estimation formula derivation apparatus, video parameter determination apparatus, subjective quality estimation formula derivation program, video parameter determination program, and computer-readable recording medium recording these programs
JP2014229931A (en) * 2013-05-17 2014-12-08 日本電信電話株式会社 Video quality evaluation apparatus, video quality evaluation method and program

Similar Documents

Publication Publication Date Title
US5847760A (en) Method for managing video broadcast
KR100954816B1 (en) Method for coding video and video signals, apparatus and computer readable recording medium for coding video, and method, apparatus and computer readable recording medium for decoding base layer data-stream and enhancement layer data-stream
US6526099B1 (en) Transcoder
US5623312A (en) Compressed-domain bit rate reduction system
US7289674B2 (en) Spatial prediction based intra coding
US6091777A (en) Continuously adaptive digital video compression system and method for a web streamer
EP0644695A2 (en) Spatially scalable video encoding and decoding
EP1313326A2 (en) Video encoder, video decoder, video processor and methods thereof
US20030231795A1 (en) Spatial prediction based intra-coding
KR100952185B1 (en) System and method for fractional multi-description channel coding of video without drift using forward error correction code
US6188730B1 (en) Highly programmable chrominance filter for 4:2:2 to 4:2:0 conversion during MPEG2 video encoding
JP2007507927A (en) System and method combining advanced data partitioning and efficient space-time-SNR scalability video coding and streaming fine granularity scalability
NZ284127A (en) Video signal decoder: motion vectors bypass decoding and encoding stages to avoid their recalculation
US5691767A (en) Video conferencing system with high resolution still image capability
JPH06253339A (en) First encoder for encoding first digital signal, second encoder for encoding second digital signal, and coded digital signal decoding system comprising at least one decoder, and encoder and decoder for using in the system
JPH07298258A (en) Image encoding / decoding method
WO2003101116A1 (en) Improved efficiency fgst framework employing higher quality reference frames
WO1999057910A1 (en) A method for transmitting video images, a data transmission system and a multimedia terminal
US6040875A (en) Method to compensate for a fade in a digital video input sequence
JP2000165857A (en) Hierarchical moving picture evaluation device and moving picture communication system
JPH0937260A (en) Moving picture coding apparatus and moving picture decoding apparatus
US20080008241A1 (en) Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer
US20070242747A1 (en) Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer
US20070223573A1 (en) Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer
US20070280354A1 (en) Method and apparatus for encoding/decoding a first frame sequence layer based on a second frame sequence layer

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050104