KR101007381B1 - Image Coding Device Considering Region of Interest - Google Patents
Image Coding Device Considering Region of Interest Download PDFInfo
- Publication number
- KR101007381B1 KR101007381B1 KR1020080097478A KR20080097478A KR101007381B1 KR 101007381 B1 KR101007381 B1 KR 101007381B1 KR 1020080097478 A KR1020080097478 A KR 1020080097478A KR 20080097478 A KR20080097478 A KR 20080097478A KR 101007381 B1 KR101007381 B1 KR 101007381B1
- Authority
- KR
- South Korea
- Prior art keywords
- region
- value
- quantization step
- interest
- macroblock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
관심 영역을 고려한 영상 부호화 장치가 개시(disclose)된다. 이 영상 부호화 장치는 영상 프레임으로부터, 적어도 하나의 관심 영역 - 하나의 매크로 블록 또는 복수의 인접한 매크로 블록들을 포함함 - 및 나머지 영역을 검출하는 검출부; 상기 적어도 하나의 관심 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균이 상기 나머지 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균보다 작도록, 상기 영상 프레임에 포함된 매크로 블록들 각각의 양자화 스텝 사이즈를 결정하는 결정부; 및 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화하는 양자화부를 포함한다. 따라서, 시각적 화질의 저하 없이 압축률을 향상시킬 수 있다.An image encoding apparatus considering a region of interest is disclosed. The apparatus for encoding an image comprises: a detector for detecting at least one region of interest, including one macroblock or a plurality of adjacent macroblocks, and a remaining region from an image frame; A determination for determining a quantization step size of each of the macroblocks included in the image frame such that an average of quantization step sizes to be used for quantization of the at least one region of interest is smaller than an average of quantization step sizes to be used for quantization of the remaining areas. part; And a quantizer for quantizing transform coefficients of each of the macroblocks according to the determined quantization step size. Therefore, the compression ratio can be improved without deteriorating the visual quality.
Description
본 발명은 영상 부호화 장치 및 방법에 관한 것이다.The present invention relates to a video encoding apparatus and method.
멀티미디어 통신에 따르면, 다양한 종류의 데이터들이 송수신되는데, 그 중에서 비디오 데이터는 어떤 종류의 데이터 보다 훨씬 높은 전송률을 요구한다. 이러한 요구에 부응하여 다양한 영상 압축 알고리즘이 제안되었고, 그 결과, 최근의 영상 압축 알고리즘인 H.264/AVC, H.264/SVC 등은 이전의 영상 압축 표준에 비해, 압축률, 화질 등의 종합적인 면에서 월등한 성능을 갖게 되었다.According to multimedia communication, various kinds of data are transmitted and received, among which video data requires much higher data rates than any kind of data. In response to these demands, various image compression algorithms have been proposed. As a result, H.264 / AVC, H.264 / SVC, etc., which are recent image compression algorithms, have compared to the previous image compression standards. In terms of performance.
이러한 영상 압축 기술의 발전에도 불구하고, 영상이 점차 고화질로 됨에 따라, 시각적 화질을 유지하면서 압축률을 향상시킬 수 있는 영상 부호화 알고리즘이 지속적으로 요구되고 있다.Despite the development of such image compression technology, as an image becomes increasingly high quality, there is a continuous demand for an image encoding algorithm capable of improving the compression ratio while maintaining visual quality.
이러한 요구에 부응하여, 인간의 시각적 특성을 이용하여 압축률 또는 화질을 향상시키기 위한 노력들이 있어 왔으나, 기존의 기술들은 추가적인 리던던시(redundancy)를 수반하기 때문에 추가적인 압축률 개선이 가능한 상황이다.In response to these demands, efforts have been made to improve the compression rate or the image quality by using the human visual characteristics. However, since the existing technologies involve additional redundancy, further compression rate improvement is possible.
본 발명이 이루고자 하는 기술적 과제는 시각적 화질의 저하 없이 압축률을 향상시킬 수 있도록 하는 영상 부호화 장치, 영상 부호화 방법, 및 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 데 있다.SUMMARY OF THE INVENTION The present invention has been made in an effort to provide an image encoding apparatus, an image encoding method, and a computer-readable recording medium capable of improving a compression ratio without degrading visual quality.
상기의 기술적 과제를 이루기 위해 본 발명의 제1 측면은 영상 프레임으로부터, 적어도 하나의 관심 영역(Region of Interest : ROI) - 하나의 매크로 블록 또는 복수의 인접한 매크로 블록들을 포함함 - 및 나머지 영역을 검출하는 검출부; 상기 적어도 하나의 관심 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균이 상기 나머지 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균보다 작도록, 상기 영상 프레임에 포함된 매크로 블록들 각각의 양자화 스텝 사이즈를 결정하는 결정부; 및 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화하는 양자화부를 포함하는 영상 부호화 장치를 제공한다.In order to achieve the above technical problem, a first aspect of the present invention provides a method for detecting at least one Region of Interest (ROI) including one macroblock or a plurality of adjacent macroblocks from an image frame and a remaining region. A detection unit; A determination for determining a quantization step size of each of the macroblocks included in the image frame such that an average of quantization step sizes to be used for quantization of the at least one region of interest is smaller than an average of quantization step sizes to be used for quantization of the remaining areas. part; And a quantization unit configured to quantize transform coefficients of each of the macroblocks according to the determined quantization step size.
바람직하게, 상기 적어도 하나의 관심 영역은, 상기 영상 프레임으로부터 추출되는 적어도 하나의 오브젝트 중에서, 소정 임계치 이상의 움직임 크기를 가진 적어도 하나의 오브젝트이다.Preferably, the at least one ROI is at least one object having a motion size greater than or equal to a predetermined threshold among at least one object extracted from the image frame.
바람직하게, 상기 검출부는, 스테레오 영상으로부터 획득되는 깊이 지도(depth map)를 이용하여, 상기 영상 프레임으로부터 상기 적어도 하나의 오브젝트를 추출한다. 바람직하게, 상기 검출부는, 상기 추출되는 적어도 하나의 오브젝트 각각에 대해 해당 움직임 벡터들의 평균 크기 값을 산출하고, 상기 적어도 하나 의 관심 영역은, 상기 소정 임계치 이상의 평균 크기 값을 가진 적어도 하나의 오브젝트이다.Preferably, the detection unit extracts the at least one object from the image frame by using a depth map obtained from a stereo image. Preferably, the detector calculates an average magnitude value of corresponding motion vectors for each of the at least one extracted object, and the at least one ROI is at least one object having an average magnitude value of more than the predetermined threshold. .
바람직하게, 상기 검출부는, 상기 영상 프레임으로부터, 경계 블록에 속하고 소정 임계치 이상의 움직임 크기 값을 가진 매크로 블록들을 추출하고, 상기 추출된 매크로 블록들을 그룹화하여 움직임의 크기 및 방향 면에서 서로 유사한 매크로 블록들을 포함하는 적어도 하나의 그룹을 생성하고, 상기 생성된 그룹마다 그룹원들을 포함하는 컨벡스 헐(convex hull)을 생성하고, 상기 적어도 하나의 관심 영역은 상기 생성된 적어도 하나의 컨벡스 헐의 내부 영역이다. 바람직하게, 상기 검출부는, 서브블록 단위로 움직임 보상이 이루어지는 매크로 블록들을 상기 경계 블록에 속하는 매크로 블록들로 결정한다. 바람직하게, 상기 관심 영역은, 상기 영상 프레임의 중심 영역 - 하나의 매크로 블록 또는 인접하는 소정 갯수의 매크로 블록들을 포함함 - 을 포함한다.Preferably, the detection unit, from the image frame, extracts macro blocks belonging to a boundary block and having a motion size value equal to or greater than a predetermined threshold, and grouping the extracted macro blocks to group similar macro blocks in terms of motion size and direction. Generate at least one group including the at least one group, and generate a convex hull including group members for each generated group, wherein the at least one region of interest is an inner region of the generated at least one convex hull. . Preferably, the detector determines macroblocks for which motion compensation is performed in subblock units as macroblocks belonging to the boundary block. Preferably, the region of interest includes a center region of the image frame, including one macro block or a predetermined number of adjacent macro blocks.
바람직하게, 상기 결정부는, 상기 적어도 하나의 관심 영역으로부터의 최소 거리에 반비례하는 제1 중요치(importance value)를 매크로블록마다 산출하는 제1 중요치 산출부; 및 상기 산출된 제1 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함한다.Preferably, the determination unit may include: a first importance value calculator for calculating, for each macroblock, a first import value that is inversely proportional to a minimum distance from the at least one region of interest; And a rate controller for determining the quantization step size of the macroblock based on the calculated first importance value.
바람직하게, 상기 결정부는, 상기 적어도 하나의 관심 영역으로부터의 최소 거리에 반비례하는 제1 중요치(importance value)를 매크로블록마다 산출하는 제1 중요치 산출부; 매크로 블록마다 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 해당 매크로 블록의 제2 중요치로 결정하는 제2 중요치 산출부; 및 상기 산출된 제1 중요치 및 제2 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함하고, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 갖는다.Preferably, the determination unit may include: a first importance value calculator for calculating, for each macroblock, a first import value that is inversely proportional to a minimum distance from the at least one region of interest; A second significant value calculator for calculating a weighted sum of transform coefficients for each macro block and determining the calculated weighted sum as a second significant value of the corresponding macro block; And a rate controller for determining a quantization step size of the macroblock based on the calculated first and second significance values, wherein each of the weights used for calculating the weighted sum is inversely proportional to the spatial frequency of the corresponding transform coefficient. Has a value.
바람직하게, 상기 결정부는, 상기 적어도 하나의 관심 영역으로부터의 최소 거리에 반비례하는 제1 중요치(importance value)를 매크로블록마다 산출하는 제1 중요치 산출부; 상기 적어도 하나의 관심 영역 및 상기 나머지 영역에 대한 제3 중요치를 산출하는 제3 중요치 산출부; 및 상기 산출된 제1 중요치 및 제3 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함하고, 상기 제3 중요치는 소정의 움직임 크기까지의 범위 내에서 해당 영역에 속하는 움직임 벡터들의 평균 크기에 비례하고, 상기 범위 이외에서는 상기 움직임 벡터들의 평균 크기에 반비례하고, 상기 소정의 움직임 크기는 상기 움직임 벡터들의 평균 방향에 대한 해당 관심 영역의 너비에 비례한다.Preferably, the determination unit may include: a first importance value calculator for calculating, for each macroblock, a first import value that is inversely proportional to a minimum distance from the at least one region of interest; A third importance value calculator configured to calculate a third importance value for the at least one region of interest and the remaining region; And a rate controller configured to determine a quantization step size of the macroblock based on the calculated first and third important values, wherein the third important value is a motion vector belonging to the corresponding region within a range up to a predetermined motion size. Is proportional to the average size of the motion vectors, and is inversely proportional to the average size of the motion vectors outside the range, and the predetermined motion size is proportional to the width of the corresponding region of interest with respect to the average direction of the motion vectors.
바람직하게, 상기 결정부는, 상기 적어도 하나의 관심 영역으로부터의 최소 거리에 반비례하는 제1 중요치를 매크로 블록마다 산출하는 제1 중요치 산출부; 매크로 블록마다 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 해당 매크로 블록의 제2 중요치로 결정하는 제2 중요치 산출부; 상기 적어도 하나의 관심 영역 및 상기 나머지 영역에 대한 제3 중요치를 산출하는 제3 중요치 산출부; 및 상기 산출된 제1 중요치, 제2 중요치, 및 제3 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함하고, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 가지고, 상기 제3 중요치는 소정의 움직임 크기까지의 범위 내에서 해당 영역에 속하는 움직임 벡터들의 평균 크기에 비례하고, 상기 범위 이외에서는 상기 움직임 벡터들의 평균 크기에 반비례하고, 상기 소정의 움직임 크기는 상기 움직임 벡터들의 평균 방향에 대한 해당 관심 영역의 너비에 비례한다.Preferably, the determination unit may include a first importance value calculator for calculating a first importance value for each macro block in inverse proportion to a minimum distance from the at least one region of interest; A second significant value calculator for calculating a weighted sum of transform coefficients for each macro block and determining the calculated weighted sum as a second significant value of the corresponding macro block; A third importance value calculator configured to calculate a third importance value for the at least one region of interest and the remaining region; And a rate control unit for determining a quantization step size of the macroblock based on the calculated first important value, the second important value, and the third important value, wherein each of the weights used for calculating the weighted sum is a value of the corresponding transform coefficient. Having a value inversely proportional to the spatial frequency, the third importance value is proportional to the average magnitude of motion vectors belonging to the region within a range up to a predetermined magnitude of motion, and is inversely proportional to the average magnitude of the motion vectors outside the range, The predetermined motion magnitude is proportional to the width of the region of interest in the average direction of the motion vectors.
바람직하게, 상기 결정부는, 상기 적어도 하나의 관심 영역 및 상기 나머지 영역에 대한 제3 중요치를 산출하는 제3 중요치 산출부; 및 상기 산출된 제3 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함하고, 상기 제3 중요치는 소정의 움직임 크기까지의 범위 내에서 해당 영역에 속하는 움직임 벡터들의 평균 크기에 비례하고, 상기 범위 이외에서는 상기 움직임 벡터들의 평균 크기에 반비례하고, 상기 소정의 움직임 크기는 상기 움직임 벡터들의 평균 방향에 대한 해당 관심 영역의 너비에 비례한다.Preferably, the determining unit comprises: a third importance value calculator for calculating a third importance value for the at least one region of interest and the remaining region; And a rate controller configured to determine a quantization step size of the macroblock based on the calculated third importance value, wherein the third importance value is determined by an average size of motion vectors belonging to the region within a range up to a predetermined motion size. Outside the range, inversely proportional to the average size of the motion vectors, and the predetermined motion size is proportional to the width of the region of interest in the average direction of the motion vectors.
바람직하게, 상기 결정부는, 매크로 블록마다 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 해당 매크로 블록의 제2 중요치로 결정하는 제2 중요치 산출부; 상기 적어도 하나의 관심 영역 및 상기 나머지 영역에 대한 제3 중요치를 산출하는 제3 중요치 산출부; 및 상기 산출된 제2 중요치, 및 제3 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 레이트 제어부를 포함하고, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 가지고, 상기 제3 중요치는 소정의 움직임 크기까지의 범위 내에서 해당 영역에 속하는 움직임 벡터들의 평균 크기에 비례하고, 상기 범위 이외에서는 상기 움직임 벡터들의 평균 크기에 반비례하고, 상기 소정의 움직임 크 기는 상기 움직임 벡터들의 평균 방향에 대한 해당 관심 영역의 너비에 비례한다.Preferably, the determination unit may include a second significant value calculator for calculating a weighted sum of transform coefficients for each macro block and determining the calculated weighted sum as a second significant value of the corresponding macro block; A third importance value calculator configured to calculate a third importance value for the at least one region of interest and the remaining region; And a rate controller for determining a quantization step size of the macroblock based on the calculated second significant value and the third significant value, wherein each of the weights used for calculating the weighted sum is inversely proportional to the spatial frequency of the corresponding transform coefficient. The third importance value is proportional to an average size of motion vectors belonging to a corresponding region within a range up to a predetermined motion size, and inversely proportional to the average size of the motion vectors outside the range, The size is proportional to the width of the region of interest in the average direction of the motion vectors.
바람직하게, 상기 제1 중요치 산출부는, 수학식Preferably, the first important value calculation unit,
(여기서, ν는 뷰잉 디스턴스, k는 매크로 블록의 인덱스, dk는 매크로 블록k와 상기 적어도 하나의 관심 영역 간의 최소 거리, N은 영상 폭, e2, α, 및 CT0는 미리 설정된 수치임)에 따라 해당 매크로 블록의 제1 중요치를 산출한다. 바람직하게, 상기 제1 중요치 산출부는, 상기 영상 프레임에 대해 상기 수학식으로 얻어지는 최대 값을 산출하고, 해당 매크로 블록에 대한 상기 수학식의 결과를 상기 최대 값으로 정규화하고, 상기 정규화된 결과를 상기 해당 매크로 블록의 제1 중요치로 결정한다.Where ν is the viewing distance, k is the index of the macroblock, d k is the minimum distance between macroblock k and the at least one region of interest, N is the image width, e 2 , α, and CT 0 are preset values ), The first important value of the macroblock is calculated. Preferably, the first important value calculator calculates a maximum value obtained by the equation for the image frame, normalizes the result of the equation for the macroblock to the maximum value, and normalizes the normalized result. Determined as the first significant value of the macro block.
바람직하게, 상기 제2 중요치 산출부는, 수학식Preferably, the second significant value calculation unit,
(여기서, k, 및 N은 각각 매크로 블록의 인덱스 및 매크로 블록의 사이즈를 나타내고, x,y는 변환 계수의 인덱스, a(k)x,y는 매크로 블록 k의 x,y 인덱스에 해당하는 변환 계수, fr(x,y)는 x,y 인덱스에 해당하는 변환 계수의 공간 주파수, A,B,D,E,F는 미리 정해지는 양의 실수를 나타냄)에 따라 해당 매크로 블록의 제2 중요치를 산출한다. 바람직하게, 상기 제2 중요치 산출부는, 상기 영상 프레임에 대해 상기 수학식으로 얻어지는 최대 값을 산출하고, 해당 매크로 블록에 대한 상기 수학식의 결과를 상기 최대 값으로 정규화하고, 상기 정규화된 결과를 상기 해당 매크로 블록의 제2 중요치로 결정한다.Where k and N represent the macroblock index and the macroblock size, respectively, x and y represent the transform coefficient index and a (k) x and y represent the transform corresponding to the macro block k x and y index. Coefficient, f r (x, y) is the spatial frequency of the transform coefficient corresponding to the x, y index, and A, B, D, E, F represent a predetermined positive real number) Calculate the important value. Preferably, the second significant value calculating unit calculates a maximum value obtained by the equation for the image frame, normalizes the result of the equation for the macroblock to the maximum value, and normalizes the normalized result. The second significant value of the macro block is determined.
바람직하게, 상기 제3 중요치 산출부는, 수학식Preferably, the third important value calculation unit,
(여기서, k는 매크로 블록의 인덱스를 나타내며, υk, 및 mk는 매크로 블록 k가 속하는 관심 영역 또는 나머지 영역의 평균 각속도 및 너비를 나타내며, B1, B2, B3, B4, B5, B6, B7, B8, 및 B9은 미리 설정된 양의 실수를 나타냄)에 따라 해당 매크로 블록의 제3 중요치를 산출한다. 바람직하게, 상기 제3 중요치 산출부는, 상기 영상 프레임에 대해 상기 수학식으로 얻어지는 최대 값을 산출하고, 해당 매크로 블록에 대한 상기 수학식의 결과를 상기 최대 값으로 정규화하고, 상기 정규화된 결과를 상기 해당 매크로 블록의 제3 중요치로 결정한다.(Where k represents the index of the macroblock, υ k , and m k represent the average angular velocity and width of the region of interest or the remaining region to which macroblock k belongs, and B 1 , B 2 , B 3 , B 4 , B 5 , B 6 , B 7 , B 8 , and B 9 represent a preset amount of real number) to calculate the third significant value of the macro block. Preferably, the third significant value calculating unit calculates a maximum value obtained by the equation for the image frame, normalizes the result of the equation for the macroblock to the maximum value, and normalizes the normalized result. The third significant value of the macro block is determined.
바람직하게, 상기 레이트 제어부는, 상기 제1 중요치, 제2 중요치, 및 제3 중요치에 대한 가중합을 매크로 블록마다 산출하고, 상기 산출된 가중합을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정한다.Preferably, the rate controller calculates a weighted sum of the first significant value, the second significant value, and the third important value for each macro block, and determines the quantization step size of the macro block based on the calculated weighted sum. .
바람직하게, 상기 레이트 제어부는, 상기 제1 중요치, 제2 중요치, 및 제3 중요치의 곱에 비례하는 값을 매크로 블록마다 산출하고, 상기 산출된 값을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정한다.Preferably, the rate controller calculates a value proportional to the product of the first important value, the second important value, and the third important value for each macro block, and determines the quantization step size of the macro block based on the calculated value. do.
상기의 기술적 과제를 이루기 위해 본 발명의 제2 측면은 영상 프레임에 포함된 매크로 블록마다, 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 결정부; 및 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화하는 양자화부를 포함하고, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 가지는 영상 부호화 장치를 제공한다.According to a second aspect of the present invention, a weighted sum of transform coefficients is calculated for each macroblock included in an image frame, and the quantization step size of the macroblock is determined based on the calculated weighted sum. Determination unit for determining; And a quantization unit for quantizing transform coefficients of each of the macroblocks according to the determined quantization step size, wherein each of the weights used for calculating the weighted sum has a value inversely proportional to the spatial frequency of the corresponding transform coefficient. to provide.
상기에서 제시한 본 발명의 실시예들은 다음의 장점들을 포함하는 효과를 가질 수 있다. 다만, 본 발명의 모든 실시예들이 이를 전부 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.Embodiments of the present invention presented above may have an effect including the following advantages. However, all the embodiments of the present invention are not meant to include them all, and thus the scope of the present invention should not be understood as being limited thereto.
본 발명의 일 실시예에 따르면, 시각적 화질의 저하 없이 압축율을 향상시킬수 있어, 네트워크에서 채널 용량이 부족하거나 채널 환경이 열악한 상황에서도 효과적으로 사용될 수 있다.According to an embodiment of the present invention, the compression ratio can be improved without deteriorating visual quality, and thus can be effectively used even in a channel shortage or poor channel environment in a network.
또한, 본 발명의 일실시예에 따르면, 기존의 영상 압축 표준에 호환될 수 있어, 시장 점유 면에서 유리하다는 장점이 있다.In addition, according to an embodiment of the present invention, it can be compatible with the existing image compression standard, there is an advantage in terms of market share.
또한, 본 발명의 일실시예에 따르면, 인간의 시각적 특성을 이용하여 영상 부호화를 하더라도 추가적인 리던던시를 수반하지 않는다는 장점이 있다.In addition, according to an embodiment of the present invention, even if the image encoding using the human visual characteristics does not have additional redundancy.
또한, 본 발명의 일실시예에 따르면, 인간의 시각에 미치는 다양한 요소들을 함께 고려하여 시각적으로 중요하지 않은 신호는 제거하고, 중요한 정보에 더 많은 비트를 할당함으로써 추가적으로 압축률 향상을 얻을 수 있다는 장점이 있다.In addition, according to an embodiment of the present invention, in consideration of various factors affecting the human vision together, it is possible to remove a signal that is not visually important and to further improve compression ratio by allocating more bits to important information. have.
본 발명의 실시예들에 관한 설명은 본 발명의 구조적 내지 기능적 설명들을 위하여 예시된 것에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예들에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 본 발명의 실시예들은 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다.Since descriptions of embodiments of the present invention are merely illustrated for structural to functional descriptions of the present invention, the scope of the present invention should not be construed as limited by the embodiments described in the present invention. That is, the embodiments of the present invention may be variously modified and may have various forms, and thus, it should be understood to include equivalents that may realize the technical idea of the present invention.
한편, 본 발명에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.On the other hand, the meaning of the terms described in the present invention will be understood as follows.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로 이들 용어들에 의해 본 발명의 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as "first" and "second" are intended to distinguish one component from another component, and the scope of the present invention should not be limited by these terms. For example, the first component may be named a second component, and similarly, the second component may also be named a first component.
"및/또는"의 용어는 하나 이상의 관련 항목으로부터 제시가능 한 모든 조합을 포함하는 것으로 이해되어야 한다. 예를 들어, "제1 항목, 제2 항목 및/또는 제3 항목"의 의미는 "제1 항목, 제2 항목 및 제3 항목 중 적어도 하나 이상"을 의미 하는 것으로, 제1, 제2 또는 제3 항목뿐만 아니라 제1, 제2 및 제3 항목들 중 2개 이상으로부터 제시될 수 있는 모든 항목의 조합을 의미한다.The term “and / or” should be understood to include all combinations that can be presented from one or more related items. For example, "first item, second item, and / or third item" means "at least one or more of the first item, second item, and third item". A combination of all items that can be presented from two or more of the first, second and third items as well as the third item.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being "connected" to another component, it should be understood that there may be other components in between, although it may be directly connected to the other component. On the other hand, when an element is referred to as being "directly connected" to another element, it should be understood that there are no other elements in between. On the other hand, other expressions describing the relationship between the components, such as "between" and "immediately between" or "neighboring to" and "directly neighboring to", should be interpreted as well.
본 발명에서 기재된 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions described herein are to be understood to include plural expressions unless the context clearly indicates otherwise, and the terms "comprise" or "having" include elements, features, numbers, steps, operations, and elements described. It is to be understood that the present invention is intended to designate that there is a part or a combination thereof, and does not exclude in advance the possibility of the presence or addition of one or more other features or numbers, steps, actions, components, parts or combinations thereof. .
본 발명에서 기술한 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.Each step described in the present invention may occur out of the stated order unless the context clearly dictates the specific order. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.Unless otherwise defined, all terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs. Terms such as those defined in the commonly used dictionaries should be construed as having meanings consistent with the meanings in the context of the related art, and shall be interpreted as having ideal or overly formal meanings unless expressly defined in this application. Can't be.
본 발명의 실시예들에 따르면, 정신 물리학의 시각적 모델을 이용함으로써, 기존의 영상 코덱과 유사한 화질을 유지하면서 추가적인 압축 효율을 얻을 수 있다. 여기서, 상기 시각적 모델의 예로는, 포비에이션 기반의 인지적 중요도(foveation-based perceptual importance)을 고려한 모델, 주파수 기반의 인지적 중요도(frequency-based perceptual importance)을 고려한 모델, 움직임 기반의 인지적 중요도 (motion-based perceptual importance)을 고려한 모델을 들 수 있다.According to embodiments of the present invention, by using a visual model of psychophysics, additional compression efficiency may be obtained while maintaining image quality similar to that of an existing image codec. In this case, examples of the visual model include a model considering the foveation-based perceptual importance, a model considering the frequency-based perceptual importance, and a motion-based cognitive importance. A model that takes into account motion-based perceptual importance is mentioned.
영상 프레임에 일부로서 포함된 특정 물체에 사람의 시각이 집중되어 있다고 가정할 때, 각 화상 영역(image region or picture region)에 대한 시각의 공간적 해상도(spatial resolution)는 해당 화상 영역이 상기 집중된 물체로부터 멀리 떨어져 있을수록 감소된다는 특성으로부터 도출되는 인지적 중요도가 포비에이션 기반의 인지적 중요도이다. 여기서, 사람의 초점(focus)을 기준으로 공간적 중요도를 검출하는 것을 포비에이션(foveation)이라 한다.Assuming that human vision is concentrated on a particular object included as part of an image frame, the spatial resolution of the visual for each image region or picture region is determined by The cognitive importance derived from the property of decreasing as far away is the perception-based cognitive importance. Here, detecting spatial importance based on the focus of a person is called foveation.
망막에 있는 시신경은 고르게 분포해 있지 않고 포비아(fovea)라고 불리는 부분에 집중되어 있다. 사람이 화상 등을 볼 때 적어도 하나의 지점(point)에 초점을 맞추게 되는데, 이 지점은 포비아에 대응된다. 화상을 이루는 지점들 중에서, 포비아에 대응되는 지점을 포비에이션 지점(foveation point)라고 부른다. 따라서 화상을 이루는 화상 영역들 각각은 포비에이션 지점에 가까울수록 높은 인지적 중요도를 가지고, 멀수록 낮은 인지적 중요도를 갖게 된다. The optic nerve in the retina is not evenly distributed but concentrated in a section called fovea. When a person sees an image or the like, at least one point is focused, which corresponds to a povia. Among the points forming the image, a point corresponding to the povia is called a foveation point. Therefore, each of the image regions constituting the image has a high cognitive importance as the nearer to the fob point, and a lower cognitive importance as the farther.
도 1은 포비에이션 지점을 설명하기 위한 도면이다.1 is a view for explaining a fob point.
도 1에 도시돤 바와 같이 얼굴이 포함된 화상을 보는 관측자는 일반적으로 얼굴에 초점을 맞추게 될 것이므로, 포비에이션 지점들은 얼굴 주변에 분포한다. 따라서, 도 1의 좌측 부분에 도시된 바와 같이 얼굴 주변에 6개의 점들이 포비에이션 지점들이라고 가정하면, 도 1의 우측 부분에 도시된 바와 같이, 국부 대역폭(local bandwidth)을 구할 수 있다. 여기서, 국부 대역폭은 화상 영역의 위치와 포비에이션 지점 간의 거리에 따라 상기 화상 영역이 갖는 신호에 대해 사람이 인지 가능한 주파수 대역을 나타낸다. 예컨대, 화상 영역 k의 국부 대역폭이 flocalBW(k)라면, 사람의 시각이 인지할 수 있는 주된 신호 성분은 상기 해당 화상 영역의 신호 중에서 주파수 범위 [0, flocalBW(k)]에 속하는 신호 성분이다. 여기서, k는 화상 영역 인덱스이다.As shown in FIG. 1, an observer who sees an image with a face will generally focus on the face, so the focal points are distributed around the face. Thus, assuming that six points around the face are poking points, as shown in the left part of FIG. 1, a local bandwidth can be obtained as shown in the right part of FIG. 1. Here, the local bandwidth represents a frequency band that is human perceptible to the signal possessed by the image region according to the distance between the position of the image region and the focal point. For example, if the local bandwidth of the image region k is f localBW (k), the main signal component that can be perceived by human vision is the signal component belonging to the frequency range [0, f localBW (k)] among the signals of the image region. to be. Where k is the image area index.
이러한 국부 대역폭은 수학식 1로 산출될 수 있으며, 후술할 제1 중요치의 산출에 사용될 수 있다.This local bandwidth may be calculated by
여기서, ν는 뷰잉 디스턴스(viewing distance)로서, 디스플레이되는 화상의 폭에 반비례하고, 상기 화상으로부터 사람의 눈까지의 거리에 비례하는 상대적인 거리를 의미한다. 또한, dk는 포비에이션 지점으로부터 신호 위치(예컨대, 픽셀의 좌표, 화상 영역 또는 해당 매크로 블록의 위치) k까지의 거리, N은 픽셀 단위의 화상 폭, 나머지는 상수로서 값은 e2=2.3, α=0.106, CT0=1/64이다.Here, v represents a viewing distance, which is inversely proportional to the width of the displayed image, and means a relative distance proportional to the distance from the image to the human eye. In addition, d k is the distance from the positioning point to the signal position (e.g., the coordinates of the pixel, the position of the image area or the corresponding macroblock) k, N is the image width in pixels, the remainder is a constant and e 2 = 2.3 , α = 0.106, CT 0 = 1/64.
사람의 눈이 상대적으로 저주파 성분에는 민감하고 고주파 성분에는 둔감하다는 특성으로부터 도출되는 인지적 중요도가 주파수 기반의 인지적 중요도(frequency-based perceptual importance)이다. 이 주파수 기반의 인지적 중요도는 화상 영역에 대한 주파수 성분에 대한 정보를 포함하는 변환 계수를 이용하여 산출될 수 있다. 여기서, 변환 계수는, 화상 영역을 직교 변환(orthogonal transform)하여 얻어지는 계수이고, 직교 변환의 예로는, 이산 여현 변환(discrete cosine transform : 이하, DCT) 등 다양한 방식이 존재한다. 본 명세서에서, 편의상, 변환 계수를 DCT 계수로 가정하여, 본 발명의 실시예들을 설명하고자 한다.The cognitive importance derived from the characteristics that the human eye is relatively sensitive to low frequency components and insensitive to high frequency components is frequency-based perceptual importance. This frequency-based cognitive importance can be calculated using transform coefficients that contain information about frequency components for the picture region. Here, the transform coefficients are coefficients obtained by orthogonal transforming an image region, and examples of orthogonal transformations include various methods such as discrete cosine transform (hereinafter, referred to as DCT). In the present specification, for convenience, embodiments of the present invention will be described assuming a transform coefficient as a DCT coefficient.
주파수 기반의 인지적 중요도에 관여하는 파라미터의 예로는 공간 주파수, 시간 주파수, 평균 휘도(luminance) 등을 들 수 있다. 수학식 2는 공간 주파수 fr에 대한 대비 감도 함수(contrast sensitivity function)를 나타내는데, 후술하겠지만, 이를 통하여 주파수 기반의 인지적 중요도 즉, 제2 중요치를 산출할 수 있다.Examples of parameters involved in frequency-based cognitive importance include spatial frequency, time frequency, average luminance, and the like. Equation 2 represents a contrast sensitivity function with respect to the spatial frequency f r , which will be described later, but through this, a frequency-based cognitive importance, that is, a second importance value, may be calculated.
여기서, 공간 주파수 fr를 산출하는 방법의 예로는 수학식 3을 이용하는 방법을 들 수 있다.Here, as an example of a method of calculating the spatial frequency f r , a method using Equation 3 may be used.
여기서, x,y는 DCT 계수들의 인덱스(주파수 인덱스)를 의미한다. 또한, p는 표시 시각적 해상도(display visual resolution)를 의미하며, p를 산출하는 방법의 예로는 수학식 4을 이용하는 방법을 들 수 있다.Here, x, y means the index (frequency index) of the DCT coefficients. In addition, p means display visual resolution, and an example of a method of calculating p may be a method using Equation 4.
여기서, d는 디스플레이되는 해상도(resolution)(pixels/cm)를 의미하고, ν는 상술한 뷰잉 디스턴스(cm)를 의미한다.Here, d means the resolution (pixels / cm) to be displayed, and ν means the viewing distance (cm) described above.
정지된 배경을 갖는 영상에서 특정한 오브젝트(object)가 움직인다고 할 때, 사람의 관심은 움직이는 오브젝트에 집중될 확률이 크다는 특성으로부터 도출되는 인지적 중요도가 움직임 기반의 인지적 중요도이다. 이 움직임 기반의 인지적 중요도는 후술한 제3 중요치의 산출에 이용될 수 있다.When a certain object is moved in an image having a stationary background, the cognitive importance derived from the characteristic that a person's interest is likely to be focused on the moving object is a motion-based cognitive importance. This motion-based cognitive importance can be used to calculate the third importance value described below.
하지만 이와는 반대로, 도 2에서 후술하는 바와 같이, 너무 빠른 속도로 움직이는 오브젝트에 대해서는, 대비 감도가 감소한다는 연구 결과가 있다. 이는 사람이 식별할 수 있는 물체의 속도는 한계가 있기 때문이다.However, on the contrary, as described later in FIG. 2, there is a study result in that the contrast sensitivity decreases for an object moving at a too high speed. This is because the speed of an object that a human can identify is limited.
도 2는 움직임 기반의 인지적 중요도를 설명하기 위해 속도 및 너비와 관련한 대비 민감도를 나타내는 그래프이다.2 is a graph showing contrast sensitivity with respect to speed and width in order to explain motion-based cognitive importance.
도 2를 참조하면, 원칙적으로 오브젝트의 속도와 대비 민감도는 비례하지만, 속도가 지나치게 큰 경우에는, 오히려 대비 민감도가 급격히 줄어듬을 알 수 있다.Referring to FIG. 2, in principle, the speed and the contrast sensitivity of the object are proportional to each other. However, when the speed is too large, the contrast sensitivity may decrease rapidly.
이러한 속도와 관련된 대비 민감도는 오브젝트의 크기에도 영향을 받는다. 이때의 크기를 보다 정확하게 표현하자면, 이동하는 방향에 평행하게 측정된 물체의 폭(width)을 의미한다. 도 2에 도시된 바와 같이, 이 폭이 넓어질수록, 인지할 수 있는 속도의 한계가 높아진다.The contrast sensitivity associated with this speed is also affected by the size of the object. In this case, the size of the object is measured to be parallel to the moving direction. As shown in Fig. 2, the wider the width, the higher the perceptible speed limit.
도 3은 본 발명의 일실시예에 따른 영상 부호화 장치를 나타낸다.3 illustrates an image encoding apparatus according to an embodiment of the present invention.
본 발명의 기술적 사상은 H.264 표준 뿐만 아니라, H.263, MPEG-2 등 다양한 영상 코덱 표준에 적용 가능하지만, 설명의 편의상, 도 3은 본 발명의 기술적 사상 을 H.264 표준에 적용했을 경우에 해당한다. 즉, 레이트 제어부(318), 변환부(320), 양자화부(324), 역양자화부(324), 디블록킹(de-blocking) 필터(330), 메모리(332), 화면내 예측부(340), 움직임 예측부(350), 움직임 보상부(352)는 H.264 표준 등의 일반적인 영상 코덱 표준에 포함될 수 있는 블록이다. 따라서, 이들 블록에 대한 구체적인 설명은 생략한다.The technical idea of the present invention can be applied not only to the H.264 standard but also to various image codec standards such as H.263 and MPEG-2. However, for convenience of description, FIG. 3 illustrates that the technical idea of the present invention is applied to the H.264 standard. This is the case. That is, the
본 발명의 제1 실시예에 따른 장치는 검출부(300), 결정부(310), 및 양자화부(324)를 포함한다.The apparatus according to the first embodiment of the present invention includes a
검출부(300)는 영상 프레임으로부터, 적어도 하나의 관심 영역 - 하나의 매크로 블록 또는 복수의 인접한 매크로 블록들을 포함함 - 및 나머지 영역을 검출한다.The
일실시예에 따른 결정부(310)는 레이트 제어부(318)과 함께 제1 중요치 산출부(310) 및/또는 제3 중요치 산출부(316)을 포함함으로써, 상기 적어도 하나의 관심 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균이 상기 나머지 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균보다 작도록, 상기 영상 프레임에 포함된 매크로 블록들 각각의 양자화 스텝 사이즈를 결정한다. 다른 일실시예에 따른 결정부(310)는 제2 중요치 산출부(314)를 더 포함할 수 있다.According to an exemplary embodiment, the
양자화부(324)는 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화한다.The
본 발명의 제2 실시예에 따른 장치는 상기 제1 실시예와는 달리 검출부(300)를 포함하지 않을 수 있으며, 영상 프레임에 포함된 매크로 블록마다, 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정하는 결정부(310); 및 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화하는 양자화부(324)를 포함한다. Unlike the first embodiment, the apparatus according to the second embodiment of the present invention may not include the
본 실시예에 따른 결정부(310)는 제2 중요치 산출부(314) 및 레이트 제어부(318)을 포함한다. 제2 중요치 산출부(314)는 영상 프레임에 포함된 매크로 블록마다, 변환 계수들에 대한 가중합을 산출한다. 여기서, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 가진다.The
일반적인 레이트 제어부(318)은 부호화로 발생되는 비트 수와 채널 상황을 보면서, 양자화 방식을 결정하여 전송률 조절을 수행하는데, 본 실시예에 따른 레이트 제어부(318)는 상술한 동작을 마찬가지로 수행할 수도 있으며, 또한, 상기 산출된 가중합을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정한다. The
상술한 실시예들에 따라, 레이트 제어부(318)는 제1 중요치, 제2 중요치, 제3 중요치 중 적어도 하나를 획득하여 양자화 스텝 사이즈를 결정하는데, 이하에서는 편의상, 결정부(310)가 제1 중요치 산출부(312), 제2 중요치 산출부(314), 제3 중요치 산출부(316)를 모두 포함하는 실시예를 기반으로 본 발명의 기술적 사상을 설명하고자 한다.According to the above-described embodiments, the
검출부(300)의 관심 영역 검출 방법은 다양하게 존재한다. 비디오 컨퍼런스의 응용이라면, 이미 많이 공지된 얼굴 검출(face detection) 알고리즘을 사용하여 관심 영역인 얼굴을 검출하는 방법도 있을 수 있다.There are various methods of detecting the ROI of the
상술한 바와 같이 움직이는 물체에 시선이 집중될 수 있기 때문에, 상기 영상 프레임으로부터 추출되는 오브젝트들 중에서, 소정 임계치 이상의 움직임 크기를 가진 오브젝트가 관심 영역이 될 수 있다. 이러한 특성에 따라 본 발명의 일실시예에 따른 검출부(300)는 스테레오 영상(즉, 도 3의 주 비디오 입력 및 보조 비디오 입력)을 입력 받아 깊이 지도(depth map)를 생성한 후, 이 깊이 지도를 이용하여 상기 영상 프레임으로부터 상기 적어도 하나의 오브젝트를 추출한다. 그 다음, 검출부(300)는 움직임 예측부(350)로부터 제공되는 매크로 블록별 움직임 벡터를 입력 받아, 상기 추출되는 적어도 하나의 오브젝트 각각에 대해 해당 움직임 벡터들의 평균 크기 값을 산출한 후, 상기 소정 임계치 이상의 평균 크기 값을 가진 적어도 하나의 오브젝트를 각 관심 영역으로 결정한다. 즉, 양안시 차가 충분한 주 비디오 영상과 보조 비디오 영상을 통하여 깊이 지도를 생성한 후, 그 생성된 깊이 지도를 통하여 배경과 전경(즉, 오브젝트)를 구분한 후, 구분된 오브젝트들 중에서 움직임 크기가 큰 오브젝트를 관심 영역으로 결정하는 것이다.Since the gaze may be focused on the moving object as described above, an object having a movement size greater than or equal to a predetermined threshold may be a region of interest among objects extracted from the image frame. According to this characteristic, the
본 발명의 또 다른 일실시예에 따른 관심 영역 검출 방법은 도 4를 참조하여 후술한다.A region of interest detection method according to another embodiment of the present invention will be described later with reference to FIG. 4.
제1 중요치 산출부(312)는 검출부(300)에서 검출된 적어도 하나의 관심 영역 으로부터의 최소 거리에 대체로 반비례하는 제1 중요치를 매크로블록마다 산출한다. 예컨대, 제1 중요치 산출부(312)는 검출부(300)로부터 영역 맵(즉, 각 관심 영역에 속하는 매크로 블록들에 대한 정보, 나머지 영역에 속하는 매크로 블록들에 대한 정보)을 제공받아 매크로 블록별로 제1 중요치를 산출한다.The first
일실시예에 따른 k번째 매크로블록의 제1 중요치는 수학식 1로 산출되는 국부대역폭이다. 다른 일실시예에 따른 k번째 매크로블록의 제1 중요치는 수학식 1을 근사화한 수학식 5로 산출되는 wk spatial이다. dk는 k번째 매크로 블록과 관심 영역 간의 최소 거리를 나타내는 등 수학식 5에서의 각 파라미터는 수학식 1에서 설명한 바와 같다.According to an embodiment, the first significant value of the k-th macroblock is the local bandwidth calculated by
한편, 관심 영역에 속하는 매크로 블록의 제1 가중치를 산출하는 방법의 예로는 수학식 1 또는 5를 그대로 사용(즉, dk=0으로 설정)하는 방법, 수학식 1 또는 5를 사용하지 않는 대신, 나머지 영역에 속하는 매크로블록들의 제1 가중치보다 상대적으로 높은 제1 가중치를 할당하는 방법을 들 수 있다.Meanwhile, as an example of a method of calculating the first weight of a macroblock belonging to the region of interest,
또 다른 일실시예에 따른 k번째 매크로 블록의 제1 중요치는 수학식 5로 산 출되 는 값을 max{wspatial}로 나누어 정규화한 결과인 w'k spatial으로서, 수학식 6으로 정의된다.Further, the first matter of the k-th macroblock in accordance with another exemplary embodiment is a result of w 'k spatial normalized by dividing the value of the acid is chuldoe by Equation 5 max {w spatial}, is defined as Equation (6).
수학식 6에서의 max{wspatial}은 현재의 영상 프레임에 포함된 매크로블록들에 대해 수학식 5로 산출한 값들 중 최대값을 의미하며, 일반적으로는, 포비에이션 지점에 해당하는 매크로블록에 대한 수학식 5의 산출 값이다.Max {w spatial } in Equation 6 refers to the maximum value of the values calculated by Equation 5 for the macroblocks included in the current image frame, and generally, to the macroblock corresponding to the foviation point. The calculated value of Equation (5).
제2 중요치 산출부(314)는 변환부(320)로부터 DCT 계수등의 변환 계수들을 입력 받아, 매크로 블록마다 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 해당 매크로 블록의 제2 중요치로 결정한다. 여기서, 상기 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 가진다.The second
일실시예에 따른 k번째 매크로 블록의 제2 중요치는 수학식 7로 산출된다.According to an embodiment, the second significant value of the k-th macroblock is calculated by Equation 7.
즉, 해당 변환 계수에 적용되는 가중치는 수학식 2로 산출되는 대비 감도 함 수 값이다. 즉, 수학식 7에서 k, 및 N은 각각 매크로 블록의 인덱스 및 매크로 블록의 사이즈를 나타내고, x,y는 변환 계수의 인덱스, a(k)x,y는 매크로 블록 k의 x,y 인덱스에 해당하는 변환 계수, fr(x,y)는 x,y 인덱스에 해당하는 변환 계수의 공간 주파수를 나타낸다. A,B,D,E,F는 미리 정해지는 양의 실수로서, 수학식 2에서 정의된 값들 또는 이들 값들과 유사한 범위에 속하는 값들이다.That is, the weight applied to the corresponding transform coefficient is the contrast sensitivity function value calculated by Equation 2. That is, in Equation 7, k and N represent the index of the macro block and the size of the macro block, respectively, x and y represent the index of the transform coefficient, and a (k) x, y represent the x, y index of the macro block k. The corresponding transform coefficient, f r (x, y), represents the spatial frequency of the transform coefficient corresponding to the x, y index. A, B, D, E, and F are predetermined positive real numbers, which are values defined in Equation 2 or values belonging to a range similar to these values.
다른 일실시예에 따른 k번째 매크로 블록의 제2 중요치는 수학식 7로 산출되는 값을 max{wfreq}로 나누어 정규화한 결과인 w'k freq으로서, 수학식 8로 정의된다.The second matter of the k-th macroblock in accordance with another exemplary embodiment is a result of w 'k freq normalized by dividing the value as max {w} freq calculated by Equation (7), is defined by equation (8).
수학식 8에서의 max{wfreq}은 현재의 영상 프레임에 포함된 매크로블록들에 대해 수학식 7로 산출한 값들 중 최대값을 의미한다.Max {w freq } in Equation 8 means the maximum value among the values calculated by Equation 7 for the macroblocks included in the current image frame.
제3 중요치 산출부(316)는 검출부(300)에서 검출된 적어도 하나의 관심 영역및 나머지 영역에 대한 제3 중요치 즉, 움직임 기반의 지각적 중요도를 산출한다.The third importance value calculator 316 calculates a third importance value, ie, a motion-based perceptual importance level, for the at least one ROI and the remaining area detected by the
예컨대, 제3 중요치 산출부(316)는 검출부(300)로부터 영역 맵(즉, 각 관심 영역에 속하는 매크로 블록들에 대한 정보, 나머지 영역에 속하는 매크로 블록들에 대한 정보)을 제공받고, 움직임 예측부(350)로부터 움직임 벡터 값들을 제공받아 및 움직임의 평균 방향에 따른 영역(관심 영역 또는 나머지 영역)의 너비 및 영역별 움직임의 평균 크기를 산출하여 매크로 블록별로 제3 중요치를 결정한다. 후술하는 수학식 11에 따라 제3 중요치가 산출되는 경우, 제3 중요치는 소정의 움직임 크기까지의 범위 내에서 해당 영역에 속하는 움직임 벡터들의 평균 크기에 비례하고, 상기 범위 이외에서는 상기 움직임 벡터들의 평균 크기에 반비례하게 된다. 여기서, 상기 소정의 움직임 크기는 상기 움직임 벡터들 의 평균 방향에 대한 해당 관심 영역의 너비에 비례한다.For example, the third importance value calculator 316 is provided with an area map (ie, information about macroblocks belonging to each ROI and information about macroblocks belonging to the remaining area) from the
여기서, 도 2에서 설명한 움직임 기반의 지각적 중요도는, 오브젝트의 움직임 및 오브젝트의 너비에 의존하기 때문에 수학식 9와 같이 모델링 될 수 있다. Here, since the motion-based perceptual importance described in FIG. 2 depends on the motion of the object and the width of the object, it may be modeled as in Equation 9.
수학식 9에서 υk, 및 mk는 k 번째 매크로 블록과 관련된 오브젝트의 각속도 및 너비를 나타낸다. 보다 상세하게는, mk은 오브젝트의 진행 방향에 대한 오브젝트 너비로서, 움직임 벡터의 방향 및 검출된 오브젝트가 차지하는 영역을 기초로 산출될 수 있다.In Equation 9 υ k , and m k represent the angular velocity and the width of the object associated with the k-th macro block. More specifically, m k is an object width with respect to the advancing direction of the object, and may be calculated based on the direction of the motion vector and the area occupied by the detected object.
υk는 수학식 10을 이용하여 구할 수 있다. 수학식 10에서 Mmax는 움직임 벡 터의 크기에 대한 측정값, P는 화면의 해상도(예컨대, 인치당 픽셀수), L은 사람과 영상 사이의 거리, RF은 프레임 율을 의미한다.ν k can be obtained using
따라서, 상술한 수학식 9를 이용하면, 일실시예에 따른 k번째 매크로 블록의 제3 중요치는 수학식 11로 산출된다.Therefore, using Equation 9 described above, the third significant value of the k-th macroblock according to an embodiment is calculated by Equation 11.
수학식 11에서, k는 매크로 블록의 인덱스를 나타내며, υk, 및 mk는 k번째 매크로 블록이 속하는 관심 영역 또는 나머지 영역의 평균 각속도 및 너비를 나타내며, B1, B2, B3, B4, B5, B6, B7, B8, 및 B9은 미리 설정된 양의 실수로서, 수학식 9에서의 해당 값들 또는 상기 해당 값들과 유사한 범위에 속하는 값들을 나타낸다.In Equation 11, k denotes an index of the macroblock, υ k , and m k denote average angular velocities and widths of the region of interest or the remaining region to which the k-th macroblock belongs, and B 1 , B 2 , B 3 , B 4 , B 5 , B 6 , B 7 , B 8 , and B 9 are preset positive real numbers representing corresponding values in Equation 9 or values in a range similar to the corresponding values.
다른 일실시예에 따른 k번째 매크로 블록의 제3 중요치는 수학식 11로 산출되는 값을 max{wmotion}로 나누어 정규화한 결과인 w'k motion으로서, 수학식 12로 정의된다.The third matter in the k-th macroblock in accordance with another exemplary embodiment is a value calculated by Equation (11) as a result of w 'k normalized by dividing the motion max {w} motion, is defined by Equation (12).
수학식 12에서의 max{wmotion}은 현재의 영상 프레임에 포함된 매크로블록들에 대해 수학식 11로 산출한 값들 중 최대값을 의미한다.Max {w motion } in Equation 12 refers to a maximum value among the values calculated by Equation 11 for the macroblocks included in the current image frame.
한편, 수학식 11 또는 수학식 12를 이용한 제3 중요도 산출 방법은 매크로 블록 단위로 수학식 11 또는 수학식 12를 산출하는 방법, 영역(즉, 관심 영역 또는 나머지 영역) 단위로 수학식 11 또는 수학식 12를 산출하고, 그 영역에 속하는 매크로블록들에 대해 해당 영역의 산출 값을 할당하는 방법을 들 수 있다.Meanwhile, the third importance calculation method using Equation 11 or Equation 12 is a method of calculating Equation 11 or Equation 12 in macroblock units, or Equation 11 or Equation in units of an area (ie, a region of interest or a remaining region). A method of calculating Equation 12 and allocating a calculated value of a corresponding region to macroblocks belonging to the region is given.
레이트 제어부(318)는 제1 중요치 산출부(312), 제2 중요치 산출부(314), 및 제3 중요치 산출부(316)에서 각각 산출된 제1 중요치, 제2 중요치, 및 제3 중요치를 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정한다.The
일실시예에 따른 양자화 스텝 사이즈 결정 방법은 k번째 매크로 블록의 제1 내지 제3 중요치를 기초로 k번째 매크로 블록의 최종 중요치 wk를 산출한 후, 그 산출된 최종 중요치를 rate distortion model에 적용하여 최적의 양자화 스텝 사이즈를 결정하는 방법을 들 수 있다.The quantization step size determination method according to an embodiment calculates the final significant value w k of the k-th macroblock based on the first to third significant values of the k-th macroblock, and then applies the calculated final importance value to the rate distortion model. To determine the optimal quantization step size.
여기서, 최종 중요치를 산출하는 방법으로는, 상기 제1 중요치, 제2 중요치, 및 제3 중요치에 대한 가중합을 산출하는 방법, 상기 제1 중요치, 제2 중요치, 및 제3 중요치의 곱에 비례하는 값으로 최종 중요치를 결정하는 방법을 들 수 있으나, 반드시 이에 한정되는 것은 아니다. 전자의 방법에 따른 최종 중요치의 예로는 "최종 중요치 = 제1 가중치 * 제1 중요치 + 제2 가중치 * 제2 중요치 + 제3 가중치 * 제3 중요치"이고, 후자의 방법에 따른 최종 중요치의 예로는, "최종 중요치 = 상수 * 제1 중요치 * 제2 중요치 * 제3 중요치"이다. 여기서, 제1 가중치, 제2 가중치, 제3 가중치, 상수는 미리 설정된 값이다.Here, the method for calculating the final important value may be proportional to a product of the method for calculating the weighted sum of the first important value, the second important value, and the third important value, the first important value, the second important value, and the third important value. The final value may be determined as a value of, but is not necessarily limited thereto. An example of the final significance according to the former method is "final significance = first weight * first importance + second weight * second importance + third weight * third importance". , "Final important value = constant * first important value * second important value * third important value". Here, the first weight, the second weight, the third weight, and the constant are preset values.
한편, 레이트 제어부(318)가 제1 내지 제3 중요치 중 두 가지만(예컨대, 제1 중요치 및 제3 중요치)을 제공 받는 경우라면, 상술한 방법과 마찬가지로 가중합 또는 서로의 곱에 비례하는 값으로 최종 중요치를 결정한다. 또한, 레이트 제어부(318)가 제1 내지 제3 중요치 중 어느 하나만(예컨대, 제1 중요치)을 제공 받는 경우라면, 그 제공받는 중요치 자체가 최종 중요치가 된다.On the other hand, if the
이렇게 산출된 최종 중요치를 rate distortion model에 적용하여 최적의 양자화 스텝 사이즈를 결정하는 방법의 예로는 수학식 13으로 정의되는 최적화 문제의 해 즉, Δ1, Δ2, ..., ΔK 의 값을 찾는 것과 같다.An example of a method of determining an optimal quantization step size by applying the final critical value thus calculated to a rate distortion model is the solution of the optimization problem defined by Equation 13, that is, the values of Δ 1 , Δ 2 , ..., Δ K. It's like finding.
수학식 13에서, Δk는 k번째 매크로블록의 양자화 스텝 사이즈이고, K는 현재의 영상 프레임에 포함된 매크로 블록의 갯수를 나타내며, 은 주어진 총 비트율을 나타낸다.In Equation 13, Δ k is the quantization step size of the k-th macroblock, K represents the number of macroblocks included in the current image frame, Represents the total bit rate given.
또한, 수학식 13에서 D(Δk) 및 Rk(Δk)는 Δk으로 양자화하였을 때의 외곡량, 및 소요 데이터량을 나타내는 함수로서 고전적인 모델에 따르면 각각 수학식 14 및 수학식 15로 정의된다. In addition, in Equation 13, D (Δ k ) and R k (Δ k ) are functions representing the amount of distortion and data required when quantized by Δ k , and according to the classical model, Equation 14 and Equation 15, respectively. Is defined as
수학식 14 및 15에서 β는 상수로서, 일반적인 값은 12이다. 또한, 수학식 15에서의 ε2는 양자화할 대상의 통계적 분포에 따라 결정되는 상수로서, 양자화할 대상이 Gaussian Source인 경우에는 1.4, Laplacian Source인 경우에는 1.2의 값을 갖는다. 수학식 15에서 σk 2는 양자화할 대상의 분산 값을 나타낸다. 즉, k번째 매크로 블록에 속하는 변환 계수 값들로 얻어지는 분산 값을 나타낸다.Β is a constant in Equations 14 and 15, and a general value is 12. Ε 2 in Equation 15 is a constant determined according to the statistical distribution of the object to be quantized, and has a value of 1.4 when the object to be quantized is Gaussian Source and 1.2 when the object is Laplacian Source. In Equation 15, σ k 2 represents a variance value of the object to be quantized. That is, the variance value obtained by the transform coefficient values belonging to the k-th macroblock.
수학식 13으로 주어지는 최적화 문제를 Lagrangian relaxation을 적용하면, 최적해 즉, k번째 매크로블록의 최적 양자화 스텝 사이즈 Δk *는 수학식 16으로 주어진다.Applying Lagrangian relaxation to the optimization problem given by Equation 13, the optimal solution, i.e., the optimal quantization step size Δ k * of the k-th macroblock, is given by Equation 16.
즉, 본 발명의 일실시예에 따르면, 레이트 제어부(318)는 상술한 방법으로 최종 중요치 wk를 산출한 후, 그 산출된 최종 중요치를 수학식 16에 적용하여 k번째 매크로 블록의 양자화 스텝 사이즈를 결정한다. 수학식 16을 참조하면, 최적 양자화 스텝 사이즈는 최종 중요치에 대체로 반비례함을 알 수 있다.That is, according to an embodiment of the present invention, the
도 4는 본 발명의 일실시예에 따른 영상 부호화 장치를 나타낸다.4 shows an image encoding apparatus according to an embodiment of the present invention.
도 4에서 사용되는 본 발명의 일실시예에 따른 검출 방법은, 도 3에서의 검출 방법과는 달리 모노 영상을 통하여 관심 영역을 검출한다. 따라서, 나머지 블록의 동작은 도 3에서의 설명과 동일하므로, 검출부(400)의 동작에 대해서만 설명한다.Unlike the detection method of FIG. 3, the detection method according to the exemplary embodiment of the present invention used in FIG. 4 detects an ROI through a mono image. Therefore, since the operation of the remaining blocks is the same as the description in FIG. 3, only the operation of the
검출부(400)는 상기 영상 프레임으로부터, 경계 블록에 속하고 소정 임계치 이상의 움직임 크기 값을 가진 매크로 블록들을 추출하고, 상기 추출된 매크로 블록들을 그룹화하여 움직임의 크기 및 방향 면에서 서로 유사한 매크로 블록들을 포함하는 적어도 하나의 그룹을 생성하고, 상기 생성된 그룹마다 그룹원들을 포함하 는 컨벡스 헐(convex hull)을 생성한 후, 상기 생성된 적어도 하나의 컨벡스 헐의 내부 영역을 관심 영역으로 결정한다. 즉, 이 방법에 따르면, 경계 블록에 속하고 소정 임계치 이상의 움직임 크기 값을 가진 매크로 블록들을 포비에이션 지점들로 추정한 후, 움직임의 방향 및 크기가 비슷한 매크로 포비에이션 지점들로 각각의 컨벡스 헐을 구성하여 각각의 관심 영역을 생성하는 것이다.The
이 방법은 하나의 카메라만을 사용하여 오브젝트를 검출할 수 있다는 장점을 갖는다. 즉, 도 3에서의 양안시 카메라 기반 기법과는 달리, 하나의 카메라로 영상을 저장하여 깊이 지도를 작성할 수 없는 상황에서도 사용할 수 있는 방법이다.This method has the advantage that the object can be detected using only one camera. That is, unlike the binocular camera-based method of FIG. 3, the image can be used even in a situation where a depth map cannot be created by storing an image with one camera.
여기서, 경계 블록에 속하는 매크로 블록을 결정해야 하는 데, 본 발명의 일실시예에 따른 검출부(300)는 서브블록 단위로 움직임 보상이 이루어지는 매크로 블록들을 상기 경계 블록에 속하는 매크로 블록들로 결정한다. 이는 복잡한 텍스쳐(texture)를 가진 매크로 블록 즉, 분산 값이 큰 매크로 블록에 대해서는 서브 블록 단위의 움직임 보상이 적용되며, 복잡한 텍스쳐를 가진 매크로 블록이 경계 블록에 해당할 가능성이 높기 때문이다.Here, the macro block belonging to the boundary block should be determined. The
예컨대, 검출부(300)는 움직임 예측부(350)로부터 매크로 블록의 구성 정보(예컨대, 서브 블록 단위의 움직임 보상이 적용되는 매크로 블록인지 여부) 및 움직임 벡터 값들을 제공받아 경계 블록에 속하고 소정 임계치 이상의 움직임 크기 값을 가진 매크로 블록들을 추출하고, 상기 추출된 매크로 블록들을 그룹화하여 움직임의 크기 및 방향 면에서 서로 유사한 매크로 블록들을 포함하는 적어도 하나의 그룹을 생성한다.For example, the
시선은 일반적으로 화면의 중앙에 집중될 가능성이 있기 때문에 이러한 특성을 반영하여 본 발명의 다른 일실시예에 따른 검출부(400)는 상기 영상 프레임의 중심 영역 - 하나의 매크로 블록 또는 인접하는 소정 갯수의 매크로 블록들을 포함함 - 도 관심 영역으로 결정한다.Since the line of sight is generally concentrated in the center of the screen, in consideration of this characteristic, the
도 5a에는 영상 프레임에 포함된 매크로 블록들 중에서 경계 블록에 속하고 소정 임계치 이상의 움직임 크기 값을 가진 것으로 추정되어 추출된 매크로 블록들및 중심 영역에 해당하는 매크로 블록이 단색으로 표시되어 있다.In FIG. 5A, macroblocks extracted from the macroblocks included in the image frame, which are estimated to belong to the boundary block and have a motion size value greater than or equal to a predetermined threshold, and the macroblocks corresponding to the central region are displayed in monochrome.
도 5b에는 도 5a의 결과에 따라 생성된 컨벡스 헐이 굵은 실선으로 표시되어 있으며, 중심 영역 및 각 컨벡스 헐의 내부가 관심 영역이 된다.In FIG. 5B, the convex hull generated according to the result of FIG. 5A is represented by a thick solid line, and the center region and the inside of each convex hull become the region of interest.
도 6은 본 발명의 일실시예에 따른 영상 부호화 방법을 나타내는 흐름도이다.6 is a flowchart illustrating an image encoding method according to an embodiment of the present invention.
본 실시예는 도 3 또는 도 4의 장치에서도 수행될 수 있으므로, 도 3 및 도 4와 관련하여 설명된 내용은 본 실시예도 그대로 적용되므로, 구체적인 설명은 생략한다.Since the present embodiment may be performed in the apparatus of FIG. 3 or 4, the contents described with reference to FIGS. 3 and 4 also apply to the present embodiment, and thus a detailed description thereof will be omitted.
편의상, 도 3을 참조하여, 도 6의 실시예를 설명하면 다음과 같다.For convenience, the embodiment of FIG. 6 will be described with reference to FIG. 3.
S600 단계에서, 검출부(300)는 영상 프레임으로부터, 적어도 하나의 관심 영역(Region of Interest : 이하, ROI) - 하나의 매크로 블록 또는 복수의 인접한 매크로 블록들을 포함함 - 및 나머지 영역을 검출한다.In operation S600, the
S610 단계에서, 결정부(310)는 상기 적어도 하나의 관심 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균이 상기 나머지 영역의 양자화에 사용될 양자화 스텝 사이즈의 평균보다 작도록, 상기 영상 프레임에 포함된 매크로 블록들 각각의 양자화 스텝 사이즈를 결정한다.In operation S610, the
S620 단계에서, 양자화부(324)는 매크로 블록들 각각의 변환 계수들을 S610 단계에서 결정된 양자화 스텝 사이즈에 따라 양자화한다.In step S620, the
도 7은 본 발명의 다른 일실시예에 따른 영상 부호화 방법을 나타내는 흐름도이다.7 is a flowchart illustrating an image encoding method according to another embodiment of the present invention.
본 실시예는 도 3 또는 도 4의 장치에서도 수행될 수 있으므로, 도 3 및 도 4와 관련하여 설명된 내용은 본 실시예도 그대로 적용되므로, 구체적인 설명은 생략한다.Since the present embodiment may be performed in the apparatus of FIG. 3 or 4, the contents described with reference to FIGS. 3 and 4 also apply to the present embodiment, and thus a detailed description thereof will be omitted.
편의상, 도 3을 참조하여, 도 7의 실시예를 설명하면 다음과 같다.For convenience, the embodiment of FIG. 7 will be described with reference to FIG. 3.
S700 단계에서, 결정부(310)는 영상 프레임에 포함된 매크로 블록마다, 변환 계수들에 대한 가중합을 산출하고, 상기 산출된 가중합을 기초로 해당 매크로 블록의 양자화 스텝 사이즈를 결정한다. 여기서, 가중합의 산출에 사용되는 가중치들 각각은 해당 변환 계수의 공간 주파수에 반비례하는 값을 갖는다.In operation S700, the
S710 단계에서, 양자화부(324)는 매크로 블록들 각각의 변환 계수들을 상기 결정된 양자화 스텝 사이즈에 따라 양자화한다.In operation S710, the
이러한 본 발명에 의한 대부분의 실시예들은 직교 변환 과정과 양자화 과정 사이에 개재되므로, H.264-SVC와 같은 스케일러블(scalable) 영상 압축 코덱에도 특별한 수정 없이 적용 가능하다는 점은 이 분야에 종사하는 자라면 충분히 이해할 수 있다.Since most embodiments of the present invention are interposed between an orthogonal transform process and a quantization process, it is possible to apply a scalable image compression codec such as H.264-SVC without special modification. If you grow up, you can fully understand.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 케리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like, which are also implemented in the form of carrier waves (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion. In addition, functional programs, codes, and code segments for implementing the present invention can be easily inferred by programmers in the art to which the present invention belongs.
이러한 본원 발명인 방법 및 장치는 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범 위에 의해 정해져야 할 것이다.Such a method and apparatus of the present invention have been described with reference to the embodiments shown in the drawings for clarity, but these are merely exemplary, and various modifications and equivalent other embodiments are possible to those skilled in the art. Will understand. Therefore, the true technical protection scope of the present invention will be defined by the appended claims.
상기에서 제시한 본 발명의 실시예들은 다음의 장점들을 포함하는 효과를 가질 수 있다. 다만, 본 발명의 모든 실시예들이 이를 전부 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.Embodiments of the present invention presented above may have an effect including the following advantages. However, all the embodiments of the present invention are not meant to include them all, and thus the scope of the present invention should not be understood as being limited thereto.
본 발명의 일 실시예에 따르면, 시각적 화질의 저하 없이 압축율을 향상시킬수 있어, 네트워크에서 채널 용량이 부족하거나 채널 환경이 열악한 상황에서도 효과적으로 사용될 수 있다.According to an embodiment of the present invention, the compression ratio can be improved without deteriorating visual quality, and thus can be effectively used even in a channel shortage or poor channel environment in a network.
또한, 본 발명의 일실시예에 따르면, 기존의 영상 압축 표준에 호환될 수 있어, 시장 점유 면에서 유리하다는 장점이 있다.In addition, according to an embodiment of the present invention, it can be compatible with the existing image compression standard, there is an advantage in terms of market share.
또한, 본 발명의 일실시예에 따르면, 인간의 시각적 특성을 이용하여 영상 부호화를 하더라도 추가적인 리던던시를 수반하지 않는다는 장점이 있다.In addition, according to an embodiment of the present invention, even if the image encoding using the human visual characteristics does not have additional redundancy.
또한, 본 발명의 일실시예에 따르면, 인간의 시각에 미치는 다양한 요소들을 함께 고려하여 시각적으로 중요하지 않은 신호는 제거하고, 중요한 정보에 더 많은 비트를 할당함으로써 추가적으로 압축률 향상을 얻을 수 있다는 장점이 있다.In addition, according to an embodiment of the present invention, in consideration of various factors affecting the human vision together, it is possible to remove a signal that is not visually important and to further improve compression ratio by allocating more bits to important information. have.
도 1은 포비에이션 지점을 설명하기 위한 도면이다.1 is a view for explaining a fob point.
도 2는 움직임 기반의 인지적 중요도를 설명하기 위해 속도 및 너비와 관련한 대비 민감도를 예시한다.2 illustrates contrast sensitivity in relation to speed and width to illustrate motion-based cognitive importance.
도 3 및 4는 본 발명의 일실시예에 따른 영상 부호화 장치를 나타내는 블록도이다.3 and 4 are block diagrams illustrating an image encoding apparatus according to an embodiment of the present invention.
도 5a 및 5b는 본 발명의 일실시예에 따른 관심 영역 검출 방법을 설명하기 위한 도면이다.5A and 5B are diagrams for describing a region of interest detection method according to an embodiment of the present invention.
도 6 및 도 7은 본 발명의 일실시예에 따른 영상 부호화 방법을 나타내는 흐름도이다.6 and 7 are flowcharts illustrating an image encoding method according to an embodiment of the present invention.
Claims (22)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020080097478A KR101007381B1 (en) | 2008-10-06 | 2008-10-06 | Image Coding Device Considering Region of Interest |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020080097478A KR101007381B1 (en) | 2008-10-06 | 2008-10-06 | Image Coding Device Considering Region of Interest |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20100038490A KR20100038490A (en) | 2010-04-15 |
| KR101007381B1 true KR101007381B1 (en) | 2011-01-13 |
Family
ID=42215187
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020080097478A Expired - Fee Related KR101007381B1 (en) | 2008-10-06 | 2008-10-06 | Image Coding Device Considering Region of Interest |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101007381B1 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101588780B1 (en) * | 2014-09-02 | 2016-01-26 | 재단법인 실감교류인체감응솔루션연구단 | Method, appratus and computer-readable recording medium for detecting boundary of object in depth image |
| KR101746799B1 (en) | 2015-11-04 | 2017-06-14 | 주식회사 쏠리드 | distributed antenna system |
| US12301825B2 (en) | 2022-03-16 | 2025-05-13 | Apple Inc. | Resolution-based video encoding |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013027950A2 (en) * | 2011-08-25 | 2013-02-28 | 삼성전자 주식회사 | Apparatus and method for encoding/decoding a depth image using variable quantization parameters |
| LT3793200T (en) | 2012-04-13 | 2023-02-27 | Ge Video Compression, Llc | VIDEO ENCODING WITH LOW LATENCY |
| CN115442623B (en) * | 2012-06-29 | 2024-08-23 | Ge视频压缩有限责任公司 | Method for decoding video data stream, storage medium, encoder, decoder |
| KR102114466B1 (en) * | 2018-09-05 | 2020-05-25 | 트러스트팜모바일 주식회사 | Image processing method and apparatus using region-of-interest information in video contents |
| KR102802945B1 (en) * | 2019-02-20 | 2025-04-30 | 세종대학교산학협력단 | Method and apparatus for center-to-edge progressively encoding image |
| CN118972582B (en) * | 2024-10-11 | 2025-01-07 | 浙江大华技术股份有限公司 | A video encoding method, device, equipment, medium and computer program product |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100464004B1 (en) * | 2002-01-30 | 2005-01-03 | 엘지전자 주식회사 | Quantization method for video using weight of interest region |
| KR20080053873A (en) * | 2006-12-11 | 2008-06-16 | 한국전자통신연구원 | Adaptive Quantization Method and Apparatus for Image Coding for Image Quality Enhancement of Stereoscopic Images |
-
2008
- 2008-10-06 KR KR1020080097478A patent/KR101007381B1/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100464004B1 (en) * | 2002-01-30 | 2005-01-03 | 엘지전자 주식회사 | Quantization method for video using weight of interest region |
| KR20080053873A (en) * | 2006-12-11 | 2008-06-16 | 한국전자통신연구원 | Adaptive Quantization Method and Apparatus for Image Coding for Image Quality Enhancement of Stereoscopic Images |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101588780B1 (en) * | 2014-09-02 | 2016-01-26 | 재단법인 실감교류인체감응솔루션연구단 | Method, appratus and computer-readable recording medium for detecting boundary of object in depth image |
| KR101746799B1 (en) | 2015-11-04 | 2017-06-14 | 주식회사 쏠리드 | distributed antenna system |
| US10200157B2 (en) | 2015-11-04 | 2019-02-05 | Solid Inc. | Distributed antenna system |
| US10897327B2 (en) | 2015-11-04 | 2021-01-19 | Solid Inc. | Distributed antenna system |
| US11799588B2 (en) | 2015-11-04 | 2023-10-24 | Solid Inc. | Distributed antenna system |
| US12301825B2 (en) | 2022-03-16 | 2025-05-13 | Apple Inc. | Resolution-based video encoding |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20100038490A (en) | 2010-04-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101007381B1 (en) | Image Coding Device Considering Region of Interest | |
| KR100853201B1 (en) | Adaptive Quantization Method and Apparatus for Image Coding for Image Quality Enhancement of Stereoscopic Images | |
| Xu et al. | Region-of-interest based conversational HEVC coding with hierarchical perception model of face | |
| US10616594B2 (en) | Picture encoding device and picture encoding method | |
| US20140321552A1 (en) | Optimization of Deblocking Filter Parameters | |
| CN103051901B (en) | Video data coding device and method for coding video data | |
| Lin | Computational models for just-noticeable difference | |
| JP4189358B2 (en) | Image coding apparatus and method | |
| Shen et al. | A novel H. 264 rate control algorithm with consideration of visual attention | |
| US20130170545A1 (en) | Image encoding apparatus, image encoding method and program | |
| CN107396081A (en) | For the Optimized Coding and device of panoramic video | |
| WO2020098751A1 (en) | Video data encoding processing method and computer storage medium | |
| CN103096079A (en) | Multi-view video rate control method based on exactly perceptible distortion | |
| WO2019109988A1 (en) | Face region detection based light field video compression | |
| KR20190062284A (en) | Method and apparatus for image processing based on perceptual characteristic | |
| Kim et al. | Depth perception and motion cue based 3D video quality assessment | |
| KR100950196B1 (en) | Method for video encoding | |
| Yu et al. | HEVC encoder optimization for HDR video coding based on irregularity concealment effect | |
| JP4033292B2 (en) | Quantization control method for video coding | |
| Shang et al. | Perceptual multiview video coding based on foveated just noticeable distortion profile in DCT domain | |
| Lin et al. | Perceptual importance analysis-based rate control method for HEVC | |
| Wang et al. | PVC-STIM: Perceptual video coding based on spatio-temporal influence map | |
| Lee et al. | An attention emphasized bit arrangement in 3-D SPIHT video coding for human vision | |
| KR101150871B1 (en) | Method and apparatus for calculating fatigue of stereoscopic image based on horizontal disparity and vertical disparity | |
| JP4668878B2 (en) | Encoder |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| N231 | Notification of change of applicant | ||
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20140103 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20150105 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| FPAY | Annual fee payment |
Payment date: 20160104 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20161227 Year of fee payment: 7 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| FPAY | Annual fee payment |
Payment date: 20200106 Year of fee payment: 10 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 10 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 11 |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20220105 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20220105 |