[go: up one dir, main page]

KR102281037B1 - 뷰포트(Viewport) 추출 방법 및 장치 - Google Patents

뷰포트(Viewport) 추출 방법 및 장치 Download PDF

Info

Publication number
KR102281037B1
KR102281037B1 KR1020190129415A KR20190129415A KR102281037B1 KR 102281037 B1 KR102281037 B1 KR 102281037B1 KR 1020190129415 A KR1020190129415 A KR 1020190129415A KR 20190129415 A KR20190129415 A KR 20190129415A KR 102281037 B1 KR102281037 B1 KR 102281037B1
Authority
KR
South Korea
Prior art keywords
region
coordinates
area
subdivided
viewport
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020190129415A
Other languages
English (en)
Other versions
KR20210045871A (ko
Inventor
한종기
이건원
Original Assignee
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세종대학교산학협력단 filed Critical 세종대학교산학협력단
Priority to KR1020190129415A priority Critical patent/KR102281037B1/ko
Publication of KR20210045871A publication Critical patent/KR20210045871A/ko
Application granted granted Critical
Publication of KR102281037B1 publication Critical patent/KR102281037B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • G06K9/3233
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)

Abstract

본 발명에 따른 뷰포트 추출 방법은, 뷰포트(viewport)영역의 화소의 위치에 대한 좌표를 UV영역의 좌표로 변환하고, 변환된 UV영역 좌표에 대응하는 구 표면 좌표를 산출하며, 산출된 구 표면 좌표에 해당하는 영상 정보를 추출할 수 있다.

Description

뷰포트(Viewport) 추출 방법 및 장치{A METHOD AND AN APPARATUS FOR EXTRACTING VIEWPORT}
본 발명은 뷰포트(Viewport) 추출 방법 및 장치에 관한 것이다.
카메라의 성능이 좋아지고, 네트워크 대역폭이 증가함에 따라, 고해상도와 높은 대역폭을 요구하는 360 VR 영상의 수요 또한 늘고 있다. 360 VR 영상 시청을 위해서, 360 전체 영상의 일부분만을 선택적으로 출력하는 viewport가 필요하다. 360 VR 영상 정보는 3차원 공간상의 단위구 표면에 저장된다. 원하는 시점의 영상만을 viewport를 통하여 시청할 때, 원하는 시점, 원하는 시야각 (FOV; Field of view)을 설정 후 이에 맞게 단위 구 표면의 영상 정보를 구에 인접해 있는 평면에 투영하여 viewport로 영상정보 추출한다.
통상적으로 사용하는 기존의 viewport 추출방법인 rectilinear 투영법은 평면을 이용하기에 viewport의 FOV가 커질수록 큰 시각적인 왜곡을 야기한다.
KR 2018-0040507 A
본 발명은 곡면을 이용한 viewport 추출 방법을 사용하여 종래기술의 문제점을 해결하는 것에 목적이 있다.
본 발명은 뷰포트 추출에 있어서 영상 정보의 밀도가 고르게 분포하도록 좌표를 보정하는 것에 목적이 있다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에 따른 viewport 추출 방법 및 장치는, 뷰포트(viewport)영역의 화소의 위치에 대한 좌표를 UV영역의 좌표로 변환하고, 상기 변환된 UV영역 좌표에 대응하는 상기 구 표면 좌표를 산출하며, 상기 산출된 구 표면 좌표에 해당하는 영상 정보를 추출할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 UV영역은 영상 정보를 담고 있는 구 표면 좌표의 산출 시 이용되는 영역일 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 UV영역은, 평면 또는 곡면일 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 곡면은, 상기 영상 정보를 담고 있는 구에 외접한 외부 구의 일부이고, 상기 외부 구의 반지름은, 상기 영상 정보를 담고 있는 구의 반지름 보다 크거나 같을 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 변환은, 상기 UV영역의 가로 및 세로 길이를 고려하지 않고, 상기 뷰포트 영역에서의 가로 방향 및 세로 방향의 화소의 개수만 고려하여 수행되고, 상기 UV영역의 가로 및 세로 길이는 상기 뷰포트 영역의 FOV(Field of view)를 고려하여 결정될 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 변환단계는, 상기 변환된 좌표를 보정하는 보정단계를 포함할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 보정단계는, 상기 UV영역을 적어도 2개의 영역으로 세분화하고, 상기 제1 세분화 영역의 좌표 간 거리를 상기 제2 세분화 영역의 좌표 간 거리보다 작도록 상기 제1 세분화 영역 또는 상기 제2 세분화 영역 중 적어도 하나의 좌표를 보정할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 보정단계는 3차원 함수를 이용하여 수행되고, 상기 3차원 함수는, 상기 제1 세분화 영역에 적용되는 범위 내에서 상기 함수의 기울기는 1보다 작고, 상기 제2 세분화 영역에 적용되는 범위 내에서 상기 함수의 기울기는 1보다 클 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 보정단계는, 상기 뷰포트 영역 또는 상기 UV영역의 크기가 문턱크기 이하인 경우, 상기 세분화된 영역들 중 적어도 일부 영역의 보정단계를 스킵할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 보정단계는, 가중치 및 오프셋 값을 적용하여 수행되고, 상기 가중치 및 상기 오프셋 값은, 상기 세분화된 영역 별로 같거나 다를 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 제1 영역은, 상기 UV영역의 중심을 기준으로 하는 원 또는 사각형의 형태일 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 산출단계는, 상기 변환된 UV영역을 상기 구 표면의 중심으로 정사영시키고, 상기 정사영된 UV영역의 좌표에 대응하는 상기 구 표면의 좌표를 산출할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 화소의 위치는, 상기 화소들로 구성된 화소 그룹의 위치를 포함할 수 있다.
본 발명에 따른 viewport 추출 방법 및 장치에 있어서, 상기 화소 그룹의 위치는, 상기 화소 그룹 내 포함된 어느 한 화소의 위치 또는 상기 화소 그룹 내 포함된 복수개의 화소들의 평균값을 포함할 수 있다.
본 발명에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 발명의 상세한 설명의 예시적인 양상일 뿐이며, 본 발명의 범위를 제한하는 것은 아니다.
본 발명에 의하면, 곡면을 이용한 viewport 추출하여, FOV가 커질수록 커지는 시각적 왜곡을 줄일 수 있다.
본 발명에 의하면, 좌표를 보정하여, 추가적으로 남아있는 상기 시각적 왜곡을 줄일 수 있다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 Viewport 추출 방법의 순서도를 도시한 도면이다.
도 2은 Rectilinear 투영법을 이용한 평면에의 2D 투영 방법을 나타낸 도면이다.
도 3은 Stereographic 투영법을 이용한 평면에의 2D 투영 방법을 나타낸 도면이다.
도 4는 곡면을 사용하는 viewport 추출 방법의 모델을 나타내는 도면이다.
도 5는 곡면을 사용하는 viewport 추출 방법의 모델(도 4)의 단면을 나타내는 도면이다.
도 6는 보정단계에서 적용되는 정의역과 치역이 [0, 1]범위인 3차 함수를 나타내는 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. '및/또는'이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다 거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
사람의 시야각은 대략 120도 정도로 한정되어 있기 때문에, 사용자가 파노라믹 영상 또는 360도 영상 전체를 한번에 볼 수는 없다. 제한된 시야각으로 인해, 사용자는 파노라믹 영상 또는 360도 영상의 부분 영상만을 시청하게 된다. 파노라믹 영상 또는 360도 영상의 전체 영역 중 사용자의 시청 영역에 대응하는 부분 영상을 뷰 포트(View port)라 정의할 수 있다.
뷰 포트는 유동성에 따라, 정적 뷰 포트(Static View port) 및 동적 뷰 포트(Dynamic View port)로 분류될 수 있다. 정적 뷰 포트는 위치 변화가 없는 뷰 포트를 의미하고, 동적 뷰 포트는 사용자의 시선이 변화함에 따라 위치가 변하는 뷰 포트를 의미한다. 360도 영상의 전체에 대해 정적 뷰 포트를 사용하는 경우는 드물고, 대부분 사용자의 시선 움직임에 따라 위치가 변화하는 동적 뷰 포트를 사용한다.
파노라믹 영상은 복수의 영상을 스티칭하여 생성된 영상일 수 있다. 상기 복수의 영상은 복수의 카메라로 각각 촬영된 영상일 수 있다. 카메라로 촬영된 영상은 카메라의 화각에 따라 시야가 제한되기 때문이다.
360도 영상은 상기 파노라믹 영상 중 소정의 중심축을 기준으로 회전 자유도(Degree of Freedom)를 갖는 영상일 수 있다. 예컨대, 360도 영상은 Yaw, Roll, Pitch 중 적어도 하나에 대한 회전 자유도를 갖는 영상일 수 있다.
후술되는 실시예는, 360도 영상을 중심으로 설명할 것이나, 360도 영상이 아닌 파노라믹 영상에도 후술되는 실시예를 적용하는 것은 본 발명의 기술적 범주에 포함된다 할 것이다.
도 1은 Viewport 추출 방법의 순서도를 도시한 도면이다.
도 1을 참조하면, viewport 추출 방법은 뷰포트(viewport)영역의 화소의 위치에 대한 좌표를 UV영역의 좌표로 변환하는 변환단계(S100); 상기 변환된 UV영역의 좌표에 대응하는 구 표면 좌표를 산출하는 산출단계(S101); 및 상기 산출된 구 표면 좌표에 해당하는 영상 정보를 추출하는 추출단계(S102) 중 적어도 하나를 포함할 수 있다.
상기 뷰포트 추출 방법은, 영상의 부호화/복호화 장치에 적용될 경우, 360도 영상의 투영 및 역투영 과정을 모두 거쳐 복호화된 구의 형태의 360도 영상으로부터 뷰포트 영상을 추출하는데 적용될 수 있다.
이하, 뷰포트(viewport) 영역의 화소의 위치에 대한 좌표를 UV영역의 좌표로 변환하는 변환단계(S100)를 설명한다.
상기 좌표는 2D의 직교 좌표계일 수 있다.
상기 화소의 위치에 대한 좌표는 하나의 화소에 대한 좌표 또는 화소 그룹의 좌표를 포함한다. 상기 화소 그룹의 좌표는 해당 화소 그룹의 화소들 중 최 좌/우/상/하측, 좌상단에 위치한 화소, 우하단에 위치한 화소, 중앙에 위치한 화소의 좌표, 또는 화소 그룹 내의 화소 좌표들의 평균값 등을 포함할 수 있다. 상기 평균값은 동일한 가중치 기반의 평균값으로 계산된 값이거나 화소 별 상이한 가중치 기반의 평균값으로 계산된 값일 수 있다. 여기서, 상이한 가중치는, 화소 거리/위치를 고려하여 결정될 수 있다. 또한, 상기 화소 위치에 대한 좌표는 하나의 좌표를 기준으로 하는 벡터 좌표일 수 있다.
일 예로, 뷰포트 영역 내 9개의 화소가 정사각형 모양으로 하나의 그룹을 이루거나, 뷰포트 영역 내 5개의 화소가 마름모 모양으로 하나의 그룹을 이루고 있는 경우, 상기 그룹 내 가운데 화소의 좌표가 화소 그룹의 좌표가 될 수 있다.
일 예로, 뷰포트 영역의 하나의 행 또는 열이 하나의 그룹을 이루고 있는 경우, 상기 그룹의 최 좌/우측 또는 중앙에 있는 화소의 좌표가 상기 그룹의 좌표가 될 수 있다. 또한, 상기 행 또는 열의 화소들의 좌표에 거리에 따른 가중치를 곱한 후 평균값으로 계산된 좌표가 상기 그룹의 좌표가 될 수 있다.
상기 UV영역은 영상 정보가 담긴 구 표면을 투영하기 위한 별도의 영역일 수 있다. 상기 영역은 곡면 또는 평면의 형태를 가질 수 있다. 상기 평면 또는 곡면은 삼각형, 사각형 등의 다각형 또는 원의 모양을 가질 수 있다. 또한, 상기 다각형의 적어도 하나의 선이 곡선인 모양을 가질 수 있다. 구체적으로, 곡면 형태의 경우, 상기 모양들은 영상 정보가 담긴 구의 방향 또는 그 반대 방향으로 휘어진 형태를 가질 수 있다. 또한, 평면 형태의 경우, 상기 모양들은 어느 방향으로도 휘어지지 않은 펼쳐진 형태를 가질 수 있다.
구체적으로, 상기 곡면은 영상 정보를 포함하는 구의 외부 구의 일부일 수 있다. 이 경우, 외부 구의 반지름은 r로 영상 정보를 포함하는 구의 반지름보다 크거나 같을 수 있다. 예를 들어, 영상 정보를 포함하는 구가 단위 구인 경우 상기 r은 1보다 크거나 같을 수 있다.
상기 UV영역은 영상 정보를 포함하는 구 표면에 외접하거나 소정의 거리만큼 떨어져 있을 수 있다. 상기 소정의 거리는 영상 정보를 포함하는 구의 반지름의 n배의 거리에 해당할 수 있으며, 상기 n은 1,2,3, 또는 그 이상의 자연수를 포함할 수 있다.
일 예로, 도 2, 3을 참조하면, UV영역은 사각형 모양을 가지는 평면의 형태이고, 영상 정보를 포함하는 구 표면에 외접하고 있다.
일 예로, 도 4를 참조하면, UV영역은 사각형 모양을 가지는 곡면의 형태이고, 영상 정보를 포함하는 구 표면에 외접하고 있으며, 상기 영상 정보를 포함하는 구의 반지름 보다 큰 외부 구의 일부를 구성하고 있다. 여기서, 외부 구의 r은 1보다 크다.
상기 UV영역의 형태, 모양, 위치, 또는 크기는 기-약속된 고정된 형태, 모양, 위치, 또는 크기일 수 있다. 또한, 상기 영역의 형태, 모양, 위치, 또는 크기는 UV영역에 관련된 정보로부터 가변적으로 결정될 수 있다. 상기 UV영역에 관련된 정보는 가로 또는 세로 방향의 FOV(Field of View), 뷰포트 영역의 크기 또는 형태, 뷰포트 영역의 화소 또는 화소 그룹의 개수, 영상 정보의 종류, 영상 정보의 데이터의 양 또는 밀도, 후술할 viewport 투영 기법 등을 포함할 수 있다. 여기서, 상기 크기는 너비, 높이, 또는 너비와 높이의 비율을 포함할 수 있다. 상기 UV영역에 관련된 정보 전부 또는 일부는 영상 부호화 장치에서 부호화되어 시그날링되거나, 사용자 입력에 의해 결정될 수도 있다.
예를 들면, UV영역의 크기는 뷰포트 영역의 크기와 같을 수 있다. 이와 달리, UV영역의 크기는 뷰포트 영역의 크기와 다를 수도 있다. 상기 크기가 서로 다른 경우, UV영역의 크기는 뷰포트 영역의 너비 및 높이의 비율과 같은 비율 가지는 크기로 설정될 수 있다.
예를 들면, 상기 가로 또는 세로 방향의 FOV가 서로 같은 경우, UV영역의 모양은 정다면체 또는 원의 모양을 가질 수 있다. 구체적으로, 상기 다각형이 사각형인 경우, UV영역의 모양은 정사각형의 모양을 가질 수 있다. 이와 달리, 가로 또는 세로 방향의 FOV가 서로 다른 경우, UV영역의 모양은 상기 FOV 비율에 따른 모양을 가질 수 있다. 구체적으로, 상기 다각형이 사각형인 경우, UV영역의 모양은 FOV 비율과 같은 너비 및 높이의 비율을 가지는 직사각형의 모양을 가질 수 있다.
좌표의 변환은, UV영역이 평면인 경우 제1 수학식에 의해 계산되고, UV영역이 곡면인 경우 제2 수학식에 의해 계산되는 것을 포함할 수 있다. 다만, 이에 한정되지 않으며, 곡면의 경우도 제1 수학식에 의해 계산될 수 있고, 평면의 경우도 제2 수학식에 의해 계산될 수 있다. 또는, UV영역의 일부는 제1 수학식에 의해 계산되고, 다른 일부는 제2 수학식에 의해 계산될 수도 있다. 예를 들어, 제1 수학식과 제2 수학식은 다음 수학식 1과 수학식 2와 같이 정의될 수 있다.
Figure 112019106190933-pat00001
Figure 112019106190933-pat00002
Figure 112019106190933-pat00003
Figure 112019106190933-pat00004
여기서,
Figure 112019106190933-pat00005
,
Figure 112019106190933-pat00006
는 UV영역의 가로, 세로 길이이며,
Figure 112019106190933-pat00007
,
Figure 112019106190933-pat00008
는 뷰포트 영역의 가로방향, 세로방향 화소의 개수이다. (u,v)는 UV영역의 좌표, (m,n)은 뷰포트 영역의 좌표이다.
상기 수학식 1의
Figure 112019106190933-pat00009
,
Figure 112019106190933-pat00010
는 투영 기법에 따라 다른 값을 가질 수 있다.
일 예로, 도 2는 Rectilinear 투영법이 이용되는 경우로,
Figure 112019106190933-pat00011
,
Figure 112019106190933-pat00012
는 아래 수학식 3에 의해 정의될 수 있다.
Figure 112019106190933-pat00013
여기서,
Figure 112019106190933-pat00014
Figure 112019106190933-pat00015
는 각각 viewport의 가로방향, 세로방향에 대한 FOV(Field of view)이다.
일 예로, 도 3은 Stereographic 투영법이 이용되는 경우로,
Figure 112019106190933-pat00016
,
Figure 112019106190933-pat00017
는 아래 수학식 4에 의해 정의될 수 있다.
Figure 112019106190933-pat00018
여기서,
Figure 112019106190933-pat00019
Figure 112019106190933-pat00020
는 각각 viewport의 가로방향, 세로방향에 대한 FOV(Field of view)이다.
이하, 상기 변환된 UV영역 좌표에 대응하는 구 표면 좌표를 산출하는 산출단계(S101)를 설명한다.
상기 구 표면 좌표는 3D XYZ 좌표계의 좌표일 수 있다. 3D XYZ 좌표계는 X, Y, Z축과 반지름 길이가 1인 단위 구로 구성될 수 있다. 여기서, 단위 구는 해당 표면에 360도 영상 정보를 포함할 수 있다.
상기 단위 구 표면 한 점은 경도(φ)와 위도(θ)로 표현될 수 있다. 상기 경도(φ)는 X축을 기준으로 반시계 방향으로의 각도를 표현할 수 있고, 그 범위는 [-π, π]일 수 있다. 상기 위도(θ)는 적도에서 Y축을 향한 각도를 표현할 수 있고, 그 범위는 [-π/2, π/2]일 수 있다. 3D XYZ 좌표계의 단위 구 표면위의 한 점의 좌표 (X, Y, Z)와 (φ, θ)는 아래 수학식 5과 같은 관계를 갖는다.
Figure 112019106190933-pat00021
Figure 112019106190933-pat00022
게다가, (X, Y, Z) 좌표는 뷰포트 영역의 중심이 되는 시점의 위도 및 경도(
Figure 112019106190933-pat00023
,
Figure 112019106190933-pat00024
)에 따라 전환될 수 있다. 구체적으로, 상기 전환은 아래 수학식 6에 의해 수행될 수 있다.
Figure 112019106190933-pat00025
Figure 112019106190933-pat00026
여기서, (X', Y', Z')는 (X, Y, Z)가 전환된 좌표이다.
상기 구 표면의 좌표 산출은, 상기 구 표면을 UV영역에 투영하여 상기 UV영역 좌표에 대응하는 투영된 구 표면의 좌표를 얻는 것을 포함할 수 있다.
상기 투영은, Rectilinear 투영법 또는 Stereographic 투영법을 포함할 수 있다.
상기 투영 기법의 결정은 기-약속된 고정된 기법에 의해 결정되거나, 투영 관련 정보에 의해 가변적으로 결정될 수 있다. 상기 투영 관련 정보는 전술한 파라미터 중 적어도 하나에 기초하여 결정될 수 있다. 전술한 파라미터는, 가로 방향 또는 세로방향의 FOV(Field of View), 뷰포트 영역의 크기 또는 형태, 뷰포트 영역의 화소 또는 화소 그룹의 개수, UV영역의 형태, 모양, 위치, 또는 크기, 영상 정보의 종류, 영상 정보의 데이터의 양 또는 밀도 중 적어도 하나를 포함할 수 있다.
도 2는 Rectilinear 투영법을 이용한 평면에의 2D 투영 방법을 나타낸 도면이다.
Rectilinear 투영법은 구의 점을 2D 영역에 수선의 발을 내려 정사영시켜 투영하는 방법이다. 상기 방법에 따라, 2D 영역의 좌표 (u, v)와 3D 구의 좌표 (X, Y, Z)는 아래 수학식 7와 같은 관계를 가질 수 있다.
Figure 112019106190933-pat00027
Figure 112019106190933-pat00028
여기서,
Figure 112019106190933-pat00029
,
Figure 112019106190933-pat00030
는 UV영역의 가로, 세로 길이이고, 앞서 설명한 수학식 3에 의해 계산될 수 있다. 또한,
Figure 112019106190933-pat00031
,
Figure 112019106190933-pat00032
는 뷰포트 영역의 가로방향, 세로방향 화소의 개수이다.
도 3은 Stereographic 투영법을 이용한 평면에의 2D 투영 방법을 나타낸 도면이다.
Stereographic 투영법은 2D 영역의 좌표 (u, v)와 3D 구의 좌표 (X, Y, Z)가 아래의 수학식 8과 같은 관계를 가지는 것을 말한다.
Figure 112019106190933-pat00033
Figure 112019106190933-pat00034
여기서,
Figure 112019106190933-pat00035
,
Figure 112019106190933-pat00036
는 UV영역의 가로, 세로 길이이고, 앞서 설명한 수학식 4에 의해 계산될 수 있다.
도 4는 곡면을 사용하는 viewport 추출 방법의 모델이고, 도 5는 곡면을 사용하는 viewport 추출 방법의 모델(도 4)의 단면을 나타내는 도면이다.
도 4, 5를 참조하여, 이하, Rectilinear 투영법을 이용한 곡면에의 2D 투영 방법을 설명한다.
먼저, 도 4를 참조하면, 곡면 ABCD는 단위 구와 외접해 있는 외부 구의 일부이고, 외부 구의 반지름은 r이며, 외부 구의 중심은 Z축을 따라 r만큼 떨어져 있는 O'이다. 또한, 외부 구는 수학식 9와 같은 방정식으로 표현된다.
Figure 112019106190933-pat00037
도 5를 참조하면, Rectilinear 투영법을 이용한 곡면에의 2D 투영 방법은 2D 영역의 좌표 (u, v)와 3D 구의 좌표 (X, Y, Z)가 아래의 수학식 10와 같은 관계를 가질 수 있다.
Figure 112019106190933-pat00038
Figure 112019106190933-pat00039
여기서,
Figure 112019106190933-pat00040
,
Figure 112019106190933-pat00041
는 아래의 수학식 11에 의해 정의될 수 있다.
Figure 112019106190933-pat00042
Figure 112019106190933-pat00043
여기서,
Figure 112019106190933-pat00044
는 Viewport의 세로방향 FOV이고,
Figure 112019106190933-pat00045
은 외부 구의 중점 O'을 기준으로 하는 세로방향 각도이다.
상기 산출된 구 표면 좌표에 해당하는 영상 정보를 추출하는 추출단계(S102)는 뷰포트 영역에 해당 뷰포트 영역 좌표 각각에 매칭되는 구 표면 영상 정보를 불러오는 것을 말한다.
상기 변환단계(S100)는, 변환된 좌표를 보정하는 보정단계를 더 포함할 수 있다.
보정단계는, 전술한 파라미터 중 적어도 하나에 기초하여 선택적으로 수행될 수 있다. 예를 들어, 뷰포트 영역(또는 UV영역)의 크기가 소정의 문턱크기 이하인 경우에는 보정단계를 스킵하고, 그렇지 않은 경우에는 보정단계를 수행할 수 있다. 상기 문턱크기는 영상 부호화/복호화 장치에 기-정의된 값일 수도 있고, 영상 부호화 장치는 최적의 문턱크기를 결정하고, 이를 부호화할 수 있다. 부호화된 문턱크기는 좌표 보정이 허용되는 최소/최대 크기를 의미할 수 있다. 또는, UV영역의 타입이 평면인 경우에는 보정단계를 스킵하고, UV영역의 타입이 곡면인 경우에는 보정단계를 수행할 수 있다.
UV영역의 전부에 대해서 보정단계가 수행될 수도 있고, UV영역의 일부에 대해서만 보정단계가 수행될 수도 있다. 여기서, 일부는, UV영역의 중심 영역 또는 UV영역 내 가장자리 영역을 의미할 수 있다. 또는, 일부는, UV영역의 좌/우측 가장자리 영역으로 한정될 수도 있고, 상/하단 가장자리 영역으로 한정될 수도 있다. 또는, 일부는, UV영역의 각 코너 영역(예를 들어, 좌상단, 좌하단, 우상단, 우하단) 중 적어도 하나로 한정될 수도 있다. 상기 가장자리 영역은, UV영역의 경계로부터 T개의 화소 라인을 포함하며, T는 1, 2, 3, 4, 5 또는 그 이상의 정수일 수 있다. 가장자리의 위치에 따라, 가장자리 영역에 속한 화소 라인의 개수가 상이할 수도 있다. 예를 들어, 보정단계가 수행되는 좌/우측 가장자리 영역이 상/하단 가장자리 영역보다 더 많은 화소 라인을 포함할 수 있다.
보정을 위해, UV영역은 크게 중심 영역과 가장자리 영역으로 구분될 수 있다. 또는, UV영역은 중심 영역, 가장자리 영역(코너 영역 제외) 및 코너 영역으로 구분될 수도 있다. 다만, 이는 구분되는 영역의 개수와 위치를 한정하는 것은 아니며, UV영역은 4개 이상의 세분화된 영역으로 구분될 수도 있다.
예를 들어, 상기 보정 단계는, 상기 UV영역을 제1 영역 및 제2 영역으로 나누고, 상기 제1 영역의 좌표 간의 거리를 상기 제 2영역의 좌표 간의 거리보다 작도록 상기 제1 영역 또는 상기 제2 영역 중 적어도 하나의 좌표를 보정하는 것을 포함할 수 있다.
상기 제1 영역은 UV영역의 중심점을 중심으로 하는 다각형 또는 원의 모양을 가질 수 있다. 이 경우, 상기 제2 영역은 UV영역에 있어서 상기 제1 영역을 제외한 나머지 영역의 전부 또는 일부를 포함할 수 있다.
본 발명에 따른 보정은, UV영역 내의 화소 위치(x,y)를 (x',y')로 변환하는 과정을 포함할 수 있다. 화소 위치의 x 좌표와 y 좌표 각각에 소정의 가중치(w)와 오프셋(o)를 적용하여 보정된 위치 x'와 y'를 획득할 수 있다. 여기서, 가중치(w)와 오프셋(o)는 0을 포함한 정수일 수 있다.
x 좌표를 위한 가중치(wx)는 wx1, wx2 또는 wx3 중 적어도 하나를 포함할 수 있다. y 좌표를 위한 가중치(wy)는 wy1, wy2 또는 wy3 중 적어도 하나를 포함할 수 있다. 예를 들어, 보정은, 다음 수학식 12와 같이 수행될 수 있다.
Figure 112019106190933-pat00046
상기 3차 방정식과 달리, 1차, 2차, 4차, 5차, 또는 그 이상의 차수 방정식도 적용될 수 있다.
영상 부호화/복호화 장치는, 보정을 위한 복수의 수학식을 정의할 수 있다. 복수의 수학식 중 어느 하나를 선택하여 보정을 수행할 수도 있다. 여기서, 선택은, 뷰포트 영역의 크기/형태, UV영역의 크기/형태, UV영역의 타입(예를 들어, 평면, 곡면 등), 영상 정보를 담고 있는 구 또는 외접하는 외부 구 중 적어도 하나의 크기(예를 들어, 반지름), 상기 구와 외부 구 간의 크기 비율 등과 같은 정보를 고려하여 수행될 수 있다. 이를 위해, 상기 정보가 메타데이터의 형태로 부호화되어 영상 복호화 장치로 전송될 수 있다.
또한, UV영역이 전술한 것과 같이 세분화된 경우, 각 영역에 대해서 동일한 수학식이 적용될 수도 있고, 영역의 위치에 따라 상이한 수학식이 적용될 수도 있다. 상이한 수학식이라 함은, 차수, 가중치 또는 오프셋 중 적어도 하나가 상이한 수학식을 의미할 수 있다. 일 예로, UV영역이, 중심 영역, 가장자리(코너 포함) 영역, 및 중심 영역의 경계로부터 가장자리의 경계까지의 경계영역으로 세분화된 경우, 상기 중심 영역 또는 상기 가장자리 영역 중 적어도 하나는 제1 수학식이 적용되나, 상기 경계 영역은 제2 수학식이 적용될 수 있다.
가중치(w) 및 오프셋(o)는 기-정의된 고정된 값이거나 전술한 파라미터 중 적어도 하나에 의해 가변적으로 결정될 수 있다.
가중치(w) 또는 오프셋(o)는 뷰포트 영역(또는 UV영역)의 크기에 비례 또는 반비례하여 가중치 또는 오프셋이 증가 또는 감소할 수 있다. 여기서, 상기 증가 또는 감소는 뷰포트 영역(또는 UV영역)의 크기에 따라 연속적으로 증가 또는 감소하는 것을 포함할 수 있다. 또는, 상기 크기를 구간으로 나누고, 가중치(w) 또는 오프셋(o)을 상기 크기가 포함된 구간의 대표값으로 설정하는 계단식으로 증가 또는 감소하는 것을 포함할 수 있다.
또한, 상기 증가 또는 감소는 상한 또는 하한을 가질 수 있다 예를 들어, 뷰포트 영역(또는 UV영역) 크기가 소정의 문턱값보다 작아지거나 커지더라도, 더 이상 가중치 또는 오프셋이 변하지 않고 일정한 가중치 또는 오프셋을 가질 수 있다.
상기 가중치 및 오프셋 값은 뷰포트 영역(또는 UV영역) 전술한 세분화된 영역에 따라 다를 수 있다.
일 예로, 가중치(w) 또는 오프셋(o)는 세분화된 영역의 위치에 따라 결정될 수 있다. 구체적으로, UV영역이 중심영역, 가장자리 영역, 코너 영역으로 세분화된 경우, 상기 영역들 간 가중치(w) 또는 오프셋(o)은 같거나 다를 수 있다.
다른 예로, 가중치(w) 또는 오프셋(o)는 세분화된 영역의 형태에 따라 결정될 수 있다. 구체적으로, UV영역이 평면의 형태인 경우 가중치(w) 또는 오프셋(o)은 다른 세분화된 영역과 같은 값을 가질 수 있으나, 곡면의 형태인 경우 가중치(w) 또는 오프셋(o)은 다른 세분화된 영역과 다른 값을 가질 수 있다.
도 6은 보정단계에서 적용되는 정의역과 치역이 [0, 1]범위인 3차 함수를 나타내는 도면이다.
상기 보정은 도 6와 같은 곡률을 가지는 3차 함수를 통해 이루어 질 수 있다. 도 6의 u'=g(u)에 있어서, 정의역(u)와 치역(g(u))는 정규화된 값으로 각각 [0, 1]의 범위를 가진다. 도 6의 그래프는 u=0.5 근처에서는 기울기가 1보다 작고, u=1 또는 0 근처에서는 기울기가 1보다 크다.
상기 곡률과 같은 함수를 가지는 아래의 수학식 13를 UV영역에 적용하여 보정할 수 있다.
Figure 112019106190933-pat00047
상기 UV영역의 중심부 위치(u=0.5) 근처에서의 변환된 화소의 좌표 간의 간격은 물리적으로 더 가까워지고, UV영역의 외곽부 위치(u=0 또는 1) 근처에서의 변환된 화소의 좌표 간의 간격은 물리적으로 더 멀어지게 될 수 있다. 상기 보정을 통해 UV영역의 외곽부와 중심부의 영상 정보 밀도가 유사해지고, 투영 과정에서 발생하는 왜곡을 줄일 수 있다.

Claims (11)

  1. 뷰포트(viewport)영역의 화소의 위치에 대한 좌표를 변환 좌표 영역의 좌표로 변환하고, 여기서, 상기 변환 좌표 영역은 영상 정보를 담고 있는 구 표면 좌표의 산출시 이용되는 영역임.
    상기 변환 좌표 영역을 적어도 2개의 영역으로 세분화하고, 여기서, 상기 세분화된 영역은 제1 세분화 영역 및 제2 세분화 영역을 포함함.
    상기 제1 세분화 영역의 좌표 간의 거리를 상기 제2 세분화 영역의 좌표 간의 거리보다 작도록 상기 제1 세분화 영역 또는 상기 제2 세분화 영역 중 적어도 하나의 좌표를 보정하고,
    상기 보정된 변환 좌표 영역의 좌표에 대응하는 상기 구 표면 좌표를 산출하고,
    상기 산출된 구 표면 좌표에 해당하는 영상 정보를 추출하되,
    상기 변환 좌표 영역은, 곡면이고,
    상기 변환 좌표 영역의 가로 및 세로 길이는 상기 뷰포트 영역의 FOV(Field of view)를 고려하여 결정되고,
    상기 변환은, 상기 변환 좌표 영역의 가로 및 세로 길이를 고려하지 않고, 상기 뷰포트 영역에서의 가로 방향 및 세로 방향의 화소의 개수만 고려하여 수행되고,
    상기 보정은, 상기 뷰포트 영역 또는 상기 변환 좌표 영역의 크기가 문턱크기 이하인 경우, 상기 세분화된 영역들 중 적어도 일부 영역의 보정을 스킵하는 것을 특징으로 하는, 영상 복호화 장치.
  2. 제 1항에 있어서,
    상기 곡면은, 상기 영상 정보를 담고 있는 구에 외접한 외부 구의 일부이고,
    상기 외부 구의 반지름은, 상기 영상 정보를 담고 있는 구의 반지름 보다 크거나 같은 것을 특징으로 하는, 영상 복호화 장치.
  3. 삭제
  4. 삭제
  5. 제1 항에 있어서,
    상기 보정은 3차원 함수를 이용하여 수행되고,
    상기 3차원 함수는, 상기 제1 세분화 영역에 적용되는 범위 내에서 상기 함수의 기울기는 1보다 작고, 상기 제2 세분화 영역에 적용되는 범위 내에서 상기 함수의 기울기는 1보다 큰 것을 특징으로 하는, 영상 복호화 장치.
  6. 삭제
  7. 제1 항에 있어서,
    상기 보정은, 가중치 및 오프셋 값을 적용하여 수행되고,
    상기 가중치 및 상기 오프셋 값은, 상기 세분화된 영역 별로 같거나 다른 것을 특징으로 하는, 영상 복호화 장치.
  8. 제1 항에 있어서,
    상기 제1 세분화 영역은, 상기 변환 좌표 영역의 중심을 기준으로 하는 원 또는 사각형의 형태인 것을 특징으로 하는, 영상 복호화 장치.
  9. 제 1항에 있어서,
    상기 산출은, 상기 변환된 변환 좌표 영역을 상기 구 표면의 중심으로 정사영시키고, 상기 정사영된 변환 좌표 영역의 좌표에 대응하는 상기 구 표면의 좌표를 산출하는 것을 특징으로 하는, 영상 복호화 장치.
  10. 제 1항에 있어서,
    상기 화소의 위치는, 상기 화소들로 구성된 화소 그룹의 위치를 포함하는 것을 특징으로 하는, 영상 복호화 장치.
  11. 제 10항에 있어서,
    상기 화소 그룹의 위치는, 상기 화소 그룹 내 포함된 어느 한 화소의 위치 또는 상기 화소 그룹 내 포함된 복수개의 화소들의 평균값을 포함하는 것을 특징으로 하는, 영상 복호화 장치.
KR1020190129415A 2019-10-17 2019-10-17 뷰포트(Viewport) 추출 방법 및 장치 Active KR102281037B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190129415A KR102281037B1 (ko) 2019-10-17 2019-10-17 뷰포트(Viewport) 추출 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190129415A KR102281037B1 (ko) 2019-10-17 2019-10-17 뷰포트(Viewport) 추출 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210045871A KR20210045871A (ko) 2021-04-27
KR102281037B1 true KR102281037B1 (ko) 2021-07-22

Family

ID=75725716

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190129415A Active KR102281037B1 (ko) 2019-10-17 2019-10-17 뷰포트(Viewport) 추출 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102281037B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3528212A4 (en) 2016-10-12 2019-09-18 Samsung Electronics Co., Ltd. METHOD AND DEVICE FOR PROCESSING IMAGES OF VIRTUAL REALITY
WO2018174542A1 (ko) * 2017-03-21 2018-09-27 주식회사 케이티 비디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
KR20210045871A (ko) 2021-04-27

Similar Documents

Publication Publication Date Title
KR102431117B1 (ko) 포인트 클라우드 맵핑
CN109194923B (zh) 基于局部非均匀分辨率的视频图像处理设备、系统及方法
CN100380403C (zh) 非平面图像的图像处理装置及图像处理方法
US6246413B1 (en) Method and system for creating panoramas
US10798301B2 (en) Panoramic image mapping method
RU2686591C1 (ru) Устройство выработки изображения и устройство управления отображением изображения
CN105631809B (zh) 一种非均匀分辨率球面全景图生成方法
WO2018035721A1 (en) System and method for improving efficiency in encoding/decoding a curved view video
WO2020063547A1 (zh) 球面图像处理方法、装置及服务器
CN104519340A (zh) 基于多深度图像变换矩阵的全景视频拼接方法
KR102551713B1 (ko) 전자 장치 및 그 이미지 처리 방법
TW201921035A (zh) 用於處理包括封裝在360度虛擬現實投影佈局中的至少一個投影面的基於投影的圖框的方法
CN106162140A (zh) 一种全景视频的压缩方法及装置
CN114615478A (zh) 投影画面校正方法、系统、投影设备和存储介质
TWI681662B (zh) 用於減少基於投影的圖框中的偽影的方法和裝置
US9299127B2 (en) Splitting of elliptical images
CN107871304B (zh) 基于球面环切和仿射变换的全景视频帧矩形映射方法
JP6851089B2 (ja) 適応的三次元空間生成方法及びそのシステム
US11528412B2 (en) Apparatus and method for stitching together multiple images
KR102281037B1 (ko) 뷰포트(Viewport) 추출 방법 및 장치
CN111418213B (zh) 用于沉浸式视频编解码的信令语法的方法以及装置
US9230359B2 (en) Method for resizing an image
US20120050304A1 (en) Image processing apparatus, method, and program
KR102554697B1 (ko) 가상 시점 영상 합성 장치 및 방법
CN106897964A (zh) 保持相邻像素相关性的全景视频帧矩形映射方法

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20191017

PA0201 Request for examination
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20210111

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20210715

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20210719

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20210719

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20240626

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20250626

Start annual number: 5

End annual number: 5