CN115065828B - 用于视频编解码的运动矢量预测 - Google Patents
用于视频编解码的运动矢量预测 Download PDFInfo
- Publication number
- CN115065828B CN115065828B CN202210258599.3A CN202210258599A CN115065828B CN 115065828 B CN115065828 B CN 115065828B CN 202210258599 A CN202210258599 A CN 202210258599A CN 115065828 B CN115065828 B CN 115065828B
- Authority
- CN
- China
- Prior art keywords
- mvp
- block
- temporal
- neighboring blocks
- derived
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000002123 temporal effect Effects 0.000 claims description 59
- 238000004590 computer program Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 12
- 238000009966 trimming Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000009795 derivation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种解码视频信号的方法、装置和非暂时性计算机可读存储介质。该方法包括:从视频信号中获得视频块,基于视频块获得空间相邻块,基于多个左侧空间相邻块获得最多一个左侧非缩放运动矢量预测值(MVP),基于多个上方空间相邻块获得最多一个上方非缩放MVP,在解码器处并且通过降低选择从空间相邻块导出的已缩放MVP的可能性,基于视频块、多个左侧空间相邻块、多个上方空间相邻块导出MVP候选列表,基于MVP候选列表接收最佳MVP,以及基于最佳MVP获得视频块的预测信号。
Description
本申请是2020年6月13日提交的申请号为202080042297.1的同名专利申请的分案申请。
相关申请的交叉引用
本申请基于2019年6月13日提交的临时申请第62/861,315号并要求享有其优先权,该临时申请的全部内容通过引用整体并入本文。
技术领域
本公开涉及视频编解码和压缩。更具体地,本公开涉及用于视频编解码中的运动矢量预测的方法和装置。
背景技术
各种视频编解码技术可以用来压缩视频数据。视频编解码是根据一种或多种视频编解码标准执行的。例如,视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图像专家组(MPEG)编解码等。视频编解码通常使用预测方法(例如,帧间预测、帧内预测等),预测方法利用了视频图像或序列中存在的冗余。视频编解码技术的一个重要目标是将视频数据压缩成使用较低比特率的形式,同时避免或最小化视频质量的下降。
发明内容
本公开的示例提供了用于视频编解码中的运动矢量预测的方法和装置。
根据本公开的第一方面,提供了一种解码视频信号的方法。该方法可以包括:在解码器处,从视频信号获得视频块。该方法还可以包括:在解码器处,基于视频块获得空间相邻块。空间相邻块可以包括多个左侧空间相邻块和多个上方空间相邻块。该方法可以包括:在解码器处,基于多个左侧空间相邻块,获得最多一个左侧非缩放运动矢量预测值(MVP)。该方法还可以包括:在解码器处,基于多个上方空间相邻块,获得最多一个上方非缩放MVP。该方法可以包括:在解码器处并且通过降低选择从空间相邻块导出的已缩放MVP的可能性,基于视频块、多个左侧空间相邻块、多个上方空间相邻块来导出MVP候选列表。MVP候选列表可以包括最多一个左侧非缩放MVP和最多一个上方非缩放MVP。该方法可以另外包括:在解码器处,基于MVP候选列表接收最佳MVP。编码器从MVP候选列表中选择最佳MVP。该方法可以包括:在解码器处,基于最佳MVP获得视频块的预测信号。
根据本公开的第二方面,提供了一种用于解码视频信号的计算设备。该计算设备可以包括一个或多个处理器、存储由该一个或多个处理器可执行的指令的非暂时性计算机可读存储器。一个或多个处理器可以被配置为:从视频信号获得视频块。一个或多个处理器可以被进一步配置为:基于视频块获得空间相邻块。空间相邻块可以包括多个左侧空间相邻块和多个上方空间相邻块。一个或多个处理器可以被配置为:基于多个左侧空间相邻块获得最多一个左侧非缩放运动矢量预测值(MVP)。一个或多个处理器还可以被配置为:基于多个上方空间相邻块获得最多一个上方非缩放MVP。一个或多个处理器可以被配置为:通过降低选择从空间相邻块导出的已缩放MVP的可能性,基于视频块、多个左侧空间相邻块、多个上方空间相邻块来导出MVP候选列表。MVP候选列表可以包括最多一个左侧非缩放MVP和最多一个上方非缩放MVP。一个或多个处理器可以另外被配置为:基于MVP候选列表接收最佳MVP。编码器从MVP候选列表中选择最佳MVP。一个或多个处理器可以被配置为:基于最佳MVP获得视频块的预测信号。
根据本公开的第三方面,提供了一种其中存储有指令的非暂时性计算机可读存储介质。当指令由装置的一个或多个处理器执行时,指令可以使装置执行:在解码器处,从视频信号获得视频块。指令可以使装置执行:在解码器处,基于视频块获得空间相邻块。空间相邻块可以包括多个左侧空间相邻块和多个上方空间相邻块。指令可以进一步使装置执行:在解码器处,基于多个左侧空间相邻块,获得最多一个左侧非缩放运动矢量预测值(MVP)。指令可以使装置执行:在解码器处,基于多个上方空间相邻块,获得最多一个上方非缩放MVP。指令可以另外使装置执行:在解码器处并且通过降低选择从空间相邻块导出的已缩放MVP的可能性,基于视频块、多个左侧空间相邻块、多个上方空间相邻块导出MVP候选列表。MVP候选列表可以包括最多一个左侧非缩放MVP和最多一个上方非缩放MVP。指令还可以使装置执行:在解码器处,基于MVP候选列表接收最佳MVP。编码器从MVP候选列表中选择最佳MVP。指令还可以使装置执行:在解码器处,在获得基于历史的MVP之后,获得从空间相邻块导出的已缩放MVP。
附图说明
被并入并构成本说明书的一部分的附图示出了与本公开一致的示例,并且与描述一起用于解释本公开的原理。
图1是根据本公开的示例的编码器的框图。
图2是根据本公开的示例的解码器的框图。
图3是图示了根据本公开的示例的用于空间MVP候选和时间MVP候选的候选位置的示图。
图4是图示了根据本公开的示例的用于空间运动矢量候选的运动矢量缩放的示图。
图5是图示了根据本公开的示例的用于时间合并候选的运动矢量缩放的示图。
图6是根据本公开的示例的解码视频信号的方法。
图7是根据本公开的示例的导出MVP候选列表的方法。
图8是图示了根据本公开的示例的与用户接口耦合的计算环境的示图。
具体实施方式
现在将详细参考示例实施例,其示例在附图中示出。以下描述参照附图,除非另有描写,否则不同附图中的相同数字代表相同或相似的元素。以下对实施例的描述中阐述的实现方式并不代表与本公开一致的所有实现方式。相反,它们仅仅是与所附权利要求中记载的与本公开相关的方面一致的装置和方法的示例。
本公开中使用的术语仅用于描述特定实施例的目的,而并不旨在限制本公开。如在本公开和所附权利要求中使用的,单数形式“一种”、“一个”和“该”旨在也包括复数形式,除非上下文另有明确指示。还应理解,本文中使用的术语“和/或”旨在表示并包括相关联的所列项目中的一个或多个项目的任何或所有可能的组合。
应当理解,虽然本文可以使用“第一”、“第二”、“第三”等术语来描述各种信息,但是信息不应当受这些术语的限制。这些术语仅用于将一类信息与另一类信息区分开。例如,在不背离本公开的范围的情况下,第一信息可以称为第二信息;并且类似地,第二信息也可以称为第一信息。如本文所使用的,取决于上下文,术语“如果”可以被理解为意指“当……时”或“一经……”或“响应于判断”。
视频编解码系统
从概念上讲,上面提及的视频编解码标准是相似的。例如,它们都使用基于块的处理并且共享相似的视频编解码框图来实现视频压缩。
图1示出了用于VVC的基于块的视频编码器的总体示图。具体地,图1示出了典型的编码器100。编码器100具有视频输入110、运动补偿112、运动估计114、帧内/帧间模式决策116、块预测值140、加法器128、变换130、量化132、预测相关信息142、帧内预测118、图片缓冲器120、逆量化134、逆变换136、加法器126、存储器124、环路滤波器122、熵编解码138和比特流144。
在编码器100中,视频帧被分割成多个视频块以进行处理。对于每个给定的视频块,基于帧间预测方法或帧内预测方法形成预测。
预测残差,其代表当前视频块(视频输入110的一部分)与其预测值(块预测值140的一部分)之间的差,从加法器128被发送到变换130。变换系数然后从变换130被发送到量化132以用于熵减少。量化系数然后被馈送到熵编解码138以生成压缩的视频比特流。如图1所示,来自帧内/帧间模式决策116的预测相关信息142(诸如视频块分割信息、运动矢量(MV)、参考图片索引、以及帧内预测模式)也通过熵编解码138馈送并保存到压缩的比特流144中。压缩的比特流144包括视频比特流。
在编码器100中,还需要与解码器相关的电路系统,以便为了预测目的而重建像素。首先,通过逆量化134和逆变换136重建预测残差。该重建的预测残差与块预测值140组合,以生成针对当前视频块的未滤波的重建像素。
空间预测(或“帧内预测”)使用来自与当前视频块相同的视频帧中已经编解码的相邻块的样本(称为参考样本)的像素,来预测当前视频块。
时间预测(也称为“帧间预测”)使用来自已经编解码的视频图片的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。针对给定编解码单元(CU)或编解码块的时间预测信号通常由一个或多个MV用信号发送,MV指示当前CU与其时间参考之间的运动的量和方向。进一步地,如果支持多个参考图片,则另外发送一个参考图片索引,其用于标识时间预测信号来自参考图片存储装置中的哪个参考图片。
运动估计114摄入视频输入110和来自图片缓冲器120的信号,并且向运动补偿112输出运动估计信号。运动补偿112摄入视频输入110、来自图片缓冲器120的信号、以及来自运动估计114的运动估计信号,并且向帧内/帧间模式决策116输出运动补偿信号。
在空间和/或时间预测被执行之后,编码器100中的帧内/帧间模式决策116选择最佳预测模式,例如,基于率失真优化方法。块预测值140然后从当前视频块中被减去,并且使用变换130和量化132对所得的预测残差去相关。所得的量化残差系数由逆量化134进行逆量化并由逆变换136进行逆变换以形成重建残差,重建残差然后被加回到预测块以形成CU的重建信号。此外,在重建的CU被放入图片缓冲器120的参考图片存储装置中并用于对未来的视频块进行编解码之前,可以在重建的CU上应用环路滤波122,诸如去块滤波器、样本自适应偏移(SAO)、和/或自适应环路滤波器(ALF)。为了形成输出视频比特流144,编解码模式(帧间或帧内)、预测模式信息、运动信息、以及量化残差系数都被发送到熵编解码单元138,以进一步压缩和打包以形成比特流。
在编码器中,视频帧被分割为块以进行处理。对于每个给定的视频块,基于帧间预测或帧内预测来形成预测。在帧间预测中,可以基于来自先前重建的帧的像素,通过运动估计和运动补偿来形成预测值。在帧内预测中,可以基于当前帧中的重建像素来形成预测值。通过模式决策,可以选择最佳预测值来预测当前块。
预测残差(即,当前块与其预测值之间的差)被发送到变换模块。变换系数然后被发送到量化模块以用于熵减少。量化系数被馈送到熵编解码模块以生成压缩的视频比特流。如图1所示,来自帧间和/或帧内预测模块的预测相关信息(诸如块分割信息、运动矢量、参考图片索引和帧内预测模式等)也经过熵编解码模块并保存到比特流中。
在编码器中,还需要与解码器相关的模块,以便为了预测目的而重建像素。首先,通过逆量化和逆变换重建预测残差。这种重建的预测残差与块预测值组合,以生成针对当前块的未滤波的重建像素。
为了改进编解码效率和视觉质量,通常使用环路滤波器。例如,去块滤波器在AVC、HEVC以及当前的VVC中可用。在HEVC中,定义了称为SAO(样本自适应偏移)的附加环路滤波器,以进一步改进编解码效率。在最新的VVC中,正在积极研究另一种称为ALF(自适应环路滤波器)的环路滤波器,并且它很有可能被包括在最终标准中。
图2示出了用于VVC的视频解码器的总体框图。具体地,图2示出了典型的解码器200框图。解码器200具有比特流210、熵解码212、逆量化214、逆变换216、加法器218、帧内/帧间模式选择220、帧内预测222、存储器230、环路滤波器228、运动补偿224、图片缓冲器226、预测相关信息234和视频输出232。
解码器200类似于位于图1的编码器100中的重建相关部分。在解码器200中,首先通过熵解码212对传入的视频比特流210进行解码,以导出量化系数级别和预测相关信息。然后通过逆量化214和逆变换216处理量化系数级别,以获得重建的预测残差。在帧内/帧间模式选择器220中实现的块预测值机制被配置为基于解码的预测信息执行帧内预测222或运动补偿224。通过使用求和器218,将来自逆变换216的重建的预测残差和由块预测值机制生成的预测输出求和,来获得一组未滤波的重建像素。
在重建块被存储在用作参考图片存储库的图片缓冲器226中之前,重建块可以进一步经过环路滤波器228。图片缓冲器226中的重建视频可以被发送以驱动显示设备,以及用于预测未来的视频块。在环路滤波器228开启的情况下,对这些重建像素执行滤波操作以导出最终重建的视频输出232。
图2示出了用于这些标准的典型解码器框图。可以看到,它与位于编码器中的重建相关部分几乎相同。
在解码器中,首先通过熵解码模块对比特流解码,以导出量化系数级别和预测相关信息。然后通过逆量化模块和逆变换模块处理量化系数级别,以获得重建的预测残差。基于解码的预测信息,通过帧内预测或运动补偿过程来形成块预测值。通过将重建的预测残差和块预测值求和来获得未滤波的重建像素。在环路滤波器开启的情况下,对这些像素执行滤波操作以导出最终重建视频以用于输出。
通用视频编解码(VVC)
在第10届JVET会议(2018年4月10-20日,美国圣地亚哥)上,JVET明确了通用视频编解码(VVC)的第一份草案和VVC测试模型1(VTM1)编码方法。决定包括具有使用二元和三元拆分编解码块结构的嵌套多类型树的四叉树,作为VVC的初始新编解码特征。从那时起,在JVET会议期间,已经开发了用于实现编码方法和草案VVC解码过程的参考软件VTM。
图片分割结构将输入视频划分成块,称为编解码树单元(CTU)。使用具有嵌套多类型树结构的四叉树将CTU拆分为编解码单元(CU),其中叶编解码单元(CU)定义共享相同预测模式(例如,帧内或帧间)的区域。在本文档中,术语“单元”定义了覆盖所有分量的图像区域;术语“块”用于定义覆盖特定分量(例如,亮度)的区域,并且在考虑色度采样格式(诸如4:2:0)时可能会在空间位置上有所不同。
VVC中的运动矢量预测
运动矢量预测利用相邻CU的运动矢量的空间和时间相关性,其用于运动参数的显式传输。它通过首先检查左侧相邻块位置、上方相邻块位置和时间相邻块位置(如下面描述的图3所示)以及基于历史的MV的可用性,来构建运动矢量预测值(MVP)候选列表。它然后去除冗余候选并添加零矢量,以使候选列表具有恒定长度。然后,编码器可以从候选列表中选择最佳预测值并发送指示所选候选的对应索引。最佳运动矢量候选的索引然后被编码到比特流中。在以下章节中,提供了有关MVP候选的导出过程的细节。
图3示出了针对空间MVP候选A0、A1、B0、B1和B2以及时间MVP候选T0和T1的候选位置。
运动矢量预测值候选的导出
在VVC中,MVP候选列表是通过按顺序包括以下候选来构建的:
(1)从左侧空间相邻CU(A0→A1)导出最多一个非缩放MVP。
(2)如果没有来自左侧的非缩放MVP可用,则从左侧空间相邻CU(A0→A1)导出最多一个已缩放MVP。
(3)从上方空间相邻CU(B0→B1→B2)导出最多一个非缩放MVP。
(4)如果相邻块A0和A1两者均是不可用或是以帧内模式被编解码的,则从上方空间相邻CU(B0→B1→B2)导出最多一个已缩放MVP。
(5)有条件的修剪。
(6)从时间同位CU(T0→T1)导出最多一个MVP。
(7)从FIFO表中导出最多两个基于历史的MVP。
(8)导出最多两个零MV。
当存在从空间块导出的两个MVP候选时,进行第5项“有条件的修剪”。将两个MVP候选相互比较,并且当它们相同时,从MVP候选列表中去除一个。帧间MVP列表的大小固定为2。对于以帧间预测但是非合并模式编解码的每个CU,标志被编解码以指示使用哪个MVP候选。
在运动矢量预测中,考虑三种类型的MVP候选:空间MVP候选、时间MVP候选、以及基于历史的MVP候选。对于空间MVP候选导出,基于每个块的位于五个不同位置(如图3所描绘)的运动矢量,导出最多两个MVP候选。对于时间MVP候选导出,从基于两个不同的共位位置导出的两个候选中选择最多一个MVP候选。如果MVP候选的数量小于2,则将附加的零运动矢量候选添加到列表以使其为2。
空间运动矢量预测值候选
在空间运动矢量预测值候选的导出中,可以在至多五个潜在候选中选择最多两个候选,至多五个潜在候选是从如图3所描绘地定位的块导出的。这些块位置与用于针对合并模式导出MVP候选的那些块位置相同。对于位于当前块左侧的那些块(包括A0、A1),它们的MV检查顺序定义为A0、A1,以及已缩放A0、已缩放A1。这里的已缩放A0、已缩放A1分别指代块A0、A1的已缩放MV。对于位于当前块上方的那些块(包括B0、B1、B2),它们的MV检查顺序定义为B0、B1、B2、已缩放B0、已缩放B1、已缩放B2。对于每一侧,在导出运动矢量候选时有四种情况要检查,其中两种情况不要求空间MV缩放,而另外两种情况要求空间MV缩放。四种不同的情况总结如下。
不要求空间MV缩放的情况:
(1)MV具有相同参考图片列表和相同参考图片索引(相同POC)。
(2)MV具有不同参考图片列表但具有相同参考图片(相同POC)。
要求空间MV缩放的情况:
(3)MV具有相同参考图片列表但具有不同参考图片(不同POC)。
(4)MV具有不同参考图片列表和不同参考图片(不同POC)。
首先检查无空间MV缩放的情况(上面的情况1和2),之后是要求空间MV缩放的情况(上面的情况3和4)。更具体地,对于MV,检查顺序根据以下步骤:
从块A0、A1中,通过按依次顺序检查以下情况,导出最多一个MV候选:A0情况1→A0情况2→A1情况1→A1情况2→A0情况3→A0情况4→A1情况3→A1情况4。
通过按依次顺序检查以下情况,从块B0、B1、B2导出最多一个MV候选:B0情况1→B0情况2→B1情况1→B1情况2→B2情况1→B2情况2。
如果没有从步骤1中导出MV候选,则通过按依次顺序检查以下情况,从块B0、B1、B2导出最多一个MV候选:B0情况3→B0情况4→B1情况3→B1情况4→B2情况3→B2情况4。
如果MVP候选的数量小于二,则附加的零运动矢量候选被添加到列表以使其为二。
当相邻块的参考图片的POC与当前块的POC不同时,无论参考图片列表如何,都需要空间MV缩放。如在以上步骤中可以看出的,如果当前块左侧的块的MV不可用(例如,块不可用或所有这些块都是帧内编解码的),则允许对当前块上侧的那些块的运动矢量进行MV缩放。否则,不允许对上方块的运动矢量进行空间MV缩放。作为结果,在整个MV预测候选导出过程中,只需要最多一次空间MV缩放。
在空间MV缩放过程中,如(下面描述的)图4所描绘的,相邻块的运动矢量以与用于时间MV缩放的类似方式被缩放。
图4示出了用于空间运动矢量候选的运动矢量缩放的图示。该图示包括410neigh_ref、420curr_ref、430curr_pic、440neighbor_PU、450curr_PU、460tb和470td。410neigh_ref是用于运动矢量缩放的相邻参考。420curr_ref是用于运动矢量缩放的当前参考。430是用于运动矢量缩放的当前图片。440neighbor_PU是用于运动矢量缩放的相邻预测单元。450curr_PU是用于运动矢量缩放的当前预测单元。460tb是当前图片的参考图片与当前图片之间的POC差。470td是相邻参考图片与当前图片之间的POC差。
时间运动矢量预测值候选
在时间MVP候选的导出中,从参考图片列表中的先前编解码图片中的同位块的MV导出已缩放运动矢量。包含用于导出时间MVP候选的同位块的图片在以下描述中被称为“同位图片”。为了导出时间运动候选,首先将条带头部中的显式标志(collocated_from_l0_flag)发送到解码器,以指示同位图片是从列表0还是列表1中选择的。进一步发送同位参考索引(collocated_ref_idx),以指示选择该列表中的哪个图片作为用于导出时间运动矢量预测值候选的同位图片。时间MVP候选的L0 MV和L1 MV根据预定义的顺序独立地导出,如表1中所示。
在表1中,CollocatedPictureList是用信号发送以指示同位图片从哪个预测列表被定位的语法。如(下面描述的)图5中的虚线所示,获得用于时间MVP候选的已缩放运动矢量。其是使用POC距离tb和td从共位块的选定运动矢量缩放的,其中tb定义为当前图片的参考图片与当前图片之间的POC差,而td定义为共位图片的参考图片与共位图片之间的POC差。时间合并候选的参考图片索引被设置为等于零。HEVC规范中描述了缩放过程的实际实现。对于B条带,两个运动矢量(一个用于参考图片列表0,而另一个用于参考图片列表1)被获得并且被组合以形成双向预测合并候选。
表1 HEVC中用于从针对TMVP的同位块导出时间MVP候选的算法
图5示出了用于时间合并候选的运动矢量缩放的图示。该图示包括510neigh_ref、520curr_ref、530curr_pic、540col_pic、550curr_PU、560col_PU、570tb和580td。510neigh_ref是用于运动矢量缩放的相邻参考图片。520curr_ref是用于运动矢量缩放的当前参考。530curr_pic是用于运动矢量缩放的当前图片。540col_pic是用于运动矢量缩放的同位图片。550curr_PU是用于运动矢量缩放的当前预测单元。560col_PU是用于运动矢量缩放的同位预测单元。570tb是当前图片的参考图片与当前图片之间的POC差。580td是同位图片的参考图片与同位图片之间的POC差。
在同位图片中,在如图3中描绘的T0和Tl之间选择用于导出时间候选的同位块。如果位置T0处的块是不可用的,或者是帧内编解码的,或者在当前CTU之外,则使用位置T1。否则,在导出时间合并候选时使用位置T0。
基于历史的合并候选导出
基于历史的MVP(HMVP)在空间MVP和TMVP之后被添加到合并列表。在该方法中,存储在表中的先前编解码的块的运动信息可以用作用于当前块的MVP。这样的MVP被称为HMVP。在编码/解码过程期间维护包含多个HMVP候选的表。当遇到新的CTU行时,该表被重置(清空)。每当CU以非子块帧间预测模式被编解码时,CU的相关联的运动信息都会作为新的HMVP候选被添加到表的最后一个条目。
用于运动矢量预测的空间运动矢量缩放
在MVP的当前设计中,可以导出最多一个已缩放空间MV候选。由于MV缩放过程在其复杂度方面并非微不足道的,因此设计了一种新方案以进一步降低在导出MVP时使用空间MV缩放的可能性。
运动矢量预测改进
在本公开中,提出了若干方法以在复杂度或编解码效率方面改进运动矢量预测。注意,所提出的各方法可以独立或联合应用。
图6示出了根据本公开的解码视频信号的方法。该方法可以例如应用于解码器。
在步骤610中,解码器可以从视频信号中获得视频块。
在步骤612中,解码器可以基于视频块获得空间相邻块。例如,空间相邻块可以包括多个左侧空间相邻块和多个上方空间相邻块。
在步骤614中,解码器可以基于多个左侧空间相邻块获得最多一个左侧非缩放运动矢量预测值(MVP)。
在步骤616中,解码器可以基于多个上方空间相邻块获得最多一个上方非缩放MVP。
在步骤618中,解码器可以通过降低选择从空间相邻块导出的已缩放MVP的可能性,基于视频块、多个左侧空间相邻块、多个上方空间相邻块来导出MVP候选列表。例如,MVP候选列表可以包括最多一个左侧非缩放MVP和最多一个上方非缩放MVP。
在步骤620中,解码器可以基于MVP候选列表接收最佳MVP,其中编码器从MVP候选列表
中选择最佳MVP。在一个示例中,最佳MVP可以由编码器基于成本值来选择。例如,对于一些编
码器设计,编码器可以使用每个MVP候选来导出选定MVP与通过运动估计导出的MV之间的MV差。对于每个MVP候选,使用例如MV差和选定MVP的MVP索引的比特来计算成本值。选择具有最佳成本值(例如,最小成本)的MVP候选作为最终MVP,并且将其MVP索引编解码到比特流中。
在步骤622中,解码器可以基于最佳MVP获得视频块的预测信号。
根据第一方面,为了降低选择/导出已缩放MVP的可能性,提出了在构建MVP候选列表时将已缩放空间MVP放到更靠后的位置。用于从空间相邻块导出已缩放MVP的条件可以与当前VVC中的条件相同或不同。
在一个示例中,用于从空间相邻块导出已缩放MVP的条件保持与当前VVC中的条件相同。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从时间同位块(T0→T1)导出最多一个MVP。
5)从FIFO表中导出最多两个基于历史的MVP。
6)如果没有来自左侧相邻块的非缩放MVP可用,则从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)如果相邻块A0和A1中的任一个都不可用或者它们以帧内模式编解码,则从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在另一示例中,用于从空间相邻块导出已缩放MVP的条件被去除。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从时间同位块(T0→T1)导出最多一个MVP。
5)从FIFO表中导出最多两个基于历史的MVP。
6)从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在第三示例中,用于从空间相邻块导出已缩放MVP的条件从当前VVC中的条件修改得出。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从时间同位块(T0→T1)导出最多一个MVP。
5)从FIFO表中导出最多两个基于历史的MVP。
6)从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)如果相邻块A0和A1中的任一个都不可用或者它们以帧内模式编解码,则从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在第四示例中,用于从空间相邻块导出已缩放MVP的条件从当前VVC中的条件修改得出。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从时间同位块(T0→T1)导出最多一个MVP。
5)从FIFO表中导出最多两个基于历史的MVP。
6)从左侧空间相邻块A0导出最多一个已缩放MVP。
7)从左侧空间相邻块A1导出最多一个已缩放MVP。
8)从上方空间相邻块B0导出最多一个已缩放MVP。
9)从上方空间相邻块B1导出最多一个已缩放MVP。
10)从上方空间相邻块B2导出最多一个已缩放MVP。
11)导出最多两个零MV。
根据第二方面,为了降低选择/导出已缩放MVP的可能性,提出了在构建MVP候选列表时,将时间MVP和已缩放空间MVP两者放到更靠后的位置。用于从空间相邻块导出已缩放MVP的条件可以与当前VVC中的条件相同或不同。
在一个示例中,用于从空间相邻块导出已缩放MVP的条件保持与当前VVC中相同。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)从时间同位块(T0→T1)导出最多一个MVP。
6)如果没有来自左侧相邻块的非缩放MVP可用,则从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)如果相邻块A0和A1中的任一个都不可用或者它们以帧内模式编解码,则从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在另一示例中,用于从空间相邻块导出已缩放MVP的条件被去除。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)从时间同位块(T0→T1)导出最多一个MVP。
6)从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在第三示例中,用于从空间相邻块导出已缩放MVP的条件从当前VVC中的条件修改得出。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)从时间同位块(T0→T1)导出最多一个MVP。
6)从左侧空间相邻块(A0→A1)导出最多一个已缩放MVP。
7)如果相邻块A0和A1中的任一个都不可用或者它们以帧内模式编解码,则从上方空间相邻块(B0→B1→B2)导出最多一个已缩放MVP。
8)导出最多两个零MV。
在第四示例中,用于从空间相邻块导出已缩放MVP的条件从当前VVC中的条件修改得出。MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)从时间同位块(T0→T1)导出最多一个MVP。
6)从左侧空间相邻块A0导出最多一个已缩放MVP。
7)从左侧空间相邻块A1导出最多一个已缩放MVP。
8)从上方空间相邻块B0导出最多一个已缩放MVP。
9)从上方空间相邻块B1导出最多一个已缩放MVP。
10)从上方空间相邻块B2导出最多一个已缩放MVP。
11)导出最多两个零MV。
根据第三方面,为了降低选择/导出已缩放MVP的可能性,提出了从MVP候选列表中排除已缩放空间MVP候选。
图7示出了根据本公开的导出MVP候选列表的方法。该方法例如可以应用于解码器。
在步骤710中,当存在从空间相邻块导出的两个MVP相同候选时,解码器可以从MVP候选列表中修剪两个MVP相同候选中的一个。
在步骤712中,解码器可以从时间同位块中获得最多一个MVP。时间同位块包括同位块T0和同位块T1。
在步骤714中,解码器可以从FIFO表中获得最多两个基于历史的MVP。FIFO表包括先前编解码的块。
在步骤716中,解码器可以获得最多两个等于0的MV。
在一个示例中,MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从时间同位块(T0→T1)导出最多一个MVP。
5)从FIFO表中导出最多两个基于历史的MVP。
6)导出最多两个零MV。
在另一示例中,MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)从时间同位块(T0→T1)导出最多一个MVP。
6)导出最多两个零MV。
根据第四方面,为了降低选择/导出已缩放MVP的可能性,提出了从MVP候选列表中排除已缩放空间MVP候选和TMVP两者。
在一个示例中,MVP候选列表是通过使用一个或多个处理器执行以下动作来构建的。
1)从左侧空间相邻块(A0→A1)导出最多一个非缩放MVP。
2)从上方空间相邻块(B0→B1→B2)导出最多一个非缩放MVP。
3)有条件的修剪。
4)从FIFO表中导出最多两个基于历史的MVP。
5)导出最多两个零MV。
值得注意的是,在上面说明的所有这些方面和/或示例中,当MVP候选列表已满时,导出过程停止。
图8示出了与用户接口860耦合的计算环境810。计算环境810可以是数据处理服务器的一部分。计算环境810包括处理器820、存储器840和I/O接口850。
处理器820通常控制计算环境810的整体操作,诸如与显示、数据获取、数据通信和图像处理相关联的操作。处理器820可以包括一个或多个处理器以执行指令来执行上文描述的方法中的所有或一些步骤。此外,处理器820可以包括促进处理器820与其他组件之间的交互的一个或多个模块。处理器可以是中央处理器(CPU)、微处理器、单片机、GPU等。
存储器840被配置为存储各种类型的数据以支持计算环境810的操作。存储器840可以包括预定软件842。这种数据的示例包括指令,指令用于对计算环境810、视频数据集、图像数据等操作的任何应用或方法。存储器840可以通过使用任何类型的易失性或非易失性存储器设备或其组合来实现,诸如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪速存储器、磁盘或光盘。
I/O接口850提供处理器820和外围接口模块(诸如键盘、点击轮、按钮等)之间的接口。按钮可以包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口850可以与编码器和解码器耦合。
在一些实施例中,还提供了一种包括多个程序的非暂时性计算机可读存储介质,该多个程序诸如包括在存储器840中,由计算环境810中的处理器820可执行,以用于执行上文描述的方法。例如,非暂时性计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。
非暂时性计算机可读存储介质中存储有多个程序以由具有一个或多个处理器的计算设备执行,其中多个程序在由一个或多个处理器执行时使计算设备执行上文描述的用于运动预测的方法。
在一些实施例中,计算环境810可以利用用于执行上述方法的一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器、或其他电子组件来实现。
本公开的描述是为了说明的目的而呈现的,而并不旨在穷举或限制于本公开。许多修改、变化和替代实现方式对于受益于前述描述和相关附图中呈现的教导的本领域普通技术人员将是显而易见的。
选择和描述示例是为了解释本公开的原理并使本领域的其他技术人员能够理解本公开的各种实现方式,并且最好地利用基本原理和具有适合于预期的特定用途的各种修改的各种实现方式。因此,将理解,本公开的范围不限于所公开的实现方式的具体示例,并且修改和其他实现方式旨在被包括在本公开的范围内。
Claims (20)
1.一种视频解码的方法,包括:
从视频信号中获得编解码块;
基于所述编解码块获得多个空间相邻块,其中所述多个空间相邻块包括多个左侧空间相邻块和多个上方空间相邻块;
基于所述多个空间相邻块获得最多两个空间运动矢量预测值MVP候选,其中所述最多两个空间MVP候选包括从所述多个左侧空间相邻块获得的最多一个左侧非缩放MVP和从所述多个上方空间相邻块获得的最多一个上方非缩放MVP;
从时间同位块获得最多一个时间MVP候选;
从先进先出FIFO表中获得最多两个基于历史的MVP候选;
基于所述最多两个空间MVP候选、所述最多一个时间MVP候选以及所述最多两个基于历史的MVP候选来导出MVP候选列表;
接收指示所述MVP候选列表中的MVP的索引;以及
基于由所述索引指示的所述MVP获得所述编解码块的预测信号。
2.根据权利要求1所述的方法,进一步包括:
获得最多两个等于0的MV。
3.根据权利要求1所述的方法,其中所述时间同位块包括右下方同位块T0和中心同位块T1。
4.根据权利要求1所述的方法,其中导出所述MVP候选列表包括:
当存在从所述多个空间相邻块导出的两个相同MVP候选时,从所述MVP候选列表中修剪所述两个相同MVP候选中的一个。
5.根据权利要求1所述的方法,其中所述多个空间相邻块包括左下方块、左侧块、右上方块、上方块、以及左上方块。
6.根据权利要求1所述的方法,进一步包括:
获得显式标志,所述显式标志指示用于时间运动矢量预测的同位图片是从第一参考图片列表还是第二参考图片列表导出的。
7.根据权利要求6所述的方法,进一步包括:
获得同位参考索引,所述同位参考索引指定用于时间运动矢量预测的所述同位图片的参考索引。
8.根据权利要求1所述的方法,其中从所述时间同位块获得所述最多一个时间MVP候选包括:
对从所述时间同位块导出的MVP执行运动矢量缩放。
9.根据权利要求8所述的方法,其中所述运动矢量缩放是基于当前图片的参考图片与所述当前图片之间的图片顺序计数POC差、以及同位图片的参考图片与所述同位图片之间的POC差来执行的。
10.一种计算设备,包括:
一个或多个处理器;
非暂时性计算机可读存储介质,存储由所述一个或多个处理器可执行的指令,其中所述一个或多个处理器被配置为:
从视频信号中获得编解码块;
基于所述编解码块获得多个空间相邻块,其中所述多个空间相邻块包括多个左侧空间相邻块和多个上方空间相邻块;
基于所述多个空间相邻块获得最多两个空间运动矢量预测值MVP候选,其中所述最多两个空间MVP候选包括从所述多个左侧空间相邻块获得的最多一个左侧非缩放MVP和从所述多个上方空间相邻块获得的最多一个上方非缩放MVP;
从时间同位块获得最多一个时间MVP候选;
从先进先出FIFO表中获得最多两个基于历史的MVP候选;
基于所述最多两个空间MVP候选、所述最多一个时间MVP候选以及所述最多两个基于历史的MVP候选来导出MVP候选列表;
接收指示所述MVP候选列表中的MVP的索引;以及
基于由所述索引指示的所述MVP获得所述编解码块的预测信号。
11.根据权利要求10所述的计算设备,其中所述一个或多个处理器被进一步配置为:
获得最多两个等于0的MV。
12.根据权利要求10所述的计算设备,其中所述时间同位块包括右下方同位块T0和中心同位块T1。
13.根据权利要求10所述的计算设备,其中所述一个或多个处理器被配置为通过以下操作来导出所述MVP候选列表:
当存在从所述多个空间相邻块导出的两个相同MVP候选时,从所述MVP候选列表中修剪所述两个相同MVP候选中的一个。
14.根据权利要求10所述的计算设备,其中所述多个空间相邻块包括左下方块、左侧块、右上方块、上方块、以及左上方块。
15.根据权利要求10所述的计算设备,其中所述一个或多个处理器被进一步配置为:
获得显式标志,所述显式标志指示用于时间运动矢量预测的同位图片是从第一参考图片列表还是第二参考图片列表导出的。
16.根据权利要求15所述的计算设备,其中所述一个或多个处理器被进一步配置为:
获得同位参考索引,所述同位参考索引指定用于时间运动矢量预测的所述同位图片的参考索引。
17.根据权利要求10所述的计算设备,其中所述一个或多个处理器被配置为通过以下操作来从所述时间同位块获得所述最多一个时间MVP候选:
对从所述时间同位块导出的MVP执行运动矢量缩放。
18.根据权利要求17所述的计算设备,其中所述运动矢量缩放是基于当前图片的参考图片与所述当前图片之间的图片顺序计数POC差、以及同位图片的参考图片与所述同位图片之间的POC差来执行的。
19.一种计算机程序产品,包括多个指令,所述多个指令在由一个或多个处理器执行时,使所述一个或多个处理器执行根据权利要求1-9中任一项所述的方法。
20.一种计算机可读存储介质,其存储比特流,所述比特流在由解码设备处理时,使所述解码设备执行根据权利要求1-9中任一项所述的方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210258599.3A CN115065828B (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962861315P | 2019-06-13 | 2019-06-13 | |
| US62/861,315 | 2019-06-13 | ||
| CN202210258599.3A CN115065828B (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
| CN202080042297.1A CN113994700A (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
| PCT/US2020/037649 WO2020252422A1 (en) | 2019-06-13 | 2020-06-13 | Motion vector prediction for video coding |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080042297.1A Division CN113994700A (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN115065828A CN115065828A (zh) | 2022-09-16 |
| CN115065828B true CN115065828B (zh) | 2024-05-03 |
Family
ID=73782260
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202210258599.3A Active CN115065828B (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
| CN202080042297.1A Pending CN113994700A (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080042297.1A Pending CN113994700A (zh) | 2019-06-13 | 2020-06-13 | 用于视频编解码的运动矢量预测 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US11917189B2 (zh) |
| EP (1) | EP3963891A4 (zh) |
| JP (4) | JP7198949B2 (zh) |
| KR (2) | KR102437696B1 (zh) |
| CN (2) | CN115065828B (zh) |
| MX (2) | MX2021014880A (zh) |
| WO (1) | WO2020252422A1 (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| MX2021014880A (es) * | 2019-06-13 | 2022-01-18 | Beijing Dajia Internet Information Tech Co Ltd | Prediccion de vector de movimiento para codificacion de video. |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017039117A1 (ko) * | 2015-08-30 | 2017-03-09 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
| CN107211156A (zh) * | 2015-01-26 | 2017-09-26 | 高通股份有限公司 | 以子预测单元为基础的先进时间运动向量预测 |
| CN107483945A (zh) * | 2011-11-08 | 2017-12-15 | 株式会社Kt | 利用解码装置对视频信号进行解码的方法 |
| CN107534778A (zh) * | 2015-04-14 | 2018-01-02 | 联发科技(新加坡)私人有限公司 | 获取时间运动矢量预测的方法及装置 |
| CN108055551A (zh) * | 2012-07-02 | 2018-05-18 | 三星电子株式会社 | 用于预测对视频进行编码或解码的运动矢量的方法和设备 |
| CN108293131A (zh) * | 2015-11-20 | 2018-07-17 | 联发科技股份有限公司 | 用于视频编解码的运动矢量预测或者运动补偿的方法和装置 |
| CN108432250A (zh) * | 2016-01-07 | 2018-08-21 | 联发科技股份有限公司 | 用于视频编解码的仿射帧间预测的方法及装置 |
| CN109076236A (zh) * | 2016-05-13 | 2018-12-21 | 高通股份有限公司 | 用于视频译码的运动矢量预测的合并候选项 |
| CN109429561A (zh) * | 2017-06-23 | 2019-03-05 | 联发科技股份有限公司 | 沉浸式视频编解码中的运动矢量推导的方法及装置 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8755437B2 (en) * | 2011-03-17 | 2014-06-17 | Mediatek Inc. | Method and apparatus for derivation of spatial motion vector candidate and motion vector prediction candidate |
| US9374598B2 (en) * | 2011-03-21 | 2016-06-21 | Lg Electronics Inc. | Method for selecting motion vector predictor and device using same |
| KR102083012B1 (ko) * | 2011-06-28 | 2020-02-28 | 엘지전자 주식회사 | 움직임 벡터 리스트 설정 방법 및 이러한 방법을 사용하는 장치 |
| KR20130030181A (ko) | 2011-09-16 | 2013-03-26 | 한국전자통신연구원 | 움직임 벡터 예측기를 이용한 움직임 벡터 부호화/복호화 방법 및 장치 |
| EP3796651A1 (en) * | 2012-05-09 | 2021-03-24 | Sun Patent Trust | Method of performing motion vector prediction, encoding and decoding methods, and apparatuses thereof |
| US10432928B2 (en) | 2014-03-21 | 2019-10-01 | Qualcomm Incorporated | Using a current picture as a reference for video coding |
| US10298951B2 (en) * | 2017-04-06 | 2019-05-21 | Mediatek Inc. | Method and apparatus of motion vector prediction |
| KR102463478B1 (ko) * | 2018-01-26 | 2022-11-04 | 에이치에프아이 이노베이션 인크. | 비디오 코딩 시스템을 위한 아핀 인터 예측 방법 및 장치 |
| US11895291B2 (en) * | 2018-05-23 | 2024-02-06 | Hfi Innovation Inc. | Method and apparatus of video coding using bi-directional CU weight |
| US11368702B2 (en) * | 2018-06-04 | 2022-06-21 | Lg Electronics, Inc. | Method and device for processing video signal by using affine motion prediction |
| US10735763B2 (en) * | 2018-07-27 | 2020-08-04 | Tencent America LLC | Method and apparatus for motion vector prediction using spatial and temporal combination |
| US10904557B2 (en) * | 2019-01-22 | 2021-01-26 | Tencent America LLC | Method and apparatus for video coding |
| MX2021014880A (es) * | 2019-06-13 | 2022-01-18 | Beijing Dajia Internet Information Tech Co Ltd | Prediccion de vector de movimiento para codificacion de video. |
-
2020
- 2020-06-13 MX MX2021014880A patent/MX2021014880A/es unknown
- 2020-06-13 KR KR1020217039525A patent/KR102437696B1/ko active Active
- 2020-06-13 EP EP20822635.7A patent/EP3963891A4/en active Pending
- 2020-06-13 KR KR1020227029347A patent/KR102858626B1/ko active Active
- 2020-06-13 CN CN202210258599.3A patent/CN115065828B/zh active Active
- 2020-06-13 WO PCT/US2020/037649 patent/WO2020252422A1/en not_active Ceased
- 2020-06-13 CN CN202080042297.1A patent/CN113994700A/zh active Pending
- 2020-06-13 JP JP2021572067A patent/JP7198949B2/ja active Active
-
2021
- 2021-12-02 MX MX2025001288A patent/MX2025001288A/es unknown
- 2021-12-03 US US17/542,151 patent/US11917189B2/en active Active
-
2022
- 2022-12-16 JP JP2022201577A patent/JP2023030061A/ja active Pending
-
2024
- 2024-01-09 JP JP2024001436A patent/JP7685083B2/ja active Active
- 2024-01-19 US US18/418,213 patent/US20240163469A1/en active Pending
-
2025
- 2025-05-29 JP JP2025090014A patent/JP2025122190A/ja active Pending
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107483945A (zh) * | 2011-11-08 | 2017-12-15 | 株式会社Kt | 利用解码装置对视频信号进行解码的方法 |
| CN108055551A (zh) * | 2012-07-02 | 2018-05-18 | 三星电子株式会社 | 用于预测对视频进行编码或解码的运动矢量的方法和设备 |
| CN107211156A (zh) * | 2015-01-26 | 2017-09-26 | 高通股份有限公司 | 以子预测单元为基础的先进时间运动向量预测 |
| CN107534778A (zh) * | 2015-04-14 | 2018-01-02 | 联发科技(新加坡)私人有限公司 | 获取时间运动矢量预测的方法及装置 |
| WO2017039117A1 (ko) * | 2015-08-30 | 2017-03-09 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
| CN108293131A (zh) * | 2015-11-20 | 2018-07-17 | 联发科技股份有限公司 | 用于视频编解码的运动矢量预测或者运动补偿的方法和装置 |
| CN108432250A (zh) * | 2016-01-07 | 2018-08-21 | 联发科技股份有限公司 | 用于视频编解码的仿射帧间预测的方法及装置 |
| CN109076236A (zh) * | 2016-05-13 | 2018-12-21 | 高通股份有限公司 | 用于视频译码的运动矢量预测的合并候选项 |
| CN109429561A (zh) * | 2017-06-23 | 2019-03-05 | 联发科技股份有限公司 | 沉浸式视频编解码中的运动矢量推导的方法及装置 |
Non-Patent Citations (1)
| Title |
|---|
| 辛亚坤 ; .HEVC中Merge模式候选决策的探究和优化.微型机与应用.2016,(第15期),全文. * |
Also Published As
| Publication number | Publication date |
|---|---|
| US11917189B2 (en) | 2024-02-27 |
| MX2021014880A (es) | 2022-01-18 |
| KR20220122802A (ko) | 2022-09-02 |
| JP2022527673A (ja) | 2022-06-02 |
| MX2025001288A (es) | 2025-03-07 |
| JP7685083B2 (ja) | 2025-05-28 |
| KR102858626B1 (ko) | 2025-09-10 |
| EP3963891A4 (en) | 2022-08-03 |
| US20220094970A1 (en) | 2022-03-24 |
| JP2025122190A (ja) | 2025-08-20 |
| JP7198949B2 (ja) | 2023-01-04 |
| KR102437696B1 (ko) | 2022-08-26 |
| CN115065828A (zh) | 2022-09-16 |
| WO2020252422A1 (en) | 2020-12-17 |
| EP3963891A1 (en) | 2022-03-09 |
| US20240163469A1 (en) | 2024-05-16 |
| CN113994700A (zh) | 2022-01-28 |
| KR20210153139A (ko) | 2021-12-16 |
| JP2023030061A (ja) | 2023-03-07 |
| JP2024038295A (ja) | 2024-03-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2683495C1 (ru) | Нововведения в предсказание блочных векторов и оценку восстановленных значений отсчетов в области перекрытия | |
| US10104392B2 (en) | Video prediction encoding device, video prediction encoding method, video prediction encoding program, video prediction decoding device, video prediction decoding method, and video prediction decoding program | |
| EP2699001B1 (en) | A method and a system for video signal encoding and decoding with motion estimation | |
| CN114339237A (zh) | 用于视频编码的方法和电子设备 | |
| CN114009033A (zh) | 用于用信号通知对称运动矢量差模式的方法和装置 | |
| JP2025122190A (ja) | ビデオ符号化のための動きベクトル予測 | |
| JP7678041B2 (ja) | ビデオエンコーディングの方法、ビデオエンコーディング装置、非一時的なコンピュータ可読記憶媒体、コンピュータプログラム、ビットストリームの信号処理方法 | |
| JP2023063506A (ja) | 構築されたアフィンマージ候補を導出する方法 | |
| KR101510585B1 (ko) | 움직임 정보 부호화/복호화 장치 및 움직임 정보를 부호화/복호화하는 방법 | |
| CN113542748B (zh) | 视频编解码方法、设备和非暂时性计算机可读存储介质 | |
| EP4550790A1 (en) | Video encoding method and apparatus, video decoding method and apparatus, and code stream, decoder, encoder and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |