本公开涉及视频编码和视频解码。
背景技术:
1、数字视频能力可以被并入到各种各样的设备中,包括数字电视机、数字直播系统、无线广播系统、个人数字助理(pda)、膝上型计算机或台式计算机、平板计算机、电子书阅读器、数字相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电话(所谓的“智能电话”)、视频电话会议设备、视频流式传输设备等。数字视频设备实现视频译码技术,诸如在由mpeg-2、mpeg-4、itu-t h.263、itu-t h.264/mpeg-4(第10部分,高级视频译码(avc))、itu-th.265/高效率视频译码(hevc)定义的标准以及此类标准的扩展还有专有视频编解码器/格式(诸如由开放媒体联盟开发的aomedia video 1(av1))中描述的那些视频译码技术。通过实现此类视频译码技术,视频设备可以更加高效地发送、接收、编码、解码和/或存储数字视频信息。
2、视频译码技术包括空间(图片内)预测和/或时间(图片间)预测,以减少或移除视频序列中固有的冗余。对于基于块的视频译码,视频切片或视频图块(例如,视频图片或视频图片的一部分)可被划分为视频块,这些视频块还可被称为译码块、超级块、译码树单元(ctu)、译码单元(cu)和/或译码节点。图片的帧内译码(i)的切片中的视频块是使用相对于同一图片中的邻近块中的参考样本(也被称为预测样本)的空间预测来编码的。图片的帧间译码(p或b)的切片中的视频块可使用相对于同一图片中的邻近块中的参考样本的空间预测或相对于其他参考图片中的参考样本的时间预测。图片可称为帧,并且参考图片可称为参考帧。
技术实现思路
1、总的来讲,本公开描述了与具有运动向量差的合并模式(mmvd)有关的各技术,这些技术可提供用于mmvd的更灵活的语法方面选项以在位流中指示运动向量差。本公开的各技术可被应用于现有视频编解码器(诸如hevc(高效率视频译码)、vvc(通用视频译码)、基本视频译码(evc))中的任一种视频编解码器,或者可以是未来视频译码标准(例如,ecm(增强压缩模型))中的高效译码工具。
2、在一个示例中,一种对视频数据进行解码的方法,该方法包括:确定(例如,编码或解码)当前块的合并模式信息,该合并模式信息指示当前块的运动信息将使用第一预测器运动向量和第二预测器运动向量来预测;确定该第一预测器运动向量的第一运动向量差(mvd)和该第二预测器运动向量的第二mvd,该第二mvd与该第一mvd不同;形成第一运动向量,该第一运动向量与该第一运动向量预测器和该第一mvd的组合相对应;形成第二运动向量,该第二运动向量与该第二运动向量预测器和该第二mvd的组合相对应;使用该第一运动向量和该第二运动向量来生成预测块;以及使用该预测块来对该当前块进行解码。
3、在另一示例中,一种用于对视频数据进行解码的设备包括:存储器,该存储器被配置为存储视频数据;以及一个或多个处理器,该一个或多个处理器被实现在电路中并被配置为:确定(例如,编码或解码)该视频数据的当前块的合并模式信息,该合并模式信息指示当前块的运动信息将使用第一预测器运动向量和第二预测器运动向量来预测;确定该第一预测器运动向量的第一运动向量差(mvd)和该第二预测器运动向量的第二mvd,该第二mvd与该第一mvd不同;形成第一运动向量,该第一运动向量与该第一运动向量预测器和该第一mvd的组合相对应;形成第二运动向量,该第二运动向量与该第二运动向量预测器和该第二mvd的组合相对应;使用该第一运动向量和该第二运动向量来生成预测块;以及使用该预测块来对该当前块进行解码。
4、在另一个示例中,一种计算机可读存储介质具有存储在其上的指令,这些指令在被执行时使处理器:确定(例如,编码或解码)当前块的合并模式信息,该合并模式信息指示当前块的运动信息将使用第一预测器运动向量和第二预测器运动向量来预测;确定该第一预测器运动向量的第一运动向量差(mvd)和该第二预测器运动向量的第二mvd,该第二mvd与该第一mvd不同;形成第一运动向量,该第一运动向量与该第一运动向量预测器和该第一mvd的组合相对应;形成第二运动向量,该第二运动向量与该第二运动向量预测器和该第二mvd的组合相对应;使用该第一运动向量和该第二运动向量来生成预测块;以及使用该预测块来对该当前块进行解码。
5、在另一个示例中,一种用于对视频数据进行解码的设备包括:用于确定(例如,编码或解码)当前块的合并模式信息的构件,该合并模式信息指示当前块的运动信息将使用第一预测器运动向量和第二预测器运动向量来预测;用于确定该第一预测器运动向量的第一运动向量差(mvd)和该第二预测器运动向量的第二mvd的构件,该第二mvd与该第一mvd不同;用于形成第一运动向量的构件,该第一运动向量与该第一运动向量预测器和该第一mvd的组合相对应;用于形成第二运动向量的构件,该第二运动向量与该第二运动向量预测器和该第二mvd的组合相对应;用于使用该第一运动向量和该第二运动向量来生成预测块的构件;以及用于使用该预测块来对该当前块进行解码的构件。
6、在附图和以下描述中阐述一个或多个示例的细节。根据描述、附图以及权利要求书,其他特征、目的和优点将是显而易见的。
1.一种对视频数据进行解码的方法,所述方法包括:
2.根据权利要求1所述的方法,其中确定所述第二mvd包括确定所述第二mvd是零值的。
3.根据权利要求1所述的方法,
4.根据权利要求3所述的方法,
5.根据权利要求3所述的方法,还包括对表示所述第一mvd的第一方向和所述第二mvd的第二方向的方向索引进行解码。
6.根据权利要求5所述的方法,其中当所述第一预测器运动向量指向第一参考图片列表中的第一参考图片并且所述第二预测器运动向量指向第二参考图片列表中的第二参考图片时,所述第一方向与所述第二方向相反。
7.根据权利要求5所述的方法,其中当所述第一预测器运动向量指向第一参考图片列表中的第一参考图片并且所述第二预测器运动向量指向所述第一参考图片列表中的第二参考图片时,所述第一方向与所述第二方向等同。
8.根据权利要求1所述的方法,还包括对指示所述第二mvd将被解码的语法元素的值进行译码。
9.根据权利要求8所述的方法,其中所述语法元素是所述当前块的译码单元(cu)级语法元素。
10.根据权利要求1所述的方法,
11.根据权利要求1所述的方法,其中所述合并模式信息包括具有小于阈值的值的合并索引。
12.根据权利要求1所述的方法,其中所述合并模式信息包括指向几何划分模式(gpm)候选列表中的第一条目的第一合并候选索引和指向所述gpm候选列表中的第二条目的第二合并候选索引。
13.根据权利要求1所述的方法,还包括对指示单向的具有mvd的合并(mmvd)将不用于所述当前块的语法元素的值进行译码。
14.根据权利要求1所述的方法,还包括在对所述当前块进行解码之前对所述当前块进行编码。
15.一种用于对视频数据进行解码的设备,所述设备包括:
16.根据权利要求15所述的设备,其中所述一个或多个处理器被配置为确定所述第二mvd是零值的。
17.根据权利要求15所述的设备,
18.根据权利要求17所述的设备,
19.根据权利要求17所述的设备,其中所述一个或多个处理器被进一步配置为对表示所述第一mvd的第一方向和所述第二mvd的第二方向的方向索引进行解码。
20.根据权利要求19所述的设备,其中当所述第一预测器运动向量指向第一参考图片列表中的第一参考图片并且所述第二预测器运动向量指向第二参考图片列表中的第二参考图片时,所述第一方向与所述第二方向相反。
21.根据权利要求19所述的设备,其中当所述第一预测器运动向量指向第一参考图片列表中的第一参考图片并且所述第二预测器运动向量指向所述第一参考图片列表中的第二参考图片时,所述第一方向与所述第二方向等同。
22.根据权利要求15所述的设备,其中所述一个或多个处理器被进一步配置为对所述当前块的指示所述第二mvd将被解码的译码单元(cu)级语法元素的值进行译码。
23.根据权利要求15所述的设备,
24.根据权利要求15所述的设备,其中所述合并模式信息包括具有小于阈值的值的合并索引。
25.根据权利要求15所述的设备,其中所述合并模式信息包括指向几何划分模式(gpm)候选列表中的第一条目的第一合并候选索引和指向所述gpm候选列表中的第二条目的第二合并候选索引。
26.根据权利要求15所述的设备,其中所述一个或多个处理器被进一步配置为对指示单向的具有mvd的合并(mmvd)将不用于所述当前块的语法元素的值进行译码。
27.根据权利要求15所述的设备,还包括显示器,所述显示器被配置为显示所解码的视频数据。
28.根据权利要求15所述的设备,其中所述设备包括相机、计算机、移动设备、广播接收器设备或机顶盒中的一者或多者。
29.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令在被执行时使得处理器:
30.一种用于对视频数据进行解码的设备,所述设备包括: