本公开总体上涉及视频编解码。具体而言,本公开涉及使用交叉分量样本适应性偏移(cross-component sample aadptive offset,简称ccsao)来细化重构样本的方法。
背景技术:
1、除非本文另有说明,否则本节中描述的方法不是下面列出的权利要求的现有技术,以及不被包含在本节中而被承认为现有技术。
2、高效视频编解码(high-efficiency video coding,简称hevc)是由视频编解码联合协作组(joint collaborative team on video coding,简称jct-vc)开发的国际视频编解码标准。hevc基于混合的基于块的运动补偿类dct变换编解码架构。压缩的基本单元,被称为编解码单元(coding unit,简称cu),是一个2nx2n的方形像素块,每个cu可以递归地分成四个更小的cu,直到达到预定的最小大小。每个cu包含一个或多个预测单元(predictionunit,简称pu)。
3、多功能视频编解码(versatile video coding,简称vvc)是由itu-tsg16 wp3和iso/iec jtc1/sc29/wg11的联合视频专家组(joint video expert team,简称jvet)制定的最新国际视频编解码标准。输入视频信号从重构信号预测,该重构信号从编解码图片区域导出。预测残差信号通过块变换进行处理。变换系数与比特流中的其他辅助信息一起被量化和熵编解码。重构信号根据预测信号和对去量化变换系数进行逆变换后的重构残差信号生成。重构信号通过环路滤波进一步被处理,以去除编解码伪像。解码后的图片存储在帧缓冲器中,用于预测输入视频信号中的未来图片。
4、在vvc中,已编解码图片被划分为由相关联的编解码树单元(coding tree unit,简称ctu)表示的非重迭方形块区域。编解码图片可以由片段集合表示,每个片段包含整数个ctu。片段中的各个ctu以光栅扫描连续处理。帧内预测或帧间预测可以被用来对双向预测(bi-predictive,简称b)片段进行解码,其中最多有两个运动向量和参考索引来预测每个块的样本值。预测(p)片段使用具有至多一个运动向量和参考索引的帧内预测或帧间预测来解码以预测每个块的样本值。帧内(intra,简称i)片段仅使用帧内预测对进行解码。
5、ctu可以使用巢状多类型树(multi-type-tree,简称mtt)结构的四叉树(quadtree,简称qt)被划分成一个或多个非重迭编解码单元(coding unit,简称cu),以适应各种局部运动和纹理特征。cu可以使用五种分割类型之一被进一步分割成更小的cu:四叉树分割、垂直二叉树分割、水平二叉树分割、垂直中心侧三叉树分割、水平中心侧三叉树分割。
6、每个cu包含一个或多个预测单元(prediction unit,简称pu)。预测单元与关联的cu语法一起作为用于发送预测信息的基本单元。指定的预测处理用于预测pu内的相关像素样本的值。每个cu可以包含一个或多个变换单元(transform unit,简称tu)用于表示预测残差块。变换单元(transform unit,简称tu)由亮度样本的变换块(transform block,简称tb)和两个相应的色度样本变换块组成,每个tb对应于来自一种颜色分量的样本的一个残差块。整数变换被应用于变换块。量化系数的级别值与其他辅助信息一起在比特流中进行熵编解码。术语编解码树块(coding tree block,简称ctb)、编解码块(coding block,简称cb)、预测块(prediction block,简称pb)和变换块(transform block,简称tb)被定义为指定分别与ctu、cu、pu和tu相关的一个颜色分量的2d样本数组。因此,一个ctu由一个亮度ctb、两个色度ctb和相关语法元素组成。类似的关系对cu、pu和tu有效。
7、样本适应性偏移(sample adaptive offset,简称sao)是在视频编解码中使用的一种技术,用于减少重构视频帧中的压缩伪影。sao用于抑制变换域中高频分量的量化误差引起的带状伪影(伪边缘)和振铃伪影。在hevc中,sao滤波器适应性地应用于满足特定条件的所有样本,例如基于梯度。sao是一种在应用去块滤波器之后基于编码器传输的查找表中的值有条件地将偏移添加到每个样本来修改解码的样本的过程。hevc指定可以对每个ctu选择sao操作的两种sao类型或分类:带偏移(band offset,简称bo)或边缘偏移(edgeoffset,简称eo)。两种sao类型都会向样本添加一定的偏移,该偏移根据该样本位置处的局部梯度从查找表中选择。当bo被应用时,像素强度或像素值被分类为32个固定带。(因此,对于8位样本,每个带的宽度为8个像素值。)特定带的偏移将被添加到落在该特定带中的所有像素。当eo被应用时,块的相邻像素用于将块分类为四种eo类型之一:eo-0(0度)、eo-1(90度)、eo-2(135度)和eo-3(45度)。对于每种eo类型,ctb内的每个样本都被分为5个分类之一:局部最小值、正边缘、平坦区域、负边缘和局部最大值。每个分类都有其相应的边缘偏移。
技术实现思路
1、以下概述仅是说明性的并且不旨在以任何方式进行约束。即,以下概述被提供以介绍本文所述的新颖且非显而易见的技术的概念、亮点、益处和优点。选择而不是所有的实施方式在下面的详细描述中被进一步描述。因此,以下概述并非旨在识别所要求保护的主题的基本特征,也不旨在用于决定所要求保护的主题的范围。
2、本发明的一些实施例提供了一种用于交叉分量样本适应性偏移(cross-component sample adative offset,简称ccsao)的视频编解码方法。视频编解码器接收正在被编解码的当前块的当前像素位置处的当前样本。视频编解码器选择一个亮度样本和两个色度样本作为当前像素位置的亮度和色度同位样本。视频编解码器基于当前像素位置的所选亮度和色度同位样本的值从多个像素分类中选择像素分类。视频编解码器根据所选像素分类执行偏移的查找。视频编解码器应用偏移来更新当前样本。视频编解码器基于更新的当前样本对当前块进行编码或解码。
3、在一些实施例中,当前像素位置的邻近区域的多个候选亮度样本中只有一个有资格作为当前像素位置的亮度同位样本。当前像素位置的邻近区域可以涵盖当前像素位置周围的八个候选亮度样本和当前像素位置的邻近区域的中心位置处的一个候选亮度样本,以及所选择的亮度同位样本位于当前像素位置的该邻近区域的中心位置。在一些实施例中,中心位置处的候选亮度样本被隐式地选择为亮度同位样本,而无需在比特流中发送。
4、在一些实施例中,仅当前像素位置附近的多个候选亮度样本的子集有资格被选择作为亮度同位样本或用于导出当前像素位置的亮度同位样本。例如,多个候选亮度样本可以包括九个亮度样本,而多个候选亮度样本的合格子集可以仅包括四个候选亮度样本。在一些实施例中,从多个候选亮度样本的合格子集中选择的两个或多个候选亮度样本的线性平均值被用作所选择的亮度同位样本。
5、在一些实施例中,第一分类索引基于对当前像素位置所选择的亮度和色度同位样本的值来计算,第二分类索引基于相邻候选亮度样本(当前像素位置附近)相对于特定阈值之间的差值来计算,以及像素分类通过使用第一分类索引和第二分类索引来选择。在一些实施例中,特定阈值基于当前样本的比特深度来决定。
1.一种视频编解码方法,包括:
2.根据权利要求1所述的视频编解码方法,其特征在于,所述当前像素位置的所述邻近区域包括所述当前像素位置周围的8个候选亮度样本以及所述当前像素位置的所述邻近区域的中心位置的一个候选亮度样本。
3.根据权利要求2所述的视频编解码方法,其特征在于,所选择的所述亮度同位样本位于所述当前像素位置的所述邻近区域的所述中心位置。
4.根据权利要求3所述的视频编解码方法,其特征在于,所述中心位置处的所述候选亮度样本被隐式地选择作为所述亮度同位样本,而不在比特流中发送。
5.根据权利要求1所述的视频编解码方法,其特征在于,第一分类索引基于对所述当前像素位置所选择的所述多个亮度和色度同位样本的所述多个值来计算,所述方法还包括:
6.根据权利要求5所述的视频编解码方法,其特征在于,所述特定阈值基于所述当前样本的比特深度来决定。
7.根据权利要求1所述的视频编解码方法,其特征在于,所述当前像素位置的所述邻近区域的所述多个候选亮度样本中只有一个有资格作为所述当前像素位置的所述亮度同位样本。
8.根据权利要求1所述的视频编解码方法,其特征在于,所述多个候选亮度样本包括九个亮度样本,以及
9.根据权利要求7所述的视频编解码方法,其特征在于,从所述多个候选亮度样本的合格的所述子集中选择的两个或多个候选亮度样本的线性平均值被用作所选择的所述亮度同位样本。
10.一种电子装置,包括:
11.一种视频解码方法,包括:
12.一种视频编码方法,包括:
