一种视频压缩信号的重建方法与流程

专利2024-07-11  55


本发明涉及视频压缩处理的技术领域,特别是涉及一种视频压缩信号的重建方法。



背景技术:

传统的具有代表性的视频压缩编码技术如h.26x和mpeg等,以尼奎斯特采样定理为基础,以至少两倍于采样信号带宽的采样率进行采样,然后再对视频信号进行高复杂度的压缩编码,最后将信号进行传输和保存,这样先采样再配合高度压缩的信号处理技术,对信号采集端造成了巨大的资源浪费,同时复杂的压缩编码技术同样造成了采样设备的功耗和性能限制。

2006年donoho、candes和tao等人提出的压缩感知理论,提供了一种全新的信号采样技术,该理论指出:对于在某个变换域内稀疏或近似稀疏的信号,可以以远低于尼奎斯特采样率的频率对信号进行采样,并有极大概率精确地重构信号。压缩感知理论的创新性在于,一方面突破了传统采样采样率瓶颈,另一方面,压缩感知理论通过设计一个观测矩阵对信号进行直接采样,采样得到的信号已经完成了压缩,这样实现了采样和压缩同步完成,有效避免采样资源的浪费,同时高复杂度的信号重构在解码端进行,能够有效的解决采样段的设备性能瓶颈。压缩感知技术在其诞生之初便引起了学术界的广泛关注,在实际应用方面也受到了无线传感和多媒体传感网络等领域的青睐。

随着压缩感知理论的发展,众多学者对视频压缩感知技术进行了深入的研究,并取得了多方面的显著成果,其中,基于预测—残差的视频重构分布式压缩感知框架被广泛采用,但是,目前的预测—残差的视频重构算法仅侧重于预测算法精度的提升,而忽略了残差重构对最终预测性能的影响。由于大多数图像帧的重构与残差密切相关,如果对残差重构的准确度不高,则很难提升视频压缩感知算法的整体性能。



技术实现要素:

本发明的目的在于克服现有技术存在的上述缺陷,提供一种视频压缩信号的重建方法。

为实现上述目的,本发明的技术方案如下:

一种视频压缩信号的重建方法,包括:

s01:根据采集端输出的关键帧和非关键帧的图像观测值,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值;

s02:根据所述非关键帧的图像预测值和所述非关键帧的图像观测值以及采集端使用的随机采样矩阵,计算非关键帧的观测残差和非关键帧的预测残差;

s03:计算所述非关键帧的观测残差的残差信号平均能量,并根据所述残差信号能量的大小,选择适配的残差重构算法,对预测残差进行重构,生成重构残差;

s04:根据所述非关键帧的图像预测值和非关键帧的重构残差,计算非关键帧的图像重构值。

进一步地,在步骤s01中,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值包括:

使用如下公式计算非关键帧的图像预测值:

其中,为非关键帧的图像预测值,hp,q是用于图像目标块估计的分量块,wp,q是对应该分量块的权重系数,k,p为图像块的帧索引,k对应于同图像组内的非关键帧,p对应于同图像组内的关键帧和非关键帧,j,q是帧内的图像块索引,权重系数wp,q使用如下公式计算:

其中,yk,j为非关键帧的图像观测值,λ为时间先验的权重因子,用于调节关联帧间的影响力,φ为随机采样矩阵,p1为关联帧的图像块的帧索引,所述关联帧包括所述非关键帧的相邻帧以及同图像组内的关键帧,p2为非关联帧的图像块的帧索引。

进一步地,对于静态类图像,λ>=0.5,对于动态类图像,λ<0.5。

进一步地,在步骤s02中,计算非关键帧的观测残差包括:

基于所述随机采样矩阵,对非关键帧的图像预测值进行域变换处理,得到变换域的图像预测值;

将所述变换域的图像预测值与非关键帧的图像观测值相减,得到观测残差。

进一步地,在步骤s02中,计算非关键帧的预测残差包括:

基于所述随机采样矩阵,对观测残差进行域逆变换处理,得到非关键帧的预测残差。

进一步地,在步骤s03中,计算所述非关键帧的观测残差的残差信号平均能量包括:

根据如下公式计算所述残差信号平均能量:

其中,r为残差信号平均能量,为非关键帧的观测残差中的非零残差,r为残差信号平均能量,k为图像块的帧索引,j为帧内的图像块索引,l为非零残差信号的索引,l为残差信号中非零分量的数量。

进一步地,在步骤s03中,根据所述残差信号平均能量的大小,选择适配的残差重构算法,对所述非关键帧的预测残差进行重构,生成非关键帧的重构残差包括:

根据预设的判定阈值t1和t2与残差信号平均能量之间的关系,选择如下公式之一,计算重构残差的稀疏表达系数:

如果r≤t1,则使用

如果t1<r≤t2,则使用

如果r>t2,则使用

其中,为重构残差的稀疏表达系数,为非关键帧的预测残差的稀疏表达系数,为非关键帧的观测残差,λ1,λ2为平衡预测图像与观测图像之间的相似和差异效果的权重因子,

使用如下公式计算非关键帧的重构残差:

其中,为非关键帧的重构残差,ψ为冗余字典。

进一步地,步骤s04包括:

使用如下公式计算非关键帧的图像重构值:

其中,为非关键帧的图像重构值,为非关键帧的图像预测值。

进一步地,上述方法还包括:

根据所述关键帧的图像观测值,计算关键帧的图像重构值。

进一步地,上述方法还包括:

使非关键帧的图像重构值和关键帧的图像重构值,分别生成关键帧图像和非关键帧图像;

将关键帧图像和非关键帧图像,按照帧序列顺序进行组合,生成重建后的视频图像。

在本发明的视频压缩信号的重建方法,在非关键帧的重建过程中,基于残差信号平均能量的大小,选择适配的残差重构算法,对预测残差进行重构,由于残差信号平均能量的大小体现了预测信息与观测信息之间的差异性,根据差异程度来选择使用不同的重建算法,能够有效提高残差重构的准确度,从而提升视频图像的差异化保留能力,最终实现视频图像的高质量重建。

附图说明

图1是为本发明的视频压缩重构算法的整体架构示意图;

图2是本发明的视频连续帧中的图像组的示意图;

图3是本发明的视频压缩信号的重建方法的流程图。

具体实施方式

下面结合附图,对本发明的具体实施方式作进一步的详细说明。

需要说明的是,在下述的具体实施方式中,在详述本发明的实施方式时,为了清楚地表示本发明的结构以便于说明,特对附图中的结构不依照一般比例绘图,并进行了局部放大、变形及简化处理,因此,应避免以此作为对本发明的限定来加以理解。

为了便于对技术方案的描述,对后续部分标号进行如下说明:

图像观测值:直接通过采集端探测器检测到的图像信号,在本发明中用yk,j表示非关键帧的图像观测值;

图像预测值:基于图像观测值预测得到的图像信号,在本发明中用表示非关键帧的图像预测值;

非关键帧的观测残差图像观测信号与变换之后图像预测信号之差,在本发明中用表示非关键帧的观测残差;

非关键帧的预测残差变换之后图像观测信号与图像预测信号之差,在本发明中用表示非关键帧的预测残差;

非关键帧的重构残差通过非关键帧的观测残差并结合分段重建算法得到的信号再通过如下公式计算得到:其中,为预测残差非关键帧的稀疏表达系数;

图像重构值:最终需要呈现的视频信号,即解压缩之后的图像信号,在本发明中用表示非关键帧的图像重构值。

参考图1,其为本发明的视频压缩重构算法的整体架构示意图。整个视频压缩重构的过程可以分为采集端的视频压缩处理和重构端的视频重构处理。采集端和重构端可以分布于不同的设备上,例如,采集端可以设置在视频服务器上,而重构端可以设置在用于移动终端上,视频信号在采集端被压缩后,通过互联网传送给移动终端,移动终端上的重构端对视频数据进行重构,生成视频帧并进行播放。

参考图2,其为本发明的视频连续帧中的图像组的示意图。在采集端视频信号被拆分为连续的图像组,每图像组由固定数量的连续图像帧组成,每个图像组的第一帧为关键帧,其他帧为非关键帧。在采集端,采用分块压缩感知算法对关键帧和非关键帧进行压缩采用,分块压缩感知算法具有存储空间需求少以及能够较好地保留图像特征的优点。

以非关键帧为例,假设被采样的原始图像的尺寸为n×n,则图像块大小可以设定为n1/2×n1/2,用k表示帧索引、j表示帧内的图像块索引,则对原始图像采样后的图像信号值表示为xk,j。对图像信号值xk,j进行压缩感知采样后,得到图像观测值,表示为yk,j。

采样过程可以通过下面的公式(1)来表示:

yk,j=φxk,j公式(1)

其中,φ为m×n的随机采样矩阵,且m<<n,即观测数量远小于图像信号的离散分量数量,采样率为m/n,随机采样矩阵可以采用高斯随机矩阵、哈达玛随机矩阵等。关键帧与非关键帧的采用处理原理是相同的,只是采样率有所不同,通常针对关键帧采用较高的m,以作为在对应图像组内的参考信号,为非关键帧图像块的估计提供参考。非关键帧采用较低的m,实现较高的压缩率,降低采集端负载。经过采样端采样后生成的图像观测值作为采样端的图像压缩数据进行输出。

根据压缩感知理论,图像观测值yk,j可以表示为如下公式(2):

yk,j=φxk,j=φψθk,j公式(2)

φψ称作观测矩阵,ψ为冗余字典,θk,j为xk,j在字典ψ下的稀疏表达系数,其中,冗余字典ψ和随机采样矩阵φ均为已知量,上述公式(1)和公式(2)的采样过程相当于使用φ对xk,j进行了域变换,为了区分变换前后的两个域,将xk,j所在的域称作信号域,将yk,j所在的域称作变换域。冗余字典ψ在重构端进行图像重构的过程中会用到。

在重构端,针对关键帧和非关键采用不同的方式进行重构。其中,关键帧可以采用现有的压缩感知算法进行重建,因为关键帧具有较高采样率,所以可以采用例如k-svd,l1-norm优化算法、mh-bcs-spl等均能取得较好的效果。非关键帧数量远大于关键帧数量,非关键帧重建质量对视频压缩重建质量起着确定性作用,在本发明中,在对关键帧的重建过程中,充分考虑了残差能量对非关键帧重建的影响,根据残差能量的大小来选择适配的残差重构算法来进行关键帧的重建,具体的处理过程,将在后面进行详述。

参见图3,其为本发明的视频压缩信号的重建方法的流程图,该方法可以包括:

s01:根据采集端输出的关键帧的图像观测值和非关键帧的图像观测值yk,j,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值具体地,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值的处理过程可以包括:

使用如下公式(3)计算非关键帧的图像预测值

其中,hp,q是用于图像目标块xk,j估计的分量块,wp,q是对应该分量块的权重系数,k,p为图像块的帧索引,k对应于同图像组内的非关键帧,p对应于同图像组内的关键帧和非关键帧,j,q是帧内的图像块索引,权重系数wp,q,使用如下公式(4)计算:

其中,λ为时间先验的权重因子,用于调节关联帧间的影响力。p1为关联帧的图像块的帧索引,所述关联帧包括所述非关键帧的相邻帧以及同图像组内的关键帧,p2为非关联帧的图像块的帧索引,非关联帧包括同图像组中除了前述的关联帧之外的其他帧。argmin函数为使目标函数取最小值时的变量值。

从公式(4)可以看出,权重系数wp,q由图像块的能量先验和时间先验共同决定。采用图像能量作为图像相似的先验信息,通过最小化图像块的观测值与图像块的估计值之间的能量差,确定权重系数wp,q,同时在公式(4)中纳入时间相关性,因为视频图像的连续性,目标帧与关联帧之间通常具有高度的相似性,为了增强关联帧的影响,将关联帧的能量差独立出来计算,形成公式(4)的第一项,公式(4)的第二项为非关联帧的能量差,并通过λ来调节关联帧的影响力。在本发明中,通过p1和p2核心是要区分同图像组内同位置的图像块对目标图像块影响大小,而关键帧和关联帧对目标帧对应图像块有更多的参考信息,同图像组中每个非关键帧的目标帧,都要使用关键帧作为参考,因此,将关键帧作为关联帧,即将其归入p1中,而不是归入到p2。上述λ为预设值,根据不同的视频图像类型,权重因子λ可以设置不同值,对于静态类图像,例如针对静物的拍摄图像或者各帧之间的变化很小的图像,λ>=0.5,对于动态类图像,例如图像中存在高速移动目标或者整帧图像都在动态变化,λ<0.5。

s02:根据所述非关键帧的图像预测值和所述非关键帧的图像观测值yk,j以及采集端使用的随机采样矩阵φ,计算非关键帧的观测残差和非关键帧的预测残差

其中,在步骤s02中,计算非关键帧的观测残差可以包括:

基于所述随机采样矩阵φ,对非关键帧的图像预测值进行域变换处理,得到变换域的图像预测值这里所说的域变换处理是指基于随机采样矩阵φ从信号域到变换域的变换,具体可以采用如下公式(5)。

然后,将所述变换域的图像预测值与非关键帧的图像观测值yk,j相减,得到非关键帧的观测残差

此外,在步骤s02中,计算非关键帧的预测残差可以包括:

基于所述随机采样矩阵φ,对观测残差进行域逆变换处理,得到非关键帧的预测残差这里所说的域逆变换处理是指基于随机采样矩阵φ从变换域到信号域的变换,具体可以采用如下公式(6):

其中,φ-1为随机采样矩阵φ的逆矩阵。

s03:计算所述非关键帧的观测残差的残差信号平均能量,并根据所述残差信号平均能量的大小,选择适配的残差重构算法,对预测残差进行重构,生成非关键帧的重构残差

在步骤s03中,计算所述非关键帧的观测残差的残差信号平均能量包括:根据如下公式(7)计算所述残差信号平均能量:

其中,r为残差信号平均能量,k为图像块的帧索引,j为帧内的图像块索引,l为非零残差信号的索引,l为残差信号中非零分量的数量。

在步骤s03中,根据所述残差信号平均能量的大小,选择适配的残差重构算法,对预测残差进行重构,生成非关键帧的重构残差包括:

根据预设的判定阈值t1和t2与残差信号平均能量r之间的关系,选择如下公式之一,计算重构残差的稀疏表达系数

如果r≤t1,则使用公式(8)计算

如果t1<r≤t2,则使用公式(9)计算

如果r>t2,则使用公式(10)计算

其中,在为非关键帧的预测残差的稀疏表达系数,为观测残差,λ1,λ2为平衡预测图像与观测图像之间的相似和差异效果的权重因子,判定阈值t1、t2与字典平均原子能量相关,判定阈值t1、t2正比于冗余字典ψ的平均原子能量。

r≤t1对应于残差信号平均能量较低的情形,说明预测信息与观测信息相似度高,即变换域的图像预测值与图像观测值yk,j具有较高的相似度,此时,采用2范数对残差高频信息(观测与预测的差异)进行抑制,从而保证图像的一致性。

t1<r≤t2对应于残差信号平均能量较高的情形,说明预测信息与观测信息出现较为明显差异,即变换域的图像预测值与图像观测值yk,j出现较为明显差异,此时,采用综合2范数和1范数对相似和差异部分进行平衡。

r>t2对应于残差信号平均能量极高的情形,说明预测信息与观测值差异非常明显,即变换域的图像预测值与图像观测值yk,j差异非常明显,此时,采用1范强化差异效果。

然后,使用如下公式(11)计算非关键帧的重构残差

其中,ψ为冗余字典。

在上述的步骤s03的残差重构处理中,充分考虑了预测残差的稀疏表达系数的特征。基于预测信息和观测信息之间的差异性与残差信号平均能量值的正相关的先验信息,评估预测残差的稀疏表达系数的特征,从而选择不同的残差重构算法,以实现高质量的重建效果。

s04:根据所述非关键帧的图像预测值和非关键帧的重构残差计算非关键帧的图像重构值具体地,步骤s04可以使用如下公式(12)计算非关键帧的图像重构值

其中,为非关键帧的图像预测值。

通过以上的步骤s01至s04,计算出了非关键帧的图像重构值,基于该图像重构值就可以生成非关键帧图像了

此外,本发明的视频压缩重构算法还可以包括关键帧的图像重构处理,具体地,本发明的视频压缩重构算法还可以包括:

s05:根据所述关键帧的图像观测值,计算关键帧的图像重构值。计算关键帧的图像重构值的处理过程,可以和前面的步骤s01-s04的计算非关键帧的图像重构值并行执行,也可以如图3中所示的顺序执行。如前面介绍的,关键帧的重构处理,可以使用k-svd,l1-norm优化算法、mh-bcs-spl等现有的方式实现。

在计算出关键帧和非关键帧的图像重构值后,就可以进行完整的视频图像重建了,具体地,本发明的视频压缩重构算法还可以包括:

s06:使非关键帧的图像重构值和关键帧的图像重构值,分别生成关键帧图像和非关键帧图像;

s07:将关键帧图像和非关键帧图像,按照帧序列顺序进行组合,生成重建后的视频图像。

以上的仅为本发明的优选实施例,实施例并非用以限制本发明的保护范围,因此凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。


技术特征:

1.一种视频压缩信号的重建方法,其特征在于,包括:

s01:根据采集端输出的关键帧和非关键帧的图像观测值,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值;

s02:根据所述非关键帧的图像预测值和所述非关键帧的图像观测值以及采集端使用的随机采样矩阵,计算非关键帧的观测残差和非关键帧的预测残差;

s03:计算所述非关键帧的观测残差的残差信号平均能量,并根据所述残差信号能量的大小,选择适配的残差重构算法,对预测残差进行重构,生成重构残差;

s04:根据所述非关键帧的图像预测值和非关键帧的重构残差,计算非关键帧的图像重构值。

2.根据权利要求1所述的视频压缩信号的重建方法,其特征在于,在步骤s01中,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值包括:

使用如下公式计算非关键帧的图像预测值:

其中,为非关键帧的图像预测值,hp,q是用于图像目标块估计的分量块,wp,q是对应该分量块的权重系数,k,p为图像块的帧索引,k对应于同图像组内的非关键帧,p对应于同图像组内的关键帧和非关键帧,j,q是帧内的图像块索引,权重系数wp,q使用如下公式计算:

其中,yk,j为非关键帧的图像观测值,λ为时间先验的权重因子,用于调节关联帧间的影响力,φ为随机采样矩阵,p1为关联帧的图像块的帧索引,所述关联帧包括所述非关键帧的相邻帧以及同图像组内的关键帧,p2为非关联帧的图像块的帧索引。

3.根据权利要求2所述的视频压缩信号的重建方法,其特征在于,对于静态类图像,λ>=0.5,对于动态类图像,λ<0.5。

4.根据权利要求1至3任一所述的视频压缩信号的重建方法,其特征在于,在步骤s02中,计算非关键帧的观测残差包括:

基于所述随机采样矩阵,对非关键帧的图像预测值进行域变换处理,得到变换域的图像预测值;

将所述变换域的图像预测值与非关键帧的图像观测值相减,得到观测残差。

5.根据权利要求4所述的视频压缩信号的重建方法,其特征在于,在步骤s02中,计算非关键帧的预测残差包括:

基于所述随机采样矩阵,对观测残差进行域逆变换处理,得到非关键帧的预测残差。

6.根据权利要求5所述的视频压缩信号的重建方法,其特征在于,在步骤s03中,计算所述非关键帧的观测残差的残差信号平均能量包括:

根据如下公式计算所述残差信号平均能量:

其中,r为残差信号平均能量,为非关键帧的观测残差中的非零残差,r为残差信号平均能量,k为图像块的帧索引,j为帧内的图像块索引,l为非零残差信号的索引,l为残差信号中非零分量的数量。

7.根据权利要求6所述的视频压缩信号的重建方法,其特征在于,在步骤s03中,根据所述残差信号平均能量的大小,选择适配的残差重构算法,对所述非关键帧的预测残差进行重构,生成非关键帧的重构残差包括:

根据预设的判定阈值t1和t2与残差信号平均能量之间的关系,选择如下公式之一,计算重构残差的稀疏表达系数:

如果r≤t1,则使用

如果t1<r≤t2,则使用

如果r>t2,则使用

其中,为重构残差的稀疏表达系数,为非关键帧的预测残差的稀疏表达系数,为非关键帧的观测残差,λ1,λ2为平衡预测图像与观测图像之间的相似和差异效果的权重因子,

使用如下公式计算非关键帧的重构残差:

其中,为非关键帧的重构残差,ψ为冗余字典。

8.根据权利要求7所述的视频压缩信号的重建方法,其特征在于,步骤s04包括:

使用如下公式计算非关键帧的图像重构值

其中,为非关键帧的图像重构值,为非关键帧的图像预测值。

9.根据权利要求8所述的视频压缩信号的重建方法,其特征在于,还包括:

根据所述关键帧的图像观测值,计算关键帧的图像重构值。

10.根据权利要求9所述的视频压缩信号的重建方法,其特征在于,还包括:

使非关键帧的图像重构值和关键帧的图像重构值,分别生成关键帧图像和非关键帧图像;

将关键帧图像和非关键帧图像,按照帧序列顺序进行组合,生成重建后的视频图像。

技术总结
本发明公开了一种视频压缩信号的重建方法,包括:根据采集端输出的关键帧和非关键帧的图像观测值,对非关键帧的图像进行初步预测,生成非关键帧的图像预测值;根据非关键帧的图像预测值和非关键帧的图像观测值以及采集端使用的随机采样矩阵,计算非关键帧的观测残差和非关键帧的预测残差;计算非关键帧的观测残差的残差信号平均能量,并根据残差信号能量的大小,选择适配的残差重构算法,对预测残差进行重构,生成重构残差;根据非关键帧的图像预测值和非关键帧的重构残差,计算非关键帧的图像重构值。在本发明的视频压缩信号的重建方法,能够有效提高残差重构的准确度,从而提升视频图像的差异化保留能力,最终实现视频图像的高质量重建。

技术研发人员:周涛;李琛
受保护的技术使用者:上海集成电路装备材料产业创新中心有限公司;上海集成电路研发中心有限公司
技术研发日:2020.12.11
技术公布日:2021.04.06

转载请注明原文地址:https://xbbs.6miu.com/read-20309.html