音频编码方法、音频解码方法、装置、可读存储介质与流程

专利2025-03-19  24


本申请涉及人工智能技术,尤其涉及一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

2、音频编解码技术是人工智能领域的重要应用之一,音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术。语音编码技术,简单讲,就是使用较少的网络带宽资源去尽量多的传递语音信息。从香农信息论的角度来讲,语音编码是一种信源编码,信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量,去掉信息中的冗余,同时在解码端还能够无损(或接近无损)的恢复出来。

3、相关技术中,解码端解码所生成的音频的质量较为单一,无法满足用户需求。


技术实现思路

1、本申请实施例提供一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够在保证音频解码的效率的情况下,输出不同质量级别的合成音频信号。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种音频编码方法,包括:

4、响应于针对音频信号的编码请求,从多个编码模式中获取针对所述音频信号的目标编码模式,从多个码率模式中获取针对所述音频信号的目标码率模式;

5、通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征;

6、通过所述目标码率模式,对所述音频信号的编码特征进行信号编码处理,得到所述音频信号的音频码流;

7、基于所述目标编码模式以及所述目标码率模式,确定帧头;

8、基于所述音频码流以及所述帧头,生成所述音频信号的音频码流封装。

9、本申请实施例提供一种音频解码方法,包括:

10、响应于针对音频码流封装的解码请求,从所述音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;

11、其中,所述音频码流封装包括的音频码流是通过所述目标编码模式以及所述目标码率模式,对音频信号进行音频编码得到的,所述目标编码模式是从多个编码模式中获取的,所述目标码率模式是从多个码率模式中获取的;

12、通过所述目标编码模式以及所述目标码率模式,对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;

13、通过所述目标编码模式,对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号。

14、本申请实施例提供一种音频编码装置,包括:

15、第二获取模块,用于响应于针对音频信号的编码请求,从多个编码模式中获取针对所述音频信号的目标编码模式,从多个码率模式中获取针对所述音频信号的目标码率模式;

16、提取模块,用于通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征;

17、信号编码模块,用于通过所述目标码率模式,对所述音频信号的编码特征进行信号编码处理,得到所述音频信号的音频码流;

18、构建模块,用于基于所述目标编码模式以及所述目标码率模式,确定帧头;

19、生成模块,用于基于所述音频码流以及所述帧头,生成所述音频信号的音频码流封装。

20、本申请实施例提供一种音频解码装置,包括:

21、第一获取模块,用于响应于针对音频码流封装的解码请求,从所述音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;

22、其中,所述音频码流封装包括的音频码流是通过所述目标编码模式以及所述目标码率模式,对音频信号进行音频编码得到的,所述目标编码模式是从多个编码模式中获取的,所述目标码率模式是从多个码率模式中获取的;

23、信号解码模块,用于通过所述目标编码模式以及所述目标码率模式,对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;

24、重建模块,用于通过所述目标编码模式,对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号。

25、本申请实施例提供一种电子设备,所述电子设备包括:

26、存储器,用于存储计算机可执行指令;

27、处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本申请实施例提供的音频编码方法或音频解码方法。

28、本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,被处理器执行时,实现本申请实施例提供的音频编码方法或音频解码方法。

29、本申请实施例提供一种计算机程序产品,包括计算机可执行指令,所述计算机可执行指令被处理器执行时实现本申请实施例提供的音频编码方法或音频解码方法。

30、本申请实施例具有以下有益效果:

31、通过不同编码模式以及码率模式,对音频码流进行信号解码,从而得到不同精度的编码特征估计值,然后对不同精度的编码特征估计值进行重建,从而得到不同质量级别的合成音频信号,提高合成音频信号的质量的多样化,以满足用户的实际应用需求。



技术特征:

1.一种音频编码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从所述音频信号中提取出所述音频信号的编码特征,包括:

3.根据权利要求1或2所述的方法,其特征在于,

4.一种音频编码方法,其特征在于,所述方法包括:

5.根据权利要求4所述的方法,其特征在于,

6.根据权利要求4所述的方法,其特征在于,

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,所述残差值的数量为n时,n为大于1的正整数,所述基于所述第一个残差值,确定所述高频特征的残差特征,包括:

9.根据权利要求4任一项所述的方法,其特征在于,

10.根据权利要求9所述的方法,其特征在于,所述确定所述高频子带信号的平坦度边信息,包括:

11.一种音频解码方法,其特征在于,所述方法包括:

12.根据权利要求11所述的方法,其特征在于,

13.根据权利要求11或12所述的方法,其特征在于,所述对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的重建音频信号,包括:

14.一种音频解码方法,其特征在于,所述方法包括:

15.根据权利要求14所述的方法,其特征在于,

16.根据权利要求15所述的方法,其特征在于,

17.根据权利要求14所述的方法,其特征在于,所述对所述低频特征估计值以及所述高频特征估计值分别进行重建处理,得到低频子带信号估计值以及高频子带信号估计值,包括:

18.根据权利要求17所述的方法,其特征在于,所述对所述高频特征估计值进行高频重建处理,得到高频子带信号估计值,包括:

19.根据权利要求18所述的方法,其特征在于,所述基于所述第一变换系数,对所述高频特征估计值进行频带扩展的逆处理,得到第一高频子带信号估计值,包括:

20.根据权利要求19所述的方法,其特征在于,

21.一种处理音频码流的方法,其特征在于,在非易失性计算机可读存储介质上存储音频码流,所述音频码流基于权利要求1至10任一项所述的音频编码方法产生,或根据权利要求11-20任一项所述的音频解码方法进行解码。

22.一种音频解码装置,其特征在于,所述装置包括:

23.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,被处理器执行时实现权利要求1至10任一项所述的音频编码方法,或权利要求11-20任一项所述的音频解码方法。


技术总结
本申请提供了一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品;音频解码方法包括:响应于针对音频码流封装的解码请求,从音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;其中,音频码流封装包括的音频码流是通过目标编码模式以及目标码率模式,对音频信号进行音频编码得到的,目标编码模式是从多个编码模式中获取的,目标码率模式是从多个码率模式中获取的;通过目标编码模式以及目标码率模式,对音频码流进行信号解码处理,得到音频码流对应的编码特征估计值;通过目标编码模式,对音频码流对应的编码特征估计值进行重建处理,得到音频码流对应的合成音频信号。

技术研发人员:肖玮
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-22566.html