本申请涉及语音识别,尤其涉及语音降噪方法、设备及存储介质。
背景技术:
1、随着远程会议的普及程度日益提高,语音通信的降噪也因此成为会议体验的关键因素。目前,语音通信的噪声通常分为两种,分别是平稳噪声和非平稳噪声。相关的语音通信降噪技术主要针对平稳噪声,比如恒定的空调噪音等,一般是通过先检测噪声出现的频段,再设计线性滤波器或滤波器组来消除噪声。在实际过程中,很多噪声是非平稳噪声,比如突发的撞击声、敲击键盘和敲击桌子的声音等,由于此类噪声的频段不稳定,不易被检测和记录,这导致相关技术在语音通信中无法消除非平稳噪声。
2、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本申请提供一种语音降噪方法、设备及存储介质,旨在解决相关技术在语音通信中无法消除非平稳噪声的问题。
2、为实现上述目的,本申请提供的一种语音降噪方法,所述语音降噪方法包括以下步骤:
3、获取采集的语音信号;
4、基于短时傅里叶变换将所述语音信号分解成频谱块,并计算所述频谱块的绝对值,生成功率谱;
5、获取噪声信号的噪声谱,根据所述噪声谱和所述功率谱确定增益值,并将所述增益值应用于所述频谱块,生成目标频谱块;
6、基于逆短时傅里叶变换将所述目标频谱块转换为目标信号,并根据bark频带尺度提取所述目标信号中的特征值;
7、将所述特征值和所述目标信号输入降噪模型,输出目标语言信号。
8、在一实施例中,所述根据bark频带尺度提取所述目标信号中的特征值和待处理信号的步骤包括:
9、获取所述目标信号;
10、基于频带尺度转换公式将所述目标信号的频率轴转换为bark单位,并映射到bark域;
11、将所述bark域划分成至少一个频域带,并计算每个所述频域带的能量值;
12、于所述能量值中提取所述特征值。
13、在一实施例中,所述基于逆短时傅里叶变换将所述目标频谱块转换为目标信号的步骤之后,还包括:
14、获取所述目标信号,并通过基音检测算法确定所述目标信号的确定基音周期;
15、根据所述基音周期,并基于梳状滤波器输出处理后的第一信号;
16、计算所述处理后的第一信号的相干性能量,在所述相干性能量高于预设阈值时,将所述第一信号确定为所述目标信号。
17、在一实施例中,所述方法包括:
18、建立所述降噪模型,其中,所述降噪模型由输入层、隐藏层以及输出层构成;
19、获取训练集,其中,所述训练集中包括输入数据以及预期结果;
20、通过所述训练集训练所述降噪模型,并根据随机梯度下降算法对所述降噪模型中的参数进行更新。
21、在一实施例中,所述建立所述降噪模型的步骤之前,还包括:
22、获取已收集的语音数据,将声音信号转换为特征向量;
23、对所述特征向量进行标签化,并关联对应的标签,将关联标签的特征向量确定为所述训练集。
24、在一实施例中,所述通过所述训练集训练所述降噪模型,并根据随机梯度下降算法对所述降噪模型中的参数进行更新的步骤之后,还包括:
25、定义损失函数,根据损失函数计算所述降噪模型的输出值与真实标签之间的差异;
26、基于优化算法更新所述降噪模型的模型参数,并确定所述损失函数的损失值为预设值时的目标损失函数;
27、输出所述目标损失函数对应的所述降噪模型。
28、在一实施例中,所述输出所述目标损失函数对应的所述降噪模型的步骤之后,还包括:
29、确定测试集,根据所述测试集对训练好的降噪模型进行评估,并输出评估结果;
30、根据所述评估结果对所述降噪模型执行调整操作,其中,所述调整操作包括调整所述降噪模型的网络架构、学习率以及正则化参数。
31、在一实施例中,所述确定所述损失函数的损失值为预设值时的目标损失函数的步骤之前,还包括:
32、根据链式法则,逐层计算所述损失函数对应的网络参数的梯度;
33、根据所述梯度更新所述网络参数中的权重值和偏置值,并根据已更新的网络参数计算所述损失函数的损失值,以使所述损失函数输出的损失值逐步减小。
34、此外,为实现上述目的,本申请还提供一种语音降噪设备,所述语音降噪设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上所述的语音降噪方法的步骤。
35、此外,为实现上述目的,本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的语音降噪方法的步骤。
36、本申请提供语音降噪方法、语音降噪设备及存储介质,通过获取采集的语音信号,再基于短时傅里叶变换将所述语音信号分解成频谱块,并计算所述频谱块的绝对值,生成功率谱,从而获取噪声的噪声谱,根据所述噪声谱和所述功率谱确定增益值,并将所述增益值应用于所述频谱块,生成目标频谱块。然后基于逆短时傅里叶变换将所述目标频谱块转换为目标信号,并根据bark频带尺度提取所述目标信号中的特征值,最后将所述特征值和所述目标信号输入降噪模型,输出目标语言信号。从而通过短时傅里叶变换对语音信号预处理,再结合bark频带尺度以及降噪模型,以消除语音信号中的非平稳噪声。
1.一种语音降噪方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的方法,其特征在于,所述根据bark频带尺度提取所述目标信号中的特征值和待处理信号的步骤包括:
3.如权利要求1所述的方法,其特征在于,所述基于逆短时傅里叶变换将所述目标频谱块转换为目标信号的步骤之后,还包括:
4.如权利要求1所述的方法,其特征在于,所述方法包括:
5.如权利要求4所述的方法,其特征在于,所述建立所述降噪模型的步骤之前,还包括:
6.如权利要求4所述的方法,其特征在于,所述通过所述训练集训练所述降噪模型,并根据随机梯度下降算法对所述降噪模型中的参数进行更新的步骤之后,还包括:
7.如权利要求6所述的方法,其特征在于,所述输出所述目标损失函数对应的所述降噪模型的步骤之后,还包括:
8.如权利要求6所述的方法,其特征在于,所述确定所述损失函数的损失值为预设值时的目标损失函数的步骤之前,还包括:
9.一种语音降噪设备,其特征在于,所述语音降噪设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至8任一项所述的语音降噪方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的语音降噪方法的步骤。