一种基于深度学习的短突发水声通信信号调制识别方法与流程

专利2024-10-15  23


本发明涉及信号识别技术领域,尤其涉及一种基于深度学习的短突发水声通信信号调制识别方法。



背景技术:

水声通信信号调制识别是在不依赖先验信息的情况下对接收水声通信信号的调制方式进行识别,是水声信号属性识别和水声通信信号内容获取的重要环节。近年来,随着人类对海洋的不断开发利用,以及对海洋信息获取需求的不断提升,水声通信信号调制识别日益成为重要的研究课题。但是由于水声信道的复杂特性,该领域的研究进展比较缓慢,尤其是在军事应用中,水声通信信号大多是短突发的,这进一步增加了对其进行调制识别的难度。

传统的水声通信信号调制识别多采用模式识别的方法,首先依据领域知识设计特征提取算法构造特征识别量,然后构造分类器进行识别,常用的特征量包括瞬时特征、循环平稳特征、高阶累积量特征、谱特征、小波变换特征和时频变换特征等。这类方法的识别性能依赖领域知识,而且水声多途效应和脉冲噪声等引起信号畸变,导致人工设计的特征量对不同水声环境的泛化能力不强。

为了降低对领域知识的依赖,以及提取更加有效和稳健的分类特征,近年来,部分文献提出了一些基于深度学习的方法,将传统方法中特征提取和分类的环节交由深层神经网络自动完成。文献1(caitlynn.marcoux,binduchandna,dianneegnor,etal.blindequalizationandautomaticmodulationclassificationofunderwateracousticsignals[j].thejournaloftheacousticalsocietyofamerica,2018,144(3):1729-1729.)采用基带时域波形来训练卷积神经网络。文献2(x.yu,l.li,j.yin,m.shao,andx.han,“modulationpatternrecognitionofnon-cooperativeunderwateracousticcommunicationsignalsbasedonlstmnetwork*,”in2019ieeeinternationalconferenceonsignal,informationanddataprocessing(icsidp),dec.2019,pp.1–5)提出采用信号时域波形的瞬时特征来作为lstm网络的输入,并在实际水域中验证了方法的有效性。但是由于lstm网络相比普通网络参数量要大得多,该方法需要大量在测试信道下获取的数据来对网络进行训练。此外,除lstm外上述基于信号时域波形和cnn的方法中网络大都拥有固定的输入维度,无法处理变长输入数据。

还有一些现有文献分别将信号的功率谱和幂次方谱输入稀疏自动编码网络(sae)和cnn网络中,实现了对多类常见水声通信信号的有效识别,但功率谱的准确估计对接收信号时长有一定要求,而且当信道多途带来的衰落严重时,算法性能急剧下降。文献3(姚晓辉,杨宏晖,李益青.基于卷积神经网络的水声通信调制识别[j].无人系统技术,2018,1(4):68-74)考虑将信号的时频幅度图作为一个尺寸更大,层数更深的cnn的输入,通过时频分布的差异来完成多类信号的分类识别。但该方法存在时频分辨率的衡量问题,当信号参数变化时,很难选择合适的窗长等参数来确保时频图的质量,同时,该方法无法对psk信号进行有效的类间识别。



技术实现要素:

为解决现有深度学习方法在复杂海洋信道条件下对短突发水声通信信号识别准确率不足、识别类别有限,以及对目标信道训练数据量需求大的问题或者至少部分地解决上述问题,本发明提供一种基于深度学习的短突发水声通信信号调制识别方法。

本发明提供一种基于深度学习的短突发水声通信信号调制识别方法,该方法包括:

步骤1:对接收信号y(n)进行脉冲预处理得到信号i(n),所述接收信号y(n)的信号模型为:

y(n)=s(n)*h(n)+w(n)(1)

其中,n表示采样时刻,s(n)为发送的载波调制信号,所述载波调制信号的类型集合为{2fsk,4fsk,8fsk,bpsk,qpsk,ofdm,s2c},h(n)表示水声多径信道冲激响应,w(n)为alpha稳定分布噪声,*表示卷积运算;

步骤2:对信号i(n)进行维度预处理得到处理后的时域波形d(m),使得所述处理后的时域波形d(m)的维度与att-cnn模块的输入维度相匹配,所述att-cnn模块指采用注意力机制的卷积神经网络;

步骤3:采用所述att-cnn模块对所述处理后的时域波形d(m)进行识别,输出第一预测概率向量pd,所述第一预测概率向量pd用于指示接收信号y(n)属于所述调制类型集合中各信号类型的概率值;

步骤4:根据所述第一输出预测概率向量pd进行再次判断,确定最终识别结果,具体为:

若所述第一预测概率向量pd中最大概率值对应2fsk、4fsk、8fsk、s2c或ofdm信号时,则将最大概率值对应的信号类型作为最终识别结果;

若所述第一预测概率向量pd中最大概率值对应bpsk或qpsk信号时,则继续采用sae网络对信号i(n)的平方谱c(k)进行特征提取,并输出第二预测概率向量pc,然后根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果。

进一步地,所述步骤1具体包括:

步骤1.1:按照公式(2)对接收信号y(n)中幅值大于门限τr的部分进行非线性抑制,得到输出信号y′(n):

步骤1.2:按照公式(4)对所述输出信号y′(n)进行归一化得到信号i(n):

进一步地,按照公式(3)确定所述门限τr:

τr=(1+2τ0)τq,(3)

其中,τ0为常系数,τq为接收信号y(n)模值|y(n)|的第二个四分位点值。

进一步地,所述步骤2具体包括:

按照公式(5)将信号i(n)在时间维度上进行重复拼接,得到处理后的时域波形d(m):

其中,m=1,2,...,lc,mod表示取余运算。

进一步地,所述att-cnn模块的结构为:包括5个级联的卷积块、与最后一级卷积块相连接的一维卷积层、与所述一维卷积层相连接的全连接层和所述全连接层相连接的softmax层;

其中,所述卷积块用于对处理后的时域波形d(m)进行特征提取;所述一维卷积层用于对特征通道进行压缩。

进一步地,每个所述卷积块均包括:一维卷积层、bn层、se单元和leakyrelu函数;并且,在级联的前4个所述卷积块中还包括averagepool层;

其中,采用所述一维卷积层对输入信号进行特征提取,采用所述bn层对提取的特征进行归一化,采用所述se单元的注意力机制对各特征通道进行加权校准,采用leakyrelu函数对加权校准后的特征进行激活,采用所述averagepool层对激活后的特征进行下采样。

进一步地,步骤4中,所述根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果,具体为:

按照公式(12)进行加权融合,输出融合预测概率向量pv:

pv=λdpd-psk+(1-λd)pc-psk,λd∈[0,1](12)

其中,pd-psk为att-cnn模块输出的第一预测概率向量pd中psk预测概率向量,pc-psk为sae网络输出的第二预测概率向量pc中psk预测概率向量,λd为权重;

将所述融合预测概率向量pv中较大概率值对应的psk信号作为最终识别结果。

进一步地,还包括:

构建公式(13)所示的迁移数据模型:

其中,表示接收信号,为alpha稳定分布噪声,特征指数为为与信道冲激响应h(n)近似的信道冲激响应;

采用所述迁移数据模型产生迁移数据训练集,利用所述迁移数据训练集完成att-cnn模块的预训练;

结合目标信道下的数据对预训练后的att-cnn模块和sae网络进行微调;其中,在所述微调的过程中将att-cnn模块中除最后3层之外的所有参数冻结,而只对最后3层的参数进行微调。

本发明的有益效果:

(1)本发明提供的一种基于深度学习的短突发水声通信信号调制识别方法,该方法首先构造脉冲噪声预处理器对接收信号中的高幅值脉冲成分进行预处理,然后构造了一个att-cnn模块和一个sae网络,分别用于提取脉冲预处理后信号的时域波形和平方谱特征。最后,对两个模块的识别结果进行决策级的融合来提高综合识别性能,能够有效识别2fsk、4fsk、8fsk、bpsk、qpsk、ofdm、s2c等7类常用水声通信信号。

(2)大部分传统方法依赖领域知识,且人工设计的特征量在不同信道下适应性差;而本发明采用深层神经网络自动提取特征和分类,对信道更加稳健;

(3)现有方法在低信噪比下的性能下降;而本发明通过在模型中引入注意力机制,能够更有效提取信号特征,对微弱信号识别性能更好。

(4)现有深度学习方法大都要求测试信号样本长度与网络输入维度相一致,无法处理变长输入数据;而本发明通过基于数据复用的维度预处理,可以处理任意长度的接收信号,对突发信号的识别性能更好;

(5)现有深度学习方法在训练过程中需要大量来自目标测试信道条件下的数据;而本发明通过采用迁移学习策略以及构建迁移训练数据模型,大大减小了对目标信道训练数据的需求。

附图说明

图1为本发明实施例提供的基于深度学习的短突发水声通信信号调制识别方法的流程示意图;

图2为本发明实施例提供的se单元的结构示例;

图3为本发明实施例提供的bpsk和qpsk的平方谱示意图;

图4为本发明实施例提供的迁移学习策略的训练过程示意图;

图5为本发明实施例提供的不同信道的幅频响应:(a)ha;(b)hb;(c)hc;(d)hd;(e)he;(f)hf;

图6为本发明实施例提供的不同方法的识别性能对比示意图;

图7为本发明实施例提供的直接训练以及微调所得网络识别性能对比示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

如图1所示,本发明实施例提供一种基于深度学习的短突发水声通信信号调制识别方法,包括:

s101:对接收信号y(n)进行脉冲预处理得到信号i(n),所述接收信号y(n)的信号模型为:

y(n)=s(n)*h(n)+w(n)(1)

其中,n表示采样时刻,s(n)为发送的载波调制信号,所述载波调制信号的类型集合为{2fsk,4fsk,8fsk,bpsk,qpsk,ofdm,s2c},h(n)表示水声多径信道冲激响应,w(n)为alpha稳定分布噪声,*表示卷积运算;

具体地,水声通信信号在水声信道传输过程中会受到水声信道的相干多途影响以及海洋环境噪声的影响,因此,本实施例按照上述公式(1)对接收信号进行建模。对于水声信道,尤其是人类工业活动和船舶航运频繁,以及海洋生物密集的浅海水声信道,往往存在大量短时尖峰脉冲噪声,研究表明,它的概率密度曲线与alpha稳定分布更加近似,因此将噪声w(n)建模为alpha稳定分布噪声。s2c信号即sweepspreadcarrier信号。

此外,水声通信的环境噪声动态范围很大,尤其是脉冲噪声具有高幅值的特点。倘若直接把原始接收信号作为神经网络的输入,很可能由于数值范围差异过大导致梯度失衡和模型不收敛的问题。因此,需要对接收信号进行脉冲预处理。

作为一种可实施方式,脉冲预处理可以包括脉冲抑制和归一化,具体为:

s1011:按照公式(2)对接收信号y(n)中幅值大于门限τr的部分进行非线性抑制,得到输出信号y′(n):

具体地,可以按照公式(3)确定所述门限τr:

τr=(1+2τ0)τq,(3)

其中,τ0为常系数,例如,可以将τ0设置为1.5,τq为接收信号y(n)模值|y(n)|的第二个四分位点值。

s1012:经脉冲抑制后,还需要进一步对信号进行归一化,具体为:按照公式(4)对所述输出信号y′(n)进行归一化得到信号i(n):

s102:对信号i(n)进行维度预处理得到处理后的时域波形d(m),使得所述处理后的时域波形d(m)的维度与att-cnn模块的输入维度相匹配,所述att-cnn(attentionaidedcnn)模块指采用注意力机制的卷积神经网络,也称为注意力辅助卷积神经网络;

具体地,在计算复杂度允许的情况下,随着神经网络输入维度的增大,可同时用于支撑分类识别的信息越多,尤其是当接收信号为短突发信号时,易造成接收信号时长小于神经网络输入维度的情况,导致接收信号无法直接作为神经网络的输入,因此需要对信号i(n)进行维度预处理以匹配att-cnn模块的输入维度。

作为一种可实施方式,本实施例提出了一种短时数据复用的维度预处理方式,具体为:按照公式(5)将信号i(n)在时间维度上进行重复拼接,得到处理后的时域波形d(m):

其中,m=1,2,...,lc,mod表示取余运算。

s103:采用所述att-cnn模块对所述处理后的时域波形d(m)进行识别,输出第一预测概率向量pd,所述第一预测概率向量pd用于指示接收信号y(n)属于所述调制类型集合中各信号类型的概率值;

具体地,卷积神经网络的滤波器组具有权值共享和局部感受野的特性,相比全连接网络,卷积神经网络在减少参数量的同时,也获得了良好的局部特征提取能力。而调制信号可看作由一组独立的码元过采样得到,同一个码元的不同采样点之间具有一定的相关性,因此,为了能够更好学习到时域波形中的时域相关特性,本实施例采用注意力机制的卷积神经网络,也即att-cnn模块,进行特征特征提取和信号识别。

作为一种可实施方式,本实施例构建的att-cnn模块的结构为:包括5个级联的卷积块、与最后一级卷积块相连接的一维卷积层(图1中的1dconv)、与所述一维卷积层相连接的全连接层(图1中的fc(7))和所述全连接层相连接的softmax层;其中,所述卷积块用于对处理后的时域波形d(m)进行特征提取;所述一维卷积层用于对特征通道进行压缩。

具体地,在实际应用中,att-cnn模块的输入维度lc可设置为lc=8192。该att-cnn模块的识别过程如下:如图1所示,首先由5个卷积块(即convblock1、convblock2、convblock3、convblock4、convblock5)对时域波形进行特征提取,再由一个单滤波器(长度为1)的一维卷积层对特征通道进行压缩,最后与一个softmax函数激活的全连接层相连,输出接收信号被识别为7个类别的概率向量。

作为一种可实施方式,每个所述卷积块均包括:一维卷积层、bn层、se单元和leakyrelu函数;并且,除了最后一级的卷积块之外,在级联的前4个所述卷积块中还包括averagepool层;其中,采用所述一维卷积层对输入信号进行特征提取,采用所述bn(batchnormalization)层对提取的特征进行归一化,采用所述se(squeezeandexcitation)单元的注意力机制对各特征通道进行加权校准,采用leakyrelu函数对加权校准后的特征进行激活,采用所述averagepool层对激活后的特征进行下采样。

具体地,5个卷积块(即convblock1、convblock2、convblock3、convblock4、convblock5)中一维卷积层的滤波器的数量依次为16、32、64、128、256,每个卷积块中的一维卷积层的滤波器的长度lf均为31;所述averagepool层的步长为4,能够在减小网络计算复杂度的同时,使网络获得一定的平移不变性。

本步骤通过将se单元应用到一维信号时域波形的处理中来,可以提高网络对不同通道特征的灵敏度,进而提高网络的识别性能。为了体现每个卷积块中的se单元能够带来上述的良好网络性能,本实施例还给出以下推导过程,具体为:

为了简化se单元对该网络性能影响的分析,本推导过程考虑只有第一个convblock的情况,并忽略其中除convlayer和seunit之外的结构,同时假设两个一维卷积(conv1和conv2)的过程中时间维度大小没有发生变化,得到一个简单示例,如图2所示。

基于se单元的工作机制,从信号滤波的角度对该单元在信号特征提取过程中所发挥的作用进行推导。如图2所述,首先,采用包含c个滤波器的滤波器组对输入序列x∈rt×1进行卷积(biases=0),得到u∈rt×c可表示为公式(6):

公式(6)表明,第一个卷积层的多个滤波器通过卷积处理提取到一组不同通道的特征,为了增强网络对其中重要特征(informativefeatures)的敏感度,有必要利用提取到的全局信息(也称global信息)来自适应地对该特征组进行加权校准,这就是squeeze和excitation的工作。

由于conv1中每个通道的输出只是单个滤波器依次作用于t时段中每段局部时间lf上得到的结果,为了探究全时段的全局信息(contextual信息),通过全局平均池化(globalaveragepooling)对u中的每个通道进行squeeze,并得到一个通道级的聚集表示v∈rc

基于上述每个通道获得的聚集表示,继续对每个通道计算得到一个介于[0,1]之间的激励excitation值,也就是每个通道的权重λ,这是由两个全连接层来实现的。

λ=fex(v,w)=σ(w2δ(w1v))(8)

公式(8)中,σ表示sigmoid函数,δ表示relu函数,为两个全连接层的权重,分别用于降维和升维。实验中,在不同的seblock中通过调整维度变化ratior使中间层维度保持为8。采用学习到的通道激励值对每个通道加权后,得到结果:

此时,通过se这种自注意力机制,不同通道提取的特征将会依据其重要程度而分别得到增强和抑制。最后,再经过一个只包含单个滤波器的进行卷积处理,得到:

从式(10)可以看出,多个卷积层的作用可看作是由多个滤波器组进行组合得到更加复杂的滤波器,然后完成特征的提取,se单元可以为这些更加复杂的滤波器进行加权。同时,由于权值是网络根据输入自适应地学习得到的,所以,采用了se单元的网络能够依据不同输入自适应地为不同新滤波器分配不同权重,得到不同的影响函数。相反,不采用se单元得到的结果为:

可以看出,此时新构建的各滤波器对输出的重要性是相同的,同时网络对不同的输入的处理也是相同的。事实上,由于不同信号的频谱分布是不同的,而不同的滤波器由于具有不同的频响将提取到不同频率的特征,因此,采用se单元依据不同输入信号自适应地构造滤波器来完成特征的提取相比采用同一组滤波器处理不同输入具有明显的优势。

s104:根据所述第一输出预测概率向量pd进行再次判断,确定最终识别结果,具体为:

若所述第一预测概率向量pd中最大概率值对应2fsk、4fsk、8fsk、s2c或ofdm信号时,则将最大概率值对应的信号类型作为最终识别结果;

若所述第一预测概率向量pd中最大概率值对应bpsk或qpsk信号时,则继续采用sae(sparseauto-encoder,稀疏自动编码)网络对信号i(n)的平方谱c(k)进行特征提取,并输出第二预测概率向量pc,然后根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果。

具体地,由于时域波形中表征psk信号的相位信息在多径信道和复杂噪声条件下往往不够稳健,因此,若所述第一预测概率向量pd中最大概率值对应bpsk或qpsk信号时,则需要继续采用sae网络对信号i(n)的平方谱c(k)进行特征提取以对其进行辅助识别。

bpsk信号的平方谱在其二倍载频处具有明显的冲激,而qpsk信号则不具备这一特征,图3中给出了一个bpsk和qpsk样本的平方谱示例(信号载频为12.5khz)。因此,本实施例考虑将平方谱序列作为区分bpsk和qpsk的依据。

作为一种可实施方式,本实施例选取welch方法,窗长设为2048,计算得到i(n)的平方谱估计c(k),k=1,2,...,2048,并输入sae网络中。如图1所示,该sae网络输入节点数为2048,两个中间隐层的节点数分别为300和80,最后添加一个softmax激活的全连接层(fc)输出二分类判决概率pc,激活函数采用relu函数。

所述根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果,具体为:

首先,按照公式(12)进行加权融合,输出融合预测概率向量pv:

pv=λdpd-psk+(1-λd)pc-psk,λd∈[0,1](12)

其中,pd-psk为att-cnn模块输出的第一预测概率向量pd中psk预测概率向量,pc-psk为sae网络输出的第二预测概率向量pc中psk预测概率向量,λd为权重;

具体地,通过研究发现,当λd过小或过大时分别会导致低信噪比和高信噪比下性能的下降,而当λd为0.5时,性能相对最好。

然后,将所述融合预测概率向量pv中较大概率值对应的psk信号作为最终识别结果。

本发明实施例提供的基于深度学习的短突发水声通信信号调制识别方法,采用深层神经网络自动提取特征和分类,对信道更加稳健;通过在模型中引入注意力机制,能够更有效提取信号特征,对微弱信号识别性能更好;通过基于数据复用的维度预处理,可以处理任意长度的接收信号,对突发信号的识别性能更好;能够有效识别2fsk、4fsk、8fsk、bpsk、qpsk、ofdm、s2c等7类常用水声通信信号。

实施例2

平方谱表征的是信号相位统计特性,相比之下,att-cnn模块输入的时域波形呈现的是每个时刻的信息,受信道影响更大。因此,通常期望att-cnn网络的训练集与测试集具有相同的数据分布,但是在实际的调制识别应用中,很难获取足够的与目标测试信道具有相同分布的数据来训练一个可靠的模型。

因此,在上述实施例的基础上,本发明实施例还提供了一种迁移学习策略,用于完成对att-cnn模块的预训练。该迁移学习策略包括以下步骤:

首先,构建公式(13)所示的迁移数据模型:

其中,表示接收信号,s(n)为发送信号,调制类型与式(1)相同,为alpha稳定分布噪声,特征指数为为与信道冲激响应h(n)近似的信道冲激响应。

具体地,同一片海域不同收发深度或距离下获取的信道,当近似信道不可得时,一般取记为h0信道。

与式(1)相比,式(13)对信道进行了简化或微调,虽然两个模型产生的数据分布发生了变化,但具有相同的发送信号集合,即y(n)与的波形中包含相同的成分,因此,具备可迁移性。

然后,如图4所示,该迁移策略采用基于模型迁移的两步训练方法,包括:

(1)采用所述迁移数据模型产生迁移数据训练集,利用所述迁移数据训练集完成att-cnn模块和sae网络的预训练;

(2)结合少量目标信道下的数据对预训练后的att-cnn模块进行微调,提高网络在目标信道下的识别性能;其中,在所述微调的过程中将att-cnn模块中除最后3层之外的所有参数冻结,而只对最后3层的参数进行微调。

具体地,在利用少量数据微调预训练网络参数时,很容易由于数据量的不足而造成过拟合现象,因此,本实施例在微调的过程中,冻结网络大部分较浅层的权重,而只对最后几层参数进行更新。

为了验证本发明提供的基于深度学习的短突发水声通信信号调制识别方法的有效性,本发明还提供以下实验数据。

(一)信号参数和数据集

表1信号参数

实验中,调制信号的采样频率设定为48khz,除s2c信号的载波频率在[8k,12k]hz范围内随机选择外,其余信号的载波频率范围为[15k,16k]hz,mpsk信号的调制阶数取2或4,采用根升余弦脉冲成型,ofdm信号子载波随机采用bpsk或qpsk调制,其余调制参数如表1所示。表1中,“/”表示不涉及该参数,“[]”表示数据在该闭集范围内随机选择,“{}”表示在所列项中随机选择。

为了模拟实际的水声信道环境,采用bellhop射线模型并基于argo海洋数据库,选择坐标(165.5°e,45.5°n)处海域的水文环境,仿真产生了不同传输条件下的6条水声信道,具体的信道参数如表2所示:

表2信道参数

各信道的传递函数可表示如下:

ha(z)=0.04+z-353+0.508z-570+0.283z-644

hb(z)=0.32+0.45z-48+z-61+0.9318z-267

hc(z)=0.68+z-184+0.882z-403

hd(z)=0.177+0.265z-534+z-689+0.369z-800

he(z)=0.606+0.49z-741+0.878z-2613+z-3535

hf(z)=0.5577+0.4213z-922+z-4621+0.8755z-5739

由于采样率设置为48k,因此该6条信道的最大传播延时分别达到13.4ms,5ms,8ms,16.7ms,73.6ms和119.6ms。它们的幅频响应曲线如图5所示。

由图5可以看出,上述在同一水域不同通信条件下获取的信道具有不同的频率衰落特性,其中,he和hf信道的衰落相对更深。在后续不同实验中,将采用不同的信道用于产生训练和测试数据集。训练集中,每种信号产生6000个样本,alpha稳定分布噪声的在[1.5,2]范围内随机选择,混合信噪比范围为[-10,20]db。

训练和测试过程在深度学习pytorch库下完成,采用单块nvidiatitanrtxgpu。模型采用adamoptimizer进行优化,batch-size设定为128,所有数据迭代至损失函数收敛后停止训练。

(二)仿真实验和结果

(1)不同方法性能对比

为了证明本发明方法的先进性,在ha信道和α=1.5的噪声条件下,将其与文献2中的sae网络(sae-2048方法)和文献1中的cnn网络(cnn-1024方法)性能进行对比。在与sae-2048方法对比时,考虑了式(1)中的7种调制类型,每个测试样本包含64个码元信息。在与cnn-1024方法对比时,考虑到4fsk、8fsk、ofdm的过采样倍数太大而该cnn的输入仅为1024个采样点的波形,对应的码元个数太少,故在与其对比时排除了这几类信号,每个测试样本为1024个采样点。图6展示了本发明方法与两种对比方法在ha信道下的性能差异,可以看出本发明方法具有明显优势,而sae-2048方法和cnn-1024方法在高信噪比下都存在性能瓶颈,本发明方法在10db下相比两种方法识别率分别提升了23%和17%,证明了本发明方法的良好性能。

(2)迁移学习性能

接下来,对本发明所提出迁移学习策略的有效性进行评估,为了验证当目标信道数据量有限时,对网络模型进行预训练的必要性,以及采用相似信道条件下数据对网络进行预训练的可行性,分别在h0以及ha、hb、hc三条信道下分别构建了两个不同的预训练网络,并分采用he和hf信道下每种信号50个标签样本对该两个网络最后3层进行微调,将微调后的网络识别性能与采用该少量标签样本直接训练得到的网络识别性能对比如图7。

如图7所示,he和hf信道条件下的识别性能对比结果都表明,当目标信道数据量有限时,不采用预训练策略而直接训练时网络识别性能最差,采用h0信道下数据进行预训练的性能居中,而采用近似的ha、hb、hc三条信道下数据进行预训练结果最好,该结果证明了本发明迁移学习策略的有效性。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。


技术特征:

1.一种基于深度学习的短突发水声通信信号调制识别方法,其特征在于,包括:

步骤1:对接收信号y(n)进行脉冲预处理得到信号i(n),所述接收信号y(n)的信号模型为:

y(n)=s(n)*h(n)+w(n)(1)

其中,n表示采样时刻,s(n)为发送的载波调制信号,所述载波调制信号的类型集合为{2fsk,4fsk,8fsk,bpsk,qpsk,ofdm,s2c},h(n)表示水声多径信道冲激响应,w(n)为alpha稳定分布噪声,*表示卷积运算;

步骤2:对信号i(n)进行维度预处理得到处理后的时域波形d(m),使得所述处理后的时域波形d(m)的维度与att-cnn模块的输入维度相匹配,所述att-cnn模块指采用注意力机制的卷积神经网络;

步骤3:采用所述att-cnn模块对所述处理后的时域波形d(m)进行识别,输出第一预测概率向量pd,所述第一预测概率向量pd用于指示接收信号y(n)属于所述调制类型集合中各信号类型的概率值;

步骤4:根据所述第一输出预测概率向量pd进行再次判断,确定最终识别结果,具体为:

若所述第一预测概率向量pd中最大概率值对应2fsk、4fsk、8fsk、s2c或ofdm信号时,则将最大概率值对应的信号类型作为最终识别结果;

若所述第一预测概率向量pd中最大概率值对应bpsk或qpsk信号时,则继续采用sae网络对信号i(n)的平方谱c(k)进行特征提取,并输出第二预测概率向量pc,然后根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果。

2.根据权利要求1所述的方法,其特征在于,所述步骤1具体包括:

步骤1.1:按照公式(2)对接收信号y(n)中幅值大于门限τr的部分进行非线性抑制,得到输出信号y′(n):

步骤1.2:按照公式(4)对所述输出信号y′(n)进行归一化得到信号i(n):

3.根据权利要求1所述的方法,其特征在于,按照公式(3)确定所述门限τr:

τr=(1+2τ0)τq,(3)

其中,τ0为常系数,τq为接收信号y(n)模值|y(n)|的第二个四分位点值。

4.根据权利要求1所述的方法,其特征在于,所述步骤2具体包括:

按照公式(5)将信号i(n)在时间维度上进行重复拼接,得到处理后的时域波形d(m):

其中,m=1,2,...,lc,mod表示取余运算。

5.根据权利要求1所述的方法,其特征在于,所述att-cnn模块的结构为:包括5个级联的卷积块、与最后一级卷积块相连接的一维卷积层、与所述一维卷积层相连接的全连接层和所述全连接层相连接的softmax层;

其中,所述卷积块用于对处理后的时域波形d(m)进行特征提取;所述一维卷积层用于对特征通道进行压缩。

6.根据权利要求5所述的方法,其特征在于,每个所述卷积块均包括:一维卷积层、bn层、se单元和leakyrelu函数;并且,在级联的前4个所述卷积块中还包括averagepool层;

其中,采用所述一维卷积层对输入信号进行特征提取,采用所述bn层对提取的特征进行归一化,采用所述se单元的注意力机制对各特征通道进行加权校准,采用leakyrelu函数对加权校准后的特征进行激活,采用所述averagepool层对激活后的特征进行下采样。

7.根据权利要求1所述的方法,其特征在于,步骤4中,所述根据所述第一预测概率向量pd和所述第二预测概率向量pc进行融合判决,将融合判决的结果作为最终识别结果,具体为:

按照公式(12)进行加权融合,输出融合预测概率向量pv:

pv=λdpd-psk+(1-λd)pc-psk,λd∈[0,1](12)

其中,pd-psk为att-cnn模块输出的第一预测概率向量pd中psk预测概率向量,pc-psk为sae网络输出的第二预测概率向量pc中psk预测概率向量,λd为权重;

将所述融合预测概率向量pv中较大概率值对应的psk信号作为最终识别结果。

8.根据权利要求1所述的方法,其特征在于,还包括:

构建公式(13)所示的迁移数据模型:

其中,表示接收信号,为alpha稳定分布噪声,特征指数为为与信道冲激响应h(n)近似的信道冲激响应;

采用所述迁移数据模型产生迁移数据训练集,利用所述迁移数据训练集完成att-cnn模块的预训练;

结合目标信道下的数据对预训练后的att-cnn模块和sae网络进行微调;其中,在所述微调的过程中将att-cnn模块中除最后3层之外的所有参数冻结,而只对最后3层的参数进行微调。

技术总结
本发明提供一种基于深度学习的短突发水声通信信号调制识别方法。该方法包括:对接收信号y(n)进行脉冲预处理得到信号I(n);对信号I(n)进行维度预处理得到处理后的时域波形d(m),使得所述处理后的时域波形d(m)的维度与Att‑CNN模块的输入维度相匹配,所述Att‑CNN模块指采用注意力机制的卷积神经网络;采用所述Att‑CNN模块对所述处理后的时域波形d(m)进行识别,输出第一预测概率向量Pd,所述第一预测概率向量Pd用于指示接收信号y(n)属于所述调制类型集合中各信号类型的概率值;根据所述第一输出预测概率向量Pd进行再次判断,确定最终识别结果。本发明能够有效识别2FSK、4FSK、8FSK、BPSK、QPSK、OFDM、S2C等7类常用水声通信信号。

技术研发人员:李勇斌;邵高平
受保护的技术使用者:中国人民解放军战略支援部队信息工程大学
技术研发日:2020.12.12
技术公布日:2021.04.06

转载请注明原文地址:https://xbbs.6miu.com/read-21821.html