您所在位置：网站首页 > 办公文档 > 总结/报告 > 试析在水声目标识别中深度学习的运用

试析在水声目标识别中深度学习的运用.docx

9页

卖家[上传人]：h****0

文档编号：261818961

上传时间：2022-03-04

文档格式：DOCX

文档大小：45.02KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

11金贝

下载

/ 9 举报版权申诉马上下载

文本预览

下载提示

常见问题

试析在水声目标识别中深度学习的运用水声目标识别技术在反潜、鱼雷防御、海底地形勘探等领域应用广泛但随着潜艇降噪技术的进步、水下无人航行器的迅速发展、鱼雷等水下武器的多样化以及不断恶劣的水下复杂环境都使人们对目标识别精度有了更高的要求，所以研究更加自主、智能、高效的水声目标识别技术刻不容缓深度学习是由Hinton等人[1]于2006年提出来的具有多层结构的深度神经网络算法，因采用多个隐藏层相互叠加的结构特点，使其具有强大的数据特征自学能力，并可以从数据中挖出其内在的变化规律[2]本文就近年来深度学习在水声目标识别中的应用进行了较为系统的研究，总结了深度学习在处理水声声信号和图像信号应用中的优越性相比于传统的识别算法，其更能提高目标识别的效率同时，也指出了深度学习在水声目标识别应用中的不足之处，为后续改进提供参考1、水声目标识别技术的研究现状及面临的挑战1.1水声目标识别技术研究现状水声目标识别主要依据目标的特征信息目标特征信息是目标原始数据中包含或者可提取的一种能精确和简化表明目标状态和身份的信息[3]水声目标主要包括噪声、运动、尾流、几何结构等特征信息[4]随着水声目标识别越来越受到人们的重视，国内外众多学者也开展了很多的研究工作。

例如Rajgopal等[5]在研制的水声目标识别专家系统中所使用的特征包括：螺旋桨桨叶数、螺旋桨转速、推进器类型、目标壳体辐射低频噪声、活塞松动产生的谐音基频喷嘴噪声、注水器噪声、最大速度、槽极噪声、传动装置类型等Lourens[6]在识别特征分析中重点强调了螺旋桨转速、主机类型、齿轮噪声线谱等特征Arnab等[7]在分类识别特征分析中归纳了谱中心、谱形、谱起伏、窄带与宽带谱特征、倒谱特征、MeI倒谱参数、音调频率参数等统计时频域特征AR模型系数、非线性融合特征等也常被作为水声目标辐射噪声识别的特征量[8,9,10,11,12]国内学者对船舶辐射噪声的调制谱、功率谱、低频线谱以及高阶谱、小波变换、混沌分形、听觉感知等特征和特性的分析也开展了很多研究工作[13,14,15,16,17,18,19,20]，例如励荣峰等人研究了各类水声目标的功率谱分析，提取了目标的视频特征，并通过实际数据分析进行了可分性验证彭圆等人研究了基于双谱的方法对水中目标辐射噪声进行特征提取与分类，同样也取得了很好的效果1.2新技术为水声目标识别技术带来的挑战随着水声探测技术的发展和降噪水平的提高，传统识别技术的性能正在逐渐下降，这为水声目标识别技术带来了新的挑战[21]。

1.2.1声呐信号带宽对识别能力的影响目标特征量的提取都是基于一定带宽的声呐传感器得到的根据香农公式，对于1个带宽为BHz的信道，信道的最大信息传送速率为式中：S为信号功率，W;N为噪声功率，W也就是说，等功率强度的信号带宽和信道的信息容量成正比，宽带信号可以比窄带信号携带更多的信息1.2.2低频探测对线谱识别性能的影响为了达到提高探测距离的目标，低频探测成为当下主流的趋势，带来的问题是波束宽度的增加对于作用距离为100km的声呐来说，波束宽度内目标很可能不是单个目标因此，对于利用低频探测来进行线谱识别，检测到的低频线谱是否就是关注的水声目标的低频线谱特征有着很大的不确定性1.2.3减震降噪对识别性能的影响对于水中目标来说，减震降噪是永恒不变的主题和最终的目标减震降噪使得低频线谱特征显著降低，而线谱特征都可以通过结构设计、工艺设计、使用减震装置等不断降低最终这些线谱特征都有可能被消除或者减得很弱，那么基于线谱探测的识别技术将失去意义2、水声目标识别中深度学习的研究及应用2.1深度学习常用的开发工具深度学习常用的开发工具主要有TensorFlow、Torch、Caffe、Theano，以下详细探讨这4种。

除此之外，Deeplearing4j、MXNet等开发工具也都有着广泛的应用1)TensorFlow开发工具优势：(1)机动性：并不是一个规则的neuralnetwork，定义新的操作只需要写1个Python函数；(2)可使用性强：可以应用在不同的设备上，如cpus、gpu移动设备、平台等；(3)自动差分：TensorFlow的自动差分能力对很多基于Graph的机器学习算法有益；(4)多种编程语言可选：有Python接口和C++接口，其他语言可以使用SWIG工具使用接口；(5)最优化表现：充分利用硬件资源，TensorFlow可以将Graph的不同计算单元分配到不同的设备执行特点：TensorFlow灵活的架构可以部署在1个或者多个CPU、GPU的台式以及服务器中，或者使用单一的API应用在移动设备中，开源之后几乎可以适用各个领域2)Torch开发工具优势：构建模型简单，高度模块化，GPU快速高效具有丰富的索引、切片和transposing的例程，支持LuaJIT接入C数值优化程序等，可移植嵌入到iOS、Android和FPGA后端的接口特点：Torch拥有Facebook为其开源的大量深度学习模块和扩展，并采用了编程语言Lua。

3)Caffe开发工具优势：(1)上手快：模型与相应优化都是以文本形式而非代码形式给出；(2)速度快：能够运行最好的模型与海量的数据；(3)模块化：方便扩展到新的任务和设置上；(4)开放性：公开的代码和参考模型用于再现；(5)社区好：可以通过BSD-2参与开发与讨论特点：Caffe是开源的，核心语言是C++，支持命令行、Python、MATLAB，既可以在CPU上运行也可以在GPU上运行4)Theano开发工具优势：(1)集成NumPy的基于Python实现的科学计算包，可以与稀疏矩阵运算包SeiPy配合使用，全面兼容NumPy库函数；(2)易于使用GPU进行加速，具有比CPU实现相对较大的加速比；(3)具有优异的可靠性和速度优势；(4)可支持动态C程序生成；(5)拥有测试和自检单元，可方便检测和诊断多类型错误特点：Theano派生出大量的深度学习Python软件包，最著名的有Blocks和Keras，其核心是1个数学表达式的编译器2.2深度学习几种典型的网络结构原理及改进2.2.1深度置信网络DBN原理及改进DBN[22](DeepBeliefNetwork）由多个受限玻尔兹曼机RBM和1层反向传播网络BP堆叠而成。

其网络结构如图1所示，图1中：h为隐藏层数；v为可视层数；W为连接权值矩阵图1深度置信网络结构图DBN的训练过程为2部分：预训练和微调整训练预训练就是对每层的每个RBM进行训练，而在微调整阶段则采用反向传播算法将训练误差逐层向后传播其改进型网络有CRBM-DBN[23]，即首先使用有高斯分布的连续受限玻尔兹曼机（CRBM）的DBN模型对数据的输入量进行特征学习，然后利用对比散度算法进行抽样以获取高层次的特征此外还有稀疏受限玻尔兹曼机（SRBM)[24]、稀疏组受限玻尔兹曼机（SGRBM)[25]等改进型深度置信网络2.2.2卷积神经网络CNN原理及改进CNN[26](ConvolutionalNeuralNetwork）通过结合局部感知区域、共享权重、空间或时间上的池化降采样3大特点来充分利用数据本身包含的局部性等特征，优化网络结构，并且保证一定程度上的位移不变性[27]其网络结构如图2所示图2卷积神经网络结构图随着CNN网络的不断发展，也出现了一些新的深层卷积网络其改进的过程实质就是用深度学习模型来替代浅层机器学习模型的过程，实现端到端的训练，速度也越来越快例如R-CNN[28]：物体检测目标是将图片中所有物体用方框框出来。

首先是生成方框将物体框出来，然后对框出来的物体进行分类判断FastR-CNN[29]将R-CNN中CNN提取特征、SVM分类、回归这3个过程放在一起，形成端到端整体的模型，速度和准确率都得到提升再如FasterR-CNN[30]:FasterR-CNN首先用卷积层、池化层处理整张图片得到特征图，在此特征图上用RNN来生成方框，其余的操作跟FastR-CNN如出一辙即FasterR-CNN将生成方框的方法也换成了深度学习模型，并由原来在整张图上生成改成在更小的特征图上生成，使得模型训练速度进一步加快此外比较常用的还有MaskR-CNN[31]等改进型卷积神经网络2.2.3循环神经网络RNN原理及改进RNN亦称递归神经网络，其最大特点在于神经网络各隐层之间的节点是具有连接的其网络结构如图3所示，图中：X为输入层；H为隐藏层；O为输出层；Y为神经网络的主体结构图3循环神经网络结构图RNN的优点是可以处理序列数据，缺点则是容易随迭代的进行，历史输入对隐含层作用会逐渐减小乃至消失，即出现梯度消失问题针对这个问题，研究者相继提出了一些RNN的变种，其中最著名的包括Hochreiter等人[32]提出的长短时记忆网络和Cho等人[33]提出的门限循环单元。

长短时记忆网络用LSTM单元替代RNN中的神经元，在输入、输出、忘记过去信息上分别加了输入门、输出门、遗忘门来控制允许多少信息过LSTM有单元状态（cellstate）和隐藏状态（hiddenstate)2个传输状态GRU是LSTM的轻量级变体，只有2个门——更新门和重置门更新门决定保留过去多少信息，以及从输入层输入多少信息；重置门与LSTM里的遗忘门类似GRU没有输出门，所以总是输出完整状态除此之外，还有分层RNN、双向RNN、多维RNN、神经图灵机等改进型循环神经网络，在处理实际任务时都表现出了很好的效果实际的使用中，常采用多个模型相结合的方式，用于规避各模型缺点，充分发挥模型优势，以达到目标识别、现象预测等研究目的2.3深度学习在水声目标识别中的应用2.3.1深度学习在水声图像识别中的应用传统的水声图像目标识别方法大多数是基于局部特征的识别但是，这种特征匹配在局部特征匹配中仅作为低级表示，对复杂背景进行特征提取时鲁棒性不足，没有足够的特征来防止假匹配，使得图像识别率也较低这主要是由于传统目标识别算法语义分割鲁棒性较差卷积神经网络是深度学习在处理图像时的主要工具，可以帮助提取图像的特征。

主要方式是通过使用若干个卷积核对图形进行滤波，得到原图像的多幅特征图，从各个角度提取图像的特征利用权值共享使得只需要训练较少的卷积参数，就可以提取图像的多个特征例如：Perez等人[34]提出了一种基于深度学习的水声图像增强方法，其基本原理就是利用卷积神经网络对采集到的水声图像进行处理Kim等人[35]提出以水声声视觉图像中的阴影作为识别特征，基于卷积神经网络的方法对水声声视觉图像进行目标识别与分类该方法成功地对4类水声目标的声视觉图像进行了准确分类2015年，Orenstein等人[36]采用卷积神经网络对340万个浮游生物图像进行了训练和分类，结果表明：该方法在时间和精度方面都优于传统人工分类筛选方法，对大量浮游生物图像的分类效果较好胡炎等[37]在FasterR-CNN框架下构建了1个仅3层的卷积神经网络，并对4种不同海洋杂波环境的宽幅SAR图像进行测试，取得了较好的检测结果林明旺[38]设计了一种基于卷积神经网络的鱼类图像分类系统，对鱼类图像的识别准确率达到96%，实现了预期效果赵亮等[39]结合CNN提取的特征、HOG算法提取的边缘特征和HSV算法得到的颜色特征，较好地实现了船舶目标识别。

张清博等人[40]提出利用基于卷积神经网络的深度学习方法对水下光电图像进行优化图像质量的研究王博[41]通过选通式水下激光成像系统在不同的光照、水质、距离、成像参数条件下采集水下目标的光学图像，分别用Adaboost方法、BFSPM方法、DCNN方法对样本图像进行水下目标识别性能的比较和分析王念滨等人。

点击阅读更多内容