好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于数据挖掘的装备质量信息分析处理技术研究综述.docx

10页
  • 卖家[上传人]:夏**
  • 文档编号:418215825
  • 上传时间:2023-12-03
  • 文档格式:DOCX
  • 文档大小:20.74KB
  • / 10 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 基于数据挖掘的装备质量信息分析处理技术研究综述   摘 要:对装备质量信息进行分析和处理是准确掌握装备性能状态,提高装备保障水平的关键随着计算机技术与信息技术的不断开展和大数据的运用,部队亟需装备质量信息分析处理技术以充分利用装备质量数据资源,基于数据挖掘的装备质量信息分析处理技术正逐渐成为装备保障领域的重要研究方向从因果分析、关联分析和数据处理几个方面论述了装备质量信息分析处理的研究内容,梳理了数据挖掘的方法,并阐述了国内外研究现状简要分析了各类数据挖掘技术面向装备质量信息分析处理不同研究点时的适用性探讨了基于数据挖掘的装备质量信息分析处理面临的主要问题及其未来开展方向  关键词:数据挖掘;装备质量信息分析处理;因果分析;关联分析;数据处理  装备质量信息是装备在设计、生产制造、使用、维护等各阶段与质量相关的信息,贯穿于装备的整个生命周期,反映装备质量要求、状态、变化和相关要素及其相互关系装备在全寿命周期内,质量特性会伴随使用过程呈现逐渐退化的趋势,局部装备那么会出现显性故障由于装备全寿命周期内的质量影响因素复杂多变,造成其质量退化特性和故障规律难以把握。

        事实上,全寿命周期内除了研制阶段,在使用阶段还会积累大量使用过程中产生的质量相关信息,例如:装备贮存、勤务、使用、维修等方面的信息,在这些大量的装备质量相关信息中蕴含着装备质量退化特性、故障规律等关联信息,如果加以充分利用,将对装备质量管理提供有力支持传统的数据分析方法可大致分为基于时间维度的分析方法、基于概率统计的分析方法和基于失效物理的分析方法  数据挖掘评职知识:数据挖掘工程师发表论文期刊推荐  此类方法的共同点是需要对原始数据进行抽样,得到数据样本,从有限的样本空间中寻找出特征和规律,追求算法的复杂性和准确性大数据分析方法直接对全体数据进行分析而不需要数据样本,所面对的数据量大大增加,更追求算法的高效性,应降低算法复杂度,提高运行速度,尽可能采用精简高效的模式对数据集进行分析大数据分析方法和传统数据分析方法的区别主要表达在分析对象和算法的要求上,而且传统数据分析方法还存在数据样本规模涵盖不全面影响分析结果的问题大数据运用是继云计算和物联网之后信息技术领域又一次重大科技变革  但是面对数据的巨量增加、数据种类繁多和数据格式迥异,如何从海量数据中获取有价值的信息,成为了大数据运用的核心问题。

      作为一种对数据高效处理和全面利用的技术,数据挖掘技术是应对上述挑战的有效手段之一应用数据挖掘技术进行装备质量信息分析处理,能够从大量数据集中开掘出有价值的知识、规那么或高层次的信息,将为装备质量信息资源利用奠定根底,为破解装备保障相关问题与提升装备管理保障科学化水平发挥重要作用  1 装备质量信息分析  处理研究内容装备质量信息是组织实施装备质量管理的根底,也是进行装备使用、维修、保障以及改良装备设计的重要依据美军从上世纪 50 年代起就已经认识到装备质量信息管理的重要性,由国防部依托综合数据交换网进行全国性的装备质量信息管理,各军种和军事基地建立信息系统,提供装备全寿命周期各阶段的相关数据  国内相关研究工作也取得了许多成果,余磊运用本体技术实现了装备 PHM信息的标准化描述,解决了信息异构问题,研究了装备 PHM 领域本体语义推理和本体检索技术,在此根底上设计并建立了信息共享系统,实现了装备PHM 信息共享[1]准确掌握装备的性能质量状况是完成作战任务的重要前提  由于传统装备性能质量评估方法存在效率较低、主观因素影响大等问题,黄睿等提出运用系统工程理论及分析方法设计某型导弹性能质量评估系统,结合导弹质量信息,实现了性能质量的评估与预测[2]。

      装备质量信息分析处理的研究内容可分为因果分析、关联分析、数据处理几个方面因果分析是纵向的,能够从结果中探寻原因或者由原因预测结果;关联分析是横向的,得到的是事物之间的相互作用和相互影响,从不同的维度分析装备质量数据可以更准确清晰地开掘其背后隐藏的知识,必要的数据处理能够提高数据质量,保证开掘过程的顺利实施  1.1 质量信息因果分析  装备质量信息因果分析主要包括故障诊断、故障预测和剩余使用寿命预测等内容故障诊断的实质是故障检测和故障隔离的过程,目的是对装备发生故障的类型、部位和原因进行诊断基于模型的故障诊断方法需要依据先验知识分析装备部组件以及分系统之间的联系,为其建立相对准确的数学物理模型,从而实现对整个系统的状态监测和故障诊断[3]  数据驱动的故障诊断技术运用多种不同的数据挖掘方法从海量的运行数据中提取和分类故障特征,不依赖系统的先验知识和准确的数学物理模型,能更好地适应新一代武器系统开展需要,因此近年来这方面的研究取得了许多成果数据驱动的故障诊断方法包括基于多元统计的方法、基于深度学习的方法、基于信号处理的方法以及基于定量 AI 模型的方法故障预测是为了预测装备的运行趋势,为维修策略的制定提供支持。

        目前常用的故障预测方法可分为定性预测和定量预测,其中定量预测包括基于数据的预测和基于模型的预测基于模型的方法需要建立较为准确的数学模型,不适用于复杂装备基于知识的方法中最具代表性的是专家系统,由于知识难以自动获取且开发周期较长,其应用范围受到限制[4]基于数据的方法旨在利用装备运行过程中产生的大量数据提取信息,不需要确定的数学模型,适用性较强,而且能用于弥补专家系统存在的缺陷[5],此类方法包括深度学习、灰色模型、极限学习机、随机森林等  剩余使用寿命是系统或部件可继续正常使用的时间长度,剩余使用寿命预测技术是装备 PHM的关键技术剩余使用寿命预测方法分为基于模型的预测方法和基于数据驱动的预测方法这两类基于模型的方法难以建立复杂装备的退化模型,不适用于描述其退化过程,此类方法主要有粒子滤波、卡尔曼滤波等[6]基于数据驱动的方法不需要对象的先验知识,以装备各个阶段的测试数据、传感器历史数据为根底,经过分析得到数据和剩余使用寿命之间的映射关系,此类方法包括卷积神经网络、循环神经网络、深度置信网络和自编码器等[7 8]  1.2 质量信息关联分析  装备质量信息关联分析主要包括参数关联分析、装备性能退化因素分析和装备故障关联分析等内容。

      参数关联分析的目的是找出装备之间或者质量参数与性能指标之间的联系,例如,导弹装备的“存储温度〞和“存储时间长度〞可能会共同对“陀螺转速〞产生影响,这种关系是很难从质量数据中直接判断的,如何发现这些关联关系需要深入研究帅勇等人利用 FP Growth 算法构建了文本数据的FP Tree,推理出了某型装甲装备动力系统关键参数之间的关联关系,提出了基于综合模型的可靠性参数选择算法[9]王魁提出的测试参数体系分析技术,梳理了导弹装备各级组成间测试参数的关联,优化了测试方案,提高了测试覆盖程度[10]装备性能退化是武器装备在使用过程中,局部性能指标随着时间的推移而逐渐下降的过程性能退化因素分析的目的是探寻装备性能退化的影响因素,如外部环境变化、内在特性变化等  装备性能退化分析的方法可分为失效物理建模方法和数据驱动建模方法两类失效物理建模方法需要分析失效机理,根据物理或化学反响规律建立基于失效物理的退化模型,应用较为广泛的模型有反响论模型[11]和累积损伤模型[12]数据驱动建模方法直接从装备性能测试数据和状态监测数据中挖掘出隐含的性能演变规律,而不用考虑装备内部的退化失效机制,此类方法包括退化轨迹方法[13]、随机过程方法[14]等。

      故障关联分析能够寻找装备故障之间的关联关系,发现关键部位之间的故障伴生规律  国内外专家学者在这方面开展了相关研究,如基于 N 1 校验的故障相关性网络、基于事故链信息的故障关联矩阵、电机故障关联分析等[15]对于复杂装备,常用的故障检测方法往往只能得到相对独立的故障信息,无法得悉其中隐含的关联关系,运用数据挖掘技术对大量故障数据开展相关性分析是解决这一问题的有效途径文献[16]提出了一种航空设备故障关联分析方法,将 Apriori 算法用于挖掘航空设备故障关联关系并进行了验证  1.3 装备质量数据处理  装备质量数据处理主要包括数据清洗、数据增强、数据离散化等内容数据清洗起初是为了解决美国社会保险号码的纠错问题,现如今已经在许多领域得到了应用随着军队信息化建设的不断推进,人们能够在装备全寿命周期内获取越来越多的质量相关信息在获得这些数据之后,通过数据挖掘技术希望能从中抽取出有价值的知识为了得到满足装备管理需求的有价值的信息,就要求所获得的数据具有可靠性,同时能够准确反映装备实际情况  但事实上,人们获得的第一手数据往往含有噪声,如果不预先进行清洗处理,其中不准确数据、异常数据以及人为造成的错误数据等可能影响数据挖掘效果甚至最终结论的准确性。

      沈小军等提出的风电机组运行数据清洗方法根据拉依达准那么,将服从正态分布的数据中超过3倍标准差的数据值视为异常值进行消除[17]  文献[18]提出运用决策树分类模型来实现数据清洗,相对于传统的数据清洗算法在性能上得到了提高四分位法根据实测数据进行离群值分析处理,实现异常数据清洗,但此方法在异常数据比重较大时识别效果不佳[19]处理大量异常数据时可采用支持向量回归算法,其核心是用函数拟合数据[20]K means算法能够实现异常数据的快速识别,且具有较好的准确性[21]  K 最近邻算法及其改良方法对于数据缺失值的处理具有较好的效果[22]实际采样收集到的装备运行状态数据中,正常数据样本量大,而故障数据样本量小且对应的各种故障类型样本分布不均衡样本数据的不平衡特性将严重影响基于数据驱动方法的有效性  为实现数据驱动的武器系统电子元部件级故障诊断技术的工程应用,解决数据质量问题,杨华晖研究了电子元部件故障小样本数据的增强方法,建立了基于生成式对抗网络的故障小样本数据增强模型,提出了基于多标签一维 AC GAN 的数据增强方法,并以电压整流器晶体管故障为例进行了验证[23]装备质量相关数据中包括局部连续量,故数据离散化也是必不可少的数据准备环节之一。

      离散化是将连续的值域划分为假设干个区间,每个区间对应一个值,最后将连续数据转化为离散量  离散化数据对存储空间的需求较小,形式更简洁,能够保证一些数据挖掘方法的顺利运行,提高数据挖掘的效率离散化算法主要有:PKID 算法,近似等频离散化算法,基于聚类的离散化算法,ChiMerge 算法,基于粗糙集的离散化算法,CAIM 算法[24 25]一些专家学者在开展自身科研工作的同时,对所涉及的数据处理方法也进行了研究改良袁浩恒提出了一种并行比拟并获得最优离散化的数据准备算法,针对不同数据集,先进行特性检测以获得其分布特性,按照分布特性进行数据集的异常值检测和剔除,并行完成与分布特性适配的离散化方法处理[26]  白堂博等人在文献[27]中指出了传统的均匀区段划分法、加权划分法和模糊指数法等离散化方法存在的问题,提出了基于符号聚合近似的关联规那么挖掘方法,对振动信号进行特征提取之后利用符号聚合近似方法进行数据离散化从装备质量信息分析处理的研究现状来看,装备质量信息因果分析与关联分析所采用的方法可大致分为基于模型的方法和基于数据的方法这两类基于模型的方法针对特定型号的装备时分析结果较为精确,但其对系统先验知识要求较高,难以满足复杂装备的需求。

        基于数据的方法不依赖装备先验知识,方法适用性较强,不局限于特定对象,能更好适应新型装备结构复杂、系统内部关联。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.