
基于TSVM的矿用钻机变速箱故障智能 诊断.doc
7页基于TSVM的矿用钻机变速箱故障智能 诊断申中杰中煤科工集团西安研究院有限公司摘要:为解决矿用钻机变速箱因典型案例少而故障诊断困难的问题,提出一种基于多 分类直推式支持向量机(TSVM)的智能诊断方法通过经验模式分解提取变速箱 振动信号中的微弱故障信息,随后计算时域和频域统计特征,选取敏感特征作 为输入,最后输入TSVM模型中自动识别钻机变速箱故障类型即使在未知状态 样本数目是已知故障样本数目50倍的极端条件下,该智能诊断方法的分类准确 率仍能达到91.62%5.31%o实验结果表明,基于TSVM智能诊断方法能较好识 别钻机变速箱故障,具有较强的工程使用价值和通用性关键词:肓推式支持向量机;经验模式分解;智能诊断;钻机变速箱;作者简介:申中杰(1985-),山东荷泽人,博士,助理研究员,2012年毕业于 西安交通大学机械工程专业,中煤科工集团西安研究院有限公司任职,从事钻 机故障诊断及电气化改造,电子信箱:shenzhongjie@cctegxian. com.收稿日期:2017-06-20基金:“十三五”国家科技重大专项项目(2016ZX05045003-002)Intelligent Fault Diagnosis of Transmission for Mine Drilling RigBased on TSVMSHEN Zhong-iieXi, an Research Institute Co., Ltd., China CoalTechnology and Engineering Group;Abstract:How to diagnose the faults occurring in transmission of mine drilling rig becomes a troublesome problem in case of insufficient labeled samples or excess unlabeled samples. Presents a novel model for the transmission fault diagnosis based on multiclass transductive support vector machine (TSVM) • Firstly, the weak fauIt i门formatio】i is extracted by Empirical Mode Decomposition. Then the time-domian and frequency-domain statistical characteristics are calculated and sensitive features are selected as input. Finally, TSVM is used to diagnose the transmission fault intelligently. Even though the number of unlabeled samples is 50 times as that of labeled samples, the testing accuracy of the novel diagnosis method based on TSVM can reach at 91. 62%5. 31%, which validates that the proposed method has the practical values and generality.Keyword:tronsductive support vector machine; empirical mode decomposition; intelligent diagnosis; dialling rig transmission;Received: 2017-06-200引言在故障诊断中,获取足够的典型故障样本是一件非常困难的问题。
以ZDY系列钻 机变速箱为例,因其井下工作环境恶劣,受力情况复杂,变速箱极易损坏由于 钻机变速箱的零部件多,且一直在煤矿井下工作,监测数据很难获取,典型的 故障样本更是匮乏因此针对钻机变速箱故障诊断,需要开发一种仅需要少量的 典型故障样木便能识别大量未知状态样木故障类型的智能诊断方法支持向量机(SVM)是由Vapnik等人提出的专门处理小样本条件下分类问题的 新型机器学习方法它通过训练样本集寻找最优分类面从而将测试样本最大间隔 分离SVM在测试样本集和训练样本集样本分布相似、数冃接近的条件下性能卓 越,但利用少量的已知故障样本识别大量的未知状态样本时会显得力不从心而 SVM只通过学习训练样木构造最优分类面,不考虑测试样木集的样木分布信息直推式支持向量机(TSVM)是支持向量机与直推式学习理论的有效结合,可以 实现将未知状态数据的样本分布信息引入到分类器的学习中,从而改进其分类 性能TSVM的特色是同时训练少量的已知故障样本和大量的未知状态样本,在 混合学习的过程中,将测试样本集的样本分布信息转移到最终的分类器中,实 现分类准确率的大幅提升1直推式支持向量机给定一组独立同分布已知标签样本集另一组与已知标签样木服从同一分布的未知标签样木集TSVM要寻找合适的分类结果刃,y2, L, yM,使得不等式成立,且日标函数最小。
直推式学习的关键是设计一定的启发式规则来实现未知标签样木中样木分布信 息的转移TSVM算法的训练过程即为求解式(4),分为以下几步进行:(1) 给定惩罚因子C和C,并利用归纳式学习对已知标签样本进行初始学习,得 到一个初始的分类器;同时按照规则设定一个未知标签样本集中正标签样本数(2) 利用初始分类器对未知标签样本进行分类,计算每个未知标签样本的判别 函数输出,并对输出值中最大的N个未知标签样本暂时标识为正标签值,其余 的标识为负标签值;同时设定一个临时惩罚因子CIcop;(3) 对所有样本再次训练,得到新的分类器;检验所有测试样本的标签,当满足 下面条件时交换2个样本标签,即赋了负标签样本的松弛因子,E I>0o交换标签可使优化问题公式中目标函数值最大程度地下降反复执行交换步骤, 直至符合交换条件的样木对找不出为止;(4)增加临时惩罚因子C 返回步骤(3)训练;当G4时,算法结束,输 出最终结果步骤(3)中标签交换保证了交换后的解强于交换前的解步骤(4)中临时惩罚 因子由小到大逐步增加,从试图逐渐增加未知标签样本对算法的影响的角度追 求尽可能小的未知标签样木分类误差由于步骤(1)中C是事先定好的有限数, 根据步骤(4)的结束准则可知,算法在有限次执行之后结束,输出其最终结 果。
2基于TSVM的智能诊断模型针对钻机变速箱典型故障样本匮乏的问题,鉴于TSVM不受样木比例影响的优良 特性,提出一种基于TSVM的智能诊断模型,如图1所示该模型不以准确提取 齿轮啮合频率为故障特征,而是利用经验模式分解处理齿轮振动信号,计算每 个基本模式分量(IMF)的时域、频域统计特征,然后利用距离评估技术从基本 模式分量的时域、频域特征中选取对故障敏感的特征,利用直推式支持向量机训 练敏感特征自动识别和诊断变速箱故障图1基于TSVM智能诊断模型 下载原图3实验验证(1)变速箱实验变速箱故障模拟实验台如图2所示,它由直流电机、负载电机、直流调速加载系 统、齿轮箱减速器等部分构成齿轮箱减速器分两级齿轮传动,包含7个齿轮 齿轮分为正常、偏心、点蚀和剥落4种状态图2变速箱试验台结构示意图 下载原图1.直流电机2.齿轮箱3.正常的滑动齿轮4. 一级齿轮传动5.负载电机6.正常的 滑动齿轮7•二级齿轮传动试验时电机转速为1 000 r/min,采样频率为6. 4 k Hz,数据记录时间为3 min, 测点布置在2轴的轴承座上数据记录为sony EX采集器,可实现低通滤波现 对记录数据进行截取分段,连续的6400个点(1 s的记录数据)组成1个样木。
每种状态下可截取153个样本,其中3个用作训练样本,另外150个作为测试样 本2) 结果分析为检验基于TSVM的智能诊断模型的有效性,将按照四类样木集-全部原始特征 集、全部IMF特征集、敏感原始特征集、敏感IMF特征集进行3组对比试验为 减小由训练样本选取带来的测试精度的随机性,拟釆用蒙特卡洛抽样法则多次 选取训练样本,多次计算、然后求取平均值与方差作为最终的诊断结论随机选取训练样本20次,分别计算其测试精度,以20个测试精度的平均值和方 差作为最终的分类结果其中,测试精度为分类正确的样本数目与测试集中全部 样本数日之比1) 全部原始特征集计算4种变速箱状态的振动信号时域统计特征和频域统计特征,输入到SVM和 TSVM中,结果如表1和图3所示在表1中,n、e、p、s分别表示正常、偏心、 点蚀和剥落4种状态下的测试样木数目对比表1和图3中的各组数据,可以看 出:测试精度随样木增多而减小n=5;e=5;p=5;s=5”、“门二50;e二50;p二50;s二50” 和“门二 150;e二 150;p二 150;s二 150” 之间的结果对比说 明了这一规律其次,测试精度还与样本分布有关,当某一种或几种容易被区分 的样本在整个样本集中所占比例较大时,测试精度也较高。
^n=50;e=5;p=5;s=5"和 “n二50;e二30;p二 15; s二5” 中,当正常状态样本和偏心 状态样本所占比例增多时,测试精度较高然而,无论何种比例的测试样本集, TSVM的测试精度总是优于标准SVMo图3全部原始特征集测试精度均值 下载原图1.原始特征SVM 2.原始特征TSVM表1全部原始特征诊断结果对比 下载原表(2) 全部IMFs特征集 对变速箱振动信号进行4层经验模式分解,并计算每个基本模式分量的时域统 计特征和频域统计特征,输入SVM和TSVM中进行分类,结果如图4和表2所示 可以看出:TSVM的优秀模式识别能力再次被证明与表1和图3相比,全部IMF 特征的测试精度明显高于全部原始特征测试精度结果表明经验模式分解可以有 效处理非平稳、非线性信号,有效提取信号中微弱的故障特征慕于经验模式分 解的特征提取来提高诊断精度图4全部TMFs集测试精度均值 下载原图1. IMF 特征 SVM 2. IMF 特征 TSVM表2全部IMF特征诊断结果对比 下载原表(3) 敏感原始特征集和敏感TMF特征集利用距离评估技术选取全部原始特征和全部TMF特征中的敏感特征,得到敏感 原始特征和敏感IMF特征,将新得到的两类特征分别输入标准SVM和TSVM中, 得到表3和图5所示的测试精度。
其中敏感IMF特征的TSVM模型即本文的基于 TSVM机的智能诊断模型在表3和图5中,与支持向量机相比,直推式支持向 量机分类效果始终占据优势与全部特征集和全部IMF特征集的测试结果相比, 敏感特征集和敏感TMF集的测试精度均有很大程度的提高因此利用距离评估技 术选择敏感特征也是提高诊断精度的一种有效手段图5敏感原始特征集和敏感TMFs特征集测试精度均值 下载原图1.敏感原始特征SVM 2.敏感原始特征TSVM 3.敏感TMF特征SVM 4.敏感TMF特 征 TSVM表3敏感原始特征和敏感IMFs特征诊断结果对比 下载原表在所有诊断模型中,基于TSVM的智能诊断模型(敏感IMF特征+TSVM)的测试精 度最高无论选取测试样本集的任何样本组成,基于TSVM的智能诊断模型的测 试精度均值均在91%以上即使测试样本集样本数是训练样本的50倍,基于TSVM 的智能诊断模型的测试精。
