好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

浅谈测量结果中离群值的剔除方法.docx

8页
  • 卖家[上传人]:I***
  • 文档编号:246740963
  • 上传时间:2022-01-28
  • 文档格式:DOCX
  • 文档大小:128.96KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    •           浅谈测量结果中离群值的剔除方法                    On the method of eliminating outliers in measurement resultsHuang Ligang 1, Jia Xiaorong 2,Yue Feng 1, Zhou Ruizi 1摘要:在一组测量结果中,有时会出现个别测定值与其他值相差较远,这些值称为离群值或逸出值,初学者往往随意剔除这一可疑值,以获得较好的分析结果对于离群值,首先要分析其出现的原因,如果查明是由操作失误引起的,不管其是否为异常值,都应该剔除;但是有时因为各种原因无法查明其出现的原因,在这种情况下就需要进行统计检验,以便判断其是否需要剔除Summary:In a group of measurement results, sometimes there will be inpidual measured values and other values are far different, these values are called outliers or outliers, beginners often randomly eliminate this suspect value, in order to get better analysis results. For outliers, the first thing to do is to analyze the reasons for their appearance. If the outliers are found to be caused by operational errors, whether or not they are outliers, they should be eliminated, in this case, a statistical test is needed to determine whether it needs to be eliminated.关键词:离群值;3σ准则;格拉布斯准则Keywords:Outlier; 3σcriterion; Grubbbs criterion1 引言测量结果中离群的异常值是由观测结果中的粗大误差所引起的,通常是由测量过程中不可重复的突发事件所致。

      一般来源于测量过程中的电子噪声或机械噪声,测量条件的突然改变,操作人员在读数和书写方面的疏忽,以及错误地使用测量设备等如果在测量结果中混有离群的异常值,必然会歪曲测量结果,剔除离群值将使测量结果更符合客观事实从另一方面说,一组正常的测量结果,如果人为地舍弃一些偏离平均值较远,但并不属于离群异常值的测量结果,这样得到的测量结果虽然分散性很小,但实质上是虚假的因此离群值的判断和剔除必须遵循一定的原则进行有些异常值可以根据实验过程中出现的异常情况立即进行判断,例如仪器的突然不稳定,电压的突然波动或突发的振动,测量仪器的跳数,以及测量人员的错误操作等对于这些离群值可以在发现的当时立即予以剔除,并同时记录剔除原因但也有许多离群值在测量当时是无法发现的,这就必须采用统计方法来加以判断统计方法的基本出发点是对于一给定的置信概率,例如0.95或0.99等,确定相应于该置信概率的置信区间如果测量结果位于该区间之外,则应属于小概率事件而认为是不可能发生的,因此它不是由随机误差引起的,应该属于离群值而加以剔除在计量检定中,我们常用两种方法判断并剔除离群值,即3σ准则和格拉布斯准则[1]2 两种常用方法2.1 3σ准则若对被测量X作 次独立测量,得到的测量结果为 ,则测量结果的平均值 为(1)对应于各测量结果的残差 和实验标准差 分别为(2)(3)在正态分布情况下,只要测量次数不太少,随机误差的绝对值超过三倍实验标准差的概率很小,故可以认为是不可能发生的事件。

      也就是说,当某一残差 满足条件 时,则认为该测量结果属于离群值而应予以剔除将离群值剔除后,重新反复使用以上程序,直到测量结果中不再包含离群值时为止2.2格拉布斯准则根据式(2)和(3)求出对应于各测量结果的残差 和单次测量的实验标准差 ,设 为各残差中绝对值最大者,且满足(4)则该值为离群值而应予以剔除式中, 是测量次数为 时的临界系数表1 给出置信概率为0.95时不同 值的临界系数 离群值剔除后,重新反复使用以上程序,直到不再出现离群值为止[2]表1临界系数表31.155102.290172.62041.481112.355182.65151.715122.412192.68161.887132.462202.70972.020142.507302.90882.126152.549403.03692.215162.585503.128例如我们在检定测距仪的分辨力时,得到10组读数如下 :30.005m,30.008m,30.007m,30.006m,30.005m,30.001m,30.006m,30.007m,30.005m,30.005m;计算得到,测量结果的平均值单次测量的实验标准差为査临界系数表得到 ,而残差绝对值最大者为 ,由于故 为离群值而应予以剔除。

      将 剔除后,重新计算其余九个测量结果的平均值和实验标准差,得到测量结果的平均 值为单次测量的实验标准差为再次査临界系数表得到 ,而残差绝对值最大者为 ,由于,因此其余九个测量结果中已无离群值3 结语以上两种方法有各自的特点和适用范围,3σ准则在测量次数较多或要求不高时可以使用它,格拉布斯准则不但引入了平均值和标准偏差,还设置了置信度,故判断的准确性比较高,也是目前国内外常用的剔除法[3]参考文献[1]倪育才.实用测量不确定度评定[M].北京:中国计量出版社,2008:107-108[2]黄近丹.数理统计方法在分析测试中的应用[J].福建分析测试,2016,(25):32-34[3]赵辉,邵素华,谢东坡.分析数据中离群值的处理方法[J].周口师范学院学报,2004(09):115姓名:黄立刚 性别:男工作单位:陕西测绘仪器计量监督检定中心通讯地址:陕西省西安市碑林区测绘西路176号(710054)固定:029-85249738号码:15902947638职称:工程师 学位:硕士从事工作:测绘仪器计量检定电子邮箱:huanglg001@  -全文完-。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.