
可疑数据的取舍方法区别.ppt
5页可疑数据的取舍方法可疑数据的取舍方法在一组条件完全相同的重复试验中,个别的测量值可在一组条件完全相同的重复试验中,个别的测量值可能会出现异常如测量值过大或过能会出现异常如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为小,这些过大或过小的测量数据是不正常的,或称为可疑的对于这些可疑数据应该用数理统计的方法判可疑的对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍常用的方法有别其真伪,并决定取舍常用的方法有拉依达法、肖拉依达法、肖维纳特(维纳特(ChavenetChavenet)法格拉布斯(格拉布斯(GrubbsGrubbs)法等拉依达法拉依达法肖维纳特法肖维纳特法格拉布斯法格拉布斯法 一、拉依达法一、拉依达法 当试验次数较多时,可简单地用当试验次数较多时,可简单地用3倍标准偏差(倍标准偏差(3S)作为确定可疑)作为确定可疑数据取舍的标准当某一测量数据(数据取舍的标准当某一测量数据(xi)与其测量结果的算术平均值)与其测量结果的算术平均值((x-‘)之差大于)之差大于3倍标准偏差时,用公式表示为:倍标准偏差时,用公式表示为: ︳︳xi --x-‘︳︳>>3S 则该测量数据应舍弃。
则该测量数据应舍弃 这是美国混凝土标准中所采用的方法,由于该方法是以这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏倍标准偏差作为判别标准,所以亦称差作为判别标准,所以亦称3倍标准偏差法,简称倍标准偏差法,简称3S法 取取3S的理由是:根据随机变量的正态分布规律,在多次试验中,的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在测量值落在 x-‘一一3S与与x-‘ 十十3S之间的概率为之间的概率为99.73%,出现在此范围%,出现在此范围之外的概率仅为之外的概率仅为0.27%,也就是在近,也就是在近400次试验中才能遇到一次,这次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能因而在实种事件为小概率事件,出现的可能性很小,几乎是不可能因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃另外,当测量值与平均值之差大于另外,当测量值与平均值之差大于2倍标准偏差(即倍标准偏差(即 ︳︳xi --x-‘︳︳>> 2S)时,则该测量值应保留,但需存疑如发现生产(施工)、试验)时,则该测量值应保留,但需存疑。
如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃过程屯有可疑的变异时,该测量值则应予舍弃 拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组)在一组测量值中即使混有异常值,也无法舍弃测量值中即使混有异常值,也无法舍弃 二、肖维纳特法二、肖维纳特法 进行进行n n次试验,其测量值服从正态分布,以次试验,其测量值服从正态分布,以概率概率1 1/(/(2n2n)设定一判别范围(一)设定一判别范围(一knSknS,,knSknS),当偏差(测量值),当偏差(测量值xixi与其算术平均值与其算术平均值x-x-‘之差)超出该范围时,就意味着该测量之差)超出该范围时,就意味着该测量值值xixi是可疑的,应予舍弃判别范围由下是可疑的,应予舍弃判别范围由下式确定:式确定:肖维纳特法可疑数据舍弃的标准为:肖维纳特法可疑数据舍弃的标准为: ︳︳xixi一一 x-x-‘︳︳/S≥kn/S≥kn三、格拉布斯法三、格拉布斯法格拉布斯法假定测量结果服从正态分布,根据顺序统计格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。
量来确定可疑数据的取舍进行进行n次重复试验,试验结果为次重复试验,试验结果为x1、、x2、、…、、xi、、…、、xn ,而且,而且xi服从正态分布服从正态分布为了检验为了检验 ((i=1,,2,,…,,n)中是否有可疑值,可将)中是否有可疑值,可将 按按其值由小到大顺序重新排列,其值由小到大顺序重新排列,根据顺序统计原则,给出标准化顺序统计量根据顺序统计原则,给出标准化顺序统计量g::当最小值当最小值x(1)可疑时,则可疑时,则: g=( x-‘一一x(1) )/S当最大值当最大值x(n)可疑时,则可疑时,则: g=( x(n) 一一 x-‘ )/S 根据格拉布斯统计量的分布,在指定的显著性水平根据格拉布斯统计量的分布,在指定的显著性水平β(一般(一般β==0.05)下,求得判别可疑值的临界值)下,求得判别可疑值的临界值g0(( β,n)) ,格拉布斯法的判别标准为:格拉布斯法的判别标准为:g≥g0(( β,n))利用格拉布斯法每次只能舍弃一个可疑值,若有两个以利用格拉布斯法每次只能舍弃一个可疑值,若有两个以上的可疑数据,应该一个一个数据的舍弃,舍弃第一个上的可疑数据,应该一个一个数据的舍弃,舍弃第一个数据后,试验次数由数据后,试验次数由n变为变为n一一1,以此为基础再判别第二以此为基础再判别第二个可疑数据。
个可疑数据例题;例题;实验室进行通配比的混凝土抗压强度试验,其实验结果为:实验室进行通配比的混凝土抗压强度试验,其实验结果为:23.6,24.0,,26.5,24.6,25.2,26.7,26.1,30.5,26.0,25.6((MPa),),使用拉依达法判别其取舍使用拉依达法判别其取舍解;分析得解;分析得Xmin=23.6MPa和和Xmax=30.5MPa最可疑,首先最可疑,首先判别判别Xmin和和Xmax根据式(根据式(2-1)()(2-4)得;)得;X=25.9MPa S=1.9MPa׀Xmax-X6.4=׀MPaXmin-X3.2=׀MPa。
