
第二章监测数据的处理.doc
7页第二章 监测数据的统计处理和结果表述2.1基本概念2.1.1误差和偏差2.1.1.1真值:在某一时刻和某一位置或状态下,某量的效应体现出客观值或实际值理论真值真值包括 约定真值标准器的相对真值2.1.1.2误差及其分类1、由于被测量的数据形式通常不能以有限为数表示,同时由于认识能力和科学技术水平的限制,使测量值与真挚不一致,这种矛盾在数值上表现即为误差2、差按其性质和产生原因可分为:系统误差(可测误差、恒定误差、偏倚):指测量值的总体均值与真值之间的差别,是由测量过程中某些恒定因素造成的,在一定条件下具有重现性,并不因增加测量次数而减少系统误差,他的产生可以是方法、仪器、试剂、恒定的操作人员或恒定的环境等所造成 随机误差(偶然误差、不可测误差):是由测量过程中各种随机因素的共同作用所造成的,其遵从正态分布规律过失误差:是由测量过程中犯下不应有的错误所造成,它明显的歪曲了测量结果,因而一经发现必须及时改正3、 误差的表示方法绝对误差:测量值(x)与真值(x t)之比 绝对误差=x-x t相对误差:指绝对误差与真值之比 相对误差= ×100%tx4、偏差:个别测量值与多次测量均值之偏离。
分绝对偏差(d):测量值与均值(x’)之差 d i=xi-x’相对偏差:绝对偏差与均值之比 相对偏差= ×100%'xd平均偏差:是绝对偏差绝对值之和的平均值 d’= = ( )n1ii 标准偏差和相对标准偏差 差方和(S):指绝对值的平方之和 S= niix12')( 样本方差(s 2或 V) s 2= = Snii12')( 1n 样本标准偏差(s 或 sD) s= =21)'(iix 样本相对标准偏差(变异系数):样本标准偏差在样本均值中所占的百分数 C v= ×100%'xs 总体方差和总体标准偏差分别以 σ 2和 σ 表示σ 2= N1nii2)( σ= =niix12)( N)x(- 2ii2式中:N——总体容量μ——总体均值 级差(R):一组测量值中最大值与最小值之差,表示误差的范围.R=xmax-xmin5、总体、样本和平均数 总体和个体研究对象的全体称总体,其中一个单位叫个体 (2)样本和样本容量总体中的一部分叫样本,样本中含有个体的数目叫此样本的样本容量。
(3)平均数:平均数代表一组变量的平均水平或集中趋势,样本观测中大多数测量值靠近平均数算术均数:样本均数 x’= nxi总体均数 μ= n→∞i几何均数:当变量呈等比关系,常需用几何均数.xg’=( x1x2……xn)1/n 中位数:将各数据按大小顺序排列,位于中间的数据若为偶数取中间两数的平均值 众数:一组数据中出现次数最多的一个数据例题:有一氯化物的标准水样,浓度为 110mg/l,以银量法测定 5次其值为:112、115、14、113、15mg/l,求算术均数、几何均数、中位数、绝对误差、相对偏差、平均偏差、极差、样本的差方和、方差、标准偏差和相对标准偏差解:算术平均数 x g=(112+115+114+113+115)/5=13.8mg/l几何均数 x g’=(112×115×114×113×115) 1/5=13.8mg/l中位数 114mg/l绝对误差 x i-xt=112-110=2 mg/l(以 xi为 112 mg/l,x t为 112 mg/l为例)相对误差 2/110=1.8%绝对偏差 d i=xi-x’=112-113.8=-1.8mg/l平均偏差 d’=1.04 mg/l极差 R=115-12=3 mg/l样本差方和 S=(-1.8) 2+1.22+1.22+(-0.8) 2+1.22=6.8 mg/l样本方差 s 2= S=1.70mg/l1n样本标准偏差 s= =1.3mg/ls样本相对标准偏差 C v= ×100%=1.1%8.32.1.3 数据的处理和结果表述2.1.3.1 数据修约规则计算的数据需要修约时,应遵守下列规则:四舍六入五考虑,五后非零则进一,五后皆零视寄偶,五前为偶应舍去,五前为寄则进一。
例题:将下列数据修约到只保留一位小数修约前: 14.3426 14.2631 14.2501 14.2500 14.0500 14.1500修越后: 14.3 14.3 14.3 14.2 14.0 14.2 2.1.3.2可疑数据的取舍离群数据:与正常数据不是来自同一分布总体,明显歪曲试验结果的测量数据可疑数据:可能会歪曲试验结果,但尚未经验证断定其实离群数据的测量数据测量中发现明显的系统误差和过失误差,由此而产生的数据应随时剔除,而可疑数据的舍取应采用统计方法判别,即离群数据的统计检验常用的检验方法(1)狄克逊(Dixon)检验法适用于一组测量值的一致性检验和剔除离群值 将一组测量数据从小到大顺序排列为 x1、x 2…xn,x 1和 xn分别为最小可疑值和最大可疑值 按下表计算式求 Q值 根据给定的显著性水平(α)和样本容量(n) ,从临界值表中查得临界值 若 Q≤Q 0.05则可疑值为正常值若 Q0.05<Q≤Q 0.01则可疑值为偏离值若 Q>Q 0.01则可疑值为离群值。
狄克逊检验统计量 Q计算公式n值范围可疑数据为最小值 x1时可疑数据为最大值 xn时n值范围 可疑数据为最小值 x1时可疑数据为最大值 xn时3~78~10Q= 2nQ= 1xQ= 1Q= 2xn11~1314~25Q= 3nQ= 12xQ= 2Q= 3xn例题:一组测量值从小到大顺序排列为:14.65、14.90、14.90、14.92、14.95、14.96、15.00、15.01、15.01、15.02,检验最小值 14.65和最大值 15.02是否为离群值解:检验最小值 x1=14.65,n=10,x 2=14.90,x n-1=15.01Q= =0.692n查临界值表知,当 n=10,给定显著性水平 α=0.01 时,Q 0.01=0.597Q>Q 0.01,故最小值 14.65为离群值,应予以剔除检验最大值 xn=15.02Q= =0.08321n查临界值表知,当 n=10,给定显著性水平 α=0.05 时,Q 0.05=0.477Q≤Q 0.05,故最大值 15.02为正常值(2)格鲁勃斯(Grubbs)检验法—是用于检验多组测量值的一致性和剔除多组测量值中离群均值。
有 l 组测定值,每组 n个测定值的均值分别为 x1’、x 2’…xi’…xl’,其中最大均值记为 xmax’,最小均值记为 xmin’ 由 l 个均值计算总均值 x’’和标准偏差 sx’x’’= sx’=l1lix' liix12)'( 可疑均值为最大值(x max’)时,按下式计算统计量(T)T= 'minxs 根据测定值组数和给定的显著性水平从表中查的临界值 若 T≤T 0.05 则可疑均值为正常均值若 T0.05<T≤T 0.01 则可疑均值为偏离均值若 T>T 0.01 则可疑均值为离群均值例题:p3012.1.4监测结果的表述1、 用算术均数(x’ )代表集中趋势2、 用算术均数和标准偏差表示测定结果的精密度(x’±s)3、 用(x’±s,C v)表示结果4、 均数置信区和 t值2.1.5 直线相关和回归2.1.6 方差分析2.1.7 模糊聚类分析 2.2 实验室质量保证2.2 .1有关术语1、 准确度:是用一个特定的分析程序所获得的分析结果与假定的或公认的真值之间符合程度的度量反映分析方法或测量系统存在的系统误差和随机误差两个的综合指标,并决定其分析结果的可靠性。
用绝对误差和相对误差来表示评价准确度的方法有两种用某一方法分析标准物质,测定其回收率,据其结果确定准确度加标回收法:即在样品中加入标准物质,测定其回收率,以确定准确度计算式为:回收率= ×100%加 标 值 试 样 测 定 值加 标 试 样 测 定 值 2、 精密度:用一特定的分析程序在受控条件下重复分析均一样品所得测定值得一致程度它反映分析方法或测量系统所存在随机误差的大小3、平行性:同一实验室中,当分析人员、分析设备和分析时间都相同时,用同一分析方法对同一样品进行双份或多份平行样测定结果之间的符合程度4、 重复性:在同一实验室内,当分析人员、分析设备和分析时间三因素中至少有一项不相同时,用同一分析方法对同一样品进行两次或两次以上独立测定结果之间的符合程度5、 再现性:在不同实验室(分析人员、分析设备、甚至分析时间都不相同) ,用同一分析方法对同一样品进行多次测定结果之间的符合程度6、 灵敏度:指该方法对单位浓度或单位量的待测物质的变化所引起的响应量变化的程度7、空白试验:是用蒸馏水代替试样的测定其所加试剂和操作与试验测定完全相同,空白试验应与试样测定同时进行,试样分析时仪器的响应值不仅是试样中待测物质的分析响应值,还包括所有其他因素,如试剂种杂志,环境及操作进程的玷污等的响应值。
8、 校准曲线:—用于描述待测物质的浓度或量与相应的测量仪器的相应值或其他指标之间的定量关系的曲线9、 检测限:某一分析方法在给定的可靠程度内可以从样品中检测待测物质的最小浓度或最小量10、 测定限:分测定上限和测定下限2.2.2、实验室内质量控制1、 质量控制图的绘制及应用质量控制图的基本组成:预期值——图中的中心线目标值——图中上、下警告线之间区域实测值的可接受范围——图中上下控制限制间的区域辅助线——上、下各一线,在中心线两侧与上、下警告限之间各一半处2、均数控制图——控制样品的浓度和组成,使其尽量与环境样品相识,用同一方法在一定时间内重复测定,至少累计 20个数据,按公式计算总均值、标准偏差、平均极差等均数—极差控制图多样控制图。
