
分析化学第六版第二章课件.ppt
69页第第2章章 误差及分析数据的统计处理误差及分析数据的统计处理2.1 定量分析中的误差定量分析中的误差 2.2 分析结果的数据处理分析结果的数据处理2.3 误差的传递误差的传递2.4 有效数字及其运算规则有效数字及其运算规则2.5 标准曲线的回归分析标准曲线的回归分析 分析化学中的误差分析化学中的误差 定量分析的任务是准确测定组分在试样中的含量在测定量分析的任务是准确测定组分在试样中的含量在测定过程中,即使采用最可靠的分析方法,使用最精密的仪定过程中,即使采用最可靠的分析方法,使用最精密的仪器,由技术很熟练的人员进行操作,也不可能得到绝对准器,由技术很熟练的人员进行操作,也不可能得到绝对准确的结果因为在任何测量过程中,误差是客观存在的确的结果因为在任何测量过程中,误差是客观存在的因此,应该了解分析过程中误差产生的原因及其出现的因此,应该了解分析过程中误差产生的原因及其出现的规律,以便采取相应措施,尽可能使误差减小另一方面规律,以便采取相应措施,尽可能使误差减小另一方面需要对测试数据进行正确的统计处理,以获得最可靠的数需要对测试数据进行正确的统计处理,以获得最可靠的数据信息2.1 定量分析中的 误差 误差与准确度 准确度(accuracy)是指测定平均值与真值接近的程度,常用误差大小表示。
误差小,准确度高uu 误差误差误差误差(Error):Error):表示表示表示表示测量值与真值之差,表征测量结果测量值与真值之差,表征测量结果的准确度的准确度u误差有两种表示方法:绝对误差误差有两种表示方法:绝对误差(E)和相对误差(和相对误差(Er)u绝对误差(绝对误差(E)是测量值(是测量值(x)与真实值()与真实值(xT)之间的)之间的差值,即:差值,即:1.绝对误差的单位与测量值的单位相同,误差越小,表示测量值与真实值绝对误差的单位与测量值的单位相同,误差越小,表示测量值与真实值越接近,准确度越高;反之,误差越大,准确度越低越接近,准确度越高;反之,误差越大,准确度越低2.测量值大于真实值时,误差为正误差,表示测定结果偏高;反之,误差测量值大于真实值时,误差为正误差,表示测定结果偏高;反之,误差为负值,表示测定结果偏低为负值,表示测定结果偏低u 相对误差(相对误差(Er)是绝对误差(是绝对误差(E)相当于真实)相当于真实值(值(xT)的百分率,即:)的百分率,即:1.相对误差和绝对误差一样,有正有负相对误差和绝对误差一样,有正有负2.相对误差反映的是误差在真实值中所占的比例大小,因此相对误差反映的是误差在真实值中所占的比例大小,因此绝对误差相同的条件下,待测组分含量越高。
相对误差越绝对误差相同的条件下,待测组分含量越高相对误差越小;反之,相对误差越大小;反之,相对误差越大真实值(XT)某一物理量本身具有的客观存在的真实数值真值是未知某一物理量本身具有的客观存在的真实数值真值是未知的、客观存在的量,严格地说,任何物质中各组分的真实的、客观存在的量,严格地说,任何物质中各组分的真实含量是不知道的,用测量的方法得到的仅是测量值含量是不知道的,用测量的方法得到的仅是测量值在分析化学中常将以下的值当作真值来处理:a、理论真值(如化合物的理论组成,例如硫酸铵含氮量)b、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等,例如原子量、分子量c、相对真值(如高一级精度的测量值相对于低一级精度的测量值例如,标准样品的标准值)偏差与精密度n 精密度(precision)是指在确定条件下,将测试方法实施多次,求出所得结果之间的一致程度精密度的大小常用偏差来表示偏差(deviation)在实际分析工作中,一般要对试样进行多次平行测定,以求得分析结果的平均值n为了说明分析结果的精密度,将各单次测定偏差的绝对值的平均值称为单次测定结果的平均偏差(d),公式如下:单次测定结果的相对平均偏差为(dr),公式如下:n当测定次数较多时,常使用标准偏差(s)或相对标准偏差(RSD,sr)来表示一组平行测定值的精密度。
公式如下:n标准偏差通过平方运算,它能将较大的偏差更显著地表现出来,因此,标准偏差能更好地反映测定值的精密度实际工作中,都用RSD表示分析结果的精密度准确度与精密度的关系高的精密度不一定保证高的准确度;但精密度高是准确度高的前提例2 p10误差的分类及减免误差的方法 在定量分析中,对于各种原因导致的误差,根据误差的来源和性质的不同,可以分为系统误差和随机误差两大类根据产生的具体原因,系统误差可分为:方法误差;仪器和试剂误差;操作误差;主观误差亦称偶然误差,由难以控制且无法避免的偶然因素造成,如测定过程中温度、湿度、气压等变化引起的误差由于疏忽或错误引起,实质是一种错误,不能成为误差消除系统误差1.对照试验:检验系统误差2.空白试验:扣除系统误差3.校正仪器4.分析结果校正消除随机误差增加平行测定次数 砝码受腐蚀:系统误差(仪器误差),更换砝码 天平的两臂不等长:系统误差(仪器误差),校正仪器容量瓶与移液管未经校准:系统误差(仪器误差),校正仪器在重量分析中,试样的非被测组分被共沉淀:系统误差(方法误差),修正方法,严格沉淀条件天平称量时最后一位读数估计不准:偶然误差;严格按操作规程操作,增加测定次数。
以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液:系统误差,做对照试验或提纯试剂思考随机误差的分布服从正态分布 随机误差是由某些难以控制且无法避免的偶然因素造成的,它的大小、正负都不定,具有随机性尽管单个随机误差的出现无规律,但在系统误差已排除的情况下,进行多次重复平行测定,会发现随机误差是服从一定的统计规律的用数理统计的方法研究发现,随机误差的分布符合正态分布(即高斯分布)1.频数分布 频数是指每组中测量值出现的次数,频数与数据总数之比为相对频数,即概率密度整理上述数据,按组距0.03来分成10组,得频数分布表:分分 组组 频频 数数 相对频数相对频数 1.265%1.295%1.295%1.325%1.325%1.355%1.355%1.385%1.385%1.415%1.415%1.445%1.445%1.475%1.475%1.505%1.505%1.535%1.535%1.565%14717242415611 0.010.040.070.170.240.240.150.060.010.01 100 1.00 以各组区间为底,相对频数为高做成一排矩形的相对频数分布直方图如果测量数据非常多,组距可更小些,组就分得更多些,直方图的形状趋于一条平滑的曲线。
相对频数分布直方图 直方图的两个特点:(1)离散特性 (2)集中趋势 当测定次数无限多时,其标准偏差称为总体标准偏差,用符号来表示其中为总体平均值,即无限多次测定的平均值在确认消除系统误差的前提下总体平均值就是真值xT此时总体平均偏差为 当测定次数非常多(20)时,总体标准偏差()与总体平均偏差()有下列关系=0.797 0.8 2.正态分布 在分析化学中,测量数据一般符合正态分布规律正态分布是德国数学家高斯首先提出的,又称高斯曲线,下图即为正态分布曲线N(,2),其数学表达式为两组精密度不同的测量值的正态分布曲线y表示概率密度;x表示测量值;是总体平均值;是总体标准偏差决定曲线在x轴的位置;决定曲线的形状:小,数据的精密度好,曲线瘦高;大,数据分散,曲线较扁平1)x=时,y最大即多数测量值集中在附近,或者说总体平均值是最可信赖值或最佳值2)x=时的直线为对称轴即正负误差出现的概率相等3)x时,曲线以x轴为渐近线即大误差出现的概率小,出现很大误差的测定值概率趋近零4),y,即测量精密度越差,测量值分布越分散,曲线平坦正态分布规律标准正态分布曲线 这样,曲线的横坐标就变为,纵坐标为概率密度,用和概率密度表示的正态分布曲线称为标准正态分布曲线,用符号N(0,1)表示。
这样,曲线的形状与大小无关,即不论原来正态分布曲线是瘦高的还是扁平的,经过这样的变换后都得到相同的一条标准正态分布曲线标准正态分布曲线与横坐标之间所加的面积,代表了某一区间的测量值或某一范围 随机误差出现的概率误差在某些区间出现的概率正态分布概率积分表或简称u表由u值可查表得到面积,也即是某一区间的测量值或某一范围随机误差出现的概率不同u值对应的积分值(面积)做成的表 测定值或误差出现的概率称为置信度或置信水平,上表中68.3%、95.5%、99.7%即为置信度,其意义可理解为某一定范围的测定值(或误差值)出现的概率2、3等称为置信区间,其意义为真实值在指定概率下,分布在某一个区间置信度选得高,置信区间就宽有限次测定中随机误差服从t分布 正态分布是无限次测量数据的分布规律,而实际分析工作中,只能对随机抽样进行有限次测量,其随机误差的分布不服从正态分布那么如何以统计的方法处理有限次测量数据,使其合理地反映总体的特征?(1 1)t t分布曲线分布曲线 当测量数据不多时,无法求得总体平均值和总体标准偏差,只能用样本的标准偏差s来估计测量数据的分散情况用s代替,必然引起分布曲线变得平坦,从而引起误差。
为了得到同样的置信度(面积),必须用一个新的因子代替u,这个因子是由英国统计学家兼化学家Gosset提出来的,称为置信因子t,定义为 以t为统计量的分布称为t分布t分布可说明当n不大时(n20)随机误差分布的规律t分布曲线t分布曲线的纵坐标仍为概率密度,但横坐标为统计量tt分布与标准正态分布的区别:1.横坐标不同t u;2.随测定次数减少,t分布曲线趋于平坦,即t分布曲线随着自由度(f=n-1)而改变:f20,t分布曲线与标准正态分布曲线很接近;f t,分布曲线与标准正态分布曲线严格一致与标准正态分布曲线一样,t分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率不同的是,对于标准正态分布曲线,只要u值一定,相应的概率也一定;但对于t分布曲线,当t值一定时,由于f值的不同,相应曲线所包括的面积也不同,即t分布中的区间概率不仅随t值而改变,还与f值有关不同f值及概率所对应的t值已由统计学家计算出来,见表中置信度用P表示,它表示在某一t值时,测定值落在(t s)范围内的概率显然,测定值落在此范围之外的概率为(1-P),称为显著性水准置信区间置信区间概念的理解:概念的理解:=47.50%0.10%(P=95%)应当理解为:在47.50%0.10%的区间内包括总体平均值的概率为95%。
注意:是个客观存在的恒定值,没有随机性,谈不上什么概率问题,不能说落在某一区间的概率是多少置信度越低,同一体系的置信区间就越窄;置信度置信度越低,同一体系的置信区间就越窄;置信度越高,同一体系的置信区间就越宽,即所估计的区越高,同一体系的置信区间就越宽,即所估计的区间包括真值的可能性也就越大;间包括真值的可能性也就越大;置信度过高会使置信区间过宽,这种判断往往就失置信度过高会使置信区间过宽,这种判断往往就失去了意义;置信度定的太低,其判断的可靠性不能去了意义;置信度定的太低,其判断的可靠性不能保证;保证;置信度的高低应定得合适,要使置信区间的宽度足置信度的高低应定得合适,要使置信区间的宽度足够窄,而置信度又足够高够窄,而置信度又足够高在分析化学中,一般将置信度定在在分析化学中,一般将置信度定在95%或或90%平均值的标准偏差:平均值的标准偏差:正态分布曲线:t分布曲线:置信区间:置信区间:样本容量 n 自由度 f=n-1 n x n-1 n s 0.8 d与s相差较大 总体标准偏差:样本标准偏差:例3 p15公差公差是生产部门对分析结果误差允许的一种限量,若果误差超出允许的公差范围,该项分析工作就应重做。
公差范围的确定,与诸多因素有关:首先,根据实际情况对分析结果准确度的要求而定;其次,公差范围常依据试样组成及待测组分含量而不同,组成愈复杂,引起误差的可能性就愈大,允许。












