
第二章-误差和数据处理.ppt
73页分析化学高职高专化学教材编写组编(第四版)第二章定量分析的误差和数据处理“十二五”职业教育国家规划教材第一节 定量分析的误差第二节 定量分析结果的数据处理第三节 有效数字及其运算规则 学习目标知知识目目标::•掌握定量分析中准确度与误差、精密度与偏差的关系•掌握各种误差与偏差的计算方法•掌握系统误差、随机误差的概念、特点、来源和消除方法•了解随机误差的分布规律、分析结果可靠性检验的意义和方法•理解平均值的置信区间的概念、可疑值的取舍方法•掌握有效数字的概念和运算规则能力目能力目标::•能够正确计算分析结果的误差、偏差•能够分析定量过程中产生误差的原因,提出减免方法•能正确计算平均值的置信区间•能正确判断并取舍测量数据中的可疑值•能够正确记录测量数据、正确计算和保留分析结果的有效数字,正确表达分析结果 本课程主要任务是学习定量分析方法定量分析方法,要求测定结果必须有一定的准确度,以满足生产和科研需要相关案例 食用醋总酸度的测定,每个人平行测定3次,统计测定结果结论: 误差是客观存在的! 第一节第一节 定量分析的误差定量分析的误差定量分析的任务 找出误差产生原因,设法减免误差。
分析测试:多次平行测定结果计算结果评价:准确度、精密度1. 准确度与误差一、误差的表征——准确度与精密度 准确度:是指分析结果与真值之间的接近程度 准确度的高低常以误差的大小来衡量 误差:测定值与真值之间的差值 误差越小,表示测定结果与真值越接近,准确度越高;反之,测定结果的准确度越低 真值:某一物理量本身具有的客观存在的真实数值一般说来,真值是未知的,在分析化学中,常将以下的值当作真值来处理: (1)理论真值:如化合物的理论组成等 (2)计量学约定真值:如国际计量大会确定的长度、质量、物质的量单位等 (3)相对真值:认定准确度高一级的测定值作为低一级的测量值的真值 绝对误差E:测定值xi与真实值xT之差E=xi-xT相对误差Er:绝对误差在真值中所占百分率误差有两种表达方式,即绝对误差E和相对误差Er 绝对误差和相对误差都有正负之分正值表示分析结果偏高、负值表示分析结果偏低误差计算参见例1 可见,一般情况下,用相对误差来表示或比较各种情况下测定结果的准确度更确切 在实际工作中,通常在相同的条件下对一个样品进行多次重复测定(称为平行测定),获得一组测量值x1、x2、…、xn,该样品的测定结果一般用各次测量结果的平均值 来表示,此时测定结果的绝对误差和相对误差可分别按下式计算:参见例2。
精密度是指一组平行测定数据相互接近的程度,平行测定的结果相互越接近,则测定的精密度越高 精密度通常用与平均值相关的各种偏差来表示 ((1 1)偏差)偏差 偏差是测量值与平均值的差值 与误差类似,偏差也有绝对偏差和相对偏差 2. 2.精密度与偏差精密度与偏差绝对偏差d:单次测定值与平均值之差d=xi-相对偏差dr:绝对偏差在平均值中所占的百分率 绝对偏差和相对偏差只能衡量单次测定值与平均值的偏离程度,其值有正有负,若将一组平行测定值的偏差相加,其代数和应为零,因此不能用来表示一组测定值的精密度 ((2 2)平均偏差)平均偏差 平均偏差是各次测定偏差的绝对值的平均值,用 表示: 取绝对值后避免了正负偏差相互抵消,可用以表示一组测定值的精密度 相对平均偏差 :平均偏差在平均值中所占的百分率: 用统计学方法处理实验数据时,常使用标准偏差和相对标准偏差来表示一组平行测定值的精密度标准偏差又称均方根偏差 对于有限次数测定,标准偏差s的表达式为:((3 3)标准偏差)标准偏差 式中(n-1)称为自由度,表示在n次平行测定中,只有(n-1)个独立可变的偏差,因为n个测定值的绝对偏差之和等于零,所以只要知道(n-1)个测定值的偏差,就可以确定第n个测定值的偏差。
相对标准偏差RSD:标准偏差在平均值中所占的百分率 相对标准偏差也称变异系数 标准偏差通过平方运算,能将较大的偏差更显著地表现出来,因此标准偏差能更好地反映一组测定值的精密度参见例3 ((4 4)极差)极差 一般分析工作中,平行测定次数不多,偏差也可以用极差或称全距R来表示,它是一组测量数据中最大值与最小值之差:R=xmax-xmin 用极差表示偏差,简单直观,便于计算,不足之处是没有利用全部测量数据 相对极差Rr: 二、准确度与精密度的关系——精密度低,表观准确度高,但不可靠36.00%36.50%37.00%37.50%38.00%ABCD——精密度低,准确度低——精密度高,准确度低——精密度高,准确度高(1)精密度是保证准确度的先决条件;(2)精密度高,准确度不一定高(可能存在系统误差) ;(3)消除系统误差后,精密度高,准确度也高————好结果!好结果!准确度与精密度的关系三、公差三、公差碳含量范围(%)0.10-0.200.20-0.500.50-1.001.00-2.002.00-3.003.00-4.00>4.00公差( ±%))0.0150.0200.0250.0350.0450.0500.060 生产部门对于分析结果允许误差的一种限量(允差) 。
例行分析一般测两次,若2次平行测定之差在2倍公差范围之内,取平均值报出结果;否则称为“超差”,必须重做如钢铁中碳含量的公差范围,国家标准规定下表所示: 例如,水泥中SiO2的测定标准规定同一实验室内公差(允许误差)为±0.20%,如果两次平行测定测得的数据分别为21.14%及21.58%,两次测定结果的差值为0.44%,超过双面公差(2×0.20%),必须重新测定;如又进行一次测定,结果为21.16%,则应以21.14%和21.16%两次测定的平均值21.15%报出四、误差分类及减免误差的方法系统误差(Systematic error )随机误差(random error),也称偶然误差按性质分类由某些固定原因造成的,具单向性、重现性,为可测误差1. 系统误差(1)方法误差: 分析方法本身造成的误差 如:溶解损失、指示剂终点误差——用其他方法校正 以上各类误差可以通过对照试验、空白实验、校准仪器和方法校正来减小或消除3) 试剂误差: 试剂不纯或实验用水含有微量待测组分引起2) 仪器误差: 仪器、量器本身不够准确或未经校准引起 如:移液管刻度不准、天平砝码磨损——校准仪器(4)操作误差: 操作人员本身引起。
如:颜色观察、滴定管读数2. 随机误差 又称偶然误差,测定值受各种因素随机变动引起的,非单向性测量次数足够多时,服从统计规律l大小相近的正误差和负误差出现的机会相等,即绝对值相近而符号相反的误差是以同等的机会出现l小误差出现的概率高,而大误差出现的概率小 过失(mistake) 由粗心大意或违反操作规程引起的,可以避免的 例如:溶液溅失、沉淀穿滤、加错试剂、读错刻度、记录和计算错误等非随机误差 弃去该结果!系统误差与随机误差的比较见下页 不存在系统误差的情况下,测定次数越多其平均值越接近真实值,取平均值的方法可减小随机误差系统误差系统误差随机误差随机误差产生原因产生原因固定的因素固定的因素有时不存在有时不存在偶然和意外的因素偶然和意外的因素总是存在总是存在分类分类方法误差;仪器误差;方法误差;仪器误差;试剂误差;主观误差试剂误差;主观误差环境的变化因素环境的变化因素主观的变化因素等主观的变化因素等特点特点单向性、重现性、可测性单向性、重现性、可测性双向性、不可测性、双向性、不可测性、服从统计规律服从统计规律影响影响准确度准确度 精密度精密度消除或减小消除或减小的方法的方法校正或减免校正或减免 进行多次平行测定进行多次平行测定系统误差与随机误差的比较系统误差与随机误差的比较3.提高分析结果准确度的方法(1)选择合适的分析方法l化学分析:滴定分析,重量分析灵敏度不高,准确度高,常量、高含量组分较合适。
l仪器分析:灵敏度高,准确度不高,微量组分分析较合适1) 称量误差 万分之一分析天平每次称量误差 ± 0.0001g,一份试样需两次称量,可能产生最大误差±0.0002g,若要求相对误差 ±0.1%,则:即:每一份试样的称量至少为0.2g2 2)减小测量误差)减小测量误差 滴定管读数误差:± 0. 01ml,滴定一份试样读数误差± 0. 02mL, 若要求相对误差 ±0.1%,则每一份试样体积量至少为±20 mL2)量器误差((3 3)消除系统误差)消除系统误差l系统误差的检验l空白试验l校正仪器l方法校正1)系统误差的检验——对照实验Ø做加标回收试验Ø用标准样品对照Ø用标准方法对照 在不加试样的情况下,按照与试样分析同样的步骤和条件进行的测定,试验得到的结果称为空白值从试样分析结果中扣除空白值即可消除试剂、蒸馏水和实验器皿带进杂质所引起的误差 空白值一般不应很大,否则应采取提纯试剂或改用适当器皿等措施来减小误差2)空白实验4)方法校正例如重量法测Si,沉淀完硅酸后用比色法测定滤液中残留的硅3)校准仪器 天平、容量仪器,在准确度要求高的分析中需要校正。
((4 4)减小随机)减小随机误差差 增加平行测定次数,以减小随机误差 一般平行测定3~5次一、平均一、平均值的置信区的置信区间 定量分析的分析结果可能和试样的真实含量不完全一致,即分析结果存在一定的不确定性为此有必要对测量数据进行统计处理,以便合理地表达分析结果,并对分析结果的可靠性和准确程度做出判断 定量分析一般是通过对一个总体中少量样本的测定,来对总体做出评价,即通过几次平行测定的样本平均值 来估计总体平均值μ存在的范围,并给出这种估计的可靠性第二节第二节 定量分析结果的数据处理定量分析结果的数据处理(1)总体平均值 前面的讨论中涉及平均值和偏差等概念都是针对少量样本而言的,当测量次数n为无限多时,所得的平均值称为总体平均值μ,即:1.1.总体平均体平均值和和总体体标准偏差准偏差在消除了系统误差的情况下,μ即为真值xT(2)总体标准偏差 各次测量值对总体平均值μ的偏离用总体标准偏差σ表示:总体:在统计学中,将所研究对象的某特征值的全体称为总体(或母体)样本:自总体中随机抽取的一组测定值称为样本(或子样)样本容量:样本中所含测定值的数目,称为样本容量。
2.随机误差的正态分布 由于随机误差的存在,同一试样的多次平行测定所得数据不完全一致,即具有分散性,如果测定次数很多,且消除了系统误差的情况下,这些数据一般服从正态分布规律:测量数据的正态分布图测量数据的正态分布图从图中可以发现大量测量数据的分布规律:①在总体平均值μ附近,测量值x所对应的y值都比较大,当x=μ时,y值最大,这说明大部分的测量值集中在μ附近,即随机误差小的测量值出现的概率高② x偏离μ越远,y值就越小,说明大误差出现概率很小③正态分布曲线以x=μ的直线为轴,呈对称分布,说明正误差和负误差出现的概率相等随机误差μ出现的区间 (以σ为单位)测量值x出现的区间概 率 p(-1,+1)(μ-1σ, μ+1σ)68.3%(-2,+2)(μ-2σ, μ+2σ) 95.5%(-3,+3)(μ-3σ, μ+3σ) 99.7%随机误差在某些区间出现的概率 因此,在实际工作中,如果多次重复测定中的个别数据的误差的绝对值大于3σ,则这个极端值可以舍去 根据随机误差的分布规律,为了减小随机误差,定量分析时应该多做几次平行测定并取其平均值作为分析结果,这样正负随机误差可以相互抵消。
在消除了系统误差的情况下,平均值比任何一次测量值都更接近真值3.随机误差的t分布t t分布曲线分布曲线 对于有限次数测量,随机误差服从t分布: 统计量t用于补偿以s代替σ、以 估计μ引起的误差t值大小与测定次数和置信度有关置信度P:测定值在某一范围内出现的概率显著性水平α:测定值落在此范围之外的概率,α=1-P 4.平均值的置信区间 定量分析时,可以通过有限次数测量的样本平均值 来估计总体平均值μ可能存在的区间: 该式表示在某一置信度下,以平均值 为中心,能够包含真值的范围, 称为平均值的置信区间常作为分析结果的表达式5.不确定度 置信区间是在仅考虑随机误差的情况下对真值存在区间的估计当考虑系统误差的影响时,分析结果的表达式应写作: 式中U即为测量不确定度,通常用标准偏差、标准偏差的倍数或说明了置信度的区间的半宽度来表示二、可疑二、可疑值的取舍的取舍l 如果确知可疑值是由实验差错引起的,可以舍去;l 否则,应进行统计检验决定取舍多次测定可能出现离群值(异常值、可疑值)常用的统计检验方法有Q检验法、4d法、Grubbs法等。
1. Q检验法 (3≤ n≤ 10)(1) 将测定值按递增顺序排列:x1,x2,…,xn(2) 求最大与最小值之差(极差)xn-x1(3) 求出可疑值与其相邻值之差xn-xn-1或x2-x1(5) 依据 n 和要求的置信度,查表1-4得Q表,Q≥Q表,该可疑值应舍去,否则应保留4) 求出 或(1)求可疑值除外的其余数据的平均值和平均偏差;(2)若 ,则舍去,否则保留 用该法取舍数据误差大,但比较简单,不必查表,故处理一些要求不高的实验,仍为人们所用2. 2. 检验法检验法*三、分析结果的可靠性检验 不同分析人员、不同实验室或采用不同方法对同一试样进行分析,所得结果之间会存在一定差异,这时需要用统计方法来检验分析结果之间是否存在实质性差异,这一过程称为显著性检验显著性检验的基本方法是首先计算一个统计量,然后将计算值与查表所得临界值进行比较如果统计量的计算值小于临界值,表示两组分析结果的差异并不显著,这种差异仅来源于随机误差;反之,则表示两组结果间存在显著性差异,即除了随机误差外,应该还存在系统误差。
分析化学中常用的显著性检验有F检验法和t检验法1. 1. F F检验法法 F检验法用于检验两组数据的精密度是否存在显著性差异 统计量F为两组数据标准方差的比值,规定大的方差为分子,小的方差为分母: 按照置信度和自由度查表2-5,得到F表值,比较 F计和F表,如果F计>F表,则认为两组数据的精密度存在显著性差异,否则不存在显著性差异参见例5、例6 2.2.t t检验法法 为了检验一种分析方法是否可靠,常用标准试样进行试验,将测定结果的平均值 与标准值μ比较,按下式求出t值: t检验法用于检验两个不同来源的数据是不是存在着显著性差异 (1)平均值与标准值比较平均值与标准值比较 根据测定次数和所要求的置信度,从表2-3查出相应的t表 ,若t计>t表,则平均值与标准值之间有显著性差异,即被检验的方法存在系统误差,若t计≤t表,则二者之间无显著性差异,被检验方法可以采用 参见例7 需要比较两种方法、两个实验室或两个操作人员对相同试样的测定结果时,也可以用t检验法,但在比较之前应首先确认二者的精密度是否存在显著性差异,即首先进行F检验,确认无显著差异后,再进行t检验。
此时,先按下式计算两组实验数据的合并标准偏差s合:t t检验法法(2)两组数据平均值比较再计算t值: 查表2-3(总自由度 f=f1+f2=n1+n2-2)得t表,若t计> t表,则两组平均值有显著性差异,否则不存在显著性差异 参见例8 需要说明的是,即使二者存在显著性差异,也不能说明其中一组数据是否存在系统误差两组数据平均值比较一、有效数字一、有效数字(Significant Figure)(Significant Figure)及位数及位数 分析工作中实际能够测量得到的数字 在保留的有效数字中,只有最后一位数字是可疑的(有±1个单位的误差),其余的数字都是准确的1.有效数字的定义 定量分析中,为了获得准确的分析结果,不仅要准确进行各种测量,而且还要正确地记录和计算保留几位数字不是任意的有效数字=全部确定的数字+1位可疑数字第三节第三节 有效数字及其运算规则有效数字及其运算规则t = 14.55 ℃ t = 14.5 ℃± 0.1℃ ± 0.01℃ (有±1个单位的误差)有效数字概念14℃15℃14℃15℃有效数字=全部确定的数字+1位可疑数字 有效数字的位数反映了测量的相对误差,不能随意舍弃最后一位数字,也不可多估读可疑数字。
如:分析天平读数 0.3280 g 滴定管读数 23.21 mL有效数字概念(2) pH、pM等对数值,仅取决于小数部分数字位数1) 数据中的“0”作具体分析——在数字中间和后面均为有效数字;在前面只起定位作用2.2.有效数字位数的确定有效数字位数的确定如 1.0070 0.001007 0.01000如 pH=10.20 2位5位4位4位分析化学常用数值的有效数字位数质量(分析天平) 0.4370g 4位体积 (滴定管) 22.35mL 4位体积 (量筒) 10mL 2位标准溶液浓度 0.1000molL-1 4位被测组分含量 22.21% 4位偏差 0.23或0.3 1位或2位解离常数 1.8×10-5 2位pH值 4.30 2位二、有效数字的数字修约规则1.四舍六入五成双后面全为0时 ——后面不全为0时—— 一律进拟保留的末位数为奇数则进拟保留的末位数为偶数则舍 “5”按照GB/T 8170-2008进行2. 一次修约至所需位数,不能连续修约 将 4.138、4.183、 4.1500 、4.1501、4.2500 、4.0500修成两位,分别为 4.1、4.2、 4.2、4.2、4.2、4.0将2.3457修约成二位为2.32.3457 → 2.346 → 2.35 → 2.4有效数字的修约三、有效数字的运算规则(1)数据相加减时,结果应以小数点后位数最少者(绝对误差最大)为依据。
例: 12.27 + 7.2 + 1.134 = ? 有效数字表达=20.6 12.3 12.3 7. 7.2 2 + 1.1 + 1.1 20. 20.6 6 绝对误差: 0.01 0.1 0.001先修约,后计算! 12.2 12.27 7 7. 7.2 2 + 1.13 + 1.134 4 20. 20.604 604 例: 的结果计算器计算=0.011111458有效数字表达 = 0.0111 0.21334× 6.25 106670 42668 128004 1.3333750(2)数据相乘除时,结果应以有效数字位数最少者(相对误差最大)为依据② 数据运算过程中,可暂时多保留一位有效数字,得到最后结果再修约③倍数、常数等非测量数字,计算时不考虑其位数,结果有效数字位数由其它数字决定④误差、偏差的计算,一般保留1位,最多保留2位; pH值1或2位;各类化学平衡常数2或3位。
此外,在计算和取舍有效数字位数时还应注意:① 若某一数据第一位数字大于或等于8,计算时可多算一位例2:7.9936 ÷ 0.9967-5.02=8.0201-5.02=8.02-5.02=3.00例1:计算 的结果四、定量分析结果的表示方法四、定量分析结果的表示方法l 质量分数 ωB——固体试样l 质量浓度ρB——液体试样l 物质的量浓度c或滴定度T TA/B——标准溶液,4位有效数字l 体积分数φB ——气体试样l 微量组分: 以μg/g、mg/L等表示,不能使用ppm、ppb等单位高含量组分 >10% 4位中含量组分 1% ~10% 3位微含量组分 <1% 2位通常以此为标准报出分析结果1.分析结果的有效数字位数2.2.分析分析结果中果中待测组分的化学表示形式待测组分的化学表示形式①通常以待测组分实际存在形式的含量表示②如果待测组分的实际存在形式不清楚,常以氧化物或元素形式的含量表示③电解质溶液的分析结果常以所存在离子的含量表示3.3. 待测组分含量的表示方法待测组分含量的表示方法试样状态待测组分含量表示方法计算公式固体质量分数ωB液体物质的量浓度cB质量浓度ρB质量分数ωB体积分数φB气体体积分数φB总总 结结l本章知识结构图本章知识结构图l本章主要知识点本章主要知识点以下内容放到第九章!四、校准曲线的回归分析1. 一元线性回归方程的求法 若有n个测定数据(xi,yi),它们之间存在着线性关系,其回归直线方程可表示为:y=a+bx根据最小二乘法原理,通过实验数据可按下式求出a和b: 当a和b确定之后,一元线性回归方程及回归直线就确定了,利用该方程可以求得线性范围内试样测定值所对应的浓度。
2.相关系数 当r=1时,x、y之间完全线性相关,即y值完全取决于x与y的线性关系,所有实验点(xi,yi)均在回归直线上 当r=0时,x、y之间完全不存性关系 当0
