好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第3章实验数据整理.doc

21页
  • 卖家[上传人]:hh****pk
  • 文档编号:289200190
  • 上传时间:2022-05-07
  • 文档格式:DOC
  • 文档大小:330.50KB
  • / 21 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第3章实验数据整理3.1数据处理中常用的几个概念总体、个体与子样是数理统计学常用的几个概念,而实验数据处理有好多内 容是数理统计方法的应用,因此也常用到这些概念我们把研究对象的全体称为总体(或母体);而研究对象的一个单体称为个体 抽选的个体的集合体,在数理统计中称为子样(或样本)每个子样所包含的个体数目,通常称为(子样)容量子样元素的某一特性指标称为子样值如上面说的每一次测定长度值就是子 样值3.2子样的均值与标准差表示数据集中性常用的是算术平均值1 无=_£兀表示数据离散程度常用的是方差子样元素值与子样平均值之偏差的平方和的平均值,即1 齐b =—工(兀-兀)2 (3.1)n /=1称为子样方差子样方差的开平方为子样标准差,即式(2.13)= 为了得到总体方差的无偏估计量(参见下V « /=!一节),必须对子样方差(3・1)式作点修改,即用bl来代替式(3.1)中的77,并记为即52(3.2)&称为子样修正方差相应地有子样修正标准差式(2.14),即S =习惯上,经常把&和S分别叫做子样方差和子样标准差(或简称标准差)本书 在后面的叙述中,也采用这种说法3.3均值与方差的点估计在实际问题中,根据子样的数据,计算出的子样特征数壬与S?,通常用来作 为相应总体特征数的估计量。

      对于服从正态分布的总体,均值为",方差为云(参 见1.6节)当子样是从一正态分布的总体中随机抽出的一部分时,可用子样平均值无去估计该总体的均值〃,而用子样方差炉去估计总体方差云,这在数理统计 中称为点估计,即(3.3)(3.4)其中“小为估计量的符号用子样特征数去估计总体特征数,很重要的一点是 前者为后者的无偏估计量也就是说,当我们用元作为〃或用S?作为肝时,子 样特征数应满足这样的要求,即它的数学期望(统计平均)应当等于它所估计的参 数本身,即E(可* (3.5)E(S2) = a2 (3.6)这个要求称为无偏性我们通常计算的算术平均值是满足这个要求的根据概率论中数学期望的性 质,有1 I nE(元)=E(_ 工兀)=_工[£(兀)] (3.7)“=1 “ 77由于心也…,尢相互独立,都是随机变量无的估计值,因此,我们可把子样 值尢看成是一随机变量,且与随机变量x有相同的理论分布和理论均值〃于是, 式(3・7)变为(3.8)至此,式(3.5)得证该式表明,子样均值无是总体均值〃的一个无偏估计量子样平均值可作为总体均值〃的最佳估计值,这只给岀了问题的一个方面 一般地说,子样均值元并不等于总体均值〃。

      换句话说,用元去估计〃是有误差的 人们往往对这一方面也是很关心的所以有必要介绍以下平均值的标准差下面我们根据概率论中方差的性质来进行推导:[门 1 ” 1 H(3.11)/(元)=庆(一£不)== — Jcr2(x,) 〃铝 rr 铝 力铝由于也,疋,…,不相互独立,都是随机变量x的估计值,与随机变量兀具有相同的分布和理论方差oh因此,式(3.11)变为:1 H

      这就意味着,要把更多的精力用来改进测试技术,往往比重 复老一套的测试精度不高的测量更有意义因此,在实际测定某一量时,由于多 方面条件的限制,重复测定的次数〃很少超过50次,一般在4〜20次左右下面我们来证明式(3.6),由式(3.2)1 " 1 "S2=—工(兀一可 2 =— ^[(X,.-//)-(X-//)]272 - 1 育 〃 - 1 気同式(3.10)的推导类似,有52 =亠[亍(兀一“)2 - A)2] (3.15)〃一1気根据概率论中数学期望的性质、方差的定义及式(3.12),有[££(兀一“)2—〃£(元一“)2]/=1=亠{£Q兀 一 ES)|2 — nE{X-E(x)]2}=——[/1CT2(X)一 77CF2(元)]n-11 r 2/ \ (尢) 2 / \ 2= [na (x) ] =(J (x) = an 一 1 n由于y的估计量S?的数学期望,等于被估计参数/的本身,这就证明了 S?是的无偏估计量3.4平均值与标准差的算法1.计算标准差的导出公式法用直接公式法需要先计算出算术平均值,然后才能计算出标准差实际上,1n 一 1我们可以导出n为(才-2兀无+元2)/=1占》I乎+閒=占字一应)(3.19)或者写成(3.20)相应地,由式(2」3)可以导出"牡pF)(3.21)或者写成1 “ 1 91— J-[£兀;—(亍兀J?] (3.22) A /=! 几 /=!通常为了提高计算的精度,避免由于计算平均值元带来的舍入误差,在计算标准差S时,可采用(3.20)式。

      这种方法为导出公式法2.平均值与标准差的Excel算法用Excel计算平均值与标准差是相当简单的,可直接用工作表函数计算 平均值用函数AVERAGE ()(见2.2.2节);计算标准差用函数STDEV ()(见 2.3节)如用Excel计算例3-3数据的平均值与标准差:在一个工作表的B2:B11单元格区域输入原始数据2.71,2.76,……,2.74;接着操作:C2: =AVERAGE(B2:B11), C3: =STDEV(B2:B11),分别显示结果为 2.784 和 0.03063.5均值的置信区间及其Excel程序3.5.1计算均值的置信区间的方法用相同的方法重复测定某一量,在消除系统误差的情况下,测定值的算术平 均值(子样平均值),可作为这个量的真值“(即总体均值,以下简称真值或均值) 的估计值〃测定次数愈多,即子样容量n愈大,平均值与真值就愈接近当 测定次数为无穷时,平均值就是这个量的真值当然,实际上测定无穷多次是做 不到的我们可以根据有限次测定数据的平均值元去估计真值“,这就是本章第 三节提到的均值点估计问题如果测定数据服从或接近服从正态分布,可以证明 这种估计是相当好的。

      但毕竟是元工“那么子样平均值与总体均值到底相差多 少呢?这就需要估计其误差我们令均值〃的估计量元的误差的绝对值为 £=1无一“丨 (3.23)由于估计量4 =工是由于样值计算出的统计量,故元也是一随机变量同例2-2 类似,我们可以找到一种方法,求估计误差位于某一区间的概率;或者反过来, 可以给定这个概率,求出估计的误差范围这后一个问题,正是本节所耍讨论的,•A£i只是问题的提法不同我们给岀一个置信概率(或称置信度),求总体均 值在这个置信概率下的所在范围(区间),这个范围称为置信区间可以用下式表示“的估计量元,即P[\x-/j\>£} = a或等价地写成P{\x- =再进一步写成P{x-£< = \-a置信区间表示估计结果的精确程度,置信概率则表示估计结果的可靠程度为了确定均值“在某一置信概率下的置信区间,需要计算式(3.26)中的£这 里需引入一个新的变量心二(3.27)S/4n S结合算术平均值的标准差的计算式(3.14),上式可写成£ = (3.31a)对应置信概率(1・Q)的均值〃的置信区间是(元-,元+ S"aj)科学工作者常把置信区间表示为 “二元 土 -ta f (3.33)于是,对于上式,我们可以通俗地说成“用子样平均值元去估计真值",有 100(1-(7)%的把握说,其误差为(S"°j)”。

      利用附录E-2,可以查到对应已给的置信概率(IV)、自由度f=n-\的⑺的 值,从而求得均值〃的置信区间具体做法如下:(1)问题给出:原始数据,子样容量4置信概率(1-O)o⑵由<7、4 = n-l)查附录E-2,得:厂(3)有原始数据计算平均值元和标准差S⑷计算£5)写出置信区间(元-元+ £),或者写成“二元±£,并标明置信概率例3-5为检验某一河流中鱼被汞污染的情况,从一批鱼中随机抽取一些 鱼样,测定鱼组织中的汞含量,得到测定结果如T(ppm): 2.06, 1.93, 2.12, 2.16, 1.89, 1.95,试从测定数据估计这批鱼汞含量的范围解:取置信概率为0.95,即(3.24)(3.25)(3.26)(3.31)1-(7= 0.95,An-1=6-1=5查附录B-2得Ct= 0.05'o.o5,5=2・57由原始数据6为兀=12.11 ,/=!1 ” ]x=-yxy =(-)(12.11) = 2.01872苗 6"1 1 7——[24.5031-(-X12.il)2 ] = 0.11 6 — 1 63.5.2计算均值的置信区间的Excel程序6工# = 24.5031, /=1卄-1铝 “铝 V "S/t°g5=(器)(2.57) = 0.12所以,这批鱼的汞含量范围为x±£j =2.02±0.12由计算结果,我们可以说“根据这次试验,有95%的把握说,这批鱼的汞 含量在1.90〜2・14ppm之内”。

      1.有关函数(l)t分布函数TINVo功能:返回作为概率和自由度函数的t分布的t值 语法:TINV(probability,degrees_freedom) probability 为对应于双尾-t分布的概率示例:TINV(0.054645,60)等于 1.9602.程序1用Excel计算均值的置信区间通用程序本书从现在开始陆续介绍一些非常简单、实用的用Excel进行数据处理的 程序,这里所说的程序有别于常规程序设计语言所编写的程序,只是在工作表的 有关单元格中输入公式、数据和文字,在使用时,输入将要处理的数据立即显示 出全部数据的处理结果这种程序的编写不需要掌握专门的程序设计语言知识, 只要了解一些Excel的基础就行了下面就介绍程序1——用Excel计算均值 的置信区间通用程序首先在你的计算机中建立一个名为“数据处理Excel程序”的文件夹(用来 存放所有的数据处理Excel程序);进入Excel,将打开的工作簿以“程序1” 为文件名保存在“数据处理Excel程序”的文件夹下然后在工作表Sheet 1中进行下面的操作命名:名称 在“引用位置”栏填入内容 f =$C$4。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.