差异显著性检验 t检验
第二章第二章 差异显著性检验差异显著性检验1学习前概述学习前概述ØØ 本章学习目的本章学习目的本章学习目的本章学习目的ØØ 重点与难点重点与难点重点与难点重点与难点ØØ 学习方法学习方法学习方法学习方法ØØ 学习内容学习内容学习内容学习内容ØØ 参考文献参考文献参考文献参考文献ØØ 课后练习(作业)课后练习(作业)课后练习(作业)课后练习(作业):tjxyl2011_2012126.comtjxyl2011_2012126.com 2学习内容提示学习内容提示1 1一些相关的概念一些相关的概念一些相关的概念一些相关的概念2 2概率反证法(小概率实际不可能原则)概率反证法(小概率实际不可能原则)概率反证法(小概率实际不可能原则)概率反证法(小概率实际不可能原则)3 3显著性检验的意义显著性检验的意义显著性检验的意义显著性检验的意义4 4实例分析(实例分析(实例分析(实例分析(t t、检验)检验)检验)检验)5 5ExcelExcelExcelExcel数据分析方法数据分析方法数据分析方法数据分析方法3具体章节安排具体章节安排第一节:显著性检验意义第一节:显著性检验意义第一节:显著性检验意义第一节:显著性检验意义第二节:第二节:第二节:第二节:t t 检验(检验(检验(检验(ExcelExcelExcelExcel)第三节:方差分析(第三节:方差分析(第三节:方差分析(第三节:方差分析(F F 检验)(检验)(检验)(检验)(SASSASSASSAS软件学习)软件学习)软件学习)软件学习)第四节:不同专业可能涉及到的具体问题的相关实第四节:不同专业可能涉及到的具体问题的相关实第四节:不同专业可能涉及到的具体问题的相关实第四节:不同专业可能涉及到的具体问题的相关实例分析(案例介绍例分析(案例介绍例分析(案例介绍例分析(案例介绍 )4第一节显著性检验意义第一节显著性检验意义一、几个相关概念一、几个相关概念一、几个相关概念一、几个相关概念二、两种试验设计方案介绍二、两种试验设计方案介绍二、两种试验设计方案介绍二、两种试验设计方案介绍三、差异显著性检验三、差异显著性检验三、差异显著性检验三、差异显著性检验5一、几个相关概念一、几个相关概念1. 1. 总体与样本总体与样本ü 根据研究目的确定的研究对象的全体称为总体根据研究目的确定的研究对象的全体称为总体(population);ü 总体中的一个研究单位称为个体总体中的一个研究单位称为个体(individual);ü 含有有限个个体的总体称为有限总体;含有有限个个体的总体称为有限总体;ü 包含有无限多个个体的总体叫无限总体;包含有无限多个个体的总体叫无限总体;ü 总体的一部分称为样本总体的一部分称为样本(sample);ü 样本中所包含的个体数目叫样本容量或大小样本中所包含的个体数目叫样本容量或大小(sample size);ü 样本容量常记为样本容量常记为 n ,通常把,通常把n30的样本叫小样本,的样本叫小样本,n >30的样的样 本本叫大样本。叫大样本。6一、几个相关概念一、几个相关概念 总体与样本关系:总体与样本关系:ØØ假想总体假想总体假想总体假想总体ØØ统计分析的特点统计分析的特点统计分析的特点统计分析的特点 ØØ随机抽取随机抽取随机抽取随机抽取ØØ样本含量与代表性:样本含量与代表性:样本含量与代表性:样本含量与代表性:ØØ统计推断或者分析的不确定性统计推断或者分析的不确定性统计推断或者分析的不确定性统计推断或者分析的不确定性7一、几个相关概念一、几个相关概念2. 2. 参数与统计量参数与统计量 参数:参数: 由总体计算的特征数叫参数由总体计算的特征数叫参数(parameter)(parameter); 常用希腊字常用希腊字母表示参数,例如用母表示参数,例如用表示总体平均数,用表示总体平均数,用表示总体标准差;表示总体标准差; 统计量:由样本计算的特征数叫统计量统计量:由样本计算的特征数叫统计量( (staisticstaistic) ) 常用拉丁字母表示统计量,例如用常用拉丁字母表示统计量,例如用 表示样表示样本平均数,用本平均数,用 s 表示样本标准差。表示样本标准差。 参数与统计量的关系:参数与统计量的关系: 总体参数由相应的统计量来估计,例如用总体参数由相应的统计量来估计,例如用 估计估计,用,用 s 估计估计等。等。8一、几个相关概念一、几个相关概念3 3 误差、错误、系统误差、随机误差误差、错误、系统误差、随机误差误差误差: : 试验过程中非处理因素造成的观测值试验过程中非处理因素造成的观测值( (或者试验结果或者试验结果) )与真值之间的差异。与真值之间的差异。错误错误: : 指工作人员在试验过程中所犯的错误造成的真值与观测值间的差异。指工作人员在试验过程中所犯的错误造成的真值与观测值间的差异。 系统误差系统误差: : 又称为片面误差,由于试验又称为片面误差,由于试验 植物植物 土壤土壤 动物等的初始条件、药品的品动物等的初始条件、药品的品质、仪器的不准等因素引起的真值与观测指间的差异;质、仪器的不准等因素引起的真值与观测指间的差异; 通过努力可以克服通过努力可以克服系统误差;系统误差;随机误差:随机误差:随机误差又叫抽样误差随机误差又叫抽样误差(sampling error) (sampling error) ,这是由于许多无法控制的,这是由于许多无法控制的内在和外在的偶然因素所造成的真值与观测指间的差异;在试验中,即使十内在和外在的偶然因素所造成的真值与观测指间的差异;在试验中,即使十分小心也难以消除;随机误差影响试验的精确性;统计上的试验误差指随机分小心也难以消除;随机误差影响试验的精确性;统计上的试验误差指随机误差,这种误差愈小,试验的精确性愈高。误差,这种误差愈小,试验的精确性愈高。9一、几个相关概念一、几个相关概念4. 4. 频率与概率频率与概率 频率频率 某一随机事件或者现象出现的次数占总调查次数或者总试验次数的比值某一随机事件或者现象出现的次数占总调查次数或者总试验次数的比值概率概率 某一事件发生可能性的定量度量,是我们所观测到的频率的理论次数某一事件发生可能性的定量度量,是我们所观测到的频率的理论次数频率与概率的关系频率与概率的关系 频率相当于统计量,概率相当于参数,概率是频率的稳定值频率相当于统计量,概率相当于参数,概率是频率的稳定值10一、几个相关概念一、几个相关概念5. 5. 百分比与百分率百分比与百分率 百分比:是一种结构指标,表示事件占的比例,也就百分比:是一种结构指标,表示事件占的比例,也就是部分对全部之比是部分对全部之比 百分率百分率 是频率指标,表示事件出现的频率。是频率指标,表示事件出现的频率。 百分比与百分率的关系百分比与百分率的关系 为两种不同的统计指标。为两种不同的统计指标。11一、几个相关概念一、几个相关概念6. 6. 准确性与精确性准确性与精确性准确性准确性 由准确性由准确性(accuracy)(accuracy)也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。近的程度。精确性精确性 由精确性由精确性(precision)(precision)也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。的程度。准确性与精确性的关系准确性与精确性的关系 调查或试验的准确性、精确性合称为正确性;调查或试验的准确性、精确性合称为正确性; 精确性高,准确性不一定高;准确性高,精确性一定高;精确性高,准确性不一定高;准确性高,精确性一定高; 实际应用中,总体均值常未知,所以准确性不易度量,但利用统计方法可度量精确性。实际应用中,总体均值常未知,所以准确性不易度量,但利用统计方法可度量精确性。12一、几个相关概念一、几个相关概念7. 7. 农业和生物学领域的科学研究农业和生物学领域的科学研究13一、几个相关概念一、几个相关概念8. 8. 科学研究的基本方法科学研究的基本方法根据自己的观察根据自己的观察( (了解了解) )或前人的观察或前人的观察( (通过文献通过文献) )对所研究的命对所研究的命 题形成一种认识或假说;题形成一种认识或假说;根据假说所涉及的内容安排相斥性的试验或抽样调查;根据假说所涉及的内容安排相斥性的试验或抽样调查;根据试验或调查所获的资料进行推理,肯定或否定或修改假根据试验或调查所获的资料进行推理,肯定或否定或修改假 说,从而形成结论,或开始新一轮的试验以验证修改完善后的说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论逐步发展、深化假说,如此循环发展,使所获得的认识或理论逐步发展、深化14一、几个相关概念一、几个相关概念9. 9. 科学研究的基本过程科学研究的基本过程选题选题文献文献假说假说 假说的检验假说的检验 试验的规划与设计试验的规划与设计15一、几个相关概念一、几个相关概念10. 10. 试验方案(狭义的概念)试验方案(狭义的概念) 根据试验目的和要求所拟进行比较的一组试验处理根据试验目的和要求所拟进行比较的一组试验处理 (treatment)(treatment)的总称。的总称。 例例1 1:研究(某地)研究生入学考试中英语试题是否泄漏?:研究(某地)研究生入学考试中英语试题是否泄漏? 例例2 2:如何在三个不同小麦品种中选择一种在太谷县种植?:如何在三个不同小麦品种中选择一种在太谷县种植? 例例3 3:温度与作物病虫害的关系研究等:温度与作物病虫害的关系研究等16一、几个相关概念一、几个相关概念11. 11. 因素或因子因素或因子(factor)(factor) 被变动并设有待比较的一组处理的因子称为试验因素。被变动并设有待比较的一组处理的因子称为试验因素。 例例1. 1. 比较三种不同的降压药哪一种对降压效果最好。比较三种不同的降压药哪一种对降压效果最好。 A A、B B、C C 例例2 . 2 . 比较山西农业大学比较山西农业大学1010个专业的就业率高低个专业的就业率高低 例例3. 3. 不同水分条件玉米的产量情况如何不同水分条件玉米的产量情况如何17一、几个相关概念一、几个相关概念12. 12. 水平水平(level)(level) 试验因素的量的不同级别或质的不同状态称为水平试验因素的量的不同级别或质的不同状态称为水平 例例1. 1. 比较三种不同的降压药哪一种对降压效果最好。比较三种不同的降压药哪一种对降压效果最好。 A A、B|B|、C C 例例2 . 2 . 比较山西农业大学比较山西农业大学1010个专业的就业率高低个专业的就业率高低 例例3. 3. 不同水分条件玉米的产量情况如何不同水分条件玉米的产量情况如何 18一、几个相关概念一、几个相关概念1313. . 单因素试验单因素试验 指整个试验中只变更、比较一个试验因素的不同指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。水平,其他作为试验条件的因素均严格控制一致的试验。 19一、几个相关概念一、几个相关概念14 14 多因素试验多因素试验 指在同一试验方案中包含指在同一试验方案中包含2 2个或个或2 2个以上的试验因个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。致的试验。20一、几个相关概念一、几个相关概念15 15 综合性试验综合性试验 综合性试验中各因素的各水平不构成综合性试验中各因素的各水平不构成平衡平衡的处理的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。理组合。21一、几个相关概念一、几个相关概念16. 16. 试验指标与效应试验指标与效应1) 1) 用于衡量试验效果的指示性状称用于衡量试验效果的指示性状称试验指标试验指标。2) 2) 试验因素对试验指标所起的增加或减少的作用称为试验因素对试验指标所起的增加或减少的作用称为试验试验效应效应。 3) 3) 在同一因素内两种水平间试验指标的差值称在同一因素内两种水平间试验指标的差值称简单效应简单效应。 4) 4) 一个因素内各简单效应的平均数称平均效应,亦称主要一个因素内各简单效应的平均数称平均效应,亦称主要效应,简称效应,简称主效主效。 5) 5) 两个因素简单效应间的平均值差异称为交互作用效应,两个因素简单效应间的平均值差异称为交互作用效应,简称互作简称互作。22实例实例1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施氮施氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 23实例实例1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施氮施氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 试验方案试验方案24实例实例 1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施施氮氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 水平水平25实例实例 1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施施氮氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 试验指标试验指标26实例实例1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施施氮氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 试验效应试验效应简单效应简单效应900-700=20027实例实例1 小麦的施肥量试验小麦的施肥量试验(N)因素因素施施氮氮量(斤量(斤/ /亩)亩)水平水平20 30 20 30 产量指标(斤产量指标(斤/ /亩)亩)700 900 700 900 主效应主效应(900-700)/2=200/2=10028实例实例2 小麦的施肥量试验小麦的施肥量试验(N、P)因素因素水水 平(斤平(斤/ /亩)亩)水平组合(处理)水平组合(处理)指标:产量(斤)指标:产量(斤)施施N N量量N N1 1(20) N(20) N2 2(40)(40)N N1 1P P1 1 N N1 1P P2 2目的:选取最佳水目的:选取最佳水平组合平组合施施P P量量P P1 1(20) P(20) P2 2(40)(40)N N2 2P P1 1 N N2 2P P2 229实例实例2 小麦的施肥量试验小麦的施肥量试验(N、P)水平水平N N1 1N N2 2P P1 1500500800800P P2 290090012001200单因素试验单因素试验实例实例1 小麦的施肥量试验小麦的施肥量试验(N)多因素试验多因素试验综合试验综合试验N1 1P2 2、 N2 2P2 230实例实例2 小麦的施肥量试验小麦的施肥量试验(N、P)水平水平N N1 1N N2 2P P1 1500500800800P P2 290090012001200P的主效应的主效应N的主效应的主效应(500-900)+(800-1200) /2=- 400(800-500)+(1200-900) /2= 30031实例实例2 小麦的施肥量试验小麦的施肥量试验(N、P)水平水平N N1 1N N2 2P P1 1500500800800P P2 290090012001200两个因素简单两个因素简单效应间的平均效应间的平均值差异称为交值差异称为交互作用效应,互作用效应,简称互作简称互作互作效应互作效应(-400 - -400)/2=032一、几个相关概念一、几个相关概念* 17.平均数平均数 平均数是统计学中最常用的统计量,用来表平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位明资料中各观测值相对集中较多的中心位置,并且可作为资料的代表而与另一组资置,并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差料相比较,借以明确二者之间相差(或者差或者差异异)的情况。的情况。 平均数主要包括有:平均数主要包括有:3317.17.平均数平均数算术平均数(算术平均数(arithmetic meanarithmetic mean)中位数(中位数(medianmedian) 众数(众数(modemode)几何平均数(几何平均数(geometric meangeometric mean)调和平均数(调和平均数(harmonic meanharmonic mean)3417.17.平均数平均数算术平均数算术平均数 算术平均数是指资料中各观测值的总和除以观测算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数值个数所得的商,简称平均数或均数。 样本均值记为样本均值记为:总体均值记为总体均值记为:3517.17.平均数平均数l 算术平均数的计算算术平均数的计算 若样本较小,即资料包含的观察值个数不多,可若样本较小,即资料包含的观察值个数不多,可直接计直接计算算平均数。设一个含有平均数。设一个含有n个观察值的样本,其各个观察值个观察值的样本,其各个观察值为为x1、x2、x3、xn,则算术平均数由下式算得,则算术平均数由下式算得:3617.17.平均数平均数计算实例计算实例1 某种公牛站测得某种公牛站测得10头成年公牛的体重头成年公牛的体重分别为分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数),求其平均数3717.17.平均数平均数 加权法加权法加权法加权法 计算若干个来自同一总体的样本平均数的平均数计算若干个来自同一总体的样本平均数的平均数计算若干个来自同一总体的样本平均数的平均数计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等时,如果样本含量不等时,如果样本含量不等时,如果样本含量不等( (或者其总要性程度不同或者其总要性程度不同或者其总要性程度不同或者其总要性程度不同) ),也采用加权法计算,也采用加权法计算,也采用加权法计算,也采用加权法计算3817.17.平均数平均数算术平均数的重要特性算术平均数的重要特性样本各观察值与其平均数的差数样本各观察值与其平均数的差数(简称离均差简称离均差)的总和等于的总和等于0样本各观察值与其平均数的差数平方的总和,较各个观察值与任意其样本各观察值与其平均数的差数平方的总和,较各个观察值与任意其他数值的差数平方的总和为小,即对任意实数他数值的差数平方的总和为小,即对任意实数 a,均有下式成立,当且均有下式成立,当且仅当仅当a取样本均值时,等号成立取样本均值时,等号成立3917.17.平均数平均数总体平均数总体平均数4017.17.平均数平均数中位数中位数p 将资料内所有观测值从小到大依次排列,位于中间将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为的那个观测值,称为中位数,记为Md。p 当观测值的个数是偶数时,则以中间两个观测值的当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。时,中位数的代表性优于算术平均数。4117.17.平均数平均数l众数众数资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数 通过调查发现,通过调查发现,5050枚受精种蛋出雏天数次数分布中,以枚受精种蛋出雏天数次数分布中,以2222出现的次数最多,则该资料的众数为出现的次数最多,则该资料的众数为2222天天。4217.17.平均数平均数几何平均数几何平均数n 个观测值相乘之积开个观测值相乘之积开 n 次方所得的方根,称为几何次方所得的方根,称为几何平均数,记为平均数,记为G。它主要应用于畜牧业、水产业的生。它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析产动态分析,畜禽疾病及药物效价的统计分析 。 如如畜禽畜禽 、水产养殖的、水产养殖的 增长率,抗体的滴度,药物的效增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。平均数更能代表其平均水平。4317.17.平均数平均数调和平均数调和平均数资料中各观测值倒数的算术平均数资料中各观测值倒数的算术平均数 的倒数,的倒数,称为调和平均数,记为称为调和平均数,记为H4417.17.平均数平均数 对于同一资料:对于同一资料: 算术平均数算术平均数算术平均数算术平均数> >几何平均数几何平均数几何平均数几何平均数> >调和平均数调和平均数调和平均数调和平均数 上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。上述五种平均数,最常用的是算术平均数。4518. 18. 标准差标准差标准差的意义标准差的意义 用平均数作为样本的代表,其代表性的强弱受用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小还需引入一个表示资料中观测值变异程度大小的统计量的统计量。4618. 18. 标准差标准差常见的表示观测值变异程度的指标有:常见的表示观测值变异程度的指标有:全全距(极差)、标准差(方差)、变异系数距(极差)、标准差(方差)、变异系数4718. 18. 标准差标准差全距(极差)全距(极差)全距(极差)全距(极差)是表示资料中各观测值变异程度大是表示资料中各观测值变异程度大是表示资料中各观测值变异程度大是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的小最简便的统计量。但是全距只利用了资料中的小最简便的统计量。但是全距只利用了资料中的小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测最大值和最小值,并不能准确表达资料中各观测最大值和最小值,并不能准确表达资料中各观测最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅值的变异程度,比较粗略。当资料很多而又要迅值的变异程度,比较粗略。当资料很多而又要迅值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距速对资料的变异程度作出判断时,可以利用全距速对资料的变异程度作出判断时,可以利用全距速对资料的变异程度作出判断时,可以利用全距这个统计量。这个统计量。这个统计量。这个统计量。4818. 18. 标准差标准差标准差的意义标准差的意义为了准确地表示样本内各个观测值的变异程度为了准确地表示样本内各个观测值的变异程度 ,人们首先会,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,考虑到以平均数为标准,求出各个观测值与平均数的离差,( ) ,称为,称为离均差离均差。4918. 18. 标准差标准差标准差的意义标准差的意义 虽然离均差能表示一个观测值偏离平均数的性虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负质和程度,但因为离均差有正、有负 ,离均,离均差之和为零,即:差之和为零,即: 因而不能用离均差之和因而不能用离均差之和 来表示资料中所有观测值的总偏离程度。来表示资料中所有观测值的总偏离程度。5018. 18. 标准差标准差 我们还可以采用将离均差平方的办法来解决离均我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。差有正、有负,离均差之和为零的问题。 先求各个离均差平方:先求各个离均差平方: 再求离均差平方和:再求离均差平方和:5118. 18. 标准差标准差为了消除样本大小的影响,用平方和除以样本为了消除样本大小的影响,用平方和除以样本含量,求出离均差平方和的平均数。含量,求出离均差平方和的平均数。5218. 18. 标准差标准差 在统计学中,求离均差平方和的平均数时,分在统计学中,求离均差平方和的平均数时,分母不用样本含量母不用样本含量n,而用,而用自由度自由度的的df=n-1,于,于是,我们采用如下公式表示资料的变异程度。是,我们采用如下公式表示资料的变异程度。称为均方,又称样本方差,记为称为均方,又称样本方差,记为S25318. 18. 标准差标准差相应的总体参数叫总体方差相应的总体参数叫总体方差 ,记为,记为2 2。对。对于有限总体而言,于有限总体而言,2 2的计算公式为:的计算公式为:因此,求一组数据的均值与方差时,选用的公式与对数据的处理方式有关因此,求一组数据的均值与方差时,选用的公式与对数据的处理方式有关5418. 18. 标准差标准差由于样本方差带有原观测单位的平方单位,在仅表示一由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,个资料中各观测值的变异程度而不作其它分析时, 常需常需要与平均数配合使用,这时应将平方单位还原,即应求要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差出样本方差的平方根。统计学上把样本方差S2 的平方根的平方根叫做样本标准差,记为叫做样本标准差,记为S,即:,即:5518. 18. 标准差标准差公式变形过程公式变形过程5618. 18. 标准差标准差相应的总体参数叫总体标准差,记为相应的总体参数叫总体标准差,记为。对。对于有限总体而言,于有限总体而言,的计算公式为的计算公式为:在统计学中,常用样本标准差在统计学中,常用样本标准差 S 估计总体标准差估计总体标准差。5718. 18. 标准差标准差方差的计算方差的计算方差的计算方差的计算对于小样本,按照公式直接计算对于小样本,按照公式直接计算5818. 18. 标准差标准差实例:计算实例:计算1010棵树的高度:棵树的高度:450450,450450,500500,500500,500500,550550,550550,550550,600600,600600,650650(cmcm)的标准差)的标准差。 59标准差的特性标准差的特性 1) 标准差的大小,受资料中每个观测值的标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差影响,如观测值间变异大,求得的标准差也大,反之则小也大,反之则小60标准差的特性标准差的特性2)在计算标准差时,在各观测值加上或)在计算标准差时,在各观测值加上或减去一减去一 个常数,其数值不变。个常数,其数值不变。x1、x2、x3、xn样本样本1 X1-a 、x2-a、x3-a、xn-a样本样本2 S1=S261标准差的特性标准差的特性3 )当每个观测值乘以或除以一个常数当每个观测值乘以或除以一个常数a,则所得,则所得的标准差是原来标准差的的标准差是原来标准差的a倍或倍或1/a倍。倍。 x1、x2、x3、xn样本样本1 X1a 、x2a、x3a、xna样本样本2 aS1=S26219. 变异系数变异系数p变异系数是衡量资料中各观测值变异程度的另一变异系数是衡量资料中各观测值变异程度的另一个统计量。个统计量。p标准差与平均数的比值称为变异系数,记为标准差与平均数的比值称为变异系数,记为C·V。p变异系数可以消除单位和平均数不同对两个或多变异系数可以消除单位和平均数不同对两个或多个资料变异程度比较的影响个资料变异程度比较的影响。 63 19. 变异系数变异系数 实例实例 已知某良种猪场长白成年母猪平均体重为已知某良种猪场长白成年母猪平均体重为 190190kgkg, 标准差为标准差为10.510.5kgkg,而大约克成年母猪平均体重为,而大约克成年母猪平均体重为196196kgkg,标准差为,标准差为8.58.5kgkg,试,试问两个品种的成年母猪,那一个体重变异程度大。问两个品种的成年母猪,那一个体重变异程度大。 长白成年母猪体重的变异系数长白成年母猪体重的变异系数大约克成年母猪体重的变异系数大约克成年母猪体重的变异系数所以,长白成年母猪体重的变异程度大于大约克成年母猪所以,长白成年母猪体重的变异程度大于大约克成年母猪6419. 变异系数变异系数例例2 10 只大象与只大象与10只小白鼠的体重如下:只小白鼠的体重如下:大象大象(吨吨): 小白鼠小白鼠(克克): 均值:均值:均值:均值:大象:大象:大象:大象:2.812.81(吨)(吨)(吨)(吨)小白鼠:小白鼠:小白鼠:小白鼠:369.4369.4(克)(克)(克)(克)标准差:标准差:标准差:标准差:大象:大象:大象:大象:0.760.76(吨)(吨)(吨)(吨)小白鼠:小白鼠:小白鼠:小白鼠:117.80117.80(克)(克)(克)(克)变异系数:变异系数:变异系数:变异系数:大象:大象:大象:大象:0.270.27小白鼠:小白鼠:小白鼠:小白鼠:0.320.326519. 变异系数变异系数例例3 10 名同学的身高与体重数据如下:名同学的身高与体重数据如下:身高身高(cm): 体重体重(kg):均值:均值:均值:均值:身高:身高:身高:身高:169.9169.9(cmcm)体重:体重:体重:体重:6868(kgkg)标准差:标准差:标准差:标准差:身高:身高:身高:身高:10.3110.31(cmcm)体重:体重:体重:体重:10.5710.57(kgkg)变异系数:变异系数:变异系数:变异系数:身高:身高:身高:身高:0.060.06体重:体重:体重:体重:0.160.166619. 变异系数变异系数注意:注意: 变异系数的大小,同时受平均数和标准差两变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标示资料的变异程度时,最好将平均数和标准差也列出准差也列出。67作业、连续见作业、连续见 邮箱:邮箱: tjxyl2011_2012126.com68