
平均数标准差与变异系数.ppt
50页平均数、标准差与变异系平均数、标准差与变异系数数 第一节第一节 平均数平均数 平均数是统计学中最常用的统计量,用来表明资平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置平均数主料中各观测值相对集中较多的中心位置平均数主要包括有:要包括有: 算术平均数算术平均数((arithmetic mean)) 中位数中位数((median)) 众数众数((mode)) 几何平均数几何平均数((geometric mean)) 调和平均数调和平均数((harmonic mean)) 一、算术平均数一、算术平均数 算术平均数算术平均数是指资料中各观测值的总和除是指资料中各观测值的总和除以观测值个数所得的商,简称以观测值个数所得的商,简称平均数或均数平均数或均数,,记为 算术平均数可根据样本大小及分组情况而算术平均数可根据样本大小及分组情况而采用直接法或加权法计算采用直接法或加权法计算。
(一一)直接法直接法 主要用于样本含量主要用于样本含量n≤30以下、未经分组资以下、未经分组资料平均数的计算料平均数的计算 设某一资料包含设某一资料包含n个观测值:个观测值: x1、、x2、、…、、xn,, 则样本平均数可通过下式计算:则样本平均数可通过下式计算: 其中,其中,Σ为总和符号;为总和符号; 表示从第一个观测值表示从第一个观测值x1累加到第累加到第n个观测值个观测值xn当当 在意义上已明确时,在意义上已明确时,可简写为可简写为Σx,(,(3-1))式可改写为:式可改写为: 【【例例3.1】】 某种公牛站测得某种公牛站测得10头成年公牛的体重头成年公牛的体重分别为分别为500、、520、、535、、560、、585、、600、、480、、510、、505、、490((kg),),求其平均数。
求其平均数 由于由于 Σx=500+520+535+560+58 +600+480+510+505+49 =5285,, n=10 得:得: 即即10头种公牛平均体重为头种公牛平均体重为528.5 kg (二)加权法(二)加权法 对于样本含量对于样本含量 n≥30 以上且已分组的资料,可以以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算在次数分布表的基础上采用加权法计算平均数,计算公式为:公式为: 式中:式中: —第第i组的组中值;组的组中值; —第第i组的次数;组的次数; —分组数分组数 第第i组的次数组的次数fi是权衡第是权衡第i组组中值组组中值xi在资料中在资料中所占比重大小的数量,因此将所占比重大小的数量,因此将fi 称为是称为是xi的的“权权”,加权法也由此而得名。
加权法也由此而得名 【【例例3.2】】 将将100头长白母猪的仔猪一月窝头长白母猪的仔猪一月窝重(单位:重(单位:kg))资料整理成次数分布表如下,资料整理成次数分布表如下,求其加权数平均数求其加权数平均数 表表3—1 100头长白母猪仔猪一月窝重次数分布表头长白母猪仔猪一月窝重次数分布表 利用(利用(3—2)式得:)式得: 即这即这100头长白母猪仔猪一月龄平均窝重为头长白母猪仔猪一月龄平均窝重为45.2kg 计算若干个来自同一总体的样本平均数的计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权平均数时,如果样本含量不等,也应采用加权法计算 【【例例3.3】】 某牛群有黑白花奶牛某牛群有黑白花奶牛 1500头,头,其平均体重为其平均体重为750 kg ,而另一牛群有黑白花,而另一牛群有黑白花奶牛奶牛1200头,平均体重为头,平均体重为725 kg,,如果将这两如果将这两个牛群混合在一起,其混合后平均体重为多少个牛群混合在一起,其混合后平均体重为多少?? 此例两个牛群所包含的牛的头数不等,要此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权群牛的头数为权,求两个牛群平均体重的加权平均数,即平均数,即 即两个牛群混合后平均体重为即两个牛群混合后平均体重为738.89 kg。
(三)平均数的基本性质(三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,、样本各观测值与平均数之差的和为零,即即离均差之和等于零离均差之和等于零 或简写成或简写成 2、样本各观测值与平均数之差的平方和为最小,、样本各观测值与平均数之差的平方和为最小,即即离均差平方和为最小离均差平方和为最小 (xi- )2 < (xi- a)2 (常数(常数a≠ )) 或简写为:或简写为: < 对于总体而言,通常用对于总体而言,通常用μ表示总体平均数,有限表示总体平均数,有限总体的平均数为:总体的平均数为: 式中,式中,N表示总体所包含的个体数表示总体所包含的个体数 当一个统计量的数学期望等于所估计的总当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的体参数时,则称此统计量为该总体参数的无偏无偏估计量估计量。
统计学中常用样本平均数(统计学中常用样本平均数( )作为总体平)作为总体平均数(均数(μ))的估计量,并已证明样本平均数是的估计量,并已证明样本平均数是总体平均数总体平均数μ的无偏估计量的无偏估计量 二、中位数二、中位数 将资料内所有观测值从小到大依次排列,位将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为于中间的那个观测值,称为中位数,记为Md 当观测值的个数是偶数时,则以中间两个观当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数当所获得的数据资料测值的平均数作为中位数当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数呈偏态分布时,中位数的代表性优于算术平均数 中位数的计算方法因资料是否分组而有所不中位数的计算方法因资料是否分组而有所不同 (一)未分组资料中位数的计算方法(一)未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大对于未分组资料,先将各观测值由小到大依次排列依次排列 1、当观测值个数、当观测值个数n为奇数时,为奇数时,(n+1)/2位置位置的观测值,即的观测值,即x(n+1)/2为中位数:为中位数: Md= 2、、当观测值个数为当观测值个数为 偶偶 数数 时时 ,, n/2和和((n/2+1))位置的两个观测值之和的位置的两个观测值之和的1/2为中位为中位数,即:数,即: 【【例例3.4】】 观察得观察得9只西农莎能奶山羊的只西农莎能奶山羊的妊娠天数为妊娠天数为 144 、、 145、、 147、、 149、、150、、151、、153、、156、、157,求其中位数。
求其中位数 此例此例 n=9,,为奇数,则:为奇数,则: Md= =150((天)天) 即西农莎能奶山羊妊娠天数的中位数为即西农莎能奶山羊妊娠天数的中位数为150天 【【例例3.5】】 某犬场发生犬瘟热,观察得某犬场发生犬瘟热,观察得10只只仔犬发现症状到死亡分别为仔犬发现症状到死亡分别为7、、8、、8、、9、、11、、12、、12、、13、、14、、14天,求其中位数天,求其中位数 此例此例n=10,,为偶数,则:为偶数,则: 即即10只仔犬从发现症状到死亡天数的中位只仔犬从发现症状到死亡天数的中位数为数为11.5天 (二)已分组资料中位数的计算方法(二)已分组资料中位数的计算方法 若资料已分组,编制成次数分布表,则可利用次数分布表若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:来计算中位数,其计算公式为: 式中:式中:L — 中位数所在组的下限;中位数所在组的下限; i — 组距;组距; f — 中位数所在组的次数;中位数所在组的次数; n — 总次数;总次数; c — 小于中数所在组的累加次数。
小于中数所在组的累加次数 【【例例3.6】】 某奶牛场某奶牛场68头健康母牛从分娩到第一头健康母牛从分娩到第一次发情间隔时间次发情间隔时间 整理成次数分布表如表整理成次数分布表如表 3—2 所示,所示,求中位数求中位数 表表3—2 68头母牛从分娩到第一次发情间隔时间头母牛从分娩到第一次发情间隔时间 次数分布表次数分布表 由表由表3—2可见:可见:i=15,,n=68,,因而中位数因而中位数只能在累加头数为只能在累加头数为36所对应的所对应的“57—71”这一这一组,于是可确定组,于是可确定L=57,,f=20,,c=16,,代入公代入公式(式(3—5)得:)得: 即奶牛头胎分娩到第一次发情间隔时间的即奶牛头胎分娩到第一次发情间隔时间的中位数为中位数为70.5天三、几何平均数三、几何平均数 n 个观测值相乘之积开个观测值相乘之积开 n 次方所得的方根,次方所得的方根,称为称为几何平均数几何平均数,记为,记为G。
它主要应用于畜牧它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析效价的统计分析 如畜禽如畜禽 、水产养殖的、水产养殖的 增长增长率,抗体的滴度,药物的效价,畜禽疾病的潜率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代伏期等,用几何平均数比用算术平均数更能代表其平均水平其计算公式如下:表其平均水平其计算公式如下: 为了计算方便,可将各观测值取对数后相为了计算方便,可将各观测值取对数后相加除以加除以n,得,得lgG,,再求再求lgG的反对数,即得的反对数,即得G值,即值,即 【【例例3.7】】 某波尔山羊群某波尔山羊群1997—2000年各年年各年度的存栏数见表度的存栏数见表3—3,试求其年平均增长率试求其年平均增长率 表表3—3 某波尔山羊群各年度存栏数与增长率某波尔山羊群各年度存栏数与增长率 利用(利用(3—7)式求年平均增长率)式求年平均增长率 G= =lg-1[((-0.368-0.398–0.602))] =lg-1((-0.456))=0.3501 即年平均增长率为即年平均增长率为0.3501或或35.01%。
四、众四、众 数数 资料资料 中出现次数最多的那个观测值或次数最多一中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为组的组中值,称为众数,记为M0 如表如表2-3 所列所列 的的 50枚受精种蛋出雏天数次数分布枚受精种蛋出雏天数次数分布中,以中,以22出现的次数最多,则该资料的众数为出现的次数最多,则该资料的众数为22天 又如又如 【【例例3.6】】 所所 列列 出出 的的 次数分布表中,次数分布表中,57—71这一组次数最多,其组中值为这一组次数最多,其组中值为64天,则该资天,则该资料的众数为料的众数为64天 五、调和平均数五、调和平均数 资料中各观测值倒数的资料中各观测值倒数的 算术平均数算术平均数 的倒数,的倒数,称为调和平均数称为调和平均数,记为,记为H,即,即 调和平均数主要用于反映畜群不同阶段的调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。
平均增长率或畜群不同规模的平均规模 【【例例3.8】】 某保种牛群不同世代牛群保种的规模分某保种牛群不同世代牛群保种的规模分别为:别为:0世代世代200头,头,1世代世代220头,头,2世代世代210头;头; 3世代世代190头,头,4世代世代210头,试求其平均规模头,试求其平均规模 利用(利用(3—9)式求平均规模:)式求平均规模: 即保种群平均规模为即保种群平均规模为208.33头 对于同一资料:对于同一资料: 算术平均数算术平均数>几何平均数几何平均数>调和平均数调和平均数 上述五种平均数,最常用的是算术平均数。
上述五种平均数,最常用的是算术平均数第二节第二节 标准差标准差 一、标准差的意义一、标准差的意义 用平均数作为样本的代表,其代表性的强用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响仅弱受样本资料中各观测值变异程度的影响仅用平均数对一个资料的特征作统计描述是不全用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程面的,还需引入一个表示资料中观测值变异程度大小的统计量度大小的统计量 全距(极差)全距(极差)是表示资料中各观测值是表示资料中各观测值变异程度大小最简便的统计量但是全距变异程度大小最简便的统计量但是全距只利用了资料中的最大值和最小值,并不只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,能准确表达资料中各观测值的变异程度,比较粗略当资料很多而又要迅速对资料比较粗略当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这的变异程度作出判断时,可以利用全距这个统计量个统计量 为为 了了 准准 确确 地地 表示样本内各个观测值的变异表示样本内各个观测值的变异程度程度 ,人们,人们 首首 先会考虑到以平均数为标准,求先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(出各个观测值与平均数的离差,( )) ,称,称为为离均差离均差。
虽然离均差能表示一个观测值偏离平均数的虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负性质和程度,但因为离均差有正、有负 ,离均,离均差之和差之和 为零,即(为零,即( )) = 0 ,因,因 而而 不不 能能 用用离均差之和离均差之和Σ(( )来)来 表表 示示 资料中所有观测资料中所有观测值的总偏离程度值的总偏离程度 为了解决离均差有正为了解决离均差有正 、有负,离均差之、有负,离均差之和为零的问和为零的问 题题 ,, 可先求可先求 离离 均均 差的绝差的绝 对对 值值 并并 将将 各各 离离 均均 差差 绝对绝对 值值 之之 和和 除以除以 观观 测测 值值 个个 数数 n 求求 得得 平平 均均 绝绝 对对 离差,即离差,即Σ| |/n虽然平均绝对离差可以表示资料中各虽然平均绝对离差可以表示资料中各观测值的变异程度观测值的变异程度 ,但由于平均绝对离差,但由于平均绝对离差包含绝对值符号包含绝对值符号 ,使用很不方便,在统计,使用很不方便,在统计学中未被采用学中未被采用。
我们还可以采用将离均差平方的办法来解决我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题离均差有正、有负,离均差之和为零的问题 先将各先将各 个离个离 均差平方,即均差平方,即 ( )2 ,再求,再求 离离均差平方和均差平方和 ,, 即即 ,简称,简称平方和平方和,记为,记为SS;; 由由 于于 离差平方和离差平方和 常常 随随 样样 本本 大大 小小 而而 改改 变变 ,为,为 了了 消消 除除 样样 本大小本大小 的的 影影 响响 ,, 用平方用平方和和 除除 以以 样样 本本 大大 小,小, 即即 ,求出离均差,求出离均差平方和的平均数平方和的平均数 ;; 为了使所得的统计量是相应总体参数的无为了使所得的统计量是相应总体参数的无 偏偏估计量,统计学证明,在求离均差平方和的平均估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量数时,分母不用样本含量n,,而用自由度而用自由度 n-1,, 于是,我们于是,我们 采采 用统计量用统计量 表示资料的表示资料的变异程度。
变异程度 统计量统计量 称称 为为 均均 方方 (( mean square缩写为缩写为MS)),又称又称样本方差样本方差,记为,记为S2,,即即 S2= 相应的总体参数叫相应的总体参数叫 总体方差总体方差 ,记,记为为σ2对于有限总体而言,对于有限总体而言,σ2的计算的计算公式为:公式为: 由于由于 样本方差样本方差 带有原观测单位的带有原观测单位的 平平方单位,在仅表示一个资料中各观测值的方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时变异程度而不作其它分析时 ,, 常需要与常需要与平均数配合使用平均数配合使用 ,这,这 时应时应 将平方单位还将平方单位还原,即应求出样本方差的平方根统计学原,即应求出样本方差的平方根统计学上把样本方差上把样本方差 S2 的平方根叫做的平方根叫做样本标准样本标准 差差,记为,记为S,,即:即: 由于由于 所以上式可改写为:所以上式可改写为: 相应的总体参数叫相应的总体参数叫总体标准差总体标准差,记为,记为σ。
对于有限总体而言,对于有限总体而言,σ的计算公式为:的计算公式为: 在统计学中,常用样本标准差在统计学中,常用样本标准差S估计估计总体标准差总体标准差σ 二、标准差的计算方法二、标准差的计算方法 (一)直接法(一)直接法 对于未分组或小样本资料对于未分组或小样本资料 ,, 可直可直接利用(接利用(3—11)或()或(3-12)式来计算)式来计算标准差 【【例例3.9】】 计算计算10只辽宁绒山羊产绒量:只辽宁绒山羊产绒量: 450,, 450,, 500,, 500,, 500,,550,, 550,, 550,, 600,, 600,,650((g))的标准差的标准差 此例此例n=10,,经计算得:经计算得:Σx=5400,,Σx2=2955000,,代入(代入(3—12)式得:)式得: 即即10只辽宁绒山羊产绒量的只辽宁绒山羊产绒量的 标准差标准差 为为65.828g (二)加权法(二)加权法 对于已制成次数分布表的大样本资料,可对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。
计利用次数分布表,采用加权法计算标准差计算公式为:算公式为: 式中,式中,f为各组次数;为各组次数;x为各组的组中值;为各组的组中值;Σf = n为总次数为总次数 【【例例3.10】】 利用某纯系蛋鸡利用某纯系蛋鸡200枚蛋重资料枚蛋重资料的次数分布表(见表的次数分布表(见表3-4)计算标准差计算标准差 将表将表3-4中的中的Σf、、Σfx、、 代入(代入(3—14)式)式得:得: 即某即某 纯纯 系系 蛋蛋 鸡鸡200枚枚 蛋蛋 重的标准差为重的标准差为3.5524g 表表3—4 某纯系蛋鸡某纯系蛋鸡200枚蛋重资料次数分布枚蛋重资料次数分布 及标准差计算表及标准差计算表 三、标准差的特性三、标准差的特性 (一)(一)标准差的大小,受资料中每个观测值的影响,标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。
如观测值间变异大,求得的标准差也大,反之则小 (二)(二)在计算标准差时,在各观测值加上或减去一在计算标准差时,在各观测值加上或减去一个常数,其数值不变个常数,其数值不变 (三)(三)当每个观测值乘以或除以一个常数当每个观测值乘以或除以一个常数a,,则所则所得的标准差是原来标准差的得的标准差是原来标准差的a倍或倍或1/a倍 (四)(四)在资料服从正态分布的条件下,资料在资料服从正态分布的条件下,资料中约有中约有68.26%的观测值在平均数左右一倍标的观测值在平均数左右一倍标准差(准差( ±S))范围内;约有范围内;约有95.43%的观测值的观测值在平均数左右两倍标准差(在平均数左右两倍标准差( ±2S))范围内;范围内;约有约有99.73%的观测值在平均数左右三倍标准的观测值在平均数左右三倍标准差(差( ±3S)) 范范 围内也就是说全距近似地围内也就是说全距近似地等于等于6倍标准差,可用(全距倍标准差,可用(全距/6)来粗略估计)来粗略估计标准差 第三节第三节 变异系数变异系数 变异系数是衡量资料中各观测值变异变异系数是衡量资料中各观测值变异 程度的另一个统计量程度的另一个统计量 。
标标 准差与平均数的比值称为准差与平均数的比值称为 变异系数变异系数,,记为记为C·V 变异系数可以消除单位变异系数可以消除单位 和和 (或)平(或)平 均均数不同对两个或多个资料变异程度比较的数不同对两个或多个资料变异程度比较的影响 变异系数的计算公式为:变异系数的计算公式为: 【【例例3.11】】 已知某良种猪场长白成年母猪已知某良种猪场长白成年母猪平均体重为平均体重为 190kg,, 标准差为标准差为10.5kg,,而大而大约克成年母猪平均体重为约克成年母猪平均体重为196kg,,标准差为标准差为8.5kg,,试问两个品种的成年母猪,那一个体试问两个品种的成年母猪,那一个体重变异程度大重变异程度大 由于,长白成年母猪体重的变异系数:由于,长白成年母猪体重的变异系数: 大约克成年母猪体重的变异系数:大约克成年母猪体重的变异系数: 所以,长白成年母猪体重的变异程度大于所以,长白成年母猪体重的变异程度大于大约克成年母猪。
大约克成年母猪 注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。












