
变异系数、偏度、峰度的认识及应用.docx
7页变异系数、偏度、峰度的认识及应用一、变异系数1、 名词解释:变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一 个统计量当进行两个或多个资料变异程度的比较时,如果度量单位 与平均数相同,可以直接利用标准差来比较如果单位和(或)平均 数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平 均数的比值(相对值)来比较简单来说就是:在表示离散程度上, 标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数 了,它也是表示离散程度,是标准差与平均数的比值称为变异系数, 记为C・V变异系数可以消除单位和(或)平均数不同对两个或多 个资料变异程度比较的影响2、 计算公式变异系数C.V =(标准偏差SD—平均值MN)X 100%3、 应用:例题:已知某良种猪场长白成年母猪平均体重为190kg,标准差为 10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问 两个品种的成年母猪,那一个体重变异程度大此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只 能用变异系数来比较其变异程度的大小由于,长白成年母猪体重的变异系数:C.V = 10.5 / 190 * 100% =5.53%大约克成年母猪体重的变异系数:C.V = 8.5 / 196 * 100% = 4.34% 所以,长白成年母猪体重的变异程度大于大约克成年母猪。
二、偏度1、 名词解释:偏度以bs表示,xi是样本测定值,是样本n次测定值的平均值表 征概率分布密度曲线相对于平均值不对称程度的特征数2、 偏度与与正态分布的关系:正态分布的偏度为0,两侧尾部长度对称bs<0称分布具有负偏离, 也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为 左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲 线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数 据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与 左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长; 而bs接近0则可认为分布是对称的若知道分布有可能在偏度上偏 离正态分布时,可用偏离来检验分布的正态性右偏时一般算术平均 数〉中位数〉众数,左偏时相反,即众数〉中位数〉平均数正态分布 三者相等3、计算方法:n£ (X - X)3^k (n - 1)(n - 2)sd3其中X是第i个样本,sd是样本标准差,g是总体偏度的有偏估计i 1三、峰度1、 名词解释:峰度,又称峰态系数表征概率密度分布曲线在平均值处峰值高低的特征数直观看来,峰度反映了尾部的厚度2、 特点:峰度以bk表示,Yi是样本测定值,Ybar是样本n次测定值的平均值,s为样本标准差。
正态分布的峰度为3< 3称分布具有不足的峰度, kb 〉3称分布具有过度的峰度若知道分布有可能在峰度上偏离正态 k分布时,可用峰度来检验分布的正态性3、计算方法:随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比 值某单位引体向上测试总体分布情况分析一、 测试成绩X (单位:个):i三月份测试成绩:8、 8、 10、 7、 11、 14、 6、 5、 7、 7、 9、 10、 12、 4、 6、 8、 7、 11、 8、9、 10、12、9、8、6、5、8、9、5、8、8、10、8、11五月份测试成绩:4、10、9、4、11、6、8、9、7、11、12、7、9、6、10、8、9、7、8、14、12、9、8、7、8、9、5、7、8、10、8、5、6、8、14二、 数据分析:三月份:样本容量:n = 35样本均值:匸=8.352941样本方差:13.34602五月份:样本容量:m = 35样本均值:丫一二8.371429样本方差:14.14776三、图像:如上图所示,其中横轴为引体向上的个数,纵轴为达到相同个数的频数由上图可以发现,三月份我单位成员引体向上测试总体分布情况服从卩二8.352941,^2二13.34602的正态分布;五月份我单位成员引体向上 测试总体分布情况服从卩二8.371429, a2二14.14776的正态分布。
四、假设检验:现给定显著性水平a = 0.05,进行假设检验提出原假设:—:卩二巴U 二 〜N(0,1)统计量 g / \;nS 2 = 13.34602, S 2 = 14.14776.1 2(n- 1)s 2 +n + m - 2(m - 1)s 2234S12 + 34晋=13.6874689(X - Y )s<1 / n + 1 / m二 0.006所以统计量的值0.01848813.7468^:1 / 35 + 1/35。
