电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

变量的统计描述分析社会统计学

54页
  • 卖家[上传人]:san****019
  • 文档编号:70817015
  • 上传时间:2019-01-18
  • 文档格式:PPT
  • 文档大小:2.86MB
  • / 54 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第二章 单变量统计描述(3),离散趋势测量法,众值、中位值和均值都反映了资料的集中特征,但这还不够,试比较以下三组数据: 甲组:80 86 90 94 100 X=90 乙组:88 89 90 91 92 X=90 丙组:90 90 90 90 90 X=90,所谓离散趋势测量法,是指求出一个值来表示一个变项中各变量值之间的差距和离散程度。,离散趋势反应的是变量分布的分散程度,数据分布的另一个重要特征 反映各变量值远离其中心值的程度,有时又称离中趋势,离势小,平均数的代表性高;离势大,平均数代表性低。 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的集中趋势对应着不同的离散趋势的测量,4,5,离散趋势的测量的内容,一.异众比率 二.极差 三. 四分位差 四. 平均差 五. 方差及标准差 六. 离散系数,一、异众比率(Variation Ration)适用于定类或以上测量层次的变量,异众比率(V)就是非众值的频数占全部个案数目的比率。 公式如下:V= N为全部个案数目,fmo是众值的频次。 这个公式所求出的是在全部的个案中有多少是偏离众值,显然,非众值的比例越小,众值的代表性越好。

      2、,可见,离异比率是众值的补充。,当V=0,说明变量只有一个取值,那是众值,这时众值可以完全代表变量;V1时,表示资料十分分散,众值几乎没有代表性。,例:调查了200名大学生,内心的苦恼倾诉对象意愿为:,党团组织41人、家长49人、知心朋友52人、闷在心里32人、 班团干部15人、随便议论11人 可见N=200 fmo=52 V= 众数的代表性很低 注意:众值与众值频数,即MO与fmo的区别。,二、极差(全距),定义:一组数据的最大值与最小值之差 例如:数据72,81,86,69,和57的极差为:86与57之差等于29。,如果数据已被分组,则极差取为极端类别的中点之差 例: 青年人阅读小说书的数目,则极端类别的中点为3和18 极差R=18-3=15,优点:,计算简单,并且一目了然,特别是对外行来说,极差是唯一可理解的离差量度。,缺点:,它仅仅以两个个案为依据,而且是两个极端的个案,数据利用率低,信息丧失严重。另外,极差随着样本的变化而变化很大,一般来说大样本的极差比小样本更大一些。,13,三、四分位差,检验中位数代表性高低,1. 排序后处于25%和75%位置上的值,2. 不受极端值的影响

      3、 3. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据,计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%的个案;则第一个四分位置的值(Q1)与第三个四分位置的(Q3)的差异,就是四分位差(简写Q),公式是Q=Q1-Q3) 25% 25% 25% 25% 低 Q1 Q2 Q3 高,(一) 未分组数据,首先应求出Q1与Q3的位置,公式是: Q1位置= ; Q3位置=3(N+1)/4 其中N是全部个案数目,如调查甲、乙两个生产队家庭的人数,甲队有11户人家,每户人数如下: 2 2 3 4 6 9 10 10 11 13 15 Md位置= Md=9 Q1位置= Q1=3 Q3位置= Q3=11 所以四分位差Q=Q3-Q1=11-3=8,乙队有8户人家,每户人数如下:,2,3,4,7,9,10,12,12 Md位置= Md= Q1位置= Q1=3+0.25(4-3)=3.25,因此,Q3位置=3(8+1)/4=6.75 Q3=10+0.75(12-10)=11.5 所以Q=Q3-Q1=11.5-3.25=8.25,根据频次分布或四分位差,步骤如下:,Q1位置=(N

      4、+1)/4=(80+1)/4=20.5 Q1=丁 Q3位置=3(N+1)/4=3(80+1)/4=60.75 Q3=乙 Md位置= 1/2(N+1)=1/2(80+1)=40.5 Md=丙 四分位置Q=Q3-Q1=乙-丁 结论,有50%的学生成绩在乙与丁之间。,21,定序数据的四分位数:例,【例3.10】根据第二章表2-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数,解:下四分位数(Q25)的位置为: Q25位置(300)/475 上四分位数(Q75)的位置为: Q75位置(3300)/4225 从累计频数看, Q25在“不满意”这一组别中; Q75在“一般”这一组别中。因此 Q25 不满意 Q75 一般,根据分组资料求四分位差,步骤:第一步:计算累加次数(Cf) 第二步:求出Q1和Q3位置 Q1位置=N+1/4 Q3位置=3(N+1)/4 其 中N是全部个案数目 第三步:参考累加次数分布,决定Q1和Q3的位置应属于哪一组 第四步:从所属的组中,计算Q1位置和Q3位置的数值,公式如下:,Q1=L1+( )W1 Q3=L3+( )W3,其中:,L1=Q1属组之真实下限 L3=Q3

      5、属组之真实下限 f1=Q1属组之频数 f3=Q3属组之频数 Cf1=低于Q1属组下限之累加次数 Cf3=低于Q3属组下限之累加次数 W1=Q1属组之组距 W3=Q3属组之组距 N=全部个案数目,例: 生产队的育龄妇女节育情况,第二步,Q1 的位置=212/4=53 Q3的位置=3/4N=3/4212=159,第三步,参加累加次数分布,可见Q1位置属于5-15组,Q3位置是45-55。,根据第四步的计算公式,计算Q1和Q3位置的数值:,L1=5.5 L3=45.5 f1=38 f3=24,cf1=16 cf3=147 W1=10 W3=10 N=212,因而:,Q1=5.5+( )10=15.2 Q3=45.5+( )10=50.5 则 Q=Q3-Q1=50.5-15.2=35.3,30,四分位差:定距数据的例子,四分位差,QQ75-Q25 128.75-117.81=10.94,【例3.13】根据第二章表2-5中的数据,计算50 名工人日加工零件数的四分位数,31,线箱图的绘制(举例),32,四、平均差 :概念要点及计算公式,1. 各变量值与其均值离差绝对值的平均数 2. 离散程度的测

      6、量值之一 3. 能全面反映一组数据的离散程度 4. 数学性质较差,实际中应用较少,5. 计算公式为,未分组数据,组距分组数据,例72、81、86、69、57、的均值是73,从每个数减去73,忽略正、负号,加上结果再除以5,得 A.D= 因此 我们可以说,记分数与均值平均相差8.4,34,平均差:计算过程及结果,【例3.13】根据第二章表2-5中的数据,计算工人日加工零件数的平均差,五、方差和标准差:概念要点,1.方差是变量值与均值偏差的平方的平均值,标准差是方差的开平方 2.离散程度的测量值之一,最常用的测量值 3.反映了数据的分布 4.反映了各变量值与均值的平均差异 5根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,36,总体方差和标准差:计算公式,未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,标准差(例),38,总体标准差:计算过程及结果,【例3.14】根据第二章表2-5中的数据,计算工人日加工零件数的标准差,还有以下一些替代公式:,S=,实际上基本公式为:,例:72,81,86,69,57,N=5

      7、 6561,7396,4761,3249.,42,离散系数:概念要点和计算公式,1.标准差与其相应的均值之比 2.测度了数据的相对离散程度 3.用于对不同组别数据离散程度的比较 4.计算公式为,例如, 代表性高,44,离散系数:实例和计算过程,【例3.15】某管理局抽查了所属的8家企业,其产品销售数据如表3.6。试比较产品销售额与销售利润的离散程度,45,离散系数:计算结果,结论: 计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度,46,数据类型与离散程度测度值,习题,一、根据以下统计资料:汉族,50,000人,苗族22,000人,布衣20,000人,藏族1,000人,问能制成哪些统计图?对变量值的排列是否有要求? 二、直方图的高度有什么意义?什么情况下,直方图的高度也可用频次或频率来表示?,三、抽查50名学员,他们的统计学成绩如下:,试以10分为组距,用划记分法编制次数分配表,并绘制直方图。,五、将习题四的50名学员统计学成绩接下表分组,四、(续),(1)计算并填充频率栏和累积频率栏 (2)哪几组是开口组?计算其组中值 (3)第三组的实际组限是多少? (4)第二组的表面组限是多少? (5)第四组的组中值是多少?,五、将空白处填充有关数据(单位:厘米),六、以下是甲乙两村九户家庭人口数的原始数据,甲村:3;3;4;4;4;5;6;7;8 乙村:3;3;4;4;4;4;5;5;5 (1)计算两村家庭人口数的众值、中位值和均值 (2)对三种集中值作出讨论,七、以下是68名职工婚姻状况的调查 N“未婚”; M“已婚” D“离婚”; W“丧偶”,选择适当的集中值和离散值,并讨论之。,八、设以下是72名离婚者婚龄的统计,(1)试作直方图 (2)试求众值、中位值和均值并作简单讨论 (3)试求四分位差和标准差,

      《变量的统计描述分析社会统计学》由会员san****019分享,可在线阅读,更多相关《变量的统计描述分析社会统计学》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.