电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

参数估计基础2013课件

67页
  • 卖家[上传人]:F****n
  • 文档编号:88138710
  • 上传时间:2019-04-19
  • 文档格式:PPT
  • 文档大小:3.64MB
  • / 67 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第五章 参数估计基础,Estimation of parameter,参数估计的定义,根据样本的统计量估计总体参数的过程,称为参数估计。 Ann landers:“如果可以重新选择,你还要孩子吗?” 结果:近1万份读者来信:70%的父母后悔! Newsday:开展了全美范围专业调查 结果:1373对随机样本,91%的父母无怨无悔!,2019/4/19,2,海南医学院卫生统计学教研室,案例:,Ann landers: 自发性回应的便利样本,高度偏差。 Newsday: 简单随机样本(simple random sample ) 统计推断中,关心的不是统计量本身,而是随机化的实现、样本的代表性和统计推断技术。,2019/4/19,3,海南医学院卫生统计学教研室,Contents,第一节 抽样分布与抽样误差,第二节 t分布,第三节 总体均数及总体概率的估计,2019/4/19,4,海南医学院卫生统计学教研室,第一节 抽样分布与抽样误差,1,2,100,n=30 x1=156.7,n=30 x2=158.1,n=30 x100=156.6,13岁女学生身高,一、样本均数的抽样分布与抽样误差,2

      2、019/4/19,5,海南医学院卫生统计学教研室,2019/4/19,6,海南医学院卫生统计学教研室,从正态总体N(155.4,5.32) 抽样得到的100个样本均数的频数分布,100个样本均数的频数分布图 (直方图),2019/4/19,7,海南医学院卫生统计学教研室,样本均数的抽样分布特点,1、样本均数恰好等于总体均数及其罕见; 2、样本均数之间存在差异; 3、样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布; 4、样本均数之间的变异明显小于原始变量值之间的变异。,2019/4/19,8,海南医学院卫生统计学教研室,一、抽样误差的概念 由于抽样造成的样本统计量与总体参数的差异及样本统计量之间的差异称为抽样误差。 对于抽样研究, 抽样误差不可避免,但有规律可循。,2019/4/19,9,海南医学院卫生统计学教研室,2019/4/19,10,海南医学院卫生统计学教研室,2019/4/19,11,海南医学院卫生统计学教研室,数理统计的中心极限定理,从正态分布N(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布; 样本均数的总体均数仍为,样本均数的标准差为 。 即

      3、使是从偏态分布总体抽样,只要n足够大(n 50),样本均数的分布也近似正态分布N(,2/n) ;,2019/4/19,12,海南医学院卫生统计学教研室,均数的标准误,均数的标准误(standard error of mean,SEM或SE) : 样本均数的标准差,通称为均数的标准误。 符号: 计算: 意义:反映均数抽样误差大小; 它反映了样本均数之间的离散程度。 (区别于标准差),2019/4/19,13,海南医学院卫生统计学教研室,1、均数标准误的大小与原变量的标准差成正比; 说明当总体中观测值变异较小时,抽到的样本均数与总体均数可能相差较小,估计总体均数可靠程度高。,影响均数标准误大小的因素,2、与样本含量n的平方根成反比; 在同一总体中随机抽样,样本含量n越大,抽样误差越小。所以可通过增加样本含量n来减小样本均数的标准误,从而降低抽样误差。,2019/4/19,14,海南医学院卫生统计学教研室,例 2000年某研究者调查某地健康成年男子27人,得到血红蛋白的平均数为X=125g/L,标准差为S=15g/L。试估计该样本平均数的抽样误差。,2019/4/19,15,海南医学院卫生统

      4、计学教研室,二、样本频率的抽样分布与抽样误差 统计实验5-3:口袋中装有黑、白两种小球。其中黑球的比例为20%。每次有返回的摸出50个球作为一个样本,计算黑球的百分比即样本频率p p =黑球数/50 每次摸出黑球的比例p服从二项分布,表示为: p B(n,), 给定n=50, =0.20. 共抽取100个样本,计算黑球的比例,p1,p2,p100.结果见表5-3。,2019/4/19,16,海南医学院卫生统计学教研室,100个样本的黑球频率的频数分布(直方图),(%),2019/4/19,17,海南医学院卫生统计学教研室,样本频率p=X/n的理论值为总体概率 样本频率的标准差即标准误:,总体概率 未知时,由样本率p近似代替,2019/4/19,18,海南医学院卫生统计学教研室,例5-1 某研究组随机调查了50岁以上中老年妇女776人,其中患骨质疏松症者322人。患病率为p=41.5%. 试估计:该样本频率的抽样误差。 已知:p=41.5%,n=776,代入公式(5-4)得到标准误估计值:,标准误的估计值较小,说明用样本患病率41.5%估计总体患病率的可靠性较好。,2019/4/19,1

      5、9,海南医学院卫生统计学教研室,标准差与均数标准误的区别,2019/4/19,20,海南医学院卫生统计学教研室,第二节 t 分布,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,原因:是一个固定值,而S是随样本而变动,Z,Z,已知,2019/4/19,21,海南医学院卫生统计学教研室,t 分布的由来,英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明在正态总体中抽样, 服 从自由度 = n1的t分布,即 t 分布, =n1 又称Student t分布(Students t-distribution)。 t分布是总体均数的区间估计和假设检验的理论基础。,2019/4/19,22,海南医学院卫生统计学教研室,从13岁女学生身高这个正态总体中分别做样本量为n=3和n=50的随机抽样. 各抽取1000份样本,并分别得到1000个样本均数、与之对应的1000个标准误。 对其分别作t变换,得到1000个t值。用t值绘制的直方图。,二、t分布的图形:,t,t,2019/4/19,23,海南医学院卫生统计学教研室,t 分布图形不是一条曲线,而是一簇曲线。 t

      6、 分布只有一个参数,即,2019/4/19,24,海南医学院卫生统计学教研室,t 分布图形的特征,单峰分布,以0为中心,左右对称 越小,t值越分散,曲线越低平,尾部越高,两侧越分散; 随着 逐渐增大,t分布逐渐逼近标准正态分布;当 趋于时,t分布就完全成为标准正态分布。,2019/4/19,25,海南医学院卫生统计学教研室,t,尾侧概率P=0.05,尾侧概率P=0.05,一般而言,t值相同时,t 分布的尾侧部分的面积大于标准正态分布的尾侧部分的面积。,0,-t,+t,2019/4/19,26,海南医学院卫生统计学教研室,2019/4/19,27,海南医学院卫生统计学教研室,t界值表(附表2-p459)的应用,横标目:自由度 纵标目:概率P(尾部面积)。 t 临界值:表中数字表示当 和P 确定时,对应的t值。 附表2只列出正值,若计算的t值为负值时,可用其绝对值查表 。 单侧概率临界值 :用t,表示(one-tailed probability) 双侧概率临界值 :用t/2,表示(two-tailed probability),2019/4/19,28,海南医学院卫生统计学教研室,当=1

      7、6、P=0.05时: 单侧概率临界t值为:t0.05, 16= 1.746, 双侧概率临界t值为:t0.05/2, 16= 2.120,练习,2019/4/19,29,海南医学院卫生统计学教研室,t分布,更一般的表示方法如图 6-5(a)和(b)中阴影部分所示为: 单侧:P(t t, )= 和 P(t t, )= 双侧:P(t t/2, )P(t t/2, )=,单侧,双侧,2019/4/19,30,海南医学院卫生统计学教研室,t分布尾部面积的特点,自由度相同时,t值越大,尾部概率P越小; 一定, t值相同时,双侧尾部概率是单侧尾部概率的2倍;t0.10/2,16 = t0.05,16 =1.746;,2019/4/19,31,海南医学院卫生统计学教研室,t分布与标准正态分布相比有以下特征: 1、两者都是单峰分布,以0为中心,左右对称。 2、t分布的峰部较矮而尾部翘得较高,随着自由度的增加,t分布逐渐逼近正态分布,当=时,t分布就完全等于标准正态分布。 3、标准正态分布有两个固定常数(0,1),t分布只有一个参数 。,2019/4/19,32,海南医学院卫生统计学教研室,练习: 1、1

      8、0,双侧尾部面积为0.05的t界值是? 2、100,单侧尾部面积为0.05的t界值是? 3、,双测尾部面积和单侧尾部面积分别为0.05的界值是?,2019/4/19,33,海南医学院卫生统计学教研室,1、t 0.05/2,102.228 2、t 0.05,1001.660 3、t 0.05/2, 1.96, t 0.05, 1.645,2019/4/19,34,海南医学院卫生统计学教研室,第三节 总体均数及总体概率的估计,统计推断 参数估计 (样本统计量推断总体参数 ) 假设检验 一、参数估计 常用的估计方式有两种: 1、 点估计(point estimation) 2、 区间估计(interval estimation),2019/4/19,35,海南医学院卫生统计学教研室,点估计(point estimation),点估计:直接利用样本统计量的一个数值来估计总体参数。(如s估计 ) 例:在某地随机抽查成年男子140人,计算得红细胞均数4.771012/L,(假设总体均数为4.751012/L ) 标准差0.38 1012/L , 试估计该地成年男子红细胞的总体均数? 答:该地成年男

      9、子红细胞的总体均数为4.771012/L 。 优点:思维朴素、方法简单; 缺点:没有考虑抽样误差,难以反映参数的估计值对其真值的代表性(即两者之间差距),无法评价参数估计的准确程度。 特点:估计的精度高但可信度低,2019/4/19,36,海南医学院卫生统计学教研室,(二)区间估计(interval estimation),区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,这种估计方法叫做区间估计。 置信度:预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。 记为100(1)%或(1), 值由研究者预先规定,一般取0.1,0.05,0.01,常取0.05; 置信区间(confidence interval,CI):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的可信区间或置信区间; (上限,下限)开区间,2019/4/19,37,海南医学院卫生统计学教研室,实际工作中,如无特殊说明,一般作双侧置信区间的估计。 必要时,也可进行单侧区间估计。 在报告参数估计的结果时,应同时给出点估计值和置信区间。,2019/4/19,38,海南医学院卫生统计学教研室,例 试计算例中该地成年男子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为: 估计该地成年男子红细胞的总体均数的95%可信区间为( 4.711012/ L , 4.831012/ L )。,下限:,上限:,举例,2019/4/19,39,海南医学院卫生统计学教研室,可信区间的构成:(可信下限,可信上限) 总体均数估计的95%置信区间的含义: 如果重复100次抽样,每次样本含量均为n,算得100个置信区间,则平均有95个可信区间包括 (估计正确),只有5个区间不包括 (估计

      《参数估计基础2013课件》由会员F****n分享,可在线阅读,更多相关《参数估计基础2013课件》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.