您所在位置：网站首页 > 办公文档 > 解决方案 > 统计学教案习题04总体均数的估计和假设检验

统计学教案习题04总体均数的估计和假设检验.doc

12页

卖家[上传人]：鲁**

文档编号：392894535

上传时间：2023-02-20

文档格式：DOC

文档大小：210KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 12 举报版权申诉马上下载

文本预览

下载提示

常见问题

第四章总体均数的估计和假设检验一、教学大纲要求一）掌握内容1．抽样误差、可信区间的概念及计算；2．总体均数估计的方法；3．两组资料均数比较的方法，理解并记忆应用这些方法的前提条件4. 假设检验的基本原理、有关概念（如、类错误）及注意事项二）熟悉内容两样本方差齐性检验三）了解内容1分布的图形与特征；2. 总体方差不等时的两样本均数的比较；3. 等效检验二、教学内容精要（一）基本概念1. 抽样误差抽样研究中，样本统计量与总体参数间的差别称为抽样误差（samplingerror）统计上用标准误（standarderror，SE）来衡量抽样误差的大小不同的统计量，标准误的表示方法不同，如均数的标准误用S表示，率的标准误X用SP表示，回归系数的标准误用Sb表示等等均数的标准误与标准差的区别见表4-1Pb表4-1均数的标准误与标准差的区别均数的标准误意义记法计算反映X的抽样误差大小-（样本估计值S-）XX标准差反映一组数据的离散情况（样本估计值S）XvnS一亠Sv(XX)2nl控制方法增大样本含量可减小标准误个体差异或自然变异，不能通过统计方法来控制2. 可信区间（1）定义、涵义：即按预先给定的概率确定的包含未知总体参数的可能范围。

该范围称为总体参数的可信区间（confidenceinterval，CI）它的确切含义是：CI是随机的，总体参数是固定的，所以，CI包含总体参数的可能性是1-不能理解为CI是固定随机的，总体参数是随机固定的，总体参数落在CI范围内可能性为1-当0.05时，称为95%可信区间，记作95%CI当0.01时，称为99%可信区间，记作99%CI2）可信区间估计的优劣：一定要同时从可信度（即1-的大小）与区间的宽度两方面来衡量二）分布与正态分布t分布与标准正态分布相比有以下特点：①都是单峰、对称分布；②分布峰值较低，而尾部较高；③随自由度增大，t分布趋近与标准正态分布；当时，t分布的极限分布是标准正态分布三）总体均数的估计参数估计有点估计和区间估计两种方式总体均数的估计,见表4-2表4-2总体均数的估计点估计区间估计意义直接用样本统计量代替总~~用统计量X和S；确定一个有概率意义的区间，以体参数该区间具有较大的可信度包含总体均数① 小样本(Xt；^s，Xt^^s)估计方法以X作为估计值_/2・x_・/2,・x② 大样本(XS-,XS>/2x/2x③ 两总体均数差值的可信区间(XX.s，Xx.s12/2,・X]Mx?12/2・X]Mr?（四）两均数差别的比较1. 样本均数和总体均数比较的t检验前提：服从正态分布H:；H:0010Xt0，nlS-X2配对设计的检验前提：差值服从正态分布H：0；H：00d1dds-d.成组设计的两样本均数比较的nl检验前提：两组数据均服从正态分布；两组总体方差相等H：0；H：1211_2XXs--nn212其中，s--X1X2S212・見妁Cn1叫・2S表示两样本均数差值的标准误。

单样本检验前提：当样本较大（如n>50）或总体o已知时u0（n较大时）S/5Xu企（已知时）/5005大样本均数比较的检验前提：样本足够大成组设计的两样本均数比较可用：XXu1—l：'s2s2X1X26.要推断组间没有差别或差别很小，4-1)(4-2)(4-3)(4-4)(4-5)(4-6)(4-7)应采用等效检验（n）五）假设检验的步骤及有关概念1．基本思想：把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理2步骤：①建立假设、选用单侧或双侧检验、确定检验水准；②选用适当检验方法，计算统计量；③确定值并作出推断结论3类错误：H为真（实际无差别），假设检验结果拒绝H，接受H（推论有差别）所犯的错误称为类001错误（），类错误的概率记作类错误：H为真（实际有差别），假设检验结果拒绝H,接受H（推论无差别）所犯的错误称为类110错误（）,类错误的概率记作4. 称为检验效能，过去称把握度（poweroftest）,即两总体确有差别，按水准能发现该差别的能力三、典型试题分析（一）单项选择题1. 当样本含量增大时，以下说法正确的是（，A. 标准差会变小B. 样均数标准误会变小C. 均数标准误会变大D. 标准差会变大答案：B［评析］本题考点：这道题是考察均数标准误的概念。

从均数标准误的定义讲，它反映的是均数抽样误差的大小，那么样本含量越大，抽样误差应该越小从均数标准误的计算公式S-S/、：n来看，也应是n越大，S-越小xx2区间X慈.58S-的含义是（）xA. 99%的总体均数在此范围内B.样本均数的99%可信区间C.99%的样本均数在此范围内D.总体均数的99%可信区间答案：D［评析］本题考点：可信区间的含义可信区间的确切含义指的是：总体参数是固定的，可信区间包含了总体参数的可能性是1，而不是总体参数落在CI范围的可能性为1本题B、D均指样本均数，首先排除A说总体均数在此范围内，显然与可信区间的含义相悖因此答案为D二）是非题1. 进行两均数差别的假设检验时，当P0.05时，则拒绝H0；当P>0.05时，则接受H0，认为两总体均数无差别评析答案：错误当P0.05，拒绝H0时，我们是依据这一小概率来下结论的而当P>0.05时，我们对两总体均数无差别这一结论无任何概率保证，因此不能贸然下无差别的结论正确的说法是，按所取检验水准,接受H］的统计证据不足2. 通常单侧检验较双侧检验更为灵敏，更易检验出差别，应此宜广泛使用［评析］答案：错误根据专业知识推断两个总体是否有差别时，是甲高于乙，还是乙高于甲，当两种可能都存在时，一般选双侧；若根据专业知识，如果甲不会低于乙，或者研究者仅关心其中一种可能时，可选用单侧。

一般来讲，双侧检验较为稳妥单侧检验，应以专业知识为依据，它充分利用了另一侧的不可能性，故检出率高但应慎用只要增加样本含量到足够大，就可以避免I和II型错误评析］答案：错误因为通过假设检验推断出的结论具有概率性，因此出现错误判断的可能性就一定存在无论用任何方法也不能消除这一可能但是，我们可以使错误判断的可能性尽量地小，比如样本含量越大，犯I和II类错误的可能性越小三）简答题1．简述可信区间在假设检验问题中的作用［评析］可信区间不仅能回答差别有无统计学意义，而且还能提示差别有无实际意义可信区间只能在预先规定的概率即检验水准的前提下进行计算，而假设检验能够获得一较为确切的概率值故将二者结合起来，才是对假设检验问题的完整分析2某医生就资料，对比用胎盘浸液钩端螺旋体菌苗对名农民接种前、后血清抗体的变化表名农民血清抗体滴度及统计量抗体滴度的倒数——CsXSx免疫前人数免疫后人数（-J25.902・6.172,按・・14查界值表，说明接种后血清抗体有增长问该医生在整理资料和分析资料过程中有何不妥？答：①资料整理不当，未整理成配对资料；②统计描述指标使用不当，对于滴度的倒数不宜用算术均数、标准差，有“”出现，也不宜算几何均数。

比较免疫前后抗体滴度的倒数，应计算中位数和四分位数间距；③不宜用检验可将抗体滴度的倒数经对数或平方根转换后，做配对检验（n）四）计算题1．某医院用新药与常规药物治疗婴幼儿贫血，将20名贫血患儿随机等分两组，分别接受两种药物治疗，测得血红蛋白增加量（g/L）见表4-4问新药与常规药的疗效有无差别？表4-4两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量（g/L）新药组24362514263423201519常规药组14182015222421252723解：本题属成组设计资料H:H:0.05012112XXnn212xx122.7匸2.64851.019，18P>0.05因此，根据现有资料尚不能认为新药与常规药的疗效有差别将20名某病患者随机分为两组，分别用甲、乙两药治疗，测得治疗前后的血沉（mm/h）见表4-5问:（1）甲、乙两药是否均有效？（2）甲、乙两药疗效是否有别？表4-5甲、乙两药治疗某病情况序号12345678910甲治疗前30332631302728282529药治疗后26292330302422252323序号11121314151617181920乙治疗前29302933282630313030药治疗后26232523232528222724(1) 解：对甲、乙两药治疗数据分别采用配对t检验，得甲药：t=d/S-3.2/0.611=5.237d乙药：t=d/S-・5.0/0.9428=5.303dv=9，PV0.001,按・=0.05水准，拒绝H0，接受化，故可认为甲乙两药治疗前后均有差别。

2) 解：由表中资料分别求得治疗前后差值，再做两组比较t=did2=-1.602，v=18，得0.2>P>0.1,按=0.05水准，不拒绝H0，尚不能认为甲、乙两药疗效有差别S0d1叫3. 测得某地90名正常成年女性红细胞数(104/mm3)的均值418、标准差为29试求：(1) 该地95%的正常成年女性红细胞数所在的范围；(2) 该地正常成年女性红细胞数总体均数的95%可信区间解：(1)用正态分布法估计正常值范围因红细胞过多或过少均为异常，故此参考值范围应是双侧范围上限：X+1.96S=418+1.96・29=474.84(104/mm3)下限：X-1.96S=418-1.96・29=361.16(104/mm3)即(361.16，474.84)(104/mm3)2)由于n=90>50，故可近似为正态分布上限：X+1.96S-=418+1.9629M;90=423.99(104/mm3)X下限：X-1.96Sx=418-1.96^29M90=412.01(104/mm3)即(412.01，423.99)(104/mm3)四、习题一)单项选择题1. 标准误的英文缩写为：A.SB.SEC.S—D.SDX2. 通常可采用以下那种方法来减小抽样误差：A. 减小样本标准差B.减小样本含量C.扩大样本含量D.以上都不对3. 配对设计的目的：A.提高测量精度B.操作方便C.为了可以使用t检验D.提高组间可比性4. 以下关于参数估计的说法正确的是：A. 区间估计优于点估计B. 样本含量越大，参数估计准确的可能性越大C. 样本含量越大，参数估计越精确D. 对于一个参数只能有一个估计值5. 关于假设检验，下列那一项说法是正确的A. 单侧检。

点击阅读更多内容