好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

t检验的资料与习题.doc

19页
  • 卖家[上传人]:s9****2
  • 文档编号:509454202
  • 上传时间:2023-10-24
  • 文档格式:DOC
  • 文档大小:272.51KB
  • / 19 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四章:定量资料的参数估计与假设检验基础1抽样与抽样误差抽样方法本身所引起的误差当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标μ之间偏差,称为实际抽样误差当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平σ x=σ/S x=S/2 t分布t分布曲线形态与n(确切地说与自由度v)大小有关与标准正态分布曲线相比,自由度v越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近正态分布曲线,当自由度v=∞时,t分布曲线为标准正态分布曲线t = X-u/Sx=X-u/(S/),V=N-1正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础正态分布有两个参数,μ和σ,决定了正态分布的位置和形态为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称u分布。

      根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n) 特征:1.以0为中心,左右对称的单峰分布;2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图.t(n)分布与标准正态N(0,1)的密度函数对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂学生的t分布(或也t分布) ,在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重要作用t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算教科书问题的处理标准偏差,因为如果它被称为是两类:( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。

      3.均数的参数估计可信区间按一定的概率或可信度 (1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间,预先给定的概率(1-α)称为可信度或者置信度,常取95%或99%1. 点估计 用样本统计量直接作为总体参数的估计值其方法简单,易于理解,但为考虑抽样误差的大小2. 区间估计 既按照预先给定的概率(1-a),确定的包含总体参数的可能范围该范围被称为总体参数的可信区间或置信区间假设检验基础假设检验的基本思想是小概率反证法思想小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立[2] 假设检验假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数结果)。

      如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)这样,所有可能的样本所组成的空间(称样本空间)被划分为两部分HA和HR(HA的补集),当样本x∈HA时,接受假设h0;当x∈HR时,拒绝h0集合HR常称为检验的拒绝域,HA称为接受域因此选定一个检验法,也就是选定一个拒绝域,故常把检验法本身与拒绝域HR基本步骤1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1H0:样本与总体或样本与样本间的差异是由抽样误差引起的;H1:样本与总体或样本与样本间存在本质差异;预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.012、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等根据资料的类型和特点,可分别选用Z检验,T检验, 3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。

      P值的大小一般可通过查阅相应的界值表得到t检验  若总体服从正态分布N(μ,σ),但σ未知,记,,则t=遵从自由度为n-1的t分布,可对μ有以下的水平为α的检验,其中tα为自由度为n-1的t分布的上α分位数这些检验称为t检验 第五章:定量资料的t检验前言:T检验 主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料 t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著一、t检验分为单总体检验和双总体检验1.单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布单总体t检验统计量为:t:为样本平均数与总体平均数的离差统计量:为样本平均数μ:为总体平均数σx:为样本标准差n:为样本容量2.双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验独立样本t检验统计量为:S1 和 S2 为两、样本方差;n1 和n2 为两样本容量上面的公式是1/n1 + 1/n2 不是减!)1/n1 -1/n2的话无法计算相同的样本空间 配对样本t检验统计量为:二、适用条件(1) 已知一个总体均数;(2) 可得到一个样本均数及该样本标准差;(3) 样本来自正态或近似正态总体。

      三、t检验步骤以单总体t检验为例说明:问题:难产儿出生体重n=35,=3.42,S =0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否?解:1.建立假设、确定检验水准αH0:μ = μ0 (零假设,null hypothesis)H1:μ ≠ μ0(备择假设, alternative hypothesis,)双侧检验,检验水准:α=0.052.计算检验统计量3.查相应界值表,确定P值,下结论查附表1,t0.05 / 2.34 = 2.032,t < t0.05 / 2.34,P >0.05,按α=0.05水准,不拒绝H0,两者的差别无统计学意义当总体呈正态分布,如果总体标准差未知,而且样本容量 <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t分布检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著 检验分为单总体t检验和双总体t检验四、t检验注意事项1、选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布) 理论上,即使样本量很小时,也可以进行t检验如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。

      如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设方差齐性的假设可进行F检验,或进行更有效的Levene's检验如果不满足这些条件,只好使用非参数检验代替t检验进行两组间均值的比较2、区分单侧检验和双侧检验单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大t检验中的p值是接受两均值存在差异这个假设可能犯错的概率在统计学上上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率3、假设检验的结论不能绝对化当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0因为,其不显著结果的原因有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误4、正确理解P值与差别有无统计学意义P越小,不是说明实际差别越大,而是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。

      5、假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率6、涉及多组间比较时,慎用t检验科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是T检验的推广在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点进行多次的T检验进行比较设计中不同格子均值时)第六章 定量资料的方差分析6.1 方差分析的基本思想和应用条件6.1.1方差分析的基本思想1. 总变异 各样本数值与总均数不同总变异反映所有观察值的变异,量化值所有数据的均方MS总 来表示SS总=Σ(X-Ẋ)2 MS总=SS总/v总 v总=N-12. 组间变异 各组别间的均数不相同包括了变量影响和随机误差SS组间=Σni (Ẋi -Ẋ)2 MS组间=SS组间/v组间 v组间=k-13.组内变异组内的个数值不同反映随机误差,又称误差变异SS组内=SS总-SS组间MS组内=SS组内/v组内V组内=N-kF=MS组间/MS组内6.1.2方差分析的应用条件1、各样本相互独立切随机,服从正态分布。

      2、总体方差相等,即方差齐性 6.2完全随机设计资料的方差分析 6.2.1离均差平方和与自由度分解(见6.1.1公式)6.2.2完全随机设计资料方差分析的基本步骤(1)建立假设检验,确定检验水准2)计算检验统计量变异来源SSvMSFP总变异——组间变异组内变异(3)确定P值,做出推断结论 6.3随机区组设计资料的方差分析 6.3.1离均差平方和与自由度的分解SS总=SS处理+SS区组+SS误差v总=v处理+v区组+v误差变异来源SSvMSF总变异Σ(X-。

      点击阅读更多内容
      相关文档
      四川省成都市2025年中考数学真题试卷附同步解析.docx 四川省成都市锦江区师一学校2024_2025学年下学期八年级数学期中考试卷.docx 四川省成都市2025年中考数学真题试卷含同步解析.pptx 2025年四川省南充市名校联测中考一模数学试卷[含答案].docx 2025年四川省绵阳市游仙区中考一模数学试卷[含答案].docx 2024—2025学年山西省晋中市左权县八年级下学期6月期末数学试题[含答案].docx 2024—2025学年江西省吉安市青原区八年级下学期6月期末数学试题[含答案].docx 2025年四川省绵阳市涪城区中考一模数学试卷[含答案].docx 2025年四川省绵阳市安州区中考模数学试卷[含答案].docx 2024—2025学年江西省赣州市于都县八年级下学期6月期末数学试题[含答案].docx 2024—2025学年江苏省盐城市盐都区七年级下学期6月期末数学试题[含答案].docx 2025年广东省惠州市集团中考一模数学试卷[含答案].docx 2024—2025学年安徽省淮北市濉溪县七年级下学期6月期末考试数学试题[含答案].docx 2025年山东省威海市环翠区中考一模数学试卷[含答案].docx 2025年四川省自贡市富顺县代寺学区中考模拟一模数学试卷[含答案].docx 2024—2025学年湖北省孝感市汉川市八年级下学期6月期末数学试题[含答案].docx 2024—2025学年山西省晋中市左权县七年级下学期6月期末数学试题[含答案].docx 2025年宁夏九年级数学一模试卷[含答案].docx 2025年山东省临沂市中考模拟数学试卷(二)[含答案].docx 2024—2025学年河南省南阳市西峡县八年级下学期6月期末考试数学试题[含答案].docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.