方差分析与回归分析.docx
5页方差分析与回归分析(一) ,两种分析得简介和原理方差分析是用于两个及两个以上样本均数差别的显著性检验由于各种因素的影响,研 究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研 究中施加的对结果形成影响的可控因素方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著 影响的变量方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组 的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异用变量在各组的 均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法运用 十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照 自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析如果在回归分析 中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析 称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且因变量和自变量 之间是线性关系,则称为多元线性回归分析、相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因 变量、而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表 现其具体关系比如说,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相 关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回 归分析方法来确定一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归 模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测 数据;如果能够很好的拟合,则可以根据自变量作进一步预测二) ,方差分析和回归分析得具体的应用让4名学生前后做3份测验卷,得到如下表的分数,运用方差分析法可以推断分析的问 题是:3份测验卷测试的效果是否有显著性差异?表氐理理名学生3決豳强S[的平方和计J序号XixGXrSR(SR) E171. 773.472. 3217.4047262.76271. 572.672.1216.2046742.44370.172. 370.8213.2045454.24470.672. 271.6214.4045967.36Sx283.9290. 50286.80861. 20= S SR=S Sk185426.80=20151.5121098.4520564.9061814.86=2 S/S (SR) E(Sx)7n20149.8021097.5620563.5661810.92=2 ( Zx)7nN44412=NX70.9872.6371. 71、 确定类型由于4名学生前后做3份试卷,是同一组被试前后参加三次考试,4位学生的考试成绩可 看成是从同一总体中抽出的4个区组,它们在三个测验上的得分是相关样本。
2、 用方差分析方法对三个总体平均数差异进行综合性地F检验检验步骤如下:第一步,提出假设:% :耳=出2=地’石:至少有两个总体平均数不相等o第二步,计算F检验统计量的值:因为是同一组被试前后参加三次考试,4位学生的考试成绩可看成是从同一总体中抽出 的4个区组,它们在三个测验上的得分是相关样本,所以可将区组间的个别差异从组内差异 中分离出来,剩下的是实验误差,这样就可以选择公式(6.6)组间方差与误差方差的F比 值来检验三个测验卷的总体平均数差异的显著性① 根据表6.4的数据计算各种平方和为:阴=yy J —61814.86-861 2 =9.41总平方和:(,川(V y X)2 861.22[— ]- =61810.92 =5.47组间平方和:碍=门4]一竺匸空空一竺L环区组平方和:误差平方和:= =9.41-5.47-3.48 = 0.46② 计算自由度总自由度:妇—11组间自由度:锁二疋_1 = 3_1 = 2区组自由度:筋=起一1 = 4-1 = 3误差自由度:^ = ^-^-^ = ^-2-3=6③ 计算方差3.481.16组间方差:区组方差:误差方差:④ 计算F值2.74108=34.25第三步,统计决断根据尬=2心=6,a =0.01,查F值表,得到张何I叮,而实际计算的F检验 统计量的值为山甩仲广1叮,即p仆>10.9)<0.01,样本统计量的值落在了拒绝域内,所以拒绝零假设日°,接受备择假设,即三个测验中 至少有两个总体平均数不相等。
3、用q检验法对逐对总体平均数差异进行检验检验步骤如下:第一步,提出假设:第二步,因为是多个相关样本,所以选择公式(6.8)计算q检验统计量的值:在丹°为真的条件下,将一次样本的有关数据及^ = 0 08代入上式中,得到A和B两组的平均数之差的q值,即:72.63-70.98-0= 11.70以此类推,就可得到每对样本平均数之间差异比较的q值,如下表所示:表6丐3次輕各对样本平均数之差的枕值直=70. 98Tg =72. 63XF72. 6311. 7X=71. 705.116. 60第三步,统计决断为了进行统计决断,在本例中,将A,B,C共3组学生英语单词测验成绩的等级排列为:等级123平均数70. 9871. 7072. 63组名ACBA与C之间和B与C之间包含有1, 2两个组,a=2; A与B之间包含有1, 2, 3三个 组,a=3根据^ = 6jC = 0 05jC = 0 01,得到当a=2时,q检验的临界值为^(6X2)0.05 =3 4® 听餘2)0J01 = 5 24当a=3时,q检验的临界值为氓飓㈣=A",沁蚀小仝33 ;将表(6.5)中的q检验统计量的值与q临界值进行比较,得到表(6.6)中的3次测验成绩各对平均数之间的比较结 果:表6.6 3次测试各对样本平均数之差q值的比较结果j^=70.98j^ = 72.63Z^ = 72.311.7 (4.34, &33尸*^ = 71.705.11(3.46,5.24)*6.60 (3.46,*表示在a =0.05显著性水平上有差异,**表示在a =0.01显著性水平上有差异)从表中可以看出,三个测验中每两个之间的总体平均数都不相等。
因为是同一组被试前后参加三次考试,所得到的样本是相关样本,这些样本所属总体的 方差基本相等,所以不需要对两个相关样本所属总体的方差进行齐性检验通过以上推断分析,我们可以知道:三份测验卷测试的效果有显著性差异,并且每两份 测验卷测试的效果之间都有显著性差异方差分析和回归分析总体上都属于一个类别,一般线性模型从资料类型来看,方差分 析的因变量是连续型资料,自变量是分类变量,一般都以组别的形式出现回归分析的因变 量是连续型资料,自变量既可以是分类资料,也可以是连续型资料,也可以两种资料都有 从目的来看,大多数方差分析的目的都是比较组间差异,比如3组人群的身高是都有差异等 而回归分析主要是看自变量对因变量的影响,或因变量是否随着自变量的变化而变化,如血 压是否随年龄而变化等。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


