好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

外语教学科研中的统计之SPSS篇2ppt课件.ppt

56页
  • 卖家[上传人]:cn****1
  • 文档编号:568711236
  • 上传时间:2024-07-26
  • 文档格式:PPT
  • 文档大小:1.04MB
  • / 56 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 外语教学科研中的统计之SPSS篇2ppt课件￿￿￿￿Still￿waters￿run￿deep.流静水深流静水深,人静心深人静心深￿￿￿￿Where￿there￿is￿life,￿there￿is￿hope有生命必有希望有生命必有希望 一、一、教育统计学概述:分类教育统计学概述:分类&1.1 分类分类&描述统计(descriptive statistics) 描述数据全貌包括数据分组,使用统计图表描述数据的分组和分布,计算数据参数 推断统计(inferential statistics) 依据随机样本数据,从局部推断总体特征包括参数检验和非参数检验、方差分析、回归分析、因子分析等2024/7/262 一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2 1.2 基本概念基本概念&1.2.1 变量(variable) 研究活动中的关键因素相对于常量而言(在研究过程中始终保持不变的特征或条件) 自变量(independent variable):教学方法 因变量(dependent variable):学生成绩 中间变量(interdependent variable):学习风格&如:研究者经常在课题的研究对象(某一层次的学习者)中安排不同风格的学习者。

      当某个自变量自变量(如教学方式)变化时,可以观测到因变量(学习成绩)的相应变化及其规律然后针对不同学习风格的研究对象(中间变量),再观察上述教学现象规律有何变化 2024/7/263 一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.2 总体(population)、个体(individual)、样本(sample) 研究对象的全体为总体,组成总体的基本单元为个体,按照一定规则从总体中抽取的一部分个体为样本1.2.3 样本容量(sample size) 无严格的数量界限一般把样本容量小于30(50、100)的样本称为小样本,大于等于30(50、100)的为大样本2024/7/264 &1.2.4正态分布(normal distribution) 正态分布是连续型随机变量分布中最重要也是最常见的一种分布例如,在人数较多的群体中,学习成绩得到的数值,其分布近似于正态分布即测验分数都是中等分数人数多,高分、低分人数少,如果以分数为横坐标,次数〈获得某一分数的人数)为纵坐标,绘制成曲线图,就会发现曲线呈中间大、两头小、左右基本对称的特点一、一、教育统计学概述:基本概念教育统计学概述:基本概念来源:Bachman, L.F. (1990). Fundamental Considerations in Language Testing. Oxford: OUP, p.73 2024/7/265 一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.5 SPSS中的变量分类•(1)定量/连续变量/等距变量(scale measure) 一定单位的实际测量值,可以加减计算,如学生的考试成绩(65,76)•(2)分类变量(包括定序变量 和称名变量) 定序变量 (ordinal measure):能够把研究对象从高到低或由大到小排序,如受教育程度(1=小学,2=初中,3=高中,4=大学,5=研究生);又如态度(1=完全不适合,2=通常不适合,3=有时适合,4=通常适合,5=完全不适合) 称名变量(Nominal measure):也叫无序变量,变量值没有大小之分,只有类别之分,如性别(1=男,2=女)2024/7/266 一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.6 参数检验和非参数检验•参数检验(parametric test):总体服从正态分布、数值连续变量、样本数为单一样本或双样本。

      如T检验、两个或两个以上样本为方差分析等•非参数假设检验(non-parametric test):总体不一定服从正态分布、数值为定序变量(有时为连续变量)、样本数为单一样本、双样本或多样本 如X2 检验、检验、Wilcoxon 检验、Mann-Whitney U检验&1.3 统计分析简要流程图2024/7/267 一、一、教育统计学概述:统计模型教育统计学概述:统计模型&1.4 统计模型和数据类型模型类型模型类型因变量因变量自变量自变量Regression连续变量连续变量或者分类变量Logistic Regression分类变量连续变量或者分类变量ANOVA,GLM连续变量分类变量或者连续变量Log-Linear分类变量分类变量SEM不限不限来源:Wu, Eric (2008,9.6-7). Introduction to SEM. 上海:上海财经大学.2024/7/268 一、一、教育统计学概述:正态分布的检验教育统计学概述:正态分布的检验&正态分布的检验正态分布的检验 参数检验分析法的前提是数据服从正态分布和方差齐性,除非对数据作转换,非正态分布的数据宜采用非参数检验2024/7/269 SPSS规定:当样本容量3≤n≥5000,结果以Shapino-Wilk(W检验)为准,当样本容量n>5000时,结果以Kolmogorov-Smirnov(D检验为准)。

      结论:n<5000,W值得概率P<0.05,接受检验假设,可认为考生成绩不是正态分布2024/7/2610 二、实战操作&2 2.1 .1 推断性统计:推断性统计:分析不同数据间的差异ß2.1.1前提条件一 首先要明确是将来自正态总体的单个变量的平均值与给定的单一标准值进行显著性差异比较,还是进行组间数据的显著性差异比较如果是前者,并且总体呈正态,就选择单一样本t 检验(one-sample t-test)如果是后者(组间数据),还要确定数据是来自相同受试者(同一样本的测试前后数据),还是不同的受试者(不同样本的数据),才能选择合适的分析方法2024/7/2611 二、实战操作:单一样本t检验&单一样本参数检验:单一样本t 检验(one-sample t-test) &因为单样本t检验是对样本与总体的平均值进行比较,因此在外语教学中用处较大,如可以用该程序检验一个班级的平均成绩与全校的平均成绩之间的差异等,或者将一个学校的四级英语统考成绩与全国平均成绩进行比较,看是好于还是低于全国平均成绩,等等举例举例1::一个班英语专业四级统考成绩与全国平均成绩(74.5665)之间是否有显著性差异?2024/7/2612 结论:该班专四成绩明显好于全国平均成绩2024/7/2613 二、实战操作:单一样本卡方检验&单一样本非参数检验:卡方检验(X2 test)(适用于称名变量,并且变量可以为双值或多值),二项分布检验(Binominal test)(适用于称名变量,变量只能为双值)&举例举例2::为了解对英语分级教学政策的态度,学校随机调查了125名教师。

      其中有41人表示赞成(1),37人表示反对(2),47人不置可否(3)试问不同态度之间是否存在显著性差异?2024/7/2614 2024/7/2615 结论:不同态度之间无显著差异!2024/7/2616 二、实战操作ß2.2.2 前提条件二 如果数据是来自相同样本,比较的是两组数据之间的差异,那么: 参数检验:配对样本T 检验(Matched t-test) 非参数检验: A: Wilcoxon符号秩次检验(Wilcoxon signed ranks test) B: 符号检验(Sign test) C: McNemar检验(McNemar test) 2024/7/2617 二、实战操作:配对样本T检验ß 参数检验:配对样本T 检验(Matched t-test) 附加条件:两个变量应该代表同一组在不同时间或者两个相关组的测量结果(数值能够搭配成对),因此相关系数应该相对较高,而且显著水平值较低(一般低于0.05)如果相关系数低,而且显著值高,就不能用配对样本t检验,而应考虑改用独立样本T检验。

      ß举例举例3::为了考察某种英语阅读训练的效能,从某班学生中随机抽取10名学生对他们进行阅读测验,然后让他们接受这种阅读训练经过一段时间的训练后,又对这10名学生进行类似的阅读测验问:阅读训练前后的测验成绩是否有显著性差异?2024/7/2618 二、实战操作:Wilcoxon检验ß非参数检验: Wilcoxon检验(适用于连续变量)ß举例举例4::在一次英语口语演讲比赛中,聘请了10 位评委参加评判工作这10位评委对其中2 名选手的打分情况(满分为20分)问:其中的一名选手的成绩是否显著地高于另外一名选手?2024/7/2619 注:Aymptotic only适用于大样本的渐进法通常应关注配对符号秩和检验(Wilcoxon)结果,而不是符号检验(sign test)McNemar:以研究对象作自身对照,检验其“前后”的变化是否显著,该法适用于相关的二分变量数据2024/7/2620 选手1和选手2的正负平均秩次分别为1,6和4.33和6 评委对两个选手的评分有显著差异检验结果只需看精确双侧显著性精确双侧显著性结果表明,选手1的成绩显著高于选手2!评委对选手2的打分相对较严(negative)(Z2>Z1)。

      评分公正欠佳!评分公正欠佳!2024/7/2621 二、实战操作ß2.2.3前提条件三 如果数据来自不同群体的受试者,而且比较的是两组数据之间的差异,那么: 参数检验:两个独立样本t 检验(independent samples t-test) 非参数检验:Mann-Whitney U检验(连续变量)Crosstabs 检验(称名变量或定序变量)2024/7/2622 ß参数检验:两个独立样本t 检验(independent samples t-test)ß 举例举例5 5::已知72名男女学生的两个学期课外学习时间,问:男女学生在努力程度上是否存在显著性差异?二、实战操作:两个独立样本t检验2024/7/2623 注备:Equal varince assumed假设方差相等,本例的方差齐性(sig.>0.05)结论:男女学生在努力程度上存在显著差异,女生努力程度明显高于男生2024/7/2624 二、实战操作:两个独立样本t检验•举例举例6 6::某校对英语课进行教学改革试验,选取甲、乙两个平行班作试点甲班30人,采用传统的教师讲授的教学方法,乙班33人,采用教师只讲授重点,主要由学生自学和学生相互讨论的方法。

      一学年后,用同一份试题对两个班的学生进行测验试问:这两种教学方法的效果是否有显著性的差异?结论:这两种方法的效果没有显著差异!(注意两个平行班的方注意两个平行班的方差不等,应看差不等,应看Equal variance not assuemed一栏的结果一栏的结果)原因:也许是测试没有体现出教改的优势!测试没有体现出教改的优势!2024/7/2625 二、实战操作ß2.2.3前提条件四ß如果比较的是三组或多组数据之间的差异,那么:•来自多个独立样本的数据:•参数检验:单因素方差分析(One-way ANOVA)•非参数检验:Kruskal-Wallis检验 (连续变量,常用);中位数(Median)检验(连续变量)•来自多个相关样本的数据:•参数检验:单因素重复测量方差分析(repeated measures ANOVA)•多因素方差分析(Factorial ANOVA)•非参数检验:Friedman检验(连续变量);Kendall检验(定序变量);Cochran’s Q检验(称名变量)2024/7/2626 二、实战操作:Kruskal-Wallis检验ß非参数检验: 多个独立样本: 中位数检验(Median test)(适用于等距变量) Kruskal-Wallis检验 (适用于等距变量,更常用)ß举例举例7::某校对大二学生进行了一次英语测验。

      现分别从经济系、政法系、中文系、教育系以及理科各系中随机抽取部分学生的测验成绩问:不同学科学生的英语成绩是否存在显著性差异?2024/7/2627 非参数检验表明不同学科之间的学生英语成绩存在显著差异,但却没法绘制图表,也无法详细比较可采用参数检验的单尾ANOVA分析,制作平均分线图2024/7/2628 二、实战操作:多个样本Kendall检验ß举例举例8::5位教师对甲、乙、丙3篇作文所作的评价如下,问5 位教师对评价3篇作文所作的评价是否一致注意输入方法!注意输入方法!2024/7/2629 结论:5 位教师对3篇作文所作的评价是不一致(p>0.05)标准制定和阅卷教师培训很重要!标准制定和阅卷教师培训很重要!2024/7/2630 二、实战操作:单因素方差分析]基本思想:通过分析不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小 一项实验有多个影响因素,如果只有一个因素在发生变化,其他因素保持不变,称为单因素方差分析One-way ANOVA)]举例举例9:为了寻求较好的词汇习得方法,现选择3种不同方法,分别对3个平行组学生进行一学期的词汇习得训练,现获得学生的期末成绩。

      问:3种不同方法下的学生词汇习得成绩是否有显著性差异?哪种更理想一点?2024/7/2631 单因素事后多重比较假设方差相等时可选用LSD或S-N-K等方法;若方差不等可采用Dunnett's C方法检验方差是否齐性;平均数做图2024/7/2632 方差齐性检验表明,三种教学方法所获得的成绩方差相等ANOVA显示,三种方法的成绩差异显著,可以进一步做多重比较LSD方法显示各教学方法的成绩差异显著2024/7/2633 结论:3种不同方法下的学生词汇习得成绩有显著性差异相比而言,第三种教学方法更理想一点2024/7/2634 二、实战操作:多因素方差分析]如果有两个或两个以上的因素发生变化,那么对应的方差分析称为多因素方差分析]几个因素(变量)对实验结果的影响有两种情况: A 独立影响(between-subject design) ,如单因素方差分析和双因素方差分析 B 交互影响(within-subject design),如单因素重复测量方差分析和双因素混合方差分析 2024/7/2635 二、实战操作:双因素方差分析]A 独立影响(between-subject design),单因素方差分析(例9)和双因素方差分析。

      ]双因素方差分析]举例举例10::8名评委对5篇论文的评分如下,试分析5篇论文的水平差异是否显著?评委对评分标准所掌握的分寸是否一致?(三个变量) 论文得分的多少主要受到两个因素的影响:一个是论文本身的水平,另一个是评委对评分标准所掌握的分寸(但两者之间无交互作用)]需要检验的假设如下: ①5篇论文的水平无显著性差异; ②评委对评分标准所掌握的分寸无显著性差异2024/7/2636 当因变量只有一个(本例为学生的作文成绩),采用GLM的Univariate方法固定因素指的是在样本中它所有可能的取值都出现了;而随机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,两种情况结论完全相同,不同的只是推论张文彤(2004),SPSS统计分析高级教程,北京:高等教育出版社2024/7/2637 本研究只分析独立影响,无交互效应,所以选Main Effects左下方的Sum of squares框用于选择方差分析模型类别,有1型到4型四种,如果搞不清他们之间的区别,使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可(但用处不大,可以不选!)。

      2024/7/2638 可以定义输出哪些指标的估计均数、并做两两比较,还有其他一些输出,如常用描述指标、方差齐性检验等2024/7/2639 首先是所用方差分析模型的检验,F值为28.277,p小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义第二行是截距,它在我们的分析中没有实际意义,忽略即可第三行是变量论文,可见它也有统计学意义,不过我们关心的也不是它;第四行是我们真正关心的变量评委,非常遗憾,它的p值为0.061,还没有统计学意义我们的结论是:5篇论文的水平有显著差异;但是篇论文的水平有显著差异;但是评委对评分评委对评分标准所掌握的分寸一致标准所掌握的分寸一致(左边的同质性检验也说明这一点)注:Partial Eta Squared指主效应的大小,值越大,效应越强本研究表明学生作文成绩严重受到论文和评委的共同影响但是评委自身对作文成绩的影响较弱2024/7/2640 右图是八个评委的作文打分分布左图是五篇作文的整体分布2024/7/2641 2024/7/2642 二、实战操作:协方差分析]协方差分析 将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制变量进行评价。

      无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著的影响如果忽略这些因素的影响,则有可能得到不正确的结论]举例举例11::研究一个班3组同学(分别接受了3种不同的教学方法)在英语成绩上是否有显著差异2024/7/2643 首先应进行预分析,了解数据是否符合协方差分析的要求,最重要的一点就是看入学成绩的影响在三组中是否相同,这可以用入学成绩与组别是否存在交互作用来表示该步骤用于判断入学成绩和组别间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续注意这里选择了Model I,从而拟合结果和模型中变量的引入顺序有关,即侧重点在入学成绩对英语成绩的影响大小和交互作用上2024/7/2644 显示交互作用无统计学意义,而且P值非常大,因此交换组别和入学成绩多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析正式分析开始!2024/7/2645 2024/7/2646 各组英语成绩方差相等模型拟合很好组间差异显著,各组入学成绩没显著差异,从而可以分析组别之间英语成绩的差异。

      三组学生英语成绩2024/7/2647 1、3组和2、3组成绩差异显著;1、2组之间无显著差异结论:三组学生成绩差异显著2024/7/2648 二、实战操作:积差相关法] 相关分析 A: 积差相关法 是指采用英国统计学家Pearson皮尔逊提出的一种计算相关系数的方法]举例举例12:: 某大学一年级12名学生参加了语音、听写和语法三项考试问:三项考试之间的两两相关系数2024/7/2649 二、实战操作:等级相关法]B: 等级相关法 当我们研究的变量是定序数据,或者变量不是正态分布时,若要考察它们的相关程度就必须采用等级相关法它是依据具有等级顺序的测量数据(定序数据)来研究变量间相互关系的方法主要有Spearman斯皮尔曼相关(适用于非参数两列相关)和Kendall W肯德尔和谐系数(较保守,不如Spearman )相关]举例举例13::其教研室要为学生准备一批英语课外阅读材料,教研室首先让一批学生读八篇材料,要求他们根据自己的感受,为这些材料的难易程度评定等级(等级分为九级,一级为特别简单,九级为极端困难)然后让一批老师也为这八篇材料评定难易度等级这样得到下面数据。

      ]学生:3 5 6 8 8 9 4 7]老师:1 3 7 9 6 8 2 9]现在,要检验这两组变量是否有显著相关2024/7/2650 学生评定和老师评定的一致性系数为0.667,显著相关,但是难度认可的相同程度为40%,不甚理想学生和教师的认知程度和学习经验有差异,有时为了公正征求学生的看法,但结果往往不甚理想建议:学生意见仅供参考!学生意见仅供参考!2024/7/2651 二、实战操作:点二列相关法]C: 点二列(point-biserial)相关法]研究中,常常有只含两个类别的变量(称名变量),例如性别、是否达标、正确与否等等这类只有两种变化结果的称名变量称为“二分”称名变量将0、1 分别与两种变化结果相对应,则对“二分”称名变量的一系列观察,得到一个“二分”数列一个连续变量的一系列观测值是一个点数列如果一个点数列中的点与一个“二分”数列中的点存在一一对应的关系,则称这两个数列为点二列点二列相关法就是考查连续变量(其观测值为点数列)与“二分”称名变量之间的相关程度] 举例举例14::某小学五年级男女学生I5人的英语成绩如下表,问英语成绩与性别是否有关?2024/7/2652 二、实战操作:偏相关]D: 偏相关(partial)]在教育领域中两种现象之间的关系,往往受到多种因素的影响,是这些因素共同作用的结果,因而简单相关系数可能由于其他因素的影响而反映的仅仅是表面非本质的联系,不能真正反映两个变量之间的相关程度。

      为了正确地显示出两个变量之间的本质联系,必须剔除其他变量的影响我们把两个变量在剔除了其他变量的影响之后的相关系数叫做偏相关系数]举例15:傣族的母语是傣语,儿童小学开始学习汉语,上中学时又学习英语近来研究人员对30名受过高等教育的傣族成年人进行了傣语、汉语及英语三种语言的水平测试问三种语言水平考试的相关关系,特别是傣语与英语的关系2024/7/2653 三种语言之间的相关显示,在没有控制汉语对英语和傣语之间的影响时,傣语和英语成绩显著相关,r=0.560这时英语和傣语相关为0.6572024/7/2654 参考文献参考文献Bachman, L.F. (1990). Fundamental Considerations in Language Testing. Oxford: OUP, p.73史耕山,(史耕山,(20072007年年6 6月月1313日),日),《外语教学科研中的统计与SPSS实现》讲义和数据河北工业大学外国语学院/中国外语教育研究中心. http://202.204.128.82/forum/(2009年5月31日)张文彤,2004, SPSS统计分析高级教程北京:高等教育出版社。

      2024/7/2655 愿我们共同进步,攀登学术上的the Himalayas!谢谢大家! 2024/7/2656 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.