
心理学研究方法-心理学研究方法-了解数据PPT课件
14页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数据分析,了解数据,例子:比较不同年龄段词汇量是否有差异,大学生组:,59,、,31,、,47,、,43,、,54,、,42,、,38,、,44,、,48,、,57,、,42,、,48,、,30,、,41,、,59,、,23,、,62,、,27,、,53,、,51,、,39,、,38,、,50,、,58,、,56,、,45,老年组:,70,、,59,、,68,、,68,、,57,、,66,、,78,、,78,、,64,、,43,、,53,、,83,、,74,、,69,、,59,、,44,、,73,、,65,、,32,、,60,、,54,、,64,、,82,、,62,、,62,、,78,问题:,拿到数据后第一步怎么做?,数据分析的三步骤,1,了解数据,2,概括数据,3,证实数据所揭示的意义,了解数据,1,、,错误数据,出现不可能的值(超出给定范围),2,、,极端值,茎叶图,箱形图,解决方法,3,、,是否正态分布,正态分布性检验,P-P,图,茎叶图,频数图,解决方法,4,、,方差是否齐性,一、查找错误数据,两种方法结合,(错误数据一般为缺失值、最大值或最小值),1,、用,sort ascending,(升序)或,sort descending,(降序),观察,操作方法:,1,)选中该列,右键,选择,sort ascending,或,sort descending,2,),data-sort cases-,选择变量名放入右侧框,sort by,中,sort orderOK,操作方法:,1,),analyze-descriptive statistics-frequencies-charts,选择,histogram,(直方图),-OK,2,、使用频数表观察有无异常值,二、极端值,极端值:,危害:造成数据的方差太大,即数据的变异很大,导致,t,检验或方差分析等处理时无法产生显著效果。
经验性标准:,均值加减三倍标准差,的数据为极端值,如何找出极端值,茎叶图,箱形图,操作方法:,analyze-descriptive statistics-explore-,把因变量放入,dependent list(,这里是,score)-,自变量放入,factor list,(这里是,group,),-plots:,选中,factor level together,和,stem-and leaf-OK,注意:一定不能任意删除数据!,最大值,75%,四分位数,中位数,25%,四分位数,最小值,箱形图,表明第,45,行的数据为异常值,异常值(差不多是超过均值,2,倍标准差)用,O,表示,极端值(差不多是超过均值,3,倍标准差)用*表示,茎叶图,大学生组,老年组,大多数数值围绕在,40,和,50,的位置,整个分布有些偏态大多数数值围绕在,60,的位置,整个分布呈现正态二、极端值,在遇到极端值时的解决方法,对于异常值分析原因,:那天有没有特殊情况如服药?有没有阅读障碍?,处理办法:替代,1,、如果有的话考虑删除数据用平均值来替代,(可以直接删除,当数据量很大也可以在,excel,中用,if,函数,=if,(,b1,下限,“平均值”,,b1,),2,、用极大值或极小值替代,excel,中用,if,函数,=if,(,b1,上限,“上限”,,b1,),数据分析过程注意点,1,、一定要存有原始数据,原始数据不能动。
之后复制一份原始数据,并在此基础上进行数据整理和分析2,、做数据分析过程中,一定要做笔记,数据存在哪个盘的哪个文件夹,某年某月某日做了什么分析,发现了什么,还存在什么问题数据讨论,数据讨论,实验目的:判断三类词(疼痛词汇、中性词汇和威胁词汇,),的唤醒度,实验方法和材料:,30,名被试,疼痛词、中性词和威胁词汇每类,40,个,共,120,个词汇每名被试对这三类词汇(即,120,个词)进行唤醒度评分唤醒度(,19,点评分):平静,-,激动程度,即从最为平静到最为激动的范围,,1,表示阅读后感到平静放松、较少刺激、不警觉;,9,代表极其激动、够刺激、令人觉醒灼痛,癌症,筷子,数据讨论,1,、在,excel,中如何整理这些原始数据?如何把整理的数据进行排列?,2,、该数据用何种统计分析方法?基于选择的统计分析方法,数据在,spss,中如何呈现?(这位同学犯了什么错误?),3,、在,spss,中正确输入了数据后,应该如何按照三个步骤来分析数据?假如出现异常值后,该怎么考虑?,。