好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

Spss统计应用基础第三章N课件.ppt

67页
  • 卖家[上传人]:re****.1
  • 文档编号:601293694
  • 上传时间:2025-05-16
  • 文档格式:PPT
  • 文档大小:165KB
  • / 67 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,,,,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,第三章 统计描述,SPSS,基本统计分析是进行其他统计分析的基础和前提通过基本统计方法,可以对要分析数据的总体特征有比较准确的把握,从而可以选择其他更为深入的统计分析方法主要内容,均值和均值标准误差 中位数,,众数 全距,,方差与标准差 四分、十分和百分位数,,频数 峰度,,偏度 标准化,Z,分数及线性转换,,探索分析 交叉列联表分析,,多选项分析 基本统计分析的报表制作,,3.1,均值,(Mean),和均值标准误差,(S.E.mean),统计学上的定义和计算公式,,同质总体某一标志在一定时间、地点、条件下所达到的一般水平,是总体的代表值,它描述分布数列的集中趋势计算公式:,,总体平均数:  样本平均数: 均值标准误差:,这是描述这些样本与总体,,均值之间平均差异程度的,,统计量3.1.2 SPSS,中实现过程,研究问题,,求某班级学生在一次数学测验中的平均成绩。

      实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,数学,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Central Tendency,框中选,Mean,,在,Dispersion,框中选择,S.E.mean,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.2,中位数,(Median),3.2.1,统计学上的定义和计算公式,,定义:把一组数据按递增或递减的顺序排序,处于中间位置上的变量值就是中位数它是一种位置代表值,所以不受极端数值的影响,具有较高的稳健性计算公式:大小为,N,的按大小排列好的数列,,当,N,为奇数:,,,当,N,为偶数:,,3.2.2 SPSS,中实现过程,,研究问题,,求某班级学生身高的中位数,,实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,,Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中。

      3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Central Tendency,框中选,Median,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.3,众数,(Mode),3.3.1,统计学上的定义和计算公式,,定义:众数是一组数据中,出现次数最多的那个变量的值计算公式,,⑴原始数据法,,出现频数最多的那个数值就是众数例:,7,,,4,,,7,,,2,,,6,,,7,的众数是,7,⑵频数分布表法,,频数最多一组的组中值就是众数当相邻的两个组频数都是最多时,两组的分组点就是众数3.3.2 SPSS,中实现过程,,研究问题,,求某医院当天出生新生儿体重的众数,,实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Central Tendency,框中选,Mode,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算。

      3.4,全距,(Range),3.4.1,统计学上的定义和计算公式,,定义:也称为极差,是数据的最大值与最小值之间的绝对差公式:,,,3.4.2 SPSS,中实现过程,,研究问题,,求某班级学生数学成绩的全距实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Dispersion,框中选,Range,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.5,方差,(Variance),标准差,(Standard Deviation),3.5.1,统计学上的定义和计算公式,,定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度两者越大,说明变量值之间的差异越大,距离平均数这个,“,中心,”,的离散趋势越大。

      计算公式:,,总体方差: 总体标准差:,,,,,样本方差: 样本标准差:,,,,,其中, 为总体平均数; 为样本平均数,,,N,为总体个数;,n,为样本的个数,,3.5.2 SPSS,中实现过程,,研究问题,,求某班学生数学成绩的方差和标准差实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Dispersion,框中选,Std. Deviation,和,Variance,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.6,四分位数,(Quartiles),、十分位数,(Deciles),和百分位数,(Percentiles),3.6.1,统计学上的定义和计算公式,,定义:四分位数是将一组个案由小到大,(,或由大到小,),排序后,用,3,个点将全部数据分为四等分,与,3,个点上相应的变量称为四分位数,分别记为,Q1,、,Q2,和,Q3,。

      其中,Q3,到,Q1,之间的距离的一半又称为四分位差,记为,Q,四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散十分位数:,D1,、,D2,…,..D9(90%,落在,D9,下,),百分位数:,P1,、,P2,…,..P99(99%,落在,P99,下,),3.6.2 SPSS,中实现过程,,研究问题,,求某班学生数学成绩的四分位数测量,54,个某种机械零件的重量,求零件重量的,D6,测量出,54,个某种机械零件的重量,求零件重量的,P,37,实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Percentile Value,框中选,Quartiles,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.7,频数,(Frequency),3.7.1,统计学上的定义和计算公式,,定义:频数是一个变量在各个变量值上取值的个案数。

      3.7.2 SPSS,中实现过程,,研究问题,,10,个学生在某次数学、语文、化学考试中成绩,试学生在,3,门课程上的频数分布实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,数学、语文、化学,”,添加到,Variable(s),框中3),单击下方的,Display frequency tables,复选框,单击,OK,,,SPSS,即开始计算3.8,峰度,(Kurtosis),3.8.1,统计学上的定义和计算公式,,定义:描述某变量所有取值分布形态陡缓程度的统计量峰度为,0,表示其数据分布与正态分布的陡缓程度相同;,,峰度大于,0,表示比正态分布高峰要更加陡峭,为尖峰峰度小于,0,表示比正态分布的高峰要平坦,为平顶峰3.8.2 SPSS,中实现过程,,研究问题,,某班,40,个学生年龄分布,试求学生年龄峰度实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,年龄,”,添加到,Variable(s),框中。

      3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Distribution,框中选,Kurtosis,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算3.9,偏度,(Skewness),3.9.1,统计学上的定义和计算公式,,定义:偏度是描述某变量取值分析对称性的统计量偏度为,0,表示其数据分布与正态分布偏度相同;,,偏度大于,0,表示正偏态差数值较大,为正偏,,偏度小于,0,表示负偏差数值较大,为负偏,,3.9.2 SPSS,中实现过程,,研究问题,,某班,41,个学生身高分布,试求学生身高分布偏度实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Frequencies,命令,,(2),将变量列表中的变量,“,身高,”,添加到,Variable(s),框中3),单击下方的,Statistics,按钮,对话框中选统计的项目在,Distribution,框中选,Skewness,,选好后单击,Continue,,返回,Friquencies,对话框,单击,OK,,,SPSS,即开始计算。

      3.10,标准化,Z,分数及其线性转换,3.10.1,统计学上的定义和计算公式,,Z,分数的定义:从平均数为, ,标准差为 ,的总体中抽出一个变量值,x,Z,分数表示的是此变量大于或小于平均数几个标准差计算公式:,,,T=10Z+50,3.10.2 SPSS,中实现过程,,研究问题,1,,某班级学生数学成绩(,31.sav),的,Z,分数,并把它线性转换为,T,分数实现步骤:,,(1),单击,Analyze,菜单,,Descriptive Statistics,中的,Descriptive,命令,,(2),将变量列表中的变量,“,数学,”,添加到,Variable(s),框中同时选中对话框左下方的,Save standardize values as variables,项3),单击右下方的,options,按钮,对话框中选统计的项目在,option,对话框中选,mean,、,std.deviation,、,Variance,,选好后单击,Continue,,返回,Descriptives,对话框,单击,OK,,,SPSS,即开始计算3.10.2 SPSS,中实现过程,,研究问题,2,,并把,Z,分数,线性转换为,T,分数。

      实现步骤:,,(1),单击,Trasform,菜单,,Compute,命令,,(2),出现,Compute Variable,对话框,目标变量框中输入,T,,在,Numeric Expression,文本框中输入,10*Z+50,也可以单击,Type,和,Label,按钮,设置变量类型和标签3),设置好后单击,Continue,,返回,Compute Variable,对话框,单击,OK,,,SPSS,即开始计算3.11,探索分析,3.11.1,统计学上的定义和计算公式,,调用此过程可对变量进行更为深入详尽的描述性统计,故称为探索分析它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案1.,探索分析的内容包括下面几个方面,,检查数据是否有错误:过大或过小的值,有可能是奇异、影响点或错误数据,找出这样的数据,并分析原因然后决定是否从分析中删除这些数据获得数据分布特征:,,对数据的规律的初步观察:如线性关系,,2.,探索分析的考察方法,,SPSS,的,Explore,分析过程将提供数据文件在分组与不分组的情况下,常用的统计量与图形。

      Explore,分析过程一般以图形的方式输出,图形可以直观地将奇异值、非正常值、丢失的数据以及数据本身的特点呈现出来Explore,统计过程也可以帮助用户确定奇异值,进行假设检验,常用的统计量分析,以确定用户要使用的分析数据方法是否得当,甚至在用户要对数据进行正态检验之前告诉之数据需要转换等3.,正态分布检验,,用,Q-Q,图,,4.,方差齐次性检验,,,Lenvene,检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析如果得到显示性水平小于,0.05,,那么就可以拒绝方差相同的假设在本节将讨论如何利用,SPSS,的,Explore,过程对数据通过散点图、茎叶图、箱图以及描述统计量、数据的齐性检验等对数据进行初步探索分析3.11.2 SPSS,中实现过程,,研究问题,,40,名,10,岁小儿的身高,(CM),资料,试作探索性分析实现步骤:,,(1),在,SPSS,数据编辑窗口中输入数据,,(2),在,Analyze,Descriptive Statistics,中选择,Explore,命令3),将“身高”作为分析变量,添加到,Dependent List,框,再选中“性别”作为分组变量,添加到,Factor List,框;选,id,添加到,Label Cases by,框中,.,,注意:如果有多个变量进入,Factor List,框中,那么会以分组变量各取值进行组合分组。

      如两个分组变量各有,2,种取值,那么就会有,4,种组合分组4),在,Display,框中选择,Both,项Display,中有,3,个选项:,,Both:,输出图形和描述统计量,并激活右边的,Statistics,和,Plot,两个按钮这是系统默认的选项Statistics,和,Plot,(5),单击,Statistics,按钮,出现,Explore: Statistics,对话框:,,将,Descriptives,、,M-estimator,、,Outliers,、,Percenttiles,这几项全部选中6),单击,Plot,按钮,弹出,Explore: Plots,对话框:,,在,Boxplots,框中选中,Factor levels togther,:按组别进行箱图绘制选中,Descriptive,框中的,Stem-and-leaf,项:作茎叶图,,Normality plots with tests,复选框,,,Spread VS. Level with Levene Test,框中选中,Power estimation,,表示进行转换幂值估计,(7),单击,Options,按钮,出现,explore,:,Option,对话框,选择对缺失值进行处理方法。

      Exclude cases listwise:,默认选项,表示去除所有含缺失值的个案后再进行分析Exclude cases pairwise:,当分析计算涉及到含有缺失值的变量,则去除在该变量上的缺失值的个案Report value:,表示当分组变量中的缺失值将被单独分为一组输出频数表时包括缺失值,但将标出分组变量的缺失值选中,Exlude cases listwise,项,单击,Continue,按钮返回,Explore,对话框,再单击,OK,,,SPSS,完成探索分析3.12,交叉列联表分析,在实际分析中,需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析称为交叉列联表分析交叉残联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性因为行列变量往往不是连续变量,所以一般选择,Kendall,等级相关系数、,Eta,值等1),卡方统计量检验是常用的检验行列变量之间是否相关的方法交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式:,,,,,(2)Contingency coefficient:,列联系数。

      用于名义变量之间的相关系数计算计算公式由卡方统计量修改而得:,,(3)Phi and Cramer’s V:,,,用于名义变量之间的相关系数计算计算公式由卡方统计量修改而得,公式如下:,,,,,,数值界于,0~1,之间,其中,K,为行数和列数较小的实际数3.12.2 SPSS,中实现过程,,研究问题,,用两个班级学生进行两个感冒疫苗的试验,问两个班级学生的患病比例有无差别实现步骤:,,(1),在数据编辑窗口定义变量,输入数据,,(2)Data,Weight Cases,命令,,(3),选择“人数”变量,使其添加到,Frequency Variable,框中,人数变量为加权变量,单击,OK,,返回到数据编辑窗口4) Analyze,Descriptive Statistics,中选择,Crosstab,命令5),在,Crosstabs,对话框中,选择班级变量添加到,Row(S),,患病变量添加到,Column(s),框如果还有其它变量参与分析,可以指定层控制变量,选定到,Layer,框中也可以根据实际的分析确定他们的层次Display clustered bar charts,指定是否显示各个变量的不同交叉取值下频数的直方图。

      Suppress tables,不显示具体表格,而直接显示交叉列联表分析过程的统计量,如果没有选中统计量,则不产生任何结果6)Statistics,,弹出,Crosstabs: Statistics,对话框,,本例选中卡方检验该对话框中提供了多种检验的方法:,,Chi-square:,卡方检验,,Correlations:,列联表行、列的,Person,相关系数或,Spearman,相关系数名义变量(,Nominal),的关联指标包括:,,Contingency coefficient:,列联系数,,Phi and Cramer’s V,系数,,Lambda:,λ,值当自变量用于预测因变量时,该检验反映预测误差Lambda,系数等于,1,,表明自变量完全预测因变量Lambda,系数等于,0,,表明自变量不能预测因变量Uncertainty coefficient,,不确定性系数表示使用一个变量的值来预测其他变量的值时,,误差成比例下降的程度不确定性系数越接近其上限,1,表明从第一个观测量获得的有关第二个变量的值的信息越多,不确定性系数越接近其下限,0,表明从第一个观测量获得的有关第二个变量的值的信息越少。

      例如,值,0.83,表明:已知一个变量在预测其他变量值时的错误减少,83%,程序计算对称与不对称两种不定系数Ordinal Data,栏,适用于有序变量的统计量①,Gamma,,两个有序变量之间关联的对称检验,该检验值范围在,-1~1,之间变化Gamma,值的绝对值接近,1,时,表明两个变量之间有很高的关联性Gamma,值近似于,0.,表明两个变量之间有没有关联性在二维交叉表,提供零阶,Gamma,值在三维或高维交叉表,提供条件,Gamma,值②,Somers’d,,两个有序变量之间关联性的检验,其数值范围为,-1~1,Somers‘d,值绝对值接近,1,时,表明两个变量之间有很高的关联性Gamma,值近似于,0,,表明两个变量之间有没有关联性Somers’d,检验是,Gamma,的非对称检验扩展,二者之间的不同仅在于不依据自变量配对的成对数据的含量③Kendall’s tau-b,复选项,考虑有结的次序或等级变量关联性的非参数检验,即相同值的观测量选入计算过程中系数的符号表明两者之间关系的方向,,Kendall’s tau-b,的绝对值表明相关性,绝对值越大表示相关性越高值的范围在,+1-1,之间,只有在正方形表格中其值才有可能为,+1,与一,1,。

      ④,Kendall’s tau-c,复选项,忽略有结的次序或等级变量关联性的非参数检验,即将相同值的观测量从计算过程中剔除其值在+,1-1,之间,系数的符号表明两者之间关系的方向,,Kendall‘s tau-c,的绝对值表明相关性,绝对值越大表示相关性越高如果交叉表边界频数相等,那么,Kendall’s tau-b,和,Kendall’s tau-c,所得的值基本一致8) Nominal by Interval,栏,适用一个名义变量另一个为等间隔变量的检验Eta,统计量,:,其平方值可认为是因变量受不同因素影响所致方差的比例两个,Eta,统计量被计算出来,一个用来描述间隔变量(行变量),另外一个用来描述列变量该统计量表明等间隔测度的因变量(如收入)和具有一定数量分类值的自变量(如性别)关联性计算两个,Eta,值,一个值将等间隔测度的变量水平作为行,另一个值将等间隔测度的变量水平作为列9) Cochran’s and Mantel-Haenszel statistics,复选项,该复选项只,SPSS 9.0,版本具有Cochran’s and Mantel-Haenszel,统计量可以用于一个二值因素变量和一个二值响应变量的独立性检验。

      Kappa,:计算,Cohen,的,Kappa,系数,是检验内部一致性的系数,仅适用于具有相同分类值和相同分类数量的变量交叉表Risk:,相对危险度可以检验事件发生和某因素之间的关联性McNemar. a nonparametric test for two related dichotomous variables. It tests for changes in responses using the chi-square distribution. It is useful for detecting changes in responses due to experimental intervention in "before and after" designs.,,,(7),单击,Exact,按钮,打开,Exact Test,对话框,,精确检验提供了除非参数检验与交叉表以外的两种专门针对小数据量与不平衡表的检验方法注意:由于精确检验的计算过程方程复杂,在计算过程中可能会耗费大量的计算机资源,也非常耗时但是在数据的样本量少于,30,时这是最好的方法了1) Asymptotic only,选项,此显著水平值适用于具有渐近分布的数据。

      一般情况下如果其显著水平值小于,0.05,,就认为有统计意义注意,该统计量的前题是大样本,如果数据量过少,或数据不具有渐进分布特征,该统计量不是一个很好的统计指标2) Monte Carlo,选项,该统计量是确切显著水平的无偏估计Monte Carlo,方法允许不依靠需要渐进方式的假设而获得精确显著水平值在样本量非常大,但是数据又不符合渐进分布的方法的要求时,这是一种非常有效的计算确切显著水平的方法①,Confidence,参数框,在此处输入,0.01-99.9.,此值用来确定置信区间的大小此值的计算依据样本与总体均值进行计算一般情况下常用的值为,90, 95, 99,②Number of,参数框,在此输入,1~1,000,000,000,之间的样本量数值用以计算,MonteCanoe,样本越大,计算得到的确切性显著水平越可靠,但计算过程耗时也越多3) Exact,选项,观测结果的概率此值如果小于,0.05,被认为行、列变量之间存在某些关系Time limite per minutes,复选项,选中该复选项后,在参数框中输入,19,999,999,9990,此值作为进行精确检验的最大时间。

      建议如果实际的计算时间超过了,30,分钟,最好使用,MonteCarlo,方式7) Cell,,弹出,Crosstabs: Cell Display,对话框全部选中,单击,Continue,返回,Crosstabs,对话框8),单击,Format,按钮,出现,Crosstabs: Table Format,对话框,,选中,Asending,后,单击,Continue,按钮,返回,Crosstabs,对话框,单击,OK,,,SPSS,完成交叉列联表分析3.13,多选项分析,3.13.1,统计学的定义和计算公式,,定义:多选项分析是对多选项问题的分析方法所谓多选项问题,就是一个问题的答案都是顺序变量,并且允许选择的答案可以有多个的问题要处理多选项问题,需要设计一个好的编码方案,对原来问题进行重新编码,即将一个问题转换成多个子问题,设置多个,SPSS,变量,分别存放几个可能的答案编码方案的方法有两种:,,1.,多选项二分法,(,Multiple Dichotomic Method,),,将每个可能的答案设置为一个,SPSS,变量,变量的取值有两个,分别表示选中或没选中缺点:需要的变量数比较多。

      好处,比较简单2.,多选项分类法,(Multiple Category Method),,首先估计多选项问题可能出现的答案个数,就设置几个变量采用多选项分类法,进行普通的频数分析或交叉列联表分析有时不能达到我们要求如了解某选项的选中次数,就需要将,3,个变量中该选项的次数都累加起来,而不仅仅是一个变量中该选项的累加针对多选项问题,,SPSS,提供了将变量中相同答案的频率累加起来的功能3.13.2 SPSS,中实现过程,,研究问题,1,,某商场对,6,种品牌的电视机进行消费者满意度调查,让他们选出最满意的,3,个电视机品牌,试用多选项二分法利用,SPSS,对该问题进行分析,包括频数分析和交叉列联表分析实现步骤:,(1),定义变量,输入数据,,(2)Analyze,Multiple ResponseDefine Sets,,(3),在,Define Multiple Response Sets,对话框中,将多选变量添加到,Variables in Set,框中Variables Are Coded As,框用来选择变量编剧方式,此例中选择,Dichotomies Counted value,,在其后面的框中输入数值,1,,表示等于该值的为一组,不等于,1,的为另一组。

      4)Analyze,Multiple ResponseFrequencies,,(5),在对话框中,选中前面定义的变量集,添加到,Table(s) for,框中,单击,OK,,,SPSS,即完成多选项分析的频数分析6)Analze,Multiple ResponseCrosstabs,命令,在弹出的对话框中,将,Mult Response Sets,框中的变量集添加到,Columns,框中7),选中性别添加到,Rows,框中,单击,Define Ranges,按钮,在弹出的对话框中确定变量的取值单击,Continue,返回8),在,Multiple Response Crosstabs,对话框中单击,Option,按钮,出现,Option,对话框选中,Cell Percentage,框中的,Total,项,单击,Continue,按钮返回,,Multiple Response Crosstabs,对话框,单击,OK,,完成交叉列联表分析研究问题,2,试用多选项分类对该问题进行分析本例中每个被调查人最多选择,3,个品牌,因此有,3,个变量来保存每个被调查人的选择实现步骤:,,(1),定义变量,输入数据,,(2)Anaylze,Multiple ResponseDefine Sets,,(3),在,Define Multiple Response Sets,对话框中,将多选变量添加到,Variables in Set,框中。

      输入变量集名,并单击,Add,按钮选中,Variables Are Coded As,框中的,Categories,项,表示采用多选分类法,并在后面的框中输入数值,,Range,从,1,到,6,,对应,6,个电视品牌4),Analyze,Multiple Response Frequencies,,(5),在对话框中,选中前面定义的变量集,添加到,Table(s) for,框中,单击,OK,,,SPSS,即完成多选项分析的频数分析6)Analze,Multiple ResponseCrosstabs,命令,在弹出的对话框中,将,Mult Response Sets,框中的变量集添加到,Columns,框中7),选中性别添加到,Rows,框中,单击,Define Ranges,按钮,在弹出的对话框中确定变量的取值单击,Continue,返回8),在,Multiple Response Crosstabs,对话框中单击,Option,按钮,出现,Option,对话框选中,Cell Percentage,框中的,Total,项,单击,Continue,按钮返回,,Multiple Response Crosstabs,对话框,单击,OK,,完成交叉列联表分析。

      3.14,基本统计分析的报表制作,3.14.1,报表分类,,以上,SPSS,的基本统计功能,可以用报表的形式呈现根据报表制作的侧重点不同,可以分为,3,种:,,1.,个案简明统计报表,(Cases Summary),,计算指定变量的分组统计量2.,行形式报表,(Report Summaries in Row),,以行为对象生成各种统计结果3.,列形式报表,(Report Summaries in Columns),,以列为对象生成各个列相应的统计信息3.14.2 SPSS,中实现过程,,研究问题,1—,个案简明统计报表,,某公司两个部门,20,个员工,收集到员工的基本工资、奖金和分红信息,生成个案简明统计报表实现步骤:,,(1) Analyze,ReportCase Summaries,,(2),在,Summaries Cases,对话框中,将变量添加到,Variables,框中,将分组变量添加到,Grouping Variables,框中3),选中,Display cases,复选框,将显示个案信息,其中包括:,,,Limit cases to first:,显示前面的一些个案信息。

      Show only valid cases:,仅显示有效的个案信息Show case numbers:,显示个案顺序号4),单击,Statistic,按钮,出现,Summary Report: Statistics,对话框,选中平均数、最小值、最大值,单击,Continue,按钮返回,Summarize Cases,对话框5),单击,Option,按钮,出现,Option,对话框在,Title,中输入个案总结,,在,Caption,框中输入,“,员工收入表,”,,单击,OK,,完成个案简明统计报表生成研究问题,2,—,行形式报表,,某公司两个部门,20,个员工,收集到员工的基本工资、奖金和分红信息,生成行形式统计报表实现步骤:,,(1)Analyze,ReportReport Summaries in Row,,弹出,Report Summaries in Rows,对话框,将有关变量添加到,Data Columns,,分组变量添加到,Break Columns,框中在,Sort Sequence,框中可确定排列顺序,包括:,,Ascending:,升序,,Descending:,降序,,Display cases,复选框,表示输出个案的数据的结果。

      2),单击,Data Columns,框中的一个变量,,Format,按钮可用,单击出现对话框,,设置,Column Title,、,Column title justification,、,Value Position within Column,、,Column Width,3),单击,Break Columns,框中的一个变量,,Summary,按钮可用,单击之,出现对话框该对话框用于选择需要输出的统计量4),单击,Break Columns,框下面的,Option,按钮,在对话框中进行页面控制Skip lines before break:,在框中输入行间距数值,最多为,20,行的空白区Begin next page:,在新的一页开始下一个分组变量输出,,,Begin new page&reset page number:,在新的一页开始下一分组变量输出,并重新设置下一个页面页码Blank Lines before Summaries,框后面的文本框用于输入分组标签和报告内容之间的间距,最多为,20,行空白区5)Report Summaries in Rows,对话框中的,Report,栏用于设置对全部数据的统计输出结果,单击,Summary,按钮,选择输出一些常用的统计量。

      6) Report,栏中的,Options,按钮,,,出现,Report:Options,对话框,用于缺失值和输出页码的设置Exclude cases with missing values listwise,复选框,选中表示剔除任何带有缺失值的个案Missing Values Appear as,参数框中输入代表缺失值的符号,这个符号只能是一个字符Number,,Pages from,后的文本框用于输入第一页输出报告的页码值7),单击,Report,栏中的,layout,按钮,在出现的对话框中,用于报告格式的布局设置其中:,,Page Layout,有:,Page Begins on line\Ends on lines,,Line Begins in Column\Ends in Column,,Page Titles and Footers,列表框用于设置页面的标题、脚注与内容的距离有,Lines after titles,和,Lines before footer,,Break columns,框用于控制分组变量的显示位置,,Column,,Titles,框用于选择列标题输出的显示位置。

      有下划线(,Underscore titles),、,lines after titles,列标题下的空白行数、,Vertically align,确定列标题对齐方式(,top\bottom),,Data Column Rows & Break Labels,框用于设置分组变量的标签与下一行之间的距离:,,Automatically align vertically,,Display on same row,,Display below labels,,,,(8),单击,Report,栏中的,Title,按钮,在对话框中对标题和脚注的内容设置Page Title line 1 of 1,中进行标题设置,可以从左边的变量列表中选择变量,使之成为标题的变量,进入不同的框表示不同的对齐方式Page Footer line 1 of 1,中进行脚注设置,可以从左边的变量列表中选择变量,使之成为脚注的变量,和上面的标题设置类似单击,Continue,按钮返回,report Summarries in Rows,对话框单击,OK,按钮,完成行形式报表生成研究问题,3,列形式报表,,某公司两个部门,20,个员工,收集到员工的基本工资、奖金和分红信息,生成列形式报表。

      实现步骤:,,(1)Analyze,ReportsReport Summaries in Rows,,在弹出的对话框中,将有关变量添加到,Data Columns,和,Break Coumns,框中,并做有关的设置2),单击,Data Columns,框中的基本工资变量,,Summary,按钮可用,单击之,在弹出的对话框中可以设置,,该列需要输出的统计量,由于单选框,因此只能选择一种统计量总和、平均数、最大最小值、个案数、标准差、方差、偏度和峰度),,输出大于或小于某个数值的个案百分比输出介于两个值之间的百分比3),分别设置奖金和分红两列变量的输出内容,,(4),单击,Data Columns,框下面的,Insert Total,按钮,此时,,Data Columns,框增加了一个,Total,变量,单击,Summary,按钮,出现,Report:Summary Column,对话框,添加有关的变量,在,Summary function,下拉框中选统计量包括:,,,Sum of columns:,输出各个列的和Mean of columns:,各列变量的平均值Minimim of columns:,各列变量中的最小值。

      Maximum of columns:,各列变量中的最大值1,st,Column,—,2st columns:,第一列变量的值减去第二列变量的值1,st,Column/2st columns:,第一列变量的值除以第二列变量的值 1,st,Column/2st columns:,第一列变量的值除以第二列变量的值乘,100,5),单击,Break Columns,框中的部门变量,然后单击,Option,按钮和,Format,按钮,进行分组输出格式的设置6),在,Report Summaries in Columns,对话框中,,Reports,框用于设置对全部数据的统计输出结果有关形式报告和前面的行形式报告类同,单击,OK,索然完成列形式报表生成。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.