
《生物统计中统计软件对比》.docx
8页生物统计中统计软件对比 生物学讨论结果常需生物数理统计处理结合才能够客观精确的的分析和解释生物界各种现象和试验调查资料[1-2]在讨论两个或多个变量之间相互制约、相互依存关系时,生物数理统计方法及其软件亦广泛应用,目前常用的有Excel、SPSS和SAS三者当中SAS以其最为强大的统计功能是熟识统计学并擅长编程的专业人士的首选而Excel、SPSS则受到非统计学专业人士的青睐;两者相比,SPSS分析的结果更精炼、直观,更易于把握本文结合相关分析综述三种软件的优缺点 1常用统计学软件的特点 Excel是我们日常工作中最常用的软件之一主要用于数据处理、统计分析与计算,精炼的数据库管理,而且它能绘制图表,具有检查与删除宏病毒的功能,并能与Internet网络共享资源[3]此外,还能利用VisualBasicforApplication(VBA)语言开发面对特定应用的程序,但实际应用中很少有人使用实际工作中我们常常用Excel的两大服务,一是自动计算功能,进行一些报表处理,这时Excel相对于Word来说不仅制表简单,更重要的是Excel有自动重算功能,一个数据被改动了,相应的结果会自动重算;二是Excel的制图功能,它能依据输入表中的数据自动生成曲线图、柱形图、饼形图等,大大减轻了手工制图的工作量。
SPSS(StatisticalPackagefortheSocialScienceorStatisticProductsandServiceSolution)forWindows,与Excel相比,SPSS的统计分析功能、图表功能和数据库互接功能更为强大SPSS软件处理巨大的受随机因素影响的数据时具有速度快、无编程、数据接口便利和功能模块组合敏捷等特点它使用Win-dows的窗口方式展现各种管理和分析数据方法的功能,并使用对话框展现出各种功能选择项,只要把握必定的Windows操作技能,只需粗通统计分析原理,就可以使用该软件为特定的科研工作服务SPSS集数据整理、分析功能于一身其基本功能包括数据管理、统计分析、图表分析、输出管理等等SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分多个统计过程,比如回归分析中又分线性回归分析、曲线估量、Logistic回归、Probit回归、加权估量、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数[4-5]。
SPSS也有特地的绘图系统,可以依据数据绘制各种图形其分析结果直观、易学易用,而且可以直接读取Excel及DBF数据文件由于其操作精炼,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用SAS是一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据呈现功能SAS系统中供应的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等等SAS中各模块具有相对独立的功能范围常用的模块有base,graph,stat,insight,assist,analyst模块等,分别执行基本数据处理、绘图、统计分析、数据探究、可视化数据处理等功能编程操作功能的无比强大是SAS系统的特长不管高级版本的SAS展露了可视化窗口,然而要想完全发挥SAS系统强大的功能,充塞利用其供应的丰富资源,把握SAS的编程操作是必要的,也只有这样SAS在各个方面的杰出特长才能得以体现 2结合相关分析探讨比较Excel、SPSS和SAS优缺点 2.1变量的相关分析及两个变量的相关分析 相关分析用于属于平行关系的两个变量的分析在相关分析中,变量无自变量和依变量之分,而且都具有随机误差。
相关分析只能讨论变量间的相关程度和性质,不能用一个变量的变化去预料另一个变量的变化事物间的联系是普遍的生物学中,作物产量与施肥量、气温、土壤湿度等都存在必定的联系这种说明客观事物相互间关系的亲密程度并用适当的统计指标表示出来的过程就是相关分析现以20种细胞系的细胞膜和细胞质中蛋白质含量的测定结果为例,经过三种软件的操作来进行两者之间的相关分析如本例题命名X为细胞膜中蛋白质含量,Y为细胞质中蛋白质含量,见表1 2.1.1Excel操作Excel经过其分析工具库实现统计分析数据在工作表中组织后,在“工具”菜单中单击“数据分析”命令假如在“工具”菜单中没有“数据分析”命令,则需要安装Excel的“分析工具库”安装过程如下:在“工具”菜单中,单击“加载宏”命令,单击“扫瞄”按钮,定位到Office安装盘所在位置安装完成后,再打开“加载宏”对话框,选中“分析工具库”复选框选择“工具”菜单中的“数据分析”命令,此时弹出“数据分析”对话框在分析工具列表框中选择“相关系数”在弹出的对话框中选择输入区域,即数据所在区域;分组方式依据输入数据的方式选择“逐列”或“逐行”假如输入区域的第一行中包含标志项,则选中“标志位于第一行”复选框;假如输入区域中没有标志项,则此复选框不选。
输出选项”中选择相应选项,以笃定分析结果的显示位置选择完成后,点击笃定即可显示相关系数的值Excel中若要显示统计描述需要在“数据分析”中选择“统计描述”可显示的结果有:平均、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大、最小、置信度(95.0%)等相关系数结果见表2本例X与Y的相关系数为0.55461,相关系数检验的P值为0.001,按α=0.05水准,拒绝H0,接受H1,相关系数检验有统计学意义,膜蛋白和质蛋白之间有55.461%的相关性这样的统计分析结果对于我们的后续试验有必定的指导作用 2.1.2SPSS操作SPSS相关分析经过Statistics菜单的Corre-late选项完成该命令允许同时输入两个或两个以上变量,但系统输出的是变量间两两相关的相关系数此过程经过对变量进行相关关系的分析,计算有关的统计指标,以推断变量之间相互关系的亲密程度初始设置:单击窗口左下角的“变量窗口”(VariableView),在名称、类型、长度、小数点等处适当设置完成相关设置后,单击窗口左下角的“数据窗口”(DataView),返回数据填充区在SPSS工作表中输入表1中的试验数据。
输入数据后,即可进行相关性分析详细步骤如下:选择菜单栏中的分析(Analyze)→相关分析(C)→两个变量相关分析(B),弹出“两个变量相关”对话框分别将X,Y变量选入“变量”的方框中,点击“选项”(Options),弹出“两个变量相关:选项”面板,选择“统计”中的“描述”(Descriptive),即可显示出“平均值和标准差”(M),交叉乘积的标准差和协方差(C)选项,然后点击“连续”,重新回到“两个变量相关”界面,本例分别选中“Pearson”,“双侧”和“标识显著相关”,然后点击“笃定”,即展露SPSS统计的结果见表3(省略统计描述表格)从表中可以看出,变量X,Y的相关系数为0.555,交叉乘积的标准差和协方差为267.314,14.069PearsonCorrelation(相关系数)一列中的星号含义是:显著性水平为0.001(默认值)的状况下,变量X,Y相关系数存在显著差异,与“Sig”一列的结果相对应从给出结果我们可以看到,比起Excel,SPSS的结果内容更详尽,结果分析更全面 2.1.3SAS操作与上述两种操作不同之处在于,SAS操作在建立数据集时应指定膜蛋白X与质蛋白Y两个变量。
再调用CORR过程求出相关系数1)设定数据库环境:LIBNAMEA''''C:\USER'''';2)数据步,建立数据集:DATAA.YTLI7_1;INPUTYX@@;CARDS;12.2115.214.5416.712.2711.912.0414.07.8819.811.1016.210.4317.013.3210.319.595.99.0518.76.4425.19.4916.410.1622.08.3823.18.4923.27.7125.011.3816.810.8211.212.4913.79.2124.4;RUN;3)CORR过程,进行相关分析:PROCCORRDATA=A.YTLI7_1;VARXY;RUN;CORR过程的默认输出结果主要包括各个变量的精炼统计描述(图略)和一个相关系数矩阵结果见表4SAS这种程序化操作过程精炼,但需娴熟把握相关的编程语言,而且结果内容也没有SPSS的结果详尽 2.2Excel、SAS、SPSS的评价 2.2.1数据处理Excel是日常办公的通用软件,也是作为计算机文化基础的一部分而被广泛学习作为精炼的数据处理工具,Excel操作简便,结果直观。
SPSS的数据编撰器很像Excel,可以输入数据SPSS的可视窗口界面和下拉列表可以选择特定命令但运用SPSS一次只能编撰一个数据文件,在一次涉及多个文件的数据处理中并不强大SAS在数据处理上可谓功能强大,简直可以进行任何可能的处理SAS中的sql数据库可以执行sql查询只是需要耗费大量时间来学习和理解那些在excel和SPSS中相对简单处理的精炼命令但是SAS可以同时处理几个文件相关联的数据,同时SAS还可以处理多达32768个文件,记录的数量能限制在磁盘最大容量范围内,因此它以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐 2.2.2统计分析三种软件用于统计分析的高级程度从高到低依次是:SAS,SPSS,EXCEL,就像例题中的操作一样,只要是Ex-cel“数据分析”库中包括的统计部分,都能经过精炼的操作给出精炼的统计结果但是Excel只能进行有限的几种运算(平均、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大、最小(1)、置信度(95.0%)等)SPSS可以运行众多统计分析其特长在于变量分析和多变量分析,可以进行多种特定效应检测。
SPSS的缺点是运算方法不多,只能依照软件中供应的模式进行运算SAS可以运行多数常用的统计分析SAS和SPSS一样都属于专业分析统计软件,而SAS的强势在于方差分析,混合模式分析和多变量分析,其不足在于依次多项规律回归,运算方法受到SAS语言的限制 2.2.3图表Excel的图表生成精炼,可视化窗口模式形象直观,是日常图表生成的有利工具,而且修饰加工的图形尤其美观,单元格数据与数据分析结果具有“联动”关系,转变其中一个单元格数据,与之相关的Excel公式或图表就会发生相应的转变,具有“即改即见”的效果Excel2022使之更加完竣,这些功能均为SAS、SPSS所望之不及SPSS窗口界面可以像Excel一样轻松的创建图表图片质量较高,因此被许多发表文章的采纳SAS包括最强大的图表工具SAS/Graph,但是SAS/Graph学习起来很有难度这种图表大多是经过程序性语言创建的不管SAS8以后的版本在创建图表方面展露可视化界面,但还是没有SPSS简单操作,一般适用于高级人士 3结语 综上所述,Excel易学易用,功能有限;但其内置函数数量多且使用便利公式、图形等具有即改即可见的特点,此功能在目前的SAS、SPSS等统计软件尚无法实现。
SPSS操作简易,功能强大,结果详尽,是生物统计等非计算机专业人士的首选;SAS要求用户突出熟识编程语言,这需要漫长的学习过程但一旦把握后就可以享受其强大的数据处理功能总之,三种统计软件各有千秋,每个软件都有其独到之处,也不免有其软肋所在总的来说,SAS,SPSS和Excel是能够用于多种统计分析的一组工具经过Stat/Transfer可以在数秒或数分钟内实现不同数据文件的转换因此,可以依据你。
