
全套课件-Excel在统计中的应用.ppt
443页第1章 Excel基础知识•1.1 Excel基本操作•1.2 工作表的操作•1.3 公式与函数的操作•1.4 分类汇总与数据透视表•1.5 图形与图表的操作本章学习目标•Excel的命令和工具栏的应用•工作表的相关操作•Excel常用函数和公式的使用•分类汇总与数据透视表的使用•图形与图表的绘制1.1 Excel基本操作•1.1.1 Excel操作界面的构成•1.1.2 菜单和命令•1.1.3 对话框的设置•1.1.4 工具栏的应用•1.1.5 添加或删除快捷按钮返回首页1.1.1 Excel操作界面的构成•要启动Excel,首先单击Windows桌面左下角的“开始”按钮,将鼠标指向“程序”选项后,再将鼠标指向“Microsoft Excel”选项,单击鼠标左键,如图1-l所示•Excel启动后,如果调入一个工作簿文件(如book1),则可获得如图1-2所示的Excel工作界面其中包含如下几项内容:标题栏、菜单栏、工具栏、编辑栏、工作表、工作表名称、滚动条、状态栏等如图1-3所示图1-1 Windows环境下的屏幕图1-2 Excel工作表组件 图1-3 Excel最大的数据容量 返回本节1.1.2 菜单和命令•单击主菜单栏上的任意菜单,屏幕上显示一个下拉菜单,如图1-4所示。
1.当前有效命令•当前有效菜单命令是那些目前能够合法使用的命令,在当前的状态下单击命令可以执行相应操作这些命令在菜单中以深色字体显示2.当前无效命令•当前无效菜单命令是那些目前不能够合法使用的命令,它们在当前的状态下是没有意义的那些字体颜色比别的菜单命令的字体颜色浅的就是当前的无效菜单命令图1-4 下拉菜单3.具有快捷按钮的命令•在菜单中,有的菜单命令左边有一个图标,称为具有快捷按钮的命令4.快捷键•快捷键,是指直接从键盘上按规定的组合键来执行菜单对应的命令 5.会弹出对话框的命令•如果菜单命令的后面带有省略号,意味着在单击这条命令之后会出现对话框,在对话框中进行了相应的操作后才能完成某项特定功能6.带有子菜单的命令•如果菜单命令的右边有一个箭头,表示该菜单命令带有子菜单选中该菜单命令,则在该命令旁弹出一个子菜单7.复选命令•带有复选标记的菜单命令称为复选命令,如图1-5所示 图1-5 复选命令返回本节1.1.3 对话框的设置•1.单选按钮•2.复选框 •3.文本框 •4.选项卡、标签和数字增减框•5.列表框•6.下拉列表框•7.图形列表框1.单选按钮图1-6 含单选按钮的对话框2.复选框 图1-7 含复选框的对话框3.文本框 图1-8 含文本框的对话框 4.选项卡、标签和数字增减框图1-9 含选项卡、标签和数宇增减框的对话框5.列表框图1-10 含列表框的对话框6.下拉列表框 图1-11 含下拉列表框的对话框 7.图形列表框 图1-12 含图形列表框的对话框返回本节1.1.4 工具栏的应用1.常用工具栏•工具栏中的按钮都是菜单中常用命令的副本,当鼠标指向某一按钮后,稍等片刻后,在按钮右下方会显示该按钮图标的含义。
2.格式工具栏•用于编辑排版,能够使输入的数据和文本更加漂亮3.绘图工具栏•使用它可以在Excel工作表格中绘制图形图1-13 常用工具栏与格式工具栏 返回本节1.1.5 添加或删除快捷按钮1.添加按钮(1)在“工具”菜单上,单击“自定义”选项,如图1-14所示2)在“自定义”对话框中,单击“工具栏”选项卡,选中要显示的工具栏的复选框3)单击“命令”选项卡,在“类别”框中,单击要让按钮执行的命令的类别4)将所需的命令从“命令”框中拖动到显示的工具栏上 图1-14 自定义对话框2.删除按钮(1)在“工具”菜单上,单击“自定义”选项2)在“自定义”对话框中,单击“工具栏”选项卡,选中要显示的工具栏的复选框3)将要删除的按钮拖离工具栏4)在“自定义”对话框中,单击“关闭”按钮返回本节1.2 工作表的操作•1.2.1 建立工作表•1.2.2 编辑单元格•1.2.3 设置行与列•1.2.4 数据的查找与替换•1.2.5 多工作表间的操作返回首页1.2.1 建立工作表•启动Excel时,计算机自动打开工作簿和工作表这时,一般显示三张工作表,即Sheet1 、Sheet2和 Sheet3,可以根据要求对工作表进行命名或者建立新的工作表。
•新建一个工作簿有两种方法:一是将光标移动到主菜单栏上的“文件”菜单,在下拉式菜单中单击“新建”,在出现的“新建工作簿”对话框中双击“空白工作簿”即可第二种方法是,单击标准工具栏的新建按钮 返回本节1.2.2 编辑单元格•1.Excel中的数据类型•(1)标签•(2)数值•(3)公式图1-15 Excel中数据的三种类型 •2.向单元格输入数据•当选中单元格后,就可以从键盘上向它输入数据输入的数据同时在选中的单元格中和公式栏上显示出来•如果相邻几个单元格的数值相同,那么输入时不必逐个去敲,只需要在最左上角的单元格输入数值后,用鼠标选中它,然后再用鼠标对准该单元格右下角的“填充柄”(形状为一个小的黑正方形),按住鼠标左键并往右(同一行的单元格)或往下(同一列的单元格)拖,一直拖到相同内容连续单元格的最后一个,最后松开鼠标左键,结果这些相邻的单元格的相同内容就全部输入好了3.单元格的插入与删除(1)插入单元格•单击要插入的单元格,使之成为活动的单元格执行“插入”菜单中的“单元格”命令(或执行快捷菜单中的“插入”命令),这时屏幕上会出现如图1-16所示的对话框2)删除单元格•用鼠标选中要删除的单元格,使其成为活动单元格。
执行“编辑”菜单中的“删除”命令(或执行快捷菜单中的“删除”命令),这时屏幕上会出现如图1-17所示的对话框如图1-17所示 图1-16 “插入”对话框图1-17 “删除”对话框 返回本节1.2.3 设置行与列1.选中整行•只需将光标移动到所要选中行的行号处,然后单击2.选中整列•只需将光标移动到所要选中列的列号处,然后单击3.插入行或列•对于一个编辑好的表格,可能要在表中增加行或列来增加新的数据 4.删除行或列•选定要删除的行或列在“编辑”菜单上,单击“删除”命令,在“删除”对话框中,单击“整行”或“整列”即可返回本节1.2.4 数据的查找与替换数据的查找与替换比较简单执行“编辑”菜单中的“查找”或“替换”命令,在出现的“查找和替换”对话框中输入需要查找或替换的内容,单击对话框下部的不同命令按钮就会执行相应操作返回本节1.2.5 多工作表间的操作1.增减工作表2.选定多张工作表3.同时修改多张工作表4.保存工作表5.移动和复制工作表返回本节1.3 公式与函数的操作•1.3.1 公式的创建与编辑•1.3.2 Excel常用函数返回首页图1-19 函数图示1.3.1 公式的创建与编辑1.公式的创建(1)选择要建立公式的单元格。
2)键入“=” 3) 输 入 公 式 的 内 容 , 比 如“=SUM(B4:G4)”4)为了完成公式的编辑,确认输入的公式,可按Enter键或用鼠标单击编辑栏左侧的“√”按钮;如果要取消编辑的公式,则可单击编辑栏的“×”按钮2.公式中的运算符(1)算术运算符(见表1-1)(2)比较运算符(见表1-2)(3)文本运算符(见表1-3)(4)引用运算符5)运算符的优先顺序(见表1-4)表1-1 算术运算符运算符运算符名称含义操作举例运算结果+加号加=10+515-减号减=10-55*星号乘=10*550/斜杠除=10/52^脱字符乘幂=10^5100000%百分号百分比=200%2表1-2 比较运算符运算符运算符名称含义操作举例=等于号等于A1=B1>大于号大于A1>B1<小于号小于A1
7)#NUM! (8)#NULL!返回本节1.3.2 Excel常用函数1.圆周率2.对数与指数3.阶乘4.排列与组合5.随机数6.数据取舍函数7.求绝对数8.求余数与求商9.连乘与连加返回本节1.4 分类汇总与数据透视表•1.4.1 分类汇总•1.4.2 数据透视表返回首页1.4.1 分类汇总1.简单分类汇总(如图1-20所示)•分类汇总计算均值可按如下步骤进行:(1)对需要分类汇总的关键字字段进行排序2)选定数据清单中的任一单元格如图1-21所示 (3)单击“分类字段”框的下拉箭头,在弹出的下拉列表中选择所需字段作为分类汇总的依据,这里指定“组别”为分类字段图1-20 某药物代谢动力学研究数据图1-21 “分类汇总”对话框(4)单击“汇总方式”框的下拉箭头,在弹出的下拉列表中有求和、计数等11个选项 (5)在“选定汇总项”列表框中,列出了数据清单中的所有字段(变量)名称,将所有需要汇总的字段前面的复选框选中 (6)根据需要,指定汇总结果显示的位置,选定相应的复选框 (7)单击“确定”按钮,获得如图1-22所示的结果图1-22 分类汇总结果 2.删除分类汇总•如果要删除分类汇总,可单击菜单中的“数据-分类汇总”命令,然后在分类汇总对话框中单击“全部删除”按钮。
此时,数据清单恢复成原来的初始状态3.多级分类汇总•多级分类汇总的关键是正确的分类汇总次序,即先按主要关键字建立第一级分类汇总,再按次要关键字建立第二级分类汇总,依此类推在分类汇总前必须按主要关键字、次要关键字等排序(如图1-24所示)图1-24 二级分类汇总结果 返回本节1.4.2 数据透视表1.创建数据透视表•例1-4 根据如图1-25所示的“学生体育成绩”工作表中的数据建立数据透视表•具体步骤如图1-25~1-29所示图1-25 “学生体育成绩”工作表(部分数据) 图1-26 数据透视表和数据透视图向导步骤1图1-27 数据透视表和数据透视图向导步骤2图1-28 数据透视表和数据透视图向导步骤3图1-29 数据透视表的雏形2.数据透视表的结构及其工具栏(1)数据区2)数据透视表工具栏(如图1-30所示)3)编辑与组织数据透视表(如图1-31所示)图1-30 工具栏按钮的作用 图1-31 各种鼠标指针的形状3.设置报告格式与更新数据(1)设置数据透视表格式①选定数据透视表中任意单元格②单击数据透视表工具栏的“设置报告格式”按钮,弹出“自动套用格式”对话框。
③从中选择需要的报表格式后,单击“确定”按钮2)更新数据透视表•在数据透视表中任意选择一个单元格,然后单击“数据透视表”工具栏的“更新数据”按钮4.数据透视图表中创建公式(1)单击数据透视表中的某一数据2)在“数据透视表”工具栏上单击“数据透视表”或“数据透视图”,再指向“公式”,然后单击“计算字段”命令3)在“插入计算字段”对话框的“名称”框中,键入由公式新创建字段的名称,如图1-32所示4)在“公式”框中编辑公式5)单击“添加”(或修改)按钮,再单击“确定”按钮图1-32 “插入计算字段”对话框 返回本节1.5 图形与图表的操作•1.5.1 图形操作•1.5.2 图表操作返回首页1.5.1 图形操作1.“绘图”工具栏图1-33 “绘图”工具栏2.绘制图形图1-34 自选图形-基本图形图1-35 绘制的自选图形3.编辑图形图1-36 添加图形图1-37 “组合”命令图1-38 默认图形叠放次序 图1-39 “叠放次序”命令 图1-40 调整叠放层次 图1-41 “阴影样式”选项图1-42 “圆柱形”阴影效果图1-43 “等腰三角形”三维效果 图1-44 “设置自选图形格式”对话框 图1-45 “艺术字库”对话框 图1-46 “编辑‘艺术字’文字”对话框 图1-47 艺术字效果返回本节1.5.2 图表操作1.Excel图表类型简介(1)柱形、条形、圆柱、圆锥和锥图(如图1-48所示 )。
2)折线图(如图1-49所示)3)面积图(如图1-50所示) (4)饼图与圆环图(如图1-51所示 )(5)XY散点图(如图1-52所示)图1-48 柱形图的7个子图表类型 图1-49 折线图的7个子图表类型 图1-50 面积图的6个子图表类型图1-51 饼图的6个子图表类型图1-52 散点图的5个子图表类型(6)雷达图(如图1-53所示)(7)曲面图(如图1-54所示)(8)气泡图两个子图表类型:气泡图和三维气泡图(9)股价图(如图1-55所示) (10)自定义类型图1-53 雷达图的3个子图表类型图1-54 曲面图的4个子图表类型图1-55 股价图子图表类型2.创建图表(1)确定制图的目的2)将统计资料输入到Excel中去(如图1-56所示)3)在想绘制图的数据中任选一个单元格,然后在“插入”菜单中选中“图表”命令 (4)决定图形 (5)确定要绘制图表的数据范围(如图1-57~1-59所示 )(6)给图表命名 (7)图表位置的选中(如图1-60、1-61所示)图1-56 学生成绩数据图1-57 “图表向导—4步骤之2”—“数据区域”选项卡图1-58 “图表向导—4步骤之2”—“系列”选项卡图1-59 “图表向导—4步骤之3”—“标题”选项卡 图1-60 “图表向导—4步骤之4-图表位置”对话框 图1-61 统计图表结果显示返回本节第2章 统计数据的采集和整理•2.1 统计理论概述•2.2 统计数据的采集•2.3 统计数据的整理本章学习目标•统计的基本含义及统计分析的过程和方法•统计数据的构成、种类及Excel数据清单的操作•统计数据整理的内容、方法及Excel的数据整理功能 2.1 统计理论概述•2.1.1 统计的意义•2.1.2 统计分析的过程和方法返回首页2.1.1 统计的意义•统计工作包括三个主要阶段:统计调查、统计整理和统计分析。
•统计调查是根据调查方案从客观调查对象取得实际统计数据;统计整理是对统计调查所得的原始数据进行汇总、加工,使之系统化、条理化;统计分析则是以条理化的数据为基础,运用科学的分析方法,定量分析和定性分析相结合,对事物的本质和规律作出说明,从而达到反映和监督社会经济发展的目的返回本节2.1.2 统计分析的过程和方法1.统计分析过程(1)数据准备 (2)方法选择 (3)数据运算 (4)判断预测 2.统计分析方法(1)统计描述方法 (2)统计推论方法3)多元统计方法返回本节2.2 统计数据的采集•2.2.1 统计数据的构成•2.2.2 统计数据的种类•2.2.3 数据清单返回首页2.2.1 统计数据的构成•统计数据包括五个组成部分:1.数据名称2.数据值3.计量单位4.时间范围5.空间范围返回本节2.2.2 统计数据的种类1.按照数据值的表现形式不同(1)属性数据(定性数据) (2)数值数据(定量数据) 2.按照取得数据时的计量方式不同(1)测量值数据(2)计数值数据(3)分类数据(4)排序数据 返回本节2.2.3 数据清单1.数据清单结构图2-1 数据清单2.录入数据•数据的录入有三种基本方法:(1)单击目标单元格直接输入数据。
2)双击目标单元格输入数据 (3)单击目标单元格,在编辑栏中输入数据 3.数据自动填充图2-2 “Ctrl+Enter”组合键自动填充图2-3 “序列”对话框图2-4 利用“序列”对话框产生等比数列 4.利用“记录单”编辑数据 (如图2-5所示)(1)浏览记录(2)浏览符合条件的记录 (3)添加记录(4)修改记录(5)删除记录图2-5 “数据清单”对话框 返回本节2.3 统计数据的整理•2.3.1 统计数据整理的内容•2.3.2 统计数据的排序与筛选•2.3.3 统计数据的分类汇总•2.3.4 统计数据的透视分析•2.3.5 统计图与直方图分析返回首页2.3.1 统计数据整理的内容•根据分析的目的,对数据进行排序和分类(组)•对分类后的数据进行汇总,计算各类(组)及总体的指标•Excel提供了多种数据整理工具,主要有:•数据排序和筛选;频数分布函数;数据透视表;统计图;直方图分析工具返回本节2.3.2 统计数据的排序与筛选(1)按单字段排序 (2)按多字段排序(如图2-6~2-11所示)图2-6 “排序”对话框图2-7 企业财务数据 图2-8 数据按“主营业务收入”排序 图2-9 设置关键字及排序方式 图2-10 “排序选项”对话框图2-11 数据按多字段排序 2.统计数据的筛选(1)自动筛选(如图2-12~2-16所示)(2)高级筛选(如图2-17~2-20所示 )图2-12 打开“自动筛选”功能图2-13 “自动筛选前10个”对话框 图2-14 “自定义自动筛选方式”对话框图2-15 设定筛选条件图2-16 自定义筛选结果图2-17 “高级筛选”对话框图2-18 设定条件区域 图2-19 输入列表区域和条件区域图2-20 高级筛选结果返回本节2.3.3 统计数据的分类汇总•利用Excel的分类汇总功能将数据归类,并进行求和、均值等计算,并将计算结果显示出来,以便对数据进行进一步分析。
•例2-6 某班10个学生的《成本会计》课程考试成绩如图2-21所示,要求统计不同分数学生的人数如图2-22、2-23所示•例2-7 利用例2-6中排序后的资料(图2-22),分别统计60分以下、60-69分、70-79分、80-89分、90分(含)以上的学生人数如图2-24、2-25所示 图2-21 学生成绩 图2-22 按成绩排序图2-23 对“成绩”分类 图2-24 “函数参数”对话框图2-25 频数分布结果返回本节2.3.4 统计数据的透视分析1.数据透视表•例2-8 某地区三个商场6月份彩电和空调的销售数据清单如图2-26所示,通过数据透视表比较不同商场及不同厂家的不同产品的销售情况具体如图2-27~2-35所示2.数据透视图•为了更直观地反映数据透视表的分析结果,可以采用数据透视图绘制统计图形有两种方法可以创建数据透视图具体如图2-36~2-39所示 图2-26 商品销售资料 图2-27 “数据透视表和数据透视图向导-版式”对话框图2-28 设计版式图2-29 “数据透视表选项”对话框 图2-30 生成的数据透视表 图2-31 改变数据透视表版式(1) 图2-32 改变数据透视表版式(2)图2-33 改变数据透视表版式(3)图2-34 “自动套用格式”对话框 图2-35 设置透视表格式 图2-36 数据透视图(堆积柱形图)图2-37 数据透视图(簇状柱形图) 图2-38 数据透视图雏形 图2-39 图表工具栏返回本节2.3.5 统计图与直方图分析1.统计图•使用统计图可以更加直观形象地描述大量统计数据所体现出的现象的发展规律与发展趋势,以及现象之间的相互关系和现象内部的结构。
•例2-10 某大学共有教师600人,其中助教180人、讲师240人、副教授120人、教授60人,计算教师的职称结构,并绘制职称结构的饼形图具体如图2-40~2-47所示 图2-40 教师结构工作表图2-41 计算合计与比重 图2-42 选择图表类型 图2-43 确定数据区域 图2-44 设置图表选项 图2-45 绘制的饼形图图2-46 “图表标题格式”对话框图2-47 修饰后的图形2.直方图分析•Excel提供了一个直方图分析工具,可用于确定数据的频数分布、累计频数分布等直方图分析工具是Excel分析工具库中的一种,利用分析工具库中的分析工具可以进行更加复杂的统计计算及数据分析如图2-48所示•例2-11 以例2-6资料,用直方图分析工具对学生成绩进行分析具体如图2-49~2-53所示图2-48 “加载宏”对话框 图2-49 “数据分析”对话框 图2-50 “直方图”对话框图2-51 直方图选项设置 图2-52 频率分布表 图2-53 直方图表返回本节第3章 数据描述统计分析•3.1 集中趋势的测定与分析•3.2 离中趋势的测定与分析•3.3 分布形态的测定与分析•3.4 描述统计工具本章学习目标• Excel描述数据集中趋势的工作表函数及其应用• Excel描述数据离中趋势的工作表函数及其应用• Excel描述数据分布形态的工作表函数及其应用• Excel描述统计工具的内容及其应用3.1 集中趋势的测定与分析•3.1.1 集中趋势的测定内容•3.1.2 用Excel工作表函数描述集中趋势•3.1.3 三种平均数的特点返回首页3.1.1 集中趋势的测定内容•在统计研究中,需要搜集大量数据并对其进行加工整理,对这些数据进行整理之后发现:大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。
这个集中趋势是现象共性的特征,是现象规律性的数量表现返回本节3.1.2 用Excel工作表函数描述集中趋势•1.均值函数(1)算术平均数2)调和平均数3)几何平均数 •2.中位数(中位次数)函数中位数是指全体数值按大小排列后位于中间的数值 语法:MEDIAN(number1,number2, ...)如果参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值•3.众数函数众数是一组数列中出现次数最多的数值,众数函数MODE()返回某一数组或数据区域中出现频率最多的数值与MEDIAN相同,MODE也是一个位置测量函数语法:MODE(number1,number2, ...)如果数据集合中不含有重复的数据,则MODE()函数返回错误值N/A•4.最大(小)值函数最大(小)值函数可以返回数据集中的最大(小)数值语法:MAX(number1,number2,...) MIN(number1,number2, ...)如果参数不包含数字,函数MAX(MIN)返回0 返回本节3.1.3 三种平均数的特点•众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不惟一性。
一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数•中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量•均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值 •例3-1 某商场家用电器销售情况如图3-1所示•(1)计算各种电器的全年平均销售量,如图3-2所示•(2)计算各种电器销售量的中位数,如图3-3所示•(3)计算各种电器销售量的众数,如图3-4所示 图3-1 某商场家用电器销售情况 图3-2 家用电器销售量平均数 图3-3 家用电器销售量中位数 图3-4 家用电器销售量众数返回本节3.2 离中趋势的测定与分析•3.2.1 离中趋势的测定内容•3.2.2 用Excel函数计算标准差•3.2.3 四分位数与四分位距返回首页3.2.1 离中趋势的测定内容•在研究现象总体标志的一般水平时,不仅要研究总体标志的集中趋势,还要研究总体标志的离中趋势,如研究价格背离价值的平均程度研究离中趋势可以通过计算标志变异指标来进行标志变异指标是同统计平均数相联系的一种综合指标,用于度量随机变量在取值区间内的分布情况,主要有平均差、标准差、方差、四分位数、百分位数等。
在一般计算中,这些指标计算是比较复杂的,但在Excel中都有相应的函数,因而使计算变得很简单返回本节3.2.2 用Excel函数计算标准差•1.样本标准差 •2.总体标准差 1.样本标准差 •样本标准差函数用来估算样本的标准偏差,反映相对于平均值(mean)的离散程度,Excel计算样本标准差采用不偏估计式(亦即自由度=n-1),其计算公式为 语法:语法:STDEV(number1,number2,...)2.总体标准差 •总体标准差函数返回以参数形式给出的整个样本总体的标准偏差,反映相对于平均值(mean)的离散程度计算总体标准差使用整个总体的变量,通常采用偏性估计式(亦即自由度为n),其计算公式为 语法:语法:STDEVP(number1,number2,...)•例3-2 使用例3-1资料,计算各家电销售量的总体标准差,如图3-5所示图3-5 计算总体标准差•例3-3 两组工人生产某种零件的产量如图3-6所示图3-6 两组工人产量 图3-7 计算产量平均数图3-8 计算两组工人产量标准差图3-9 计算两组工人产量标准差系数返回本节3.2.3 四分位数与四分位距四分位数是将中值的前后两部分数值再等分为二,以数值小的一端算起,前半部的分区点称为第1四分位数,后半部的分区点称为第3四分位数,而中值即为第2四分位数。
四分位数通常用于在销售额和测量值数据集中对总体进行分组语法:QUARTILE(array,quart)array:需要求四分位数值的数组或数字型单元格区域quart:决定返回哪一个四分位值Quart值与QUARTILE返回值的对应关系见表3-1所示quart值函数QUARTILE返回值0最小数值1第一个四分位数(第25个百分排位)2中分位数(第50个百分排位)3第三个四分位数(第75个百分排位)4最大数值表3-1 Quart值与QUARTILE返回值的对应关系•例3-4 使用例3-1资料,计算四分位数和四分位距,如图3-10所示 图3-10 计算四分位数和四分位距返回本节3.3 分布形态的测定与分析•3.3.1 分布形态的测定内容•3.3.2 用Excel工作表函数描述分布形态返回首页3.3.1 分布形态的测定内容•只用集中趋势和离中趋势来表示所有数据,难免不够准确分析总体次数的分布形态有助于识别整个总体的数量特征总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度•峰度是掌握分布形态的另一指标,它能描述分布的平缓或陡峭程度。
如果峰度数值等于零,说明分布为正态;如果峰度数值大于零,说明分布呈陡峭状态;如果峰度数值小于零,说明分布形态趋于平缓返回本节3.3.2 用Excel工作表函数描述分布形态•1.偏度函数•2.峰度函数1.偏度函数•偏度函数返回分布的偏斜度偏斜度反映以平均值为中心的分布的不对称程度正偏斜度表示不对称边的分布更趋向正值,负偏斜度表示不对称边的分布更趋向负值其计算公式为 语法:语法:SKEW(number1,number2,...)2.峰度函数•峰度函数返回数据集的峰值,表示次数分布高峰的起伏状态峰值反映与正态分布相比某一分布的尖锐度或平坦度正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布其计算公式为 语法:语法:KURT(number1,number2, ...)•例3-5 使用例3-1资料,计算各家电销售量的偏度和峰度,如图3-11所示 返回本节3.4 描述统计工具•对于统计数据的一些常用统计量,比如均值、中位数、众数、标准差、峰度系数、偏度系数等,可以利用上述统计函数计算但Excel提供了一种更快捷的方法,就是描述统计工具描述统计分析工具用于生成数据源区域中数据的单变量统计分析报表,它可以同时计算出一组数据的多个常用统计量,提供有关数据集中趋势和离中趋势以及分布形态等方面的信息。
返回首页•例3-6 调查某企业生产车间10名工人的月工资水平,资料如图3-12所示用描述统计工具对工人工资数据进行分析图3-12 工资资料图3-13 “统计描述”对话框图3-14 “描述统计”工具输出结果返回本节第4章 概率分布与抽样分布•4.1 4.1 概率分布概率分布•4.2 4.2 抽样分布抽样分布返回首页本章学习目标u Excel离散型随机变量概率分布的工作表函数u Excel连续型随机变量概率分布的工作表函数u 利用Excel绘制正态分布图u Excel抽样分布的工作表函数4.1 概率分布•4.1.1 4.1.1 概率与概率分布概率与概率分布•4.1.2 4.1.2 二项分布二项分布•4.1.3 4.1.3 正态分布正态分布返回首页4.1.1 概率与概率分布Excel提供的离散概率分布包括:提供的离散概率分布包括:l l BINOMDIST::二项分布二项分布l l CRITBINOM::累累积积二二项项分分布布((依依临临界界值值,,找最小整数找最小整数K))l l HYPGEOMDIST::超几何分布超几何分布l l NEGBINOMDIST::负二项分布负二项分布l l POISSON::泊松分布泊松分布Excel提供的连续概率分布包括:提供的连续概率分布包括:l l BETADIST::累积概率密度函数累积概率密度函数l l BETAINV::累累积积概概率率密密度度函函数数的的反反函函数数l l EXPONDIST::指数分布函数指数分布函数l l GAMMADIST::伽玛分布函数伽玛分布函数l l GAMMAINV::伽伽玛玛累累积积分分布布函函数数的的反反函数函数l l LOGNORMDIST::对对数数正正态态累累加加分分布函数布函数l l LOGINV::对对数数正正态态累累加加分分布布函函数数的的反反函数函数l l NORMDIST::正态分布函数正态分布函数l l NORMINV::正正态态累累积积分分布布函函数数的的反反函函数数l l NORMSDIST::标标准准正正态态累累积积分分布布函函数数l l NORMSINV::标标准准正正态态累累积积分分布布函函数数的反函数的反函数l l WEIBULL::韦伯分布函数韦伯分布函数返回本节4.1.2 二项分布•1 1.二项分布函数.二项分布函数•2 2.累积二项分布函数.累积二项分布函数 •3 3.负二项分布函数.负二项分布函数 1.二项分布函数 •二项分布函数适用于固定次数的独立试验,当试验的结果只包含成功或失败两种情况时,且当成功的概率在试验期间固定不变,该函数返回一元二项式分布的概率值,其计算公式为 语法:BINOMDIST(number_s,trials,probability_s,cumulative)•例4-1 抛硬币的结果不是正面就是反面,如果每次硬币为正面的概率是0.5。
则抛硬币10 次中6次正面的概率为多少?•(1)建立“BINOMDIST函数.xls”工作表,输入有关数据,如图4-1所示•(2)在单元格C2中输入公式“=BINOMDIST(B2,B3,B4,FALSE)”,按回车键显示结果等于0.205078,如图4-2所示表示抛10硬币出现6次的概率为0.205078 图4-1 BINOMDIST函数工作表图4-2 BINOMDIST函数计算结果2.累积二项分布函数 •该函数可以计算使累积二项分布大于或等于临界值的最小整数值累积二项分布函数可以用于质量检验例如,使用函数 CRITBINOM 来决定最多允许出现多少个有缺陷的部件,才可以保证整个产品在离开装配线时检验合格•语法:CRITBINOM(trials,probability_s,alpha)图4-3 CRITBINOM函数工作表图4-4 CRITBINOM函数计算结果3.负二项分布函数 •该函数返回负二项式分布当成功概率为常量probability_s时,函数 NEGBINOMDIST返回在到达number_s次成功之前,出现number_f次失败的概率此函数与二项式分布函数相似,只是它的成功次数固定,试验总数为变量。
与二项式分布类似的是,试验次数被假设为自变量,其计算公式为: 语法:语法:NEGBINOMDIST(number_f,number_s,probability_s)图4-5 NEGBINOMDIST函数工作表图4-6 NEGBINOMDIST函数计算结果返回本节4.1.3 正态分布•1 1.正态分布函数.正态分布函数•2 2.绘制正态分布图形.绘制正态分布图形 1.正态分布函数 •((1 1)正态分布函数正态分布函数 •((2 2)标准正态分布函数标准正态分布函数•((3 3)正态分布函数的反函数正态分布函数的反函数•((4 4)标准正态分布函数的反函数标准正态分布函数的反函数2.绘制正态分布图形 •((1 1)建立正态分布基本数据建立正态分布基本数据 •((2 2)绘制正态分布图形绘制正态分布图形 图4-7 “序列”对话框 图4-8 结果显示(4~117行隐藏) 图4-9 “坐标轴格式”对话框 图4-10 “数据系列格式”对话框图4-11 正态分布图绘制结果 返回本节4.2 抽样分布•4.2.1 4.2.1 利用利用Excel模拟抽样过程模拟抽样过程•4.2.2 4.2.2 总体分布与抽样分布总体分布与抽样分布•4.2.3 4.2.3 中心极限定理中心极限定理•4.2.4 4.2.4 t分布分布4.2.1 利用Excel模拟抽样过程•通过抽样方法,可由母体产生所要的样本,下面抽取一个容量为10的样本。
图4-12 建立工作表图4-13 产生随机数图4-14 取整函数对话框图4-15 选定参数对话框图4-16 索引函数对话框图4-17 抽样结果返回本节4.2.2 总体分布与抽样分布•总体分布与抽样分布之间具有一定数量关系,这个数量关系可以描述为: ,即样本均值抽样分布的均值等于总体均值; ,即样本均值抽样分布的方差等于总体方差除以样本容量的平方根,即 ,此式又称为标准误差,是抽样分布的标准差返回本节4.2.3 中心极限定理w在概率统计中,正态分布占有很重要的地位,很在概率统计中,正态分布占有很重要的地位,很多随机变量服从正态分布,即使原来不服从正态多随机变量服从正态分布,即使原来不服从正态分布的一些独立的随机变量,当随机变量的个数分布的一些独立的随机变量,当随机变量的个数无限增大时,它们的和的分布也服从正态分布无限增大时,它们的和的分布也服从正态分布 返回本节4.2.4 t分布w11..t分布函数分布函数该该函函数数用用于于在在一一定定自自由由度度和和显显著著水水平平下下得得出出t分分布布的的概概率率面面积积。
t分分布布用用于于小小样样本本数数据据集集合合的的假假设设检检验,使用此函数可以代替验,使用此函数可以代替t分布的临界值表分布的临界值表语法:语法:TDIST(x,degrees_freedom,tails)2..t分布反函数分布反函数该函数返回作为概率和自由度函数的该函数返回作为概率和自由度函数的t分布的分布的t值语法:语法:TINV(probability,degrees_freedom)其其中中::probability为为对对应应于于双双尾尾t分分布布的的概概率率,,degrees_freedom为分布的自由度为分布的自由度返回本节第5章 参数估计•5.1 参数估计的基本内容•5.2 总体均值区间估计•5.3 两均值之差的区间估计•5.4 总体比例区间估计•5.5 总体标准差及方差的估计本章学习目标•Excel在总体均值区间估计中的应用•Excel在总体比例区间估计中的应用•Excel在总体标准差及方差估计中的应用5.1 参数估计的基本内容•参数估计就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计量包括点估计和区间估计两种•若总体X的分布函数形式已知,但它的一个或多个参数未知,则由总体X的一个样本估计总体未知参数的值的问题就是参数的点估计问题。
•要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计返回首页5.2 总体均值区间估计•5.2.1 总体均值区间估计的基本内容•5.2.2 利用Excel计算总体均值置信区间•5.2.3 必要抽样容量的计算公式•5.2.4 利用Excel计算必要样本单位数 返回首页5.2.1 总体均值区间估计的基本内容•设是总体X的一个样本,X~N(μ,σ2),求总体均值μ的置信区间1.总体方差σ2已知,求μ的置信区间•构造总体均值μ的置信区间为:2.总体方差σ2未知,求μ的置信区间•构造均值μ的置信区间为:返回本节5.2.2 利用Excel计算总体均值置信区间•例5-1 从某班男生中随机抽取10名学生,测得其身高(cm)分别为170、175、172、168、165、178、180、176、177、164,以95%的置信度估计本班男生的平均身高•在95%的置信度下,本班男生身高的置信区间为(168.5063658,176.4936342)计算结果如图5-1所示图5-1 总体均值置信区间的计算返回本节5.2.3 必要抽样容量的计算公式•在 总 体 均 值 的 区 间 估 计 中 , 置 信 区 间 为 。
从公式中可以看出,从到的距离实际上为置信区间长度的1/2,这段距离表示在一定的置信度1-α下,用样本均值估计总体均值时所允许的最大绝对误差,即抽样极限误差,它表示抽样误差的可能范围,又称允许误差•如果用Δ表示抽样极限误差,则•那么样本容量n的大小则为确定抽样数目,应考虑以下几个问题:•(1)被调查总体的标志变动程度总体各单位值之间差异程度大,抽样数目就多,反之可以少些•(2)对推断精确度的要求,即被允许的抽样误差范围在标志变动程度不变的条件下,精确度要求越高,即被允许的误差范围越小,抽样数目就需要增加,反之可以减少•(3)对推断把握程度的要求在其他条件不变的情况下,要提高抽样的把握程度,抽样数目就需要增加,反之可以减少•(4)抽取调查单位的方式 返回本节5.2.4 利用Excel计算必要样本单位数•例5-2 某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?如图5-2、5-3所示 图5-2 “样本容量计算”工作表 图5-3 必要样本容量计算返回本节5.3 两均值之差的区间估计•5.3.1 总体方差已知•5.3.2 大样本总体方差未知•5.3.3 小样本总体方差未知但相等•5.3.4 小样本总体方差未知且不等•5.3.5 成对样本的均值之差 返回首页5.3.1 总体方差已知返回本节5.3.2 大样本总体方差未知返回本节5.3.3 小样本总体方差未知但相等返回本节5.3.4 小样本总体方差未知且不等•如果正态分布总体的方差未知,而且不相等,则当小样本时: •并不服从t分布,只是近似服从t分布,其自由度为: 返回本节•上述的两均值之差是建立在两个独立样本上,样本之间彼此无关。
但如果两个样本是成对地发生,那么这两个样本必定相关由于受试者是成对地被观察,例如抽取某个家庭的老大和老小;调查某位先生和他的太太;测量某位受试者受训前和受训后的体重,因此两样本之间会有关连,而非两个独立样本5.3.5 成对样本的均值之差返回本节5.4 总体比例区间估计•5.4.1 样本比例的区间估计•5.4.2 估计总体比例的必要抽样容量 返回首页5.4.1 样本比例的区间估计•同均值的区间估计一样,总体比例的推断也建立在样本比例的抽样分布基础上样本比例分布直接来源于二项分布从理论上说,二项分布是确定置信区间用以估计总体比例的一种恰当的分布,但当样本单位数较大时,概率的计算非常复杂,所以使用二项分布估计总体比例非常困难根据中心极限定理,随着样本容量的增加,二项分布渐近于正态分布,所以这时可以用正态分布代替二项分布•样本比例抽样分布的数量特征如下:•样本比例抽样分布的标准差为 •标准正态分布,确定围绕 值的置信区间是:图5-4 建立工作表图5-5 样本比例区间估计的计算结果返回本节5.4.2 估计总体比例的必要抽样容量•比例估计同均值估计相同,也存在一个必要样本容量问题,也受极限误差、置信水平的制约。
对于比例估计来讲,其必要样本容量的计算公式为: 图5-6 “比例样本容量”工作表 图5-7 计算结果返回本节5.5 总体标准差及方差的估计•5.5.1 方差估计的内容和工作表函数•5.5.2 总体方差的置信区间 返回首页5.5.1 方差估计的内容和工作表函数•1.大样本情况下总体标准差的区间估计 •2.小样本情况下正态总体方差的置信区间 1.大样本情况下总体标准差的区间估计 2.小样本情况下正态总体方差的置信区间 •Excel提供了两个用于方差估计的工作表函数 •(1)卡方分布函数该函数返回卡方分布的单尾概率•(2)卡方分布反函数该函数返回卡方分布单尾概率的反函数值 返回本节5.5.2 总体方差的置信区间•例5-5 对某机床生产的一批模具随机抽取20件进行尺寸检测,其尺寸的标准差为0.5毫米,假定总体服从正态分布,以95%的置信度估计这批模具尺寸的方差的置信区间结果如下图所示图5-8 “方差区间估计”工作表 图5-9 计算结果返回本节第第6章章 假设检验假设检验•6.1 假设检验的基本思想和步骤•6.2 总体标准差已知条件下均值双侧检验•6.3 标准差未知时总体均值的假设检验•6.4 总体方差的假设检验本章学习目标本章学习目标u 假设检验的基本思想与步骤u Excel在总体标准差已知条件下均值检验中的应用u Excel在总体标准差未知条件下均值检验中的应用u Excel在总体方差检验中的应用6.1 假设检验的基本思想和步骤假设检验的基本思想和步骤•6.1.1 假设检验的基本思想•6.1.2 假设检验的基本步骤 返回首页6.1.1 假设检验的基本思想假设检验的基本思想•假设检验是根据样本的信息来判断总体分布是否具有指定的特征,在管理方面有时称之为古典决策。
在质量管理中经常用到它,例如检验新产品质量是否有显著提高,利用各种控制图判断工序是否出现异常现象等•在数理统计中,把需要用样本判断正确与否的命题称为一个假设根据研究目的提出的假设称为原假设,记为H0;其对立面假设称为备择假设(或对立假设),记为H1提出假设之后,要用适当的统计方法决定是否接受假设,称为假设检验或统计假设检验返回本节6.1.2 假设检验的基本步骤假设检验的基本步骤一般来说,假设检验需要经过以下操作步骤:•(1)构造假设•(2)确定检验的统计量及其分布•(3)确定显著性水平•(4)确定决策规则•(5)判断决策 返回本节6.2 总体标准差已知条件下均值总体标准差已知条件下均值双侧检验双侧检验•6.2.1 构造检验统计量•6.2.2 P值法•6.2.3 临界值法 返回首页6.2.1 构造检验统计量构造检验统计量 图6-1 双侧检验的拒绝与接受域 图6-2 单侧检验的拒绝与接受域(1)图6-3 单侧检验的拒绝与接受域(2)图6-4 “双侧检验”工作表图6-5 最终计算结果返回本节6.2.2 P值法值法•P值法是将统计量z值转换成概率,即大于统计量z的绝对值的概率。
以例6-2资料为例,如图6-6所示,阴影区域的面积即为该概率•在Excel中可以用标准正态分布函数NORMSDIST计算这个面积,返回小于已知标准正态变量的概率如果变量值为-2.76694,则NORMSDIST将返回图6-6中左侧阴影区域的面积;如果变量值为2.76694,则NORMSDIST将返回这个值左边区域的面积,它等于1减去图6-6中右侧阴影部分的概率本例要求的是双侧阴影区域的面积,把由-2.76694所计算的概率加倍,即可得到该概率 具体操作步骤如下:(1)打开“双侧检验”工作表2)在单元格D1中输入公式“=2*NORMSDIST(-ABS(B7))”,回车后显示P值0.0056593)在单元格D2中输入公式“=IF(D1 图6-8 临界值法检验结果返回本节6.3 标准差未知时总体均值的假标准差未知时总体均值的假设检验设检验•设总体X服从正态分布N(μ, σ2),方差σ2未知,此时,可以用服从t分布的统计量去检验总体均值由于总体方差σ2未知,因而需要用样本标准差s代替总体标准差返回首页•例6-3 某糖厂用自动打包机包糖,每包重量服从正态分布,其标准重量μ0=100斤,某日开工后测得10包的平均重量为99.98斤,标准差为1.23斤,如果显著性水平为0.05,那么打包机的工作是否正常? 设每包糖的重量为X,X~N(μ, σ2),σ2未知由题意作假设H0:μ=100,H1:μ≠100•(1)建立“t双侧检验”工作表,如图6-9所示•(2)在单元格B1、B2、B4、B5、B6中分别输入100、1.23、99.98、10、0.05•(3)在单元格B3中输入“=B2/SQRT(B5)”,计算标准误差,回车后显示0.38896•(4)在单元格B7中输入公式“=ABS((B4-B1)/B3)”,回车后显示0.051419,为统计量t的值•( 5) 在 单 元 格 D3中 输 入 公 式“=TINV(B6,B5-1)”,回车后显示2.262157,为临界双侧t值。 •(6)根据样本数据计算P值在单元格D1中输入公式“=TDIST(B7,B5-1,2)”,回车后显示P值0.960115•( 7) 在 单 元 格 D2中 输 入 公 式“=IF(D1 •(2)构造检验统计量 ,在H0成立的条件下,统计量服从自由度为n-1的x2分布•(3)确定显著性水平•(4)规定决策规则•(5)进行判断决策返回本节6.4.2 总体方差单侧检验总体方差单侧检验•(2)在单元格B1~B4中分别输入5000、7200、26、0.05•(3)计算x2检验统计量在单元格B5中输入公式“=(B3-1)*B2/B1”,回车后显示36•(4)计算单侧P值在单元格B6中输入公式 “=CHIDIST(B5,B3-1)”, 回 车 后 显 示0.0716•(5)计算右侧x2临界值在单元格B7中输入公式“=CHIINV(B4,B3-1)”,回车后显示37.65248•(6)显示检验结论 图6-11 “方差检验”工作表图6-12 方差单侧检验计算结果返回本节6.4.3 总体方差双侧检验总体方差双侧检验•例6-5 以例6-4资料为例,在0.05的显著性水平下,是否可以证明这种电池寿命的方差不是5000小时图6-13 双侧P值检验计算结果返回本节第7章 方差分析•7.1 单因素方差分析•7.2 单因素方差分析工具•7.3 双因素方差分析本章学习目标•方差分析的基本思想•Excel单因素方差分析工具的运用•Excel无重复双因素方差分析工具的运用•Excel有重复双因素方差分析工具的运用7.1 单因素方差分析•7.1.1 单因素方差分析的构想•7.1.2 检验模型•7.1.3 方差分析表返回首页•方差分析最简单的形式就是单因素方差分析。 单因素方差分析可用于检验两个或两个以上总体均值相等的原假设方差分析有三个基本假设:•(1)每个总体都应服从正态分布也就是说,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本•(2)各个总体的方差必须相同也就是说,各组观察数据是从具有相同方差的总体中抽取的•(3)观察值是独立的7.1.1 单因素方差分析的构想•为了分析某一个因素A对所考察的随机变量ξ的影响,我们可以在试验时让其它因素保持不变,而只让因素A改变,这样的试验叫做单因素试验,因素A所处的状态叫做水平(如表7-1、7-2所示) 表表7-1 不同水平下的样本观测值不同水平下的样本观测值表7-2 各组销售人员销售业绩•在Excel中具体的操作步骤如下:•(1)建立“方差分析”工作表,如图7-1所示•(2)在单元格A7中输入“样本均值”,在单元格A8中输入“总体均值”•(3)选择单元格B7,输入公式“=AVERAGE(B2:B6)”,计算样本均值,并将其复制到C7和D7单元格中,得到的值分别是2228.80、2928.00和1951.60•(4)在单元格D8中输入公式“=AVERAGE(B2:D6)”,回车后显示2369.47。 •(5)建立一个新工作表“计算表” •(6)分别将单元格A2~A6、A7~A11、A12~A16合并,并分别输入“第一组”、“第二组”、“第三组”,表示样本的组数•(7)将“方差分析”工作表中B2~B6、C2~C6、D2~D6区域内的数据复制到“计算表”的B2~B16区域中•(8)在“方差分析”工作表中选择单元格B7,单击“复制”按钮,切换到“计算表”工作表,选定单元格C2~C6,右击选择“选择性粘贴”选项,打开“选择性粘贴”对话框,单击“粘贴链接”按钮同样方法将“方差分析”表C7、D7中的数据复制到“计算表”的C7~C11、C12~C16区域•(9)按照步骤(8)的方法将“方差分析”表D8中的数据复制到“计算表”D2~D16区域 图7-1 “方差分析”工作表图7-2 “计算表”工作表 返回本节7.1.2 检验模型•接例7-1,构造F统计量进行检验,需要利用“计算表”中的数据•(1)打开“计算表”工作表,在单元格E1、F1、 G1中 分 别 输 入 “(x-xbar)2”、 “(xbar-Xbar)2”和“(x-Xbar)2”,分别表示组内方差、组间方差和总方差在单元格A17中输入“合计”。 •(2)在单元格E2中输入“=(B2-C2)^2”,回车后显示29172.64•(3)在单元格F2中输入“=(C2-D2)^2”,回车后显示19787.11•(4)在单元格G2中输入“=(B2-D2)^2”,回车后显示97011.48•(5)选择单元格E2:G2,并复制到E3:G16区域中•(6)在单元格E17中输入“=SUM(E2:E16)”,并将其复制到F17和G17计算结果如图7-3所示图7-3 各离差平方和的计算返回本节7.1.3 方差分析表•下面用Excel建立方差分析表•(1)打开“方差分析”工作表和“计算表”工作表•(2)在“方差分析”工作表的单元格B10~F10中分别输入“平方和”、“自由度”、“均方差”、“F值”、“P值”;分别在单元格A11~A13中输入“组间方差”、“组内方差”和“总方差”•(3)将“计算表”工作表单元格E17、F17、G17中的数据“粘贴链接”到“方差分析”工作表的B12、B11和B13单元格中•(4)确定各方差的自由度总方差的自由度是样本容量数之和减1,因此应为5+5+5-1=14,在单元格C13中输入14 •(5)在单元格D11中输入“=B11/C11”,并将其复制到D12和D13。 •(6)在单元格E11中输入“=D11/D12”,计算F值•(7)在单元格F11中输入公式“=FDIST(E11,C11,C12)”,回车后显示0.078425,即为P值计算结果如图7-4所示图7-4 方差分析表返回本节7.2 单因素方差分析工具•Excel分析工具中具有方差分析模块,利用它分析例7-1可以产生与7.1节操作相同的结论具体方法如下:•(1)打开“方差分析”工作表•(2)选择“工具”菜单中的“数据分析”选项,弹出“数据分析”对话框,选择“方差分析:单因素方差分析”选项,单击“确定”按钮,进入“方差分析:单因素方差分析”对话框•(3)在“输入区域”中输入“$B$1: $D$6”,选中“标志位于第一行”复选框,在“”区域中输入0.1,表明显著性水平选中“输出区域”,输入“$A$16”,表明以A16为起点放置方差分析结果,如图7-5所示 •(4)单击“确定”按钮,输出结果如图7-6所示返回首页图7-5 “方差分析:单因素方差分析”对话框图7-6 单因素方差分析输出结果图7-6 单因素方差分析输出结果•用Excel进行方差分析•(1)输入原始数据•(2)实现自动计算,得出方差分析结果。 图7-7 “增重试验分析”工作表图7-8 单因素方差分析输出结果返回本节7.3 双因素方差分析•7.3.1 无重复双因素方差分析•7.3.2 有重复的双因素方差分析返回首页7.3.1 无重复双因素方差分析•例7-3 将土质基本相同的一块耕地等分为5个地块,每个地块又等分成4个小块,有4个品种的小麦,在每一地块内随机地分种在4小块上,每一小块种同样多种子的任意一种小麦,今测得收获量如表7-4所示表7-4 小麦产量表图7-9 “无重复方差分析”工作表图7-10 “方差分析:无重复双因素方差分析”对话框图7-11 无重复双因素方差分析结果返回本节7.3.2 有重复的双因素方差分析•有重复的双因素方差分析是用来分析影响某一特定结果的两个不同的特征值之间关系的一种方法它与无重复双因素分析相比具有以下几点区别:•(1)通常调查者对两个因素都感兴趣•(2)每个因素的每组值都不止一个观察值•(3)除了每个因素的影响外,分析者也应注意到因素之间的相互作用,这些因素的不同组合可能带来不同影响•例7-4 为了了解3种改革方案(因素B)在3个不同地区(因素A)促使经济效益提高的状况,现抽样调查,得到数据如表7-5所示(假定数据来自方差相等的正态分布)。 试在5%的显著性水平下推断不同的地区、方案以及两者的交互作用中哪些因素对经济效益的提高有显著影响•(1)建立“重复方差分析”工作表,输入相关数据,如图7-12所示•(2)选择“工具”菜单中的“数据分析”选项,弹出“数据分析”对话框,选择“方差分析:可重复双因素分析”选项,单击“确定”按钮,进入“方差分析:可重复双因素分析”对话框•(3)在“输入区域”中输入“$A$1: $D$7”,在“每一样本的行数”中输入2,在“”区域中输入0.05,表明显著性水平•(4)单击“确定”按钮,显示输出结果,如图7-14所示 表7-5 改革方案效益表图7-12 “重复方差分析”工作表图7-13 “方差分析:可重复双因素分析”对话框图图7-14 可重复双因素分析结果可重复双因素分析结果表7-6 猪仔重量数据图7-15 “分组试验”工作表图7-16 有重复双因素方差分析结果返回本节第8章 回归分析•8.1 线性回归分析的基本原理•8.2 图表分析与回归函数分析•8.3 Excel回归分析工具•8.4 多元回归分析•8.5 非线性回归分析本章学习目标u 回归分析的基本思想u 利用Excel图表进行线性回归分析u利用Excel回归分析工作表函数进行线性回归分析u利用Excel回归分析工具进行一元及多元线性回归分析u 非线性回归分析的基本思路8.1 线性回归分析的基本原理•8.1.1 回归分析的概念•8.1.2 回归分析的主要内容返回首页8.1.1 回归分析的概念•首先要区分两种主要类型的变量:一种变量相当于通常函数关系中的自变量,对这样的变量能够赋予一个需要的值(如室内的温度、施肥量)或者能够取到一个可观测但不能人为控制的值(如室外的温度),这样的变量称为自变量;自变量的变化能引起另一些变量(如水稻亩产量)的变化,这样的变量称为因变量。 •由一个或一组非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型及所进行的统计分析,称为回归分析因此,回归分析是研究随机变量与非随机变量之间的数量关系的一种数学方法如果所建立的模型是线性的就称为线性回归分析线性回归分析不仅告诉我们怎样建立变量间的数学表达式,即经验公式,而且还利用概率统计知识进行分析讨论,判断出所建立的经验公式的有效性,从而可以进行预测或估计返回本节8.1.2 回归分析的主要内容•回归分析的内容包括如何确定因变量与自变量之间的回归模型;如何根据样本观测数据,估计并检验回归模型及未知参数;在众多的自变量中,判断哪些变量对因变量的影响是显著的,哪些变量的影响是不显著的;根据自变量的已知值或给定值来估计和预测因变量的值•Excel提供了许多回归分析的方法与工具,它们可用于不同的分析目的返回本节8.2 图表分析与回归函数分析•8.2.1 利用图表进行分析•8.2.2 Excel中的回归分析工作表函数•8.2.3 利用工作表函数进行回归分析返回首页8.2.1 利用图表进行分析•例8-1 某种合成纤维的强度与其拉伸倍数之间存在一定关系,图8-1所示(“线性回归分析”工作表)是实测12个纤维样品的强度y与相应的拉伸倍数x的数据记录。 试求出它们之间的关系 •(1)打开“线性回归分析”工作表•(2)在工具栏上选择“图表向导”按钮,单击打开图表向导对话框,如图8-2所示,在“图表类型”列表框中选择“XY散点图”,单击“下一步”按钮进入图表向导步骤2 •(3)在图表向导步骤2对话框的“数据区域”中输入“B2:C13”,选择“系列产生在”为“列”,如图8-3所示,单击“下一步”按钮进入步骤3•(4)在图表向导步骤3的对话框中,打开“图例”页面,取消“显示图例”,省略标题,如图8-4所示•(5)单击“完成”按钮,得到XY散点图如图8-5所示•(6)在散点图中,把鼠标放在任一数据点上,右击,在快捷菜单中选择“添加趋势线”,打开趋势线对话框•(7)在“添加趋势线”对话框中打开“类型”页面,选择“线性”选项,在“选项”页面中选择“显示公式”和“显示R平方”选项,单击“确定”按钮,得到趋势回归图,如图8-6所示图8-1 “线性回归分析.xls”工作表图8-2 图表向导(步骤1) 图8-3 图表向导(步骤2)图8-4 图表向导(步骤3)图8-5 XY散点图图8-6 趋势回归直线返回本节8.2.2 Excel中的回归分析工作表函数•Excel提供的回归分析工作表函数主要有以下几个:•(1)截距函数。 •(2)斜率函数 •(3)测定系数函数•(4)估计标准误差函数 (1)截距函数•其功能是利用现有的x值与y值计算直线与y轴的截距截距为穿过已知的known_x's和known_y's数据点的线性回归线与y轴的交点当自变量为0时,使用INTERCEPT函数可以决定因变量的值例如,当所有的数据点都是在室温或更高的温度下取得的,可以用INTERCEPT函数预测在0°C时金属的电阻•语法:INTERCEPT(known_y's,known_x's)图8-7 x、y数据图8-8 计算截距(2)斜率函数 •该函数返回根据known_y's和known_x's中的数据点拟合的线性回归直线的斜率斜率为直线上任意两点的垂直距离与水平距离的比值,也就是回归直线的变化率•语法:SLOPE (known_y's,known_x's)•其中:Known_y's为数字型因变量数据点数组或单元格区域;Known_x's为自变量数据点集合 (3)测定系数函数•(3)测定系数函数该函数返回根据known_y's和known_x's中数据点计算得出的乘积矩相关系数的平方R平方值可以解释为y方差与x方差的比例。 •语法:RSQ(known_y's,known_x's)•回归直线的斜率计算公式如下:图8-9 计算斜率(4)估计标准误差函数 •该函数返回通过线性回归法计算每个x的y预测值时所产生的标准误差标准误差用来度量根据单个x变量计算出的y预测值的误差量•语法:STEYX(known_y's,known_x's)其中:Known_y's为因变量数据点数组或区域,Known_x's为自变量数据点数组或区域•预测值y的标准误差计算公式如下: 返回本节8.2.3 利用工作表函数进行回归分析•例8-4 在某大学一年级新生体检表中随机抽取10张,得到10名大学生的身高(x)和体重(y)的数据,如图8-10(“身高体重”工作表)所示•用Excel提供的工作表函数进行相关计算•(1)在单元格A12~A15中分别输入“截距”、“斜率”、“测定系数”、“估计标准误差”•(2)在单元格B12中输入公式“=INTERCEPT(C2:C11,B2:B11)”,回车后显示-79.42015•(3)在单元格B13中输入公式“=SLOPE(C2:C11,B2:B11)”,回车后显示0.8041825•(4)在单元格B14中输入公式“=RSQ(C2:C11,B2:B11)”,回车后显示0.6817018。 •(5)在单元格B15中输入公式“=STEYX(C2:C11,B2:B11)”,回车后显示2.8180738计算结果如图8-8所示 图8-10 “身高体重”工作表 图8-11 “身高体重”回归计算结果返回本节8.3 Excel回归分析工具•8.3.1 回归分析工具的主要内容•8.3.2 回归分析工具的应用•8.3.3 回归分析工具的输出解释返回首页8.3.1 回归分析工具的主要内容•回归分析工具是通过对一组观察值使用“最小平方法”进行直线拟合,以分析一个或多个自变量对单个因变量的影响方向与影响程度的方法它是Excel中数据分析工具的一个内容•在“工具”菜单中选择“数据分析”选项,会出现“数据分析”对话框,在分析工具中选择“回归”,单击“确定”按钮就会进入“回归”对话框,如图8-12所示在此对话框中主要包括以下内容:•Y值输入区域:•X值输入区域:•标志:•置信度:•常数为零: •输出区域:•新工作表组:•新工作簿: •残差:•标准残差:•残差图: •线形拟合图:•正态概率图: 返回本节8.3.2 回归分析工具的应用例8-5 以例8-4资料为例,利用回归分析工具进行回归分析。 1)打开“身高体重”工作表2)在“工具”菜单中选择“数据分析”选项,在“分析工具”列表中选择“回归”,单击“确定”按钮,打开“回归”对话框3)在“Y值输入区域”中输入“$C$1: $C$11”,在“X值输入区域”中输入“$B$1: $B$11”;选择“标志”,置信度默认;在“输出选项”中选择“输出区域”,在其右边输入“$D$1”,如图8-13所示,单击“确定”按钮输出结果,如图8-14所示图8-13 “回归”对话框 图8-14 回归分析结果返回本节8.3.3 回归分析工具的输出解释•Excel回归分析工具的输出结果包括3个部分:• 1.回归统计表• 2.方差分析表• 3.回归参数表•回归统计表包括以下几部分内容:•(1)Multiple R(复相关系数R):•(2)R Square(复测定系数R2):•(3)Adjusted R Square(调整复测定系数R2): •(4)标准误差: •(5)观测值: 返回本节8.4 多元回归分析•例8-6 有一个工厂会计部门在估计每月管理费y时,用工人的劳动日数x1与机器的开工台数x2作自变量,现将当年10个月的数据搜集起来,如图8-15(“多元回归分析”工作表)所示,估计y对x1与x2的线性回归方程(α=0.05)。 返回首页•(1)在“工具”菜单中选择“数据分析”选项,在“分析工具”列表中选择“回归”,单击“确定”按钮,打开“回归”对话框•( 2) 在 “Y值 输 入 区 域 ”中 输 入“D1:D11”,在“X值输入区域”中输入“B1:C11”;选择“标志”,置信度默认;在“输出选项”中选择“输出区域”,在其右边输入“A12”,单击“确定”按钮输出结果,如图8-16所示图8-15 “多元回归分析”工作表图8-16 二元线性回归分析计算结果返回本节8.5 非线性回归分析•以最小平方法分析非线性关系资料在数量变化上的规律叫做非线性回归分析从非线性回归的角度看,线性回归仅是其中的一个特例一个恰当的非线性回归方程的确定不是很容易的,一般要经过变量转换,将非线性问题转化为线性问题解决下面讨论几种非线性方程线性化的情况返回首页•1.• (1)添加趋势线• (2)利用回归分析工具 表8-1 微量元素超标量与患病人数图8-17 添加对数趋势线结果图8-18 “回归”工具获得的对数曲线模型拟合结果•2.表8-2 氰化物浓度数据图8-19 添加指数趋势线结果8-20 “回归”工具获得的指数曲线模型拟合结果•3.返回本节第9章 时间数列分析与预测•9.1 时间数列的基本特征•9.2 移动平均法分析与预测•9.3 回归法分析与预测•9.4 指数平滑法分析与预测•9.5 季节变动的测定与分析本章学习目标u 时间数列的构成及影响因素u 时间数列分析的移动平均法u 时间数列分析的回归分析法u 时间数列分析的指数平滑法u 利用长期趋势剔除法进行季节变动的分析9.1 时间数列的基本特征•9.1.1 时间数列的概念与特点•9.1.2 时间数列的构成与分解返回首页9.1.1 时间数列的概念与特点• 时间数列具有以下特点:•(1)时间数列按时间先后顺序排列。 •(2)时间数列是按一定方式搜集的一系列数据•(3)时间数列中的观察值具有差异•(4)时间数列中的数据不许遗漏返回本节9.1.2 时间数列的构成与分解•影响时间数列变动的因素主要有4种:•(1)长期趋势(T) •(2)季节变动(S) •(3)循环变动(C)•(4)不规则变动(I) 返回本节9.2 移动平均法分析与预测•9.2.1 移动平均法的概念及特点•9.2.2 趋势图直接预测法•9.2.3 利用Excel创建公式预测•9.2.4 利用移动平均分析工具预测返回首页9.2.1 移动平均法的概念及特点•移动平均法是测定时间数列趋势的一种方法它按一定的间隔长度逐期移动,计算一系列的移动平均数,来修匀原时间数列的波动,呈现出现象发展的变动趋势采取移动平均法时,移动平均间隔的长度应长短适中移动平均法是在算术平均法的基础上发展起来的预测方法,它利用过去若干期实际值的均值来预测现象的发展趋势•简单移动平均公式如下: 返回本节9.2.2 趋势图直接预测法例9-1 某电视机厂三年的销售额(万元)资料如图9-1(“移动平均.xls”工作表)所示,试对第四年的销售额进行预测1)产生“年季”变量。 1)打开“移动平均”工作表2)在C列选定任一个单元格,选择“插入”菜单中的“列”选项,则原来C列的内容被移到D列3)在C1单元格中输入标志“年季”,在C2单元格中输入公式“=B2&CHAR(13)&A2”,再把单元格C2中的公式复制到C3:C13结果如图9-2所示 图9-1 “移动平均”工作表 图9-2 产生“年季”变量•(2)绘制销售额趋势图 •1)打开“图表向导”对话框,在“图表类型”列表中选择“折线图”项;在“子图表类型”列表中选择“数据点折线图” •2)在“图表选项”中,选择“标题”页面,在“图表标题”、“分类(X)轴”、“数值(Y)轴”中分别填入“销售额趋势图”、“季度”和“销售额” 图9-3 “图表源数据”对话框图9-4 “图表选项”对话框•(3)在图表中插入趋势线进行预测•1)单击图表以激活它,选取垂直轴,双击或单击鼠标右键并从快捷菜单中选择“坐标轴格式”选项,弹出“坐标轴格式”对话框• 2)选取水平轴,双击或单击鼠标右键并从快捷菜单中选择“坐标轴格式”选项,打开“对齐”页面,取消自动设置;打开“字体”页面,设置字号为8单击“确定”按钮•3)选取图中的折线,单击鼠标右键并从快捷菜单中选择“添加趋势线”选项,打开“添加趋势线”对话框。 选择“类型”页面,在“趋势预测/回归分析类型”框中选择“移动平均”,设置“周期”为4单击“确定”按钮产生趋势图,如图9-6所示图9-5 “坐标轴格式”对话框图9-6 销售额趋势图返回本节9.2.3 利用Excel创建公式预测•可以利用Excel提供的均值函数进行移动平均计算•(1)打开“移动平均”工作表•(2)在单元格E1中输入“公式预测值”•( 3) 在 单 元 格 E6中 输 入 公 式“=AVERAGE(D2:D5)”,此处需要相对引用以便复制•(4)把单元格E6中的公式复制到E7:E14各单元格中,结果如图9-7所示可以看出,2001年第一季度的预测值为203万元图9-7 移动平均预测结果 返回本节9.2.4 利用移动平均分析工具预测•例9-2 某地区过去15年商品零售额资料如图9-8(“移动分析”工作表)所示,用移动分析工具进行预测•(1)在“工具”菜单中选择“数据分析”选项,在弹出的“数据分析”对话框中选中“移动平均”选项,并单击“确定”按钮,此时将出现“移动平均”对话框,如图9-9所示•(2)在输入区域中输入B3:B17,间隔设为3,在输出区域中输入C3,即输出区域的左上角的绝对引用。 选择“图表输出”和“标准误差”单击“确定”按钮,所得结果如图9-10所示 图9-8 零售额资料 图9-9 “移动平均”对话框图9-10 移动平均分析结果返回本节9.3 回归法分析与预测•9.3.1 时间数列预测工作表函数•9.3.2 使用直线函数和趋势函数进行线性预测•9.3.3 使用指数函数和增长函数进行非线性预测返回首页9.3.1 时间数列预测工作表函数•Excel提供的回归分析函数主要有:•1.FORECAST预测函数•2.TREND趋势函数•3.GROWTH增长函数•4.LINEST线性拟合函数 •5.LOGEST函数 1.FORECAST预测函数•该函数根据已有的数值计算或预测未来值此预测值为基于给定的 x 值推导出的 y 值已知的数值为已有的 x 值和 y 值,再利用线性回归对新值进行预测可以使用该函数对未来销售额、库存需求或消费趋势进行预测•语法:FORECAST(x,known_y's,known_x's)2.TREND趋势函数•该函数返回一条线性回归拟合线的值即找到适合已知数组known_y's和known_x's的直线(用最小二乘法),并返回指定数组new_x's在直线上对应的y值。 •语法:TREND(known_y's,known_x's,new_x's,const)3.GROWTH增长函数•该函数根据现有的数据预测指数增长值根据现有的x值和y值,GROWTH 函数返回一组新的x值对应的y值可以使用GROWTH工作表函数来拟合满足现有x值和y值的指数曲线•语法:GROWTH(known_y's,known_x's,new_x's,const)4.LINEST线性拟合函数 •该函数使用最小二乘法对已知数据进行最佳直线拟合,并返回描述此直线的数组因为此函数返回数值数组,所以必须以数组公式的形式输入•直线的公式为: 或 (如果有多个区域的x值)•语法:LINEST(known_y's,known_x's,const,stats)5.LOGEST函数 •该函数在回归分析中,计算最符合数据的指数回归拟合曲线,并返回描述该曲线的数值数组因为此函数返回数值数组,故必须以数组公式的形式输入•此曲线的公式为: 或 (如果有多个x值)。 •语法:LOGEST(known_y's,known_x's,const,stats)返回本节9.3.2 使用直线函数和趋势函数进行线性预测•1.使用LINEST函数计算回归统计值•2.使用趋势函数TREND求预测值 •3.趋势预测 图9-11 销售额资料 图9-12 计算结果 CD2参数参数b的估计值的估计值参数参数a的估计值的估计值3参数参数b的标准误差的标准误差参数参数a的标准误差的标准误差4判定系数判定系数R2y值估计标准误差值估计标准误差5F统计值统计值自由度自由度6回归平方和回归平方和残差平方和残差平方和表9-1 LINEST函数输出结果对应的统计量图9-13 趋势拟合值返回本节9.3.3 使用指数函数和增长函数进行非线性预测•例9-4 某地区1991~2000年汽车销售量(万辆)资料如图9-14(“汽车销量”工作表)所示试对其拟合指数曲线,并预测2001~2003年的销量•1.使用LOGEST函数计算回归统计量•2.使用增长函数GROWTH计算预测值图9-14 汽车销量数据图9-15 LOGEST函数计算及预测结果返回本节9.4 指数平滑法分析与预测•9.4.1 指数平滑法的基本内容与要求•9.4.2 指数平滑分析工具预测•9.4.3 最佳平滑常数的确定返回首页9.4.1 指数平滑法的基本内容与要求•指数平滑法是在移动平均法基础上发展起来的一种时间数列分析预测法,它通过计算指数平滑值,配合一定的时间数列预测模型对现象的未来进行预测。 指数平滑法通过对历史时间数列进行逐层平滑计算,从而消除随机因素的影响,识别经济现象基本变化趋势•根据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑法和三次指数平滑法等它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权•1.一次指数平滑法•2.二次指数平滑法•3.三次指数平滑法 返回本节9.4.2 指数平滑分析工具预测•例9-5 某企业1991年~2000年的产值(万元)资料如图9-16(“平滑分析”工作表)所示,下面利用指数平滑工具进行预测,具体步骤如下:•(1)选择“工具”菜单中的“数据分析”命令,弹出“数据分析”对话框 •(2)在“输入区域”指定数据所在的单元格区域B1:B11;因指定的输入区域包含标志行,所以选中“标志”复选框;在“阻尼系数”中指定系数0.3如图9-17所示•(3)单击“确定”按钮这时,Excel给出一次指数平滑值,如图9-18所示 图9-16 “平滑分析”工作表数据 图9-17 “指数平滑”对话框图9-18 指数平滑分析结果返回本节9.4.3 最佳平滑常数的确定•在指数平滑法中,预测成功的关键是的选择。 的大小规定了在新预测值中新数据和原预测值所占的比例值愈大,新数据所占的比重就愈大,原预测值所占比重就愈小,反之亦然•若把一次指数平滑法的预测公式改写为: •最佳的平滑常数应使实际值和预测值之间的差最小,通常使预测误差的平方和的平方根(RMSPE)最小•计算误差的公式为: 返回本节9.5 季节变动的测定与分析•季节变动指现象受季节的影响而发生的变动,即现象在一年内或更短的时间内随着时序的更换,呈现周期重复的变化季节变动的原因,既有自然因素又有社会因素•季节变动分析是根据以月、季为单位的时间数列资料,测定以年为周期的、随着季节转变而发生的周期性变动的规律性季节变动分析为了消除偶然性因素的影响,至少需要三年以上的数据资料,年数愈多,偶然性因素消除得愈彻底返回首页•进行季节变动分析常采用长期趋势剔除法长期趋势剔除法是指先配合趋势模型,确定各月(季)的趋势值加以剔除,再分析季节变动的方法具体有乘法型时间数列季节变动分析和加法型时间数列季节变动分析•乘法型时间数列季节变动分析是将长期趋势值去除相应的原时间数列的数据,剔除长期趋势影响,再用月(季)平均计算季节指数分析季节变动首先,计算Y/T剔除长期趋势影响;其次,根据消除长期趋势后的比率计算同季平均数和季节指数。 季节指数如果大于100%则表示旺季,小于100%表示淡季,在100%左右表示平季•加法型时间数列季节变动分析是将原时间数列的实际数据减去长期趋势值,剔除长期趋势影响,再同月(季)平均计算季节差分析季节变动首先,计算(Y-T)剔除长期趋势影响;其次,根据剔除长期趋势后的离差计算同期平均数和季节差季节差正值表示旺季,负值表示淡季,在0附近表示平季图9-19 “趋势剔除”工作表图9-20 长期趋势剔除法计算结果返回本节。












