
《统计组统计图形》PPT课件.ppt
24页统计图形统计图形n定量变量的图形表示定量变量的图形表示n分类变量的图形表示分类变量的图形表示一、定量变量的图形表示一、定量变量的图形表示n1. 1. 直方图直方图• 对于数值型变量,常用直方图(对于数值型变量,常用直方图(histogram)来展示变)来展示变量取值的分布将变量取值的范围分成若干区间,在等间量取值的分布将变量取值的范围分成若干区间,在等间隔区间的情况,每个区间的长度称为组距考察数据落入隔区间的情况,每个区间的长度称为组距考察数据落入每一区间的频数与频率,在每个区间上画一个矩形,它的每一区间的频数与频率,在每个区间上画一个矩形,它的宽度是组距,它的高度可以是频数、频率或密度(频率/宽度是组距,它的高度可以是频数、频率或密度(频率/组距),在高度是密度的情况,每一矩形的面积恰是数据组距),在高度是密度的情况,每一矩形的面积恰是数据落入区间的频率,这种直方图可以估计总体的概率密度落入区间的频率,这种直方图可以估计总体的概率密度•图1 密度直方图与频数直方图•SAS软件会根据样本容量在样本取值范围内自动地确定一个软件会根据样本容量在样本取值范围内自动地确定一个分组方式,另外也提供了设定分组的方法。
分组方式,另外也提供了设定分组的方法 n2. 2. 盒形图盒形图• 盒形图(盒形图(boxplot,又称箱图、箱线图、盒子图)是用更,又称箱图、箱线图、盒子图)是用更为简洁的方法表现数据在数轴上的分布及其特点的图形为简洁的方法表现数据在数轴上的分布及其特点的图形• 左边是根据居民家庭的收入情况所绘的盒形图;右边是左边是根据居民家庭的收入情况所绘的盒形图;右边是分地区情况所绘的盒形图分地区情况所绘的盒形图 n3. 3. 散点图散点图• 通常得到的数据可能有两个变量,比如家庭的收入和支通常得到的数据可能有两个变量,比如家庭的收入和支出情况的数据,这里家庭总收入是一个变量,而家庭总支出情况的数据,这里家庭总收入是一个变量,而家庭总支出是第二个变量希望通过图形了解收入和支出的关系,出是第二个变量希望通过图形了解收入和支出的关系,这时可以用一个变量为横坐标(如家庭总收入),另一个这时可以用一个变量为横坐标(如家庭总收入),另一个为纵坐标(这里是家庭总支出)来作图下面这种图称为为纵坐标(这里是家庭总支出)来作图下面这种图称为散点图散点图(Scatter Plot) n4. 4. 线图线图• 线图线图(Line Plot)用来表示变量间的取值变化情况,有单用来表示变量间的取值变化情况,有单式和复式两种。
式和复式两种• 在复式线图中可用不同颜色的实线来标志区别,如右图在复式线图中可用不同颜色的实线来标志区别,如右图所示 二、分类变量的图形表示二、分类变量的图形表示• 分类变量也可以通过图形直观地描绘出它们各类的数量分类变量也可以通过图形直观地描绘出它们各类的数量和所占比例,常用的有条形图、饼图和马赛克图和所占比例,常用的有条形图、饼图和马赛克图n1. 1. 条形图条形图• 条形图条形图(Bar Chart)给出分类变量取每个值的频数,如图给出分类变量取每个值的频数,如图所示为变量所示为变量R_ID取值的条形图取值的条形图•2. 2. 饼图饼图• 通常,饼图通常,饼图(Pie Chart)可以对分类变量描述其频数取值可以对分类变量描述其频数取值的比例,对于数值变量,则像直方图那样应先计算各区间的比例,对于数值变量,则像直方图那样应先计算各区间取值的频数,再按比例画出取值的频数,再按比例画出• 图中给出的是家庭支出分组频数的饼图要注意的是,图中给出的是家庭支出分组频数的饼图要注意的是,如果有太多的分组,那么饼图就不那么好看了如果有太多的分组,那么饼图就不那么好看了。
用用SASSAS绘制统计图形绘制统计图形n用用INSIGHT绘制统计图形绘制统计图形n用用“分析家分析家”绘制统计图形绘制统计图形n编程绘制统计图编程绘制统计图n图形的调整与输出图形的调整与输出一、一、 用用INSIGHT绘制统计图形绘制统计图形• INSIGHT模块可以画出多种统计图形,而且图形清晰、模块可以画出多种统计图形,而且图形清晰、美观n1. 1. 绘制直方图绘制直方图• 选择菜单选择菜单“Analyze(分析)(分析)”→“Histogram/Bar Chart (Y)(直方图(直方图/条形图)条形图)”,打开,打开“Histogram/Bar Chart (Y)”对话框在数据集的变量列表中,选择变量,然对话框在数据集的变量列表中,选择变量,然后单击后单击“Y”按钮• 单击单击“Output(输出)(输出)”按钮,在打开的对话框中选择按钮,在打开的对话框中选择“Labels(标签)(标签)”选项,如图所示,以便输出的图形显选项,如图所示,以便输出的图形显示中文标签名单击示中文标签名单击“OK”按钮返回对话框按钮返回对话框• 单击单击“OK”按钮,即可得到直方图如左图所示。
按钮,即可得到直方图如左图所示• 单击图形框左下角处的三角形,在打开的菜单中选择单击图形框左下角处的三角形,在打开的菜单中选择“Values(值)(值)”,即可在图中显示频数值,如右图所示即可在图中显示频数值,如右图所示 n2. 2. 绘制条形图绘制条形图• INSIGHT模块对分类变量绘制条形图首先单击模块对分类变量绘制条形图首先单击R_Id变变量名上边的变量作用按钮,在弹出的菜单中选择量名上边的变量作用按钮,在弹出的菜单中选择“Nominal(列名型)(列名型)”,如左图所示如左图所示• 选择菜单选择菜单“Analyze”→“Histogram/Bar Chart (Y)”,,打开打开“Histogram/Bar Chart (Y)”对话框在数据集的变量对话框在数据集的变量列表中选择变量,然后单击列表中选择变量,然后单击“Y”按钮,如右图所示按钮,如右图所示 • 单击单击“Output(输出)(输出)”按钮,在打开的对话框中选择按钮,在打开的对话框中选择“Labels(标签)(标签)”选项,单击选项,单击“OK”按钮返回对话框按钮返回对话框• 单击单击“OK”按钮,即可得到条形图如左图所示。
如果选按钮,即可得到条形图如左图所示如果选择择Income_freq(见(见2.2.2节)作为分析变量,则可以得到节)作为分析变量,则可以得到右图所示的条形图右图所示的条形图 n3. 3. 绘制盒形图绘制盒形图• 选择菜单选择菜单“Analyze”→“Box Plot/Mosaic Plot (Y)”,,可以对区间型变量作盒形图,对分类型变量作马赛克图可以对区间型变量作盒形图,对分类型变量作马赛克图打开打开“Box Plot/Mosaic Plot (Y)”对话框在数据表对话框在数据表sryzc的变量列表中,选择的变量列表中,选择income变量,然后单击变量,然后单击“Y”按钮,按钮,income变量被选定,如图左所示变量被选定,如图左所示• 单击单击“Output”按钮,在打开的对话框中选择按钮,在打开的对话框中选择“Labels”选项,取消选项,取消“Y Axis Vertical”如图右所示如图右所示 • 单击单击“OK”按钮,即可得到盒形图如左图所示按钮,即可得到盒形图如左图所示 •在在“Box Plot/Mosaic Plot (Y)”对话框中选定多个分析变量,对话框中选定多个分析变量,可以将多个盒形图画在一个坐标系下,这样便于比较变量可以将多个盒形图画在一个坐标系下,这样便于比较变量的取值情况,如图所示。
的取值情况,如图所示• 图形分析:从图中可以看到支出数据在均值两边的分布图形分析:从图中可以看到支出数据在均值两边的分布近似对称,说明低于和高于平均支出的家庭几乎各占一半;近似对称,说明低于和高于平均支出的家庭几乎各占一半;收入数据的二分之一分位数在均值的左边,说明大部分人收入数据的二分之一分位数在均值的左边,说明大部分人的收入低于平均收入另外,的收入低于平均收入另外,10号家庭的收入是一个极端号家庭的收入是一个极端值,它不具有代表性值,它不具有代表性 n4. 4. 绘制散点图绘制散点图• 选择菜单选择菜单“Analyze”→“Scatter Plot (Y X)”,打开,打开“Scatter Plot (Y X)”对话框在变量列表中,选择对话框在变量列表中,选择Income,单击,单击“Y”按钮,按钮,Income变量被选定为变量被选定为Y轴变量,轴变量,选择选择Outgo,单击,单击“X”按钮,按钮,Outgo变量被选定为变量被选定为X轴变轴变量,如图左所示量,如图左所示• 单击单击“OK”按钮,即可得到散点图如右图所示可以看按钮,即可得到散点图如右图所示可以看出收入与支出有一定的线性相关关系。
出收入与支出有一定的线性相关关系 • 在数据集窗口选中所有在数据集窗口选中所有1号地区的观测号,图下是在散点号地区的观测号,图下是在散点图中区分两个地区的情况,细点为图中区分两个地区的情况,细点为2号地区,粗点为号地区,粗点为1号地号地区从该图可以看出区从该图可以看出1号地区比号地区比2号地区在收入和支出水平号地区在收入和支出水平上都要高出许多上都要高出许多• 若在若在“Line Plot (Y X)”对话框中,将对话框中,将ID变量选定为变量选定为X轴,轴,选择选择Income变量和变量和Outgo变量,单击变量,单击“Y”按钮单击按钮单击“Output(输出)(输出)”按钮,在打开的对话框中选择按钮,在打开的对话框中选择“Labels(标签)(标签)”选项,如图左所示,以便输出的图形选项,如图左所示,以便输出的图形显示中文标签名两次单击显示中文标签名两次单击“OK”按钮,得到关于按钮,得到关于Income变量和变量和Outgo变量的复式线图(图右)变量的复式线图(图右) 二、二、 用用“分析家分析家”绘制统计图形绘制统计图形n1. 1. 绘制饼图绘制饼图• 在在“分析家分析家”中打开数据集中打开数据集mylib.sryzc。
• 选择主菜单选择主菜单“Graphs”→“Pie Chart”,打开,打开“Pie Chart”对话框,选择变量列表中的对话框,选择变量列表中的Income,单击,单击“Chart”按钮,选定分析变量,如图左所示所得饼图如按钮,选定分析变量,如图左所示所得饼图如图右所示图右所示 n2. 2. 绘制条形图绘制条形图• 选择主菜单选择主菜单“Graphs”→“Bar Chart”→“Horizontal”,打开,打开“Horizontal Bar Chart”对话框,选择变量列表中对话框,选择变量列表中的的INCOME,单击,单击“Chart”按钮,选定分析变量,选择按钮,选定分析变量,选择R_ID变量,单击变量,单击“Stack By”按钮,再选中按钮,再选中3-D选项,如图选项,如图左所示单击左所示单击“OK”按钮,得到水平条形图,如图右所示按钮,得到水平条形图,如图右所示 。












