《数据可视化》教学课件—项目六-高级可视化分析.pptx
67页项目六 高级可视化分析目录高级可视化分析任务一 帕累托图任务二 盒须图任务三 瀑布图任务目标:制作企业采购金额帕累托图相关知识:帕累托(Pareto) 图与帕累托法则密切相关帕累托法则是19世纪末20世纪初意大利经济学家帕累托发现的他认为:在任何一组对象中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的,因此又称二八定律在市场、营销、管理等领域,帕累托法则所反映的现象广泛存在帕累托图是“揭示”帕累托法则的有力工具,以“数量占比”为横轴,“重要性占比”为纵轴,直观的显示出“两个占比”的数量关系任务分析:原始数据为某网店过去一年的客户消费金额数据为了显示该网店客户消费金额的集中度,制作帕累托图以反映累计金额的直方图与累计金额占比的线型图为基础,通过控件及参考线使得图形显示出与累计消费金额占比对应的客户数量占比任务数据:见网店销售数据任务一 帕累托图步骤2 进入工作表,如图6-2:步骤3 修改表名为帕累托图,如图6-3:图6-2图6-3任务一 帕累托图步骤4 创建计算字段消费金额百分比,公式:RUNNING_SUM(sum(累计消费金额)/TOTAL(sum(累计消费金额),如图6-4、6-5: 图6-4 图6-5任务一 帕累托图步骤4将姓名拖到列,如图6-6:步骤5:将消费金额百分比拖到行,如图6-7:图6-6任务一 帕累托图步骤6 将行区域消费金额百分比的计算依据设置为姓名,如图6-8: 图6-8 任务一 帕累托图步骤7 设置视图尺寸为适合宽度,如图6-9:步骤8 对列区域姓名设置排序,如图6-10: 图6-9 图6-10任务一 帕累托图注:如果已有其他排序,须将原排序清除。
点击排序下的清除排序即可步骤9 设置排序条件降序、累计消费金额、总计如图6-11: 图6-11任务一 帕累托图步骤10 设置标记类型为线,如图6-12: 步骤11 将累计消费金额拖到行,如图6-13: 图6-12 图6-13任务一 帕累托图步骤12 调整累计消费金额的标记类型为条形图(注意选择累计消费金额的标记类型),如图6-14:步骤13 将总计(累计消费金额)设置双轴,如图6-15: 图6-14 图6-15任务一 帕累托图步骤14 调整图形显示顺序将消费金额百分比拖到总计(累计金额)右侧,如图6-16:步骤15 为了更好地表示分布,我们将横轴转换为客户总数量的百分比创建计算字段%客户,公式index()/size(),如图6-17、6-18: 图6-16 图6-17,图6-18任务一 帕累托图步骤16 将创建的字段%客户拖放到列,如图6-19: 图6-19任务一 帕累托图步骤17将列区域%客户的计算依据设置为姓名,如图6-20: 图6-20任务一 帕累托图步骤18 将列区域的姓名拖到标记卡上的全部页签内的详细信息,如图6-21: 图6-21任务一 帕累托图步骤19 右键单击右轴的任意区域,点选设置格式,设置轴中数字格式为百分比,小数位数为0,如图6-22、6-23: 图6-22,图6-23任务一 帕累托图注:因为刻度值习惯上不设为小数。
步骤20 数字格式设置完成后,关闭当前的设置界面,如图6-24: 图6-24任务一 帕累托图注:接下来对横轴数字格式及范围进行调整步骤21 右键单击横轴的任意区域,点选设置格式,设置轴中数字格式为百分比,小数位数为0,如图6-25、6-26: 图6-25 图6-26任务一 帕累托图注:因为刻度值习惯上不设为小数步骤22 数字格式设置完成后,关闭当前的设置界面,如图6-27: 图6-27任务一 帕累托图步骤23 右键单击横轴任意区域,对横轴的范围进行编辑,见图6-28:步骤24 在编辑框中,点选固定,并将固定开始及固定结束分别设置为0,1见图6-29: 图6-28 图6-29任务一 帕累托图注:因为横轴指标%客户的数值范围介于0与1之间如图6-30,此时帕累托图的主体图形已经成型,接下来的工作是参考线及控件的制作 图6-30任务一 帕累托图步骤25 创建参数总额百分比,并设置属性及范围,如图6-31、6-32: 图6-31 图6-32任务一 帕累托图注:选择“范围”意味着设置参数的变化范围在“最小值”与“最大值”之间步长”为参数变化的最小单位步骤26 为了让累计百分比图的横轴参考线和纵轴参考线的交点落在累计百分比图上,需要创建一个新的字段作为横轴参考线的值的依据。
创建计算字段横轴参考线%,公式:IF 消费金额百分比=总额百分比THEN %客户ELSE NULLEND如图6-33、6-34图6-33图6-34任务一 帕累托图步骤27 为右轴(消费金额百分比) 添加参考线,如图6-35、6-36: 图6-35 图6-36任务一 帕累托图步骤28 将横轴参考线% 拖到标记卡上的全部页签内的详细信息,如图6-37: 图6-37任务一 帕累托图步骤29 为横轴添加参考线,如图6-38、6-39: 图6-38 图6-39任务一 帕累托图步骤30 右键单击总额百分比,将总额百分比显示参数控件,如图6-40: 图6-40任务一 帕累托图效果如图6-41,在图像右上区域出现总额百分比控件,可以通过点击控件的“”控制总额百分比参数的大小箭头所指的数字即为当前的客户数量占比可见:约70%的客户贡献了90%的销售额 图6-41任务一 帕累托图如图6-42,如果将总额百分比调整为0.8,则客户占比约为58% 图6-42任务一 帕累托图任务目标:通过图形展示整体及不同类别订单的利润率分布情况相关知识:盒须图又叫箱线图,因形状如箱子而得名盒须图包含了数据的五个统计指标最大值、最小值、中位数、及上下四分位数。
其中:中位数是按顺序排列的一组数值中居于中间位置的数上四分位数为该组数值由小到大排列后第处于75%位置的数,即该分位数数据集中%75的个体值下四分位数为该组数值由小到大排列后处于第25%位置的数,即该分位数数据集中%25的个体值通过五个指标在数据点分布图中的位置显示数据的分散程度、异常值等常见于品质管理,还可以用于对多组数据分布特征的比较任务分析:制作订单利润率的盒须图,在此基础上加入分类字段查看不同产品类别、客户类别及其交叉类别订单的利润率分布情况任务数据:见家具电商数据任务二 盒须图步骤1 导入数据,如图6-43: 图6-43任务二 盒须图步骤2 进入工作表,如图6-44: 步骤3 修改表名为盒须图,如图6-45: 图6-44 图6-45任务二 盒须图步骤4 将利润率拖到行(或双击利润率),如图6-46: 图6-46任务二 盒须图步骤5 依次点选菜单栏的分析聚和度量,解除聚合状态,如图6-47:注:聚合状态意味着当前视图显示所有数据的“聚合”值(如总和、均值等汇总性的指标值),解除聚合状态意味着视图显示所有数据点的“个体”分布情况 图6-47任务二 盒须图步骤6 在右侧的智能显示中点选盒须图,如图6-48: 图6-48任务二 盒须图注:此时盒须图的“初稿”完成,接下来对视图作必要的调整与修饰。
步骤7 交换行列,使得图形横向分布,如图6-49:注:由于视图的“宽度”大于“高度”,将视图横向排布更有利于观察数据点分布在实务中可根据分析者的习惯自行调整步骤8 将视图尺寸设置为整个视图,如图6-50: 图6-49 图6-50任务二 盒须图步骤9 由于初始图形中的数据点较小,可在标记卡的大小中向右侧移动滑块将其尺寸适当放大,如图6-51:注:标记大小可根据分析者的习惯自行调整 图6-51任务二 盒须图如图6-52所示,当前视图显示出所有订单的利润率分布情况,但在数据点分布较为密集的区域,存在着大量数据点“重合”的情况从而低估了数据点在该区间段的占比,造成“误导”如果能够将数据点“上下错开”则能够在很大程度上解决这个问题接下来通过计算字段加以实现 图6-52任务二 盒须图步骤10 创建计算字段分散变量,公式销售额%40,如图6-53、6-54: 图6-53 图6-54任务二 盒须图注1:“%”为取余运算A%B运算结果为A整除B所得到的余数例如:9除以4,商数为2,余数为1注2:公式里的“40”可根据实际分布情况调整该数值越大,则不同的点分散的范围越大注3:分散变量是销售额取余运算的结果,这里借助分散变量使得所有点“上下错开”。
步骤11 将分散变量拖到行,如图6-55: 图6-55任务二 盒须图操作效果如图6-56所示,可见大部分订单的利润率分布在-0.70.5之间0.7以下的订单分布较为稀疏区间0,0.5的数据点密度高于-0.7,0区间从图中可见中位数为0.17(需要将鼠标悬停在视图中的“盒须”部分)基本可以确定该电商平台整体上是盈利的 图6-56任务二 盒须图注:接下来查看不同类别(含产品类别、客户类别)的订单利润率分布情况步骤12 将类别拖到行,如图6-57: 图6-57任务二 盒须图步骤13 为了更好的区分各个类别,将类别拖到标记卡中的颜色,如图5-58: 图6-58任务二 盒须图注:类别为产品类别步骤14 为了视图的简洁,可将视图中的标题分散变量删除,右键单击分散变量区域,点选编辑轴,在编辑轴界面中删除标题“分散变量”,如图6-59、6-60: 图6-59 图6-60任务二 盒须图操作效果如图6-61所示,可见视图被分为三个子图,从上到下依次为:办公用品、技术、家具分别为三类产品订单的利润率盒须图可见办公用品的亏损订单占比最高,其次是家具注意到虽然办公用品类亏损订单数量比较高,但盈利订单数量也非常高,办公用品订单在盒须图中的右侧区域(高利润率区域)密度显著高于其他两类产品。
图6-61任务二 盒须图注:接下来查看不同客户类别的订单利润率分布情况步骤15 分别将标记卡及行的类别移除,如图6-62、6-63: 图6-62 图6-63任务二 盒须图步骤16 将细分拖到行,如图6-64: 图6-64任务二 盒须图注:“细分”为客户类别步骤17将细分拖到标记卡中的颜色,如图6-65: 图6-65任务二 盒须图操作效果如图6-66所示,可见视图被分为三个子图,从上到下依次为:公司、消费者、小型企业分别为三类客户订单的利润率盒须图可见三类客户“盒须”部分的分布形态大致相同利润率的中位数也相差不大小型企业的高亏损订单(分布在“稀疏区域”的订单)数量占比最低 图6-66任务二 盒须图注:接下来将类别(产品类别)也拖入行,查看不同产品/客户组合类的订单利润分布情况步骤18 将类别拖到行,如图6-67: 图6-67任务二 盒须图效果如图6-68所示,可见视图被分为九个子图,从上到下依次对应办公用品的三类客户订单利润率箱线图、技术的三类客户订单利润率箱线图、家具的三类客户订单利润率箱线图此时可以更为清晰的观察各个交叉类别的订单利润率分布情况可见,相同产品类别的箱线图大体上相差不大。
家具类别中,小型企业相较于公司、消费者,低利润率订单占比显著更低 图6-68任务二 盒须图任务目标:制作视图反映各保险产品盈利情况相关知识:瀑布图是由麦肯锡顾问公司所独创的图表类型,采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系瀑布图外观与条形图较为类似但与条形图相比,瀑布图能够对指标值较大或者为负的个体予以突出显示,从而凸显这类个体对总体的影响,提示问题或机会任务分析:原始数据为某保险公司意外险部的所有产品的年度利润由于不同保险产品的赔付情况不一样,赔付数量较多的产品往往出现较大的亏损,反之则亏损较小甚至盈利本图的目的是为了展示不同保险产品的盈利情况,并展示部门的整体盈亏状态在瀑布图中,以条形的长度展示不同产品的盈利(亏损)大小,以不同的颜色展示不同产品的盈亏状态任务数据:见意外险经营数据任务三 瀑布图步骤1 导入数据,如图6-69: 步骤2 进入工作表,如图6-70: 图6-69 图6-70任务三 瀑布图步骤3 修改表名为瀑布图,如图6-71: 步骤4 将险种拖到列,如图6-72: 图6。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


