利用大数据探索工具快速启动大数据分析
16页1、 利用大数据探索工具快速启动大数据分析 现在大数据已经成为企业信息化热点方向之一,很多企业都已经开始或者准备利用大数据大干一场,降低成本、提升数据价值,从而实现智能决策,但是从以 Hadoop 为代表的大数据技术面世以来,将近 10 年的时间,除了几家大型互联网公司以外,企业能够用好大数据的案例远远没有期望的那么多。据国外一家咨询公司 2015 年统计,只有 27% 的公司认为他们的大数据计划是成功的,而只有 8% 的认为是非常成功的。即便是在 POC 阶段,很多企业的平均成功率才只有 38%。1.jpg部署大数据分析面临哪些问题?笔者从 2014 年专注于大数据技术和相关解决方案,和很多客户沟通过,包括位列世界 500 强的大型企业,发现多数企业没有实施大数据,或者实施大数据没有成功的主要原因有两点:一个是看不清大数据的回报而犹豫不前,一个是依旧以传统数据仓库的观念来实施大数据项目,因为难以看清价值而半途而废。本文重点讨论的是第二种情况。2.jpg上图是一个数据仓库建设的典型步骤,其中前两个阶段是极其重要的,往往花费大量的时间。因为通过需求分析,了解业务人员想要哪些报表和分析,才能通
2、过模型设计确定如何建立表结构、构建事实表和维度表、建立星形结构,实现对数据立方体的切片、切块、旋转、上卷和下钻,从而支持报表的丰富展现。所以对于传统数据仓库来说,模型很重要,有没有现成的行业模型往往成为选择解决方案和产品的关键。按照这个实施步骤构建传统的数据仓库也是面临很多挑战:一是前期需求收集和确立时间过长;二是如果要用新的维度分析或者产生了新的需求,需要由 IT 人员重新建模,不仅耗费时间,而且增加了 IT 人员的负担;三是做成的报表是相对静态的,除非更改模型,否则不能灵活地查看其它结果。大数据分析情况下,由于引入了更多类型的数据,包括很多新型的数据,传统的数据仓库的模型大多不再适用于更广泛的大数据分析,而企业中的业务人员对于大数据分析往往也不知道向哪个方向进行,无法提出像传统数据仓库 KPI 那样清晰的展现需求。所以很多企业部署了 Hadoop 集群,收集了企业内部的数据,希望基于 Hive 表取代传统的关系型数据库来构建数据仓库,但是由于需求不明,基于 Hadoop 构建数据立方体和进行数据查询又远远比关系型数据库复杂,最后 Hadoop 平台往往只是进行数据加工和处理,还需要
3、把数据导回关系型数据库,通过 BI 工作来进行可视化展现,Hadoop 集群更像是一个分布式的海量存储和数据初步加工工具。3.jpg敏捷性 BI 产品在这种情况下,敏捷性 BI 产品横空出世,近年越来越成为企业优先考虑选择的 BI 工具,敏捷性 BI 和传统 BI 工具相比,其主要特点如下:4.jpg如下是敏捷性 BI 工具的一些特性说明示例:5.jpg如下是敏捷性 BI 工具的一些界面展示示例:6.jpg可以看到最左侧是数据库表结构或者是半结构化文本内容,通过拖曳即可以实现各种图表,例如地图和按照小时显示数量,针对右图可以计算趋势轨迹,对未来进行预测等,上方显示的是对年龄过滤,数据显示的是年龄在 30 到 34 岁之间,通过点击左图 0 点数量,右图也会选取相应的点,可以看到大多集中在哪些区域。这种可视化工具图形定义简单,显示直观,经过培训确实能让业务人员也可以基于各种数据来进行可视化展现,从而实现大数据分析。但是目前的敏捷性 BI 工具也有一些不足,主要表现在:7.jpg大数据探索工具为了弥补敏捷性 BI 工具的不足,同时能够为大数据分析人员提供数据相关性洞察的平台,出现了大数据探
《利用大数据探索工具快速启动大数据分析》由会员Baige****0346分享,可在线阅读,更多相关《利用大数据探索工具快速启动大数据分析》请在金锄头文库上搜索。
员工积极主动行为的组态效应:基于过程的视角
汪晖齐物平等与跨体系社会的天下想象
函数性质中的数学抽象在问题解决与设计中的应用
日本东京大学入学考试理科数学试题解析
二次电池研究进展
实践研究与论理逻辑
光学视觉传感器技术研究进展
龙泉青瓷的传承困境与发展
齐齐哈尔地区抗根肿病大白菜品种的抗性鉴定与评价
基于系统动力学模型的胶州湾海域承载力预测
基于弯液面电化学连接碳纤维实验初探
龟甲胶研究发展探析
鼻腔黏膜免疫佐剂鞭毛蛋白的研究进展
鼻内镜辅助上颌骨部分切除术治疗鼻腔鼻窦腺样囊性癌的临床分析
黑豆不同发芽期多酚、黄酮及抗氧化活性分析
齐鲁青未了:山东当代文学审美流变论
黄登水电站机电设备安装工程施工技术质量管理
黄河文化传承视角下音乐剧创作探究
黄亦琦从风论治咳嗽变异性哮喘经验※
鲸豚动物吸附式声学行为记录器综述
2022-03-24 12页
2022-03-24 11页
2022-03-24 10页
2022-03-24 25页
2022-03-24 13页
2022-03-24 18页
2022-03-24 10页
2022-03-24 32页
2022-03-24 8页
2022-03-24 9页