电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

大数据平台方案设计

48页
  • 卖家[上传人]:桔****
  • 文档编号:467644273
  • 上传时间:2022-09-18
  • 文档格式:DOC
  • 文档大小:398KB
  • / 48 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、项目技术方案大数据平台方案设计1.1 需求分析1.1.1 采购范围与基本要求建设XX高新区开发区智慧园区的人口库(12万居民)、法人库(1200家企业)、地理信息库(已建设区域35平方公里的3维电子地图、未建设区域80平方公里的航拍电子地图)、视频库(1000个摄像点)、大数据处理平台、数据管理服务平台。1.1.2 建设内容要求1.1.2.1 人口库人口库的基本信息以公安部门户籍和暂住人口信息为基础,整合人社、计生、民政、教育等多个部门信息资源,建设统一规范的人口库和人口信息服务平台(1)人口库的内容目录序号信息目录(一级)信息目录(二级)可能的信息源单位1人口基本信息人员信息(常驻)公安局2人员信息(暂住)3户籍成员信息4死亡信息5人员车辆信息驾驶人员信息公安局(交警系统)6机动车信息7电动车信息8社居民区服务信息房主信息房管局、村(居)委会9房屋变动信息10社区党建信息党员信息组织人社局、村(居)委会11培养党员信息12党员流入信息13党员流出信息14社居民区服务信息准生证信息社会发展局15婚前检查信息16孕前检查信息17婚育证信息序号信息目录(一级)信息目录(二级)可能的信息源单

      2、位18节育手术信息19计生处罚信息20卫生信息社区卫生服务机构信息社会发展局21医疗机构信息22医疗资源信息23卫生许可信息24民政信息社会组织信息社会发展局25区域地名信息26最低保障收入人员信息27精准扶贫对象信息村居管理委员会28社保基本信息单位信息组织人社局29参保人员信息30养老保险信息退休待遇信息31转移人员信息32失业信息失业登记和失业保险信息33医疗信息城镇职工基本医疗保险账户信息34门慢信息35定点医疗机构和定点零售药店信息36工伤信息伤残认定信息37劳动能力鉴定信息38工伤待遇信息(2)人口信息服务平台功能需求数据库层:能够安全存储人口库的内容目录中列出的信息内容,对居民、企业、政府提供安全的人口信息服务,为人口大数据分析提供基本数据源。应用支撑层:包括门户框架、数据库维护、报表组件、数据挖掘等,用于为应用层提供应用支撑。数据挖掘提供常见的数据分析/挖掘工具、通用算法,利用大数据平台的计算能力进行分析,对人口库数据进行数据挖掘与发现,提供有价值的分析结果0应用层:包括人口信息服务、人口专题分析、公共服务等。1.1.2.2 法人库法人库以工商部门的企业信息为基础,整合

      3、各参建部门系统中的法人信息,如机构代码、机构名称、机构类型、经济行业、业务经营范围、机构地址、法定代表人等字段信息,建成标识统一、结构科学、查询快捷、动态管理的法人信息库。制定与交换平台对应的相关标准、制度和规范管理体系,实现工商局、地税局、国税局、质量技术监督局等法人数据相关业务部门之间的网络互联和业务数据的实时交换与应用。(1)法人库的内容目录序号信息目录(一级)信息目录(二级)可能的信息源单位1企业基本信息股东(投资者)信息工商质监局,企业2法人信息3地址与联系信息4工商注册信息工商登记信息工商质监局5工商变更信息6工商注销信息7工商吊销信息8税务信息税务登记信息税务局9税务注销信息10税务登记验换证信息11企业发票信息12企业经营信息组织架构企业13发展战略14品牌15产品与服务信息16人力资源信息17高端技术和设备18财务报表19资质信息20信用信息21荣誉信息22文化23违规处罚等不良信息(2)法人信息服务平台功能需求数据库层:能够安全存储法人库的内容目录中列出的信息内容,对居民、企业、政府提供安全的法人信息服务,为法人大数据分析提供基本数据源。应用支撑层:包括门户框架、数

      4、据库维护、统计与报表组件、数据挖掘等,用于为应用层提供应用支撑。数据挖掘提供常见的数据分析/挖掘工具、通用算法,利用大数据平台的计算能力进行分析,对法人库数据进行数据挖掘与发现,提供有价值的分析结果应用层:包括法人信息服务、法人专题分析、公共服务等。以国土资源部空间地理数据框架作为基础,采用分布式存储并行计算的技术思路统一搭建地理信息库,再与智慧园区建设涉及的各类专题图层进行融合、关联,实现统一共享,逐渐形成XX高新区权威、丰富的地理信息数据库。要求根据不同信息资源类别,提供数据库表结构设计。地理信息库维护文件主要提供地图基本操作、地图测量、图层控制、空间分析等信息服务功能。地理信息库配置一套高性能GIS工具软件,基于高性能云GIS平台搭建,实现空问数据的统一管理,完成空间数据检查、转换、入库、管理、制图显示、服务发布等一系列空间数据分析处理功能。(1)地理信息库的内容目录序号信息目录(一级)信息目录(二级)可能的信息源单位1电子地图数据三维电子地图:已建设区域30平方公里国土资源部、中标单位测量航拍电子地图:未建设区域60平方公里2地理实体数据建筑、道路、水系、绿地、农田等国土资源部

      5、、中标单位测量3三维模型数据已建设区域30平方公里,分等级实现重点城区精细三维模型数据和其它地区简易模型数据中标单位测量、建设4城市部件数据路灯、交通灯、屏显、导示牌、标志性行道树、线缆、地下管网等城管等部门5规划数据规划用地数据规划局6POI数据企业(项目)数据规划局、办公室等(2)地理信息库管理平台功能需求数据处理:格式转换、坐标转换、属性编辑、数据裁切。数据质检:矢量数据检查、栅格数据检查、三维模型数据检查、元数据检查。入库更新:矢量数据入库、影像数据入库、三维模型数据入库、元数据入库。数据输出:矢量数据提取、栅格数据提取。查询浏览:地图浏览、数据加载、SQL查询、空间查询、数据对比浏览、元数据查历史数据管理:历史版本数据比较、版本数据提取。系统管理:权限管理、日志管理、备份恢复。2 视频库(1)视频库的内容目录序号信息目录(一级)信息目录(二级)可能的信息源单位1视频视频目录砚频监控系统数字摄像装置视频文件2视频特征视频特征文件(2)视频库管理平台功能需求与视频监控系统的接口、视频入库、视频目录管理、视频文件管理、视频特征文件生成、视频检索、视频异常发现等。2 大数据处理平台(

      6、1)大数据基础平台提供基础管控、基础服务的大数据基础支撑功能。大数据基础平台要充分利用目前先进的大数据处理技术,保证系统技术的前瞻性和先进性。大数据基础平台要求提供海量数据的采集、存储、计算、接口服务能力;需要满足海量、异构的大数据的存储、共享、开放及分析挖掘方面的要求;需要采用主流的大数据的技术架构,全面满足结构化数据、半构化数据及非结构化数据的存储、处理及计算要求;提供多种数据采集工具,支持多种格式数据采集;提供接口服务,供二次开发应用等。大数据基础平台要求能够管理大数据中心集群的物理服务器资源,控制分布式程序运行,隐藏下层故障恢复和数据冗余等细节,为大数据处理平台提供统一的管理、监控、维护等日常管理功能。主要包括:资源管理、安全管理、运维管理、集群部署及监控、任务调度等功能,同时配备友好的管理界面。数据采集要求大数据处理平台数据主要来自数据资源中心,包括基础库(人口库、法人库、地理信息库、视频库)数据、主题库(业务数据库)数据和互联网数据,同时也支持其他外部系统数据来源。数据采集系统要求提供多种数据采集工具,支持多种格式数据采集。对于结构化数据、非结构化数据以及网络数据采用不同的

      7、采集工具进行数据导入。支持多种数据采集方式,比如ETLFTR文件导入导出、关系数据库数据等。分布式存储要求平台能够根据结构化数据和非结构数据的不同特点,分别提供数据仓库和分布式列式数据库存储服务,底层支撑技术支持分布式文件系统,所有的数据可以形成多份副本均匀分布存储在各个服务节点的存储上,保证数据可靠性和提高读写效率。大数据计算引擎要求离线计算引擎(Mapreduce):离线分布式计算作为一个海量结构化数据离线处理与分析服务,着力于实时性要求不高的海量数据(TB/PB级别)离线处理。支持并行化、容错、数据分布、负载均衡。离线计算引擎需要具有PB级的存储处理能力和计算吞吐能力,支持多应用多实例并发同时计算并隔离应用数据和程序的能力。支持Mapreduce等批量数据分布式计算框架。支持分布式内存计算框架。支持作业查询预处理调度算法,可根据业务属性对指定的多个队列按照优先级的配置进行任务的提交。具备高可靠性,支持主控节点双机,避免单点故障不可恢复。具备高度可扩展,可动态增加/削减计算节点,真正实现弹性计算。支持离线计算组件界面配置化,可以对配置进行查看和修改,并立刻生效。支持离线计算组件性能

      8、指标界面可视化,通过界面实时监控组件性能指标。支持多租户权限管理能力,支持不同用户之间的资源隔离。支持多应用多实例并发同时计算并隔离应用数据和程序的能力。内存计算引擎(Spark):基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。由于中间输出和结果可以保存在内存中,从而不再需要读写分布式文件系统,能更好地适用于数据挖掘与机器学习等需要迭代的算法。支持作业查询预处理调度算法,可以根据业务属性对指定的多个队列按照优先级的配置进行任务的提交。支持审计日志可查询,在管理运维的界面中可以进行内存计算引擎日志的查询。支持相关存储目录规整,对内存计算引擎的数据目录进行规整,修改默认配置,并提供界面上的修改配置的地方。支持配置界面化,能够在管理运维界面上对内存计算引擎的配置进行查看和修改,并能够同步到前台立刻生效。支持通过界面展示性能指标,能够在界面上查看内存计算引擎的性能指标数据。支持onYarn等方式,在管理运维界面上安装服务,可以在安装的时候,选择OnYarn等的方式安装。支持内存计算引擎的Master的HA等,可以对内存计算引擎的master角色进行HA等部署,以保证该节点的高可用性。实时计算引擎(例如sparkstreaming、Storm):实时分布式计算需要提供大吞吐量的实时流式数据处理。要求保证高可靠性的前提下让数据处理更加实时,具备低延时、容错和分布计算特性。采用分布式计算框架提供实时计算服务,可按需扩容。支持高并发低延时的数据处理。计算引擎:支持SPARSTREAMING实时计算框架、STOR蹄布式流式计算框架两种计算框架功能。支持对流数据的处理,数据可以建立关联处理。高效处理数据:支持消息的分流、合流、聚合的消息处理。数据按业务分析,可支持不同的应用接入,并对应不同的应用输出计算结果。事件监测:对数据处理低延时,满足事件监控等实时性要求很高的场景。具备高可靠性,支持主控节点双机,具备自动容错能力,避免单点故障不可恢复。支持实时计算组件界面配置化,可以对配置进行查看和修改,配置修改立刻生效。支持实时计算组件性能指标界面可视化,通过界面实时监控实时计算组件性能指标

      《大数据平台方案设计》由会员桔****分享,可在线阅读,更多相关《大数据平台方案设计》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.