南开大学复习资料-大数据导论
22页1、大数据导论课程期末复习资料一、客观部分:(单项选择、多项选择)(一)、单项选择1.以下不是NoSQL数据库的是(D)A.MongoDBB.HBaseC.CassandraD.DB22以下不是目前主流开源分布式计算系统的是(A)A.AzureB.HadoopC.SparkD.Storm3.Apriori算法是一种(A)算法A.关联规则B.聚类C.分类D.预测(二)、多项选择1.大数据的特征包括( ABCD )A.体量大(Volume)B.多样性(Variety)C.速度快(Velocity)D.价值高(Value)2. 按照数据结构分类,数据可分为(ABC )A.结构化数据B.半结构化数据C.非结构化数据D.无结构数据3. 根据产生主体的不同,大数据可以分为(BC)A.产量企业应用产生的数据B.大量个人用户产生的数据C.由巨量机器产生的数据D.科研数据数据可根据产生主体的不同分为三类:(1)由少量企业应用而产生的数据。关系型数据库中的数据、数据仓库中的数据。(2)大量个人用户产生的数据。社交媒体,如微博、博客、QQ、微信、Facebook、Twitter等产生的大量文字 、图片、视频、音
2、频数据)、企业应用的相关评论数据、电子商务在线交易、供应商交易的日志数据。(3)由巨量机器产生的数据。应用服务器日志(Web站点、游戏)、传感器数据(天气、水、智能电网)、图像和视频监控、RFID、二维码或者条形码扫描的数据。4. 根据作用方式不同,大数据可以分为(AC)A.交互数据B.社交数据C.交易数据D.个人数据5. Google分布式计算模型不包括(D)A. GFSB. BigTableC. MapReduceD.RDD6. 根据数据分析深度,可将数据分析分为(BCD )A. 关联性分析B. 预测性分析C. 规则性分析D. 描述性分析7. 根据数据分析的实时性,可将数据分析分为(AD )A. 实时数据分析B. 预测性分析C. 规则性分析D. 离线数据分析二、主观部分:(一)、名词解释1. 流处理流处理:“动态数据”转变为“正使用数据”,直接处理(Straight-through Process),任务来一件做一件,信息来一点处理一点,有的直接过滤掉,有的存起来。对于流数据,多采用流处理,获得实时智能,速度快。2.磁盘阵列磁盘阵列(Redundant Arrays of Inde
3、pendent Disks,RAID),全称为“冗余的独立磁盘阵列”。冗余是为了补救措施、保证可靠性而采取的一种方法,独立是指磁盘阵列不在主机内而是自成一个系统。磁盘阵列是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。RAID可以让很多磁盘驱动器同时传输数据,在逻辑上又是一个磁盘驱动器,故使用此技术可以达到单个磁盘几倍、几十倍甚至上百倍的速率。在很多RAID模式中都有较为完备的相互校验/恢复功能,大大提高了系统容错度和稳定性。3.云存储云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是一种新兴的网络存储技术。它是云计算的重要组成部分,也是云计算的重要应用之一。云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。4.NoSQLNoSQL(Not Only SQL)泛指非关系型、分布式和不提供ACID的数据库设计模式,它不是单纯地反对关系型数据库,而是强调键值(Key-Value
4、)存储数据库和文档数据库的优点。5.数据仓库William H. Inmon在1992年出版Building the Data Warehouse一书,第一次给出了数据仓库的清晰定义和操作性极强的指导意见,真正拉开了数据仓库得到大规模应用的序幕。在该书中,将数据仓库定义为:“一个面向主题的(subject oriented)、集成的(integrate),相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,用于支持管理决策。6.云计算云计算(Cloud Computing) 是一种分布在大规模数据中心、能动态的提供各种服务器资源以满足科研、电子商务等领域需求的计算平台。同时,云计算是分布式计算、并行计算和网络计算的发展 ,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。简单的说,云计算是基于互联网相关服务的增加、使用和交付模式,通过互联网来提供一般为虚拟化的动态易扩展资源。狭义云计算指IT基础设施的交付和使用模式;广义云计算指服务的交付和使用模式。两种云计算均通过网络以按
《南开大学复习资料-大数据导论》由会员唯嘉分享,可在线阅读,更多相关《南开大学复习资料-大数据导论》请在金锄头文库上搜索。
2023年镁合金铸件项目筹资方案
2023年铜及铜合金材项目筹资方案
2023年轨道车项目融资书
2023年节电设备项目筹资方案
2023年聚砜及其合金项目融资书
2023年疗养院项目筹资方案
2023年洗发护发项目融资渠道探索
2023年水利机械项目筹资方案
2023年月子中心项目融资渠道探索
2023年显示器化学品项目筹资方案
2023年报纸报刊项目筹资方案
2023年微生物多糖项目融资渠道探索
2023年引风机项目融资书
2023年幼儿教育项目融资书
2023年居家饰品项目筹资方案
2023年图书出版项目融资书
2023年公关礼仪服务项目筹资方案
2023年优特钢:碳结钢项目融资书
2023年除菌吸氧管项目筹资方案
2023年镍压延加工材项目筹资方案
2023-05-27 23页
2023-02-08 28页
2023-06-26 24页
2023-10-20 13页
2024-01-26 8页
2022-12-26 14页
2023-11-27 5页
2022-10-17 13页
2023-02-15 11页
2023-10-14 23页