电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(二)》在线作业答卷

7页
  • 卖家[上传人]:哼****
  • 文档编号:119595023
  • 上传时间:2020-01-20
  • 文档格式:DOC
  • 文档大小:28.50KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、19秋学期(1709、1803、1809、1903、1909)大数据开发技术(二)在线作业-0003试卷总分:100 得分:100一、单选题 (共 25 道试题,共 50 分)1.Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素A.tailB.lastC.initD.head答案:A2.Scala列表方法中返回所有元素,除了最后一个的方法是()A.initB.headC.filterD.drop答案:A3.GraphX中()方法可以缓存整个图,并指定存储级别A.unpersistVerticesB.presistC.edges.unpersistD.cache答案:B4.以下哪个函数可以对两个RDD进行合并()A.unionB.substractC.intersectionD.cartesian答案:A5.Spark GraphX中类Graph的subgraph方法可以()A.按照设定条件取出子图B.合并边相同的属性C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.反转图中所有边的方向答案:A6.Scala中如果函数中的每个参数在函数中最多只出现一次

      2、,则可以使用占位符()代替参数。A.逗号B.斜杠C.井号D.下划线答案:D7.Spark GraphX中类Graph的reverse方法可以()A.按照设定条件取出子图B.合并边相同的属性C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.反转图中所有边的方向答案:D8.Dstream输出操作中()方法在Driver中打印出DStream中数据的前10个元素。A.saveAsTextFilesB.saveAsObjectFilesC.saveAsHadoopFilesD.print答案:D9.以下算法中属于聚类算法的是()A.随机森林B.逻辑回归C.KmeansD.KNN算法答案:C10.MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树A.trainRegressorB.trainClassifierC.LogisticRegressionModelD.LabeledPoint答案:A11.Spark GraphX中类Graph的mapReduceTriplets方法可以()A.收集邻居顶点的顶点Id和顶点属性B.收集邻

      3、居顶点的顶点IdC.将顶点信息更新到图中D.向指定顶点发送信息并聚合信息答案:D12.Spark中DataFrame的()方法是进行查询前n行记录A.whereB.limitC.joinD.apply答案:B13.以下哪个函数可以对RDD进行去重()A.sortByB.intersectionC.filterD.distinct答案:D14.以下哪个函数可以求两个RDD差集 ()A.unionB.substractC.intersectionD.cartesian答案:B15.Spark Streming中()函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素A.unionB.mapC.flatMapD.filter答案:C16.以下哪个函数可以对RDD进行排序()A.sortByB.intersectionC.filterD.distinct答案:A17.Spark GraphX中类Graph的aggregateMessages方法可以()A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.将顶点信息更新到图中D.向指定顶点发送信息并聚合信

      4、息答案:D18.spark-submit配置项中()表示executor使用的总核数A.-total-executor-cores NUMB.-num-executors NUMC.-executor-memory MEMD.-executor-coures NUM答案:A19.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.reduceByWindowC.reduceByKeyAndWindowD.countByWindow答案:B20.Spark Streming中()函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, SeqV, SeqW)类型的新的DStream。A.unionB.reduceC.joinD.cogroup答案:C21.图的结构通常表示为:G(V,E),其中,V是图G中()A.顶点的集合B.顶点C.边的集合D.边答案:A22.请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端A.zipB.joinC.combineBy

      5、KeyD.collect答案:D23.Spark Streming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。A.transformB.reduceC.joinD.cogroup答案:A24.Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的DstreamA.unionB.mapC.flatMapD.filter答案:D25.以下哪个不是Scala的数据类型()A.Short IntB.LongC.IntD.Any答案:A二、多选题 (共 10 道试题,共 20 分)26.Spark Streaming的特点有()A.高吞吐量B.容错能力强C.可伸缩D.单极性答案:ABC27.Scala中使用()方法来查看两个集合的交集元素A.Set.intersectB.Set.concatC.Set.&D.Set.&答案:AD28.Spark可以从()分布式文件系统中读取

      6、数据A.TachyonB.HiveC.HbaseD.HDFS答案:ABCD29.Spark SQL 可以通过()方法加载json文件为DataFrameA.readB.jsonC.getD.format答案:BD30.GraphX中()方法可以缓存整个图A.unpersistVerticesB.presistC.edges.unpersistD.cache答案:BD31.以下是机器学习的常用算法的是()A.降维算法B.聚类算法C.回归算法D.分类算法答案:ABCD32.Spark DataFrame中()方法可以获取若干行数据A.takeB.headC.firstD.collect答案:ABCD33.Scala支持()A.隐式参数B.转换C.显式参数D.多态方法答案:ABCD34.MLlib中用于线性回归算法的包主要有()A.RidgeRegressionWithSGDB.LinearRegressionWithSGDC.LeftRegressionD.LassoWithSGD答案:ABD35.TF-IDF中IDF指的是()A.逆文档概率B.词频C.词在文档集中出现的概率D.词在文档集

      7、中出现的概率E.词在文档中出现的次数答案:AC三、判断题 (共 15 道试题,共 30 分)36.Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素答案:错误37.Spark只有键值对类型的RDD才能设置分区方式答案:正确38.RDD的flatMap操作是将函数应用于RDD 之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD 。答案:正确注意:答案的顺序有可能和你的题不一样 注意核对答案与选项售后或需要更多联系QQ1192235545 微信同步 39.Scala可以通过“var” 来定义变量,通过“val” 关键字来定义常量答案:正确40.Scala是不可扩展的答案:错误41.Spark是Apache基金会的顶级项目答案:正确42.Spark在同一个应用中不能同时使用Spark SQL和Mllib答案:错误43.RDD的intersection方法用于求出两个RDD 的共同元素答案:正确44.Scala中元组是是一种可迭代的键值对(key/value)结构。答案:错误45.RDD的union函数会将两个RDD元素合并成一个并且去处重复元素答案:错误46.Scala 语言中提供的数组是用来存储动态大小的同类型元素答案:错误47.Scala可以通过“val” 来定义变量,通过“var” 关键字来定义常量答案:错误48.Scala是一种纯面向对象的语言,每个值都是对象。答案:正确49.Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD 实例。答案:正确50.Scala列表中last返回列表最后一个元素答案:正确

      《19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(二)》在线作业答卷》由会员哼****分享,可在线阅读,更多相关《19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(二)》在线作业答卷》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.