电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业答卷

7页
  • 卖家[上传人]:哼****
  • 文档编号:182730083
  • 上传时间:2021-05-21
  • 文档格式:DOC
  • 文档大小:28.50KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、21春学期(1709、1803、1809、1903、1909、2003、2009、2103)大数据开发技术(二)在线作业试卷总分:100 得分:100一、单选题 (共 25 道试题,共 50 分)1.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()A.filterB.foreachC.mapD.mkString答案:D2.Mllib中线性会馆算法中的参数reParam表示()A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso 和ridge 的正规化参数答案:D3.Scala列表方法中输出符号指定条件的所有元素的方法是()A.dropB.headC.filterD.init答案:C4.Spark GraphX中类Graph的mask方法可以()A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性答案:C5.Spark中DataFrame的()方法是进行分组查询A.order byB.group byC.select byD.sort by答案:B6.

      2、图结构中如果无重复的边或者顶点到自身的边,那么称之为()A.完全图B.有向完全图C.无向图D.简单图答案:D7.PairRDD中()函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey答案:A8.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow答案:C9.Scala类通过子类化和基于灵活的混合类来进行扩展,作为#的一个可靠性解决方案A.多态B.虚函数C.派生D.多重继承答案:D10.以下哪个函数可以对RDD进行去重()A.sortByB.filterC.distinctD.intersection答案:C11.PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection答案:A12.Mllib中metrics.recallByThreshol

      3、d 表示()指标A.准确度B.召回率C.F值D.ROC曲线答案:B13.Spark GraphX中类Graph的reverse方法可以()A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性答案:A14.GraphX中()方法可以释放顶点缓存A.cacheB.presistC.unpersistVerticesD.edges.unpersist答案:C15.图的结构通常表示为:G(V,E),其中,E是图G中()A.顶点B.顶点的集合C.边D.边的集合答案:D16.Scala中重写一个非抽象方法必须使用()修饰符。A.extendsB.overrideC.extendD.overrides答案:B17.GraphX中()方法可以查询度数A.degreesB.degreeC.verticesD.edges答案:A18.Mllib中线性会馆算法中的参数intercept表示()A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso 和ridge 的正规化参数答案:C19.Scal

      4、a函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()A.filterB.flattenC.groubyD.flatmap答案:C20.Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStreamA.unionB.reduceC.joinD.cogroup答案:B21.以下哪个不是Scala的数据类型()A.IntB.Short IntC.LongD.Any答案:B22.Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union答案:A23.图是一种数据元素间为()关系的数据结构A.多对多B.一对一C.一对多D.多对一答案:A24.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()A.0,numPartitionsB.0,numPartitions-1C.1,numPartitions-1D.1,numPartitions答

      5、案:B25.Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法A.Graph(vertices,edges, defaultVertexAttr)B.Graph.fromEdges(RDDEdgeED, defaultValue)C.Graph.fromEdgeTuples(rawEdges: RDD(VertexId, VertexId), defaultValue,)D.GraphLoader.edgeListFile(sc,filename)答案:C二、多选题 (共 10 道试题,共 20 分)26.Scala函数支持()A.递归函数B.高阶函数C.柯里化D.匿名函数答案:ABCD27.以下哪个是Scala的数据类型()A.AnyB.NULLC.NothingD.AnyRef答案:ABCD28.Scala中可以用()方法来连接两个或多个列表A.:B.#:C.List.:()D.List.concat()答案:BCD29.Spark可以通过哪些外部存储创建RDD()A.文本文件B.目录C.压缩文件D.通配符匹配的文件答案:ABCD30

      6、.Spark中的RDD的说法正确的是()A.弹性分布式数据集B.是Spark中最基本的数据抽象C.代表一个可变的集合D.代表的集合里面的元素可并行计算答案:ABD31.Spark中DataFrame的()方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply答案:ABCD32.以下哪个方法可以从集合中创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile答案:AB33.TF-IDF中TF指的是()A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率答案:AB34.Mllib实现了一些常见的机器学习算法和应用程序,包括()A.分类B.聚类C.降维D.回归答案:ABCD35.Spark SQL 可以通过()方法加载json文件为DataFrameA.formatB.jsonC.getD.read答案:AB三、判断题 (共 15 道试题,共 30 分)36.RDD的mapPartitions操作会导致Partitions数量的变化答案:错误37.Scala函数组合器

      7、中filter过滤移除使得传入的函数的返回值为true的元素答案:错误38.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。答案:错误39.Scala函数组合器中foreach和map类似,有返回值答案:错误40.Spark中DataFrame 的查询操作也是一个懒操作, 仅仅生成一个查询计划, 只有触发Action 操作才会进行计算并返回查询结果。答案:正确41.PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。答案:正确42.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。答案:正确43.RDD的union函数会将两个RDD元素合并成一个并且去处重复元素答案:错误44.RDD中combineByKey不允许返回类型与输入数据类型不同的返回值答案:错误45.RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。答案:错误威心:open4511 需要联系46.Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map答案:正确47.Scala中元组是是一种可迭代的键值对(key/value)结构。答案:错误48.RDD是一个可读写的数据结构答案:错误49.RDD的map操作不会改变RDD的分区数目答案:正确50.Spark只有键值对类型的RDD才能设置分区方式答案:正确

      《21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业答卷》由会员哼****分享,可在线阅读,更多相关《21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《大数据开发技术(二)》在线作业答卷》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.