电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

[南开大学]20春学期《大数据开发技术(二)》在线作业(答案100分)

9页
  • 卖家[上传人]:j****u
  • 文档编号:135285502
  • 上传时间:2020-06-14
  • 文档格式:DOC
  • 文档大小:48.50KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 谋学网【奥鹏】-南开大学20春学期(1709、1803、1809、1903、1909、2003)大数据开发技术(二)在线作业试卷总分:100 得分:100第1题,在MLlib中,逻辑回归算法的输入值为()类型A、DoubleB、LabledPointC、PointD、SGB正确答案:B第2题,Scala列表方法中获取列表的第一个元素的方法是()A、dropB、headC、filterD、init正确答案:B第3题,spark-submit配置项中()表示每个executor使用的内核数A、-num-executors NUMB、-executor-memory MEMC、-total-executor-cores NUMD、-executor-coures NUM正确答案:D第4题,Spark Streming中()函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, SeqV, SeqW)类型的新的DStream。A、unionB、reduceC、joinD、cogroup正确答案:C第5题,PairRDD可以通过()获得仅包含键的RDDA、

      2、keyB、keysC、valueD、values正确答案:B第6题,GraphX中()是完整提供边的各种操作类A、RDDEdgeB、EdgeRDDC、RDD(VertexId,VD)D、VertexRDD正确答案:B第7题,一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍A、2B、10C、100D、1000正确答案:C第8题,MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练分类树A、trainClassifierB、trainRegressorC、LogisticRegressionModelD、LabeledPoint正确答案:A第9题,Scala中()方法返回Map所有的valueA、keyB、keysC、valueD、values正确答案:D第10题,Spark Streming中DStream的每个RDD都是由()分割开来的数据集A、分区B、一小段时间C、数据量D、随机正确答案:B第11题,Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的D

      3、Stream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamA、windowB、countByWindowC、reduceByWindowD、reduceByKeyAndWindow正确答案:D第12题,Scala列表方法中输出符号指定条件的所有元素的方法是()A、dropB、headC、filterD、init正确答案:C第13题,以下哪个不是Scala的数据类型()A、IntB、Short IntC、LongD、Any正确答案:B第14题,当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作A、transferB、changeC、mapD、build正确答案:C第15题,Dstream窗口操作中()方法返回一个基于源DStream的窗口批次计算后得到新的DStream。A、windowB、countByWindowC、reduceByWindowD、reduceByKeyAndWindow正确答案:A第16题,Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA、windowB

      4、、countByWindowC、reduceByWindowD、reduceByKeyAndWindow正确答案:C第17题,Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。A、printB、saveAsTextFilesC、saveAsObjectFilesD、saveAsHadoopFiles正确答案:C第18题,如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()A、0,numPartitionsB、0,numPartitions-1C、1,numPartitions-1D、1,numPartitions正确答案:B第19题,GraphX中graph.edges可以得到()A、顶点视图B、边视图C、顶点与边的三元组整体视图D、有向图正确答案:B第20题,GraphX中()是存放着存放顶点的RDDA、RDDEdgeB、EdgeRDDC、RDD(VertexId,VD)D、VertexRDD正确答案:C第21题,Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素A、headB、initC、ta

      5、ilD、last正确答案:C第22题,请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端A、joinB、zipC、combineByKeyD、collect正确答案:D第23题,Spark GraphX中类Graph的mapReduceTriplets方法可以()A、收集邻居顶点的顶点Id和顶点属性B、收集邻居顶点的顶点IdC、向指定顶点发送信息并聚合信息D、将顶点信息更新到图中正确答案:C第24题,Scala列表方法中通过给定的方法将所有元素重新计算的方法是()A、filterB、foreachC、mapD、mkString正确答案:C第25题,Scala列表方法中返回所有元素,除了最后一个的方法是()A、dropB、headC、filterD、init正确答案:D第26题,Scala中可以用()方法来连接两个或多个列表A、:B、#:C、List.:()D、List.concat()正确答案:B,C,D第27题,Spark DataFrame中()方法可以返回一个Array对象A、collectB、takeC、takeAsListD、collectAsList正

      6、确答案:A,B第28题,Scala系统支持()作为对象成员A、通用类B、内部类C、抽象类D、复合类正确答案:A,B,C,D第29题,Mllib实现了一些常见的机器学习算法和应用程序,包括()A、分类B、聚类C、降维D、回归正确答案:A,B,C,D第30题,Spark Streaming能够和()无缝集成A、HadoopB、Spark SQLC、MllibD、GraphX正确答案:B,C,D第31题,以下算法中属于分类算法的是()A、KNN算法B、逻辑回归C、随机森林D、Kmeans正确答案:A,B,C第32题,Spark Core包含的功能有()A、任务调度B、内存管理C、SQL查询D、容错机制正确答案:A,B,D第33题,Scala中构造列表的两个基本单位是 ()A、NilB、NillC、:D、List正确答案:A,C第34题,Spark DataFrame中()方法可以返回一个ListA、collectB、takeC、takeAsListD、collectAsList正确答案:C,D第35题,MLlib中用于线性回归算法的包主要有()A、LinearRegressionWithSG

      7、DB、RidgeRegressionWithSGDC、LassoWithSGDD、LeftRegression正确答案:A,B,C第36题,RDD的map操作不会改变RDD的分区数目T、对F、错正确答案:T第37题,MLlib中StandardScaler处理的对象是每一列,也就是每一维特征,将特征标准化为单位标准差或是0均值,或是0均值单位标准差。T、对F、错正确答案:T第38题,Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数T、对F、错正确答案:F第39题,Spark SQL仅仅包括基本的SQL语法T、对F、错正确答案:F第40题,聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中T、对F、错正确答案:T第41题,MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。T、对F、错正确答案:T第42题,Spark GraphX课通过mapVerticesVD2: ClassTag(map: (VertexId, VD) = VD2)实现对顶点属性经过变换生成新的图T、对F、错正确答案:T第43题,Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作T、对F、错正确答案:T第44题,Scala中默认情况下使用的是可变的MapT、对F、错正确答案:F第45题,mllib.feature中存在一些常见的特征转化方法,主要包括创建特征向量和标准化数据T、对F、错正确答案:T第46题,Scala中允许集成多个父类T、对F、错正确答案:F第47题,RDD中combineByKey不允许返回类型与输入数据类型不同的返回值T、对F、错正确答案:F第48题,Spark SQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型T、对F、错正确答案:T第49题,Spark GraphX课通过mapTripletsED2: ClassTag(map: EdgeTripletVD, ED = ED2)实现对边属性经过变换生成新的图T、对F、错正确答案:T第50题,Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。T、对F、错正确答案:F

      《[南开大学]20春学期《大数据开发技术(二)》在线作业(答案100分)》由会员j****u分享,可在线阅读,更多相关《[南开大学]20春学期《大数据开发技术(二)》在线作业(答案100分)》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.