好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

南开大学22春《大数据开发技术》离线作业1答案参考18.docx

11页
  • 卖家[上传人]:汽***
  • 文档编号:551410484
  • 上传时间:2024-01-11
  • 文档格式:DOCX
  • 文档大小:12.80KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 南开大学22春《大数据开发技术》离线作业1答案参考1. 用分支限界法设计算法的第二步是( )A.针对所给问题,定义问题的解空间(对解进行编码)B.确定易于搜索的解空间结构(按树或图组织解)C.以广度优先或以最小耗费(最大收益)优先的方式搜索解空间D.在搜索过程中用剪枝函数避免无效搜索参考答案:B2. PairRDD中( )函数可以合并具有相同键的值A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:A3. 美国奥巴马政府宣布投资2亿美元启动“大数据研发计划” )A.对B.错参考答案:A4. 关系数据库与NoSQL数据库相比有哪些优势( )A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力参考答案:AC5. PairRDD可以通过( )获得仅包含键的RDDA.keyB.keysC.valueD.values参考答案:B6. 每个变量的最大值和最小值之差称为极差 )A.对B.错参考答案:A7. 以下哪个不是Scala的数据类型( )A.IntB.Short IntC.LongD.Any参考答案:B8. PairRDD中( )函数可以进行分组A.mapValuesB.groupByC.groupByKeyD.reduceByKey参考答案:BC9. Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储。

      )A.正确B.错误参考答案:B10. 实现棋盘覆盖算法利用的算法是( )A.分治法B.动态规划法C.贪心法D.回溯法参考答案:A11. 下列随机算法中运行时有时候成功有时候失败的是( )A.数值概率算法B.舍伍德算法C.拉斯维加斯算法D.蒙特卡罗算法参考答案:C12. 下列哪一种算法不是随机化算法?( )A.蒙特卡罗算法B.拉斯维加斯算法C.动态规划算法D.舍伍德算法参考答案:C13. Spark中运行交互式SQL查询的大规模并行查询引擎是( )A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib参考答案:C14. Spark只有键值对类型的RDD才能设置分区方式 )A.正确B.错误参考答案:A15. var a=10; for(aA.10B.11C.20D.19参考答案:D16. 阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等 )A.正确B.错误参考答案:A17. RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组 )A.正确B.错误参考答案:A18. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。

      )T.对F.错参考答案:F19. RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD )A.正确B.错误参考答案:A20. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素 )T.对F.错参考答案:F21. Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是( )A.mapB.foreachC.flattenD.flatmap参考答案:A22. 图的结构通常表示为:G(V,E),其中,G表示( )A.图B.子图C.顶点D.边参考答案:A23. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster) )A.对B.错参考答案:A24. Spark Streming中( )函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新 DStreamA.unionB.reduceC.joinD.cogroup参考答案:D25. 使用分治法求解不需要满足的条件是( )。

      A.子问题必须是一样的B.子问题不能够重复C.子问题的解可以合并D.原问题和子问题使用相同的方法解参考答案:A26. 动态规划算法的基本思想是将待求解问题分解成若干子问题,先求解子问题,然后从这些子问题的解得到原问题的解 )A.错误B.正确参考答案:B27. Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算 )A.正确B.错误参考答案:B28. 以下是机器学习的常用算法的是( )A.回归算法B.聚类算法C.降维算法D.分类算法参考答案:ABCD29. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回 )T.对F.错参考答案:F30. Spark Streming中( )函数可以对源DStream的每个元素通过函数func返回一个新的DStreamA.mapB.flatMapC.filterD.union参考答案:A31. SQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流( )A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure Layer参考答案:A32. Storm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作。

      )A.正确B.错误参考答案:A33. Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素 )A.正确B.错误参考答案:B34. MspReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A35. Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值 )A.正确B.错误参考答案:B36. var a=10; do{ a+=1;}while(aA.9B.10C.11D.12参考答案:B37. UMP系通过( )来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Proxy服务器C.愚公系统D.Agent服务器参考答案:A38. 从分治法的一般设计模式可以看出,用它设计出的程序一般是递归算法 )A.错误B.正确参考答案:B39. Scala列表中last返回列表最后一个元素 )A.正确B.错误参考答案:A40. 最大效益优先是下列哪项的一种搜索方式?( )A.分支界限法B.动态规划法C.贪心法D.回溯法参考答案:A41. 分布式离线分析可以实现秒级别的实时分析响应。

      )A.正确B.错误参考答案:B42. 大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等 )A.对B.错参考答案:A43. 可视化工具包括( )A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC44. 以下哪个函数可以求两个RDD交集 ( )A.unionB.substractC.intersectionD.cartesian参考答案:C45. Hbase和传统数据库一样都是列式数据库 )A.正确B.错误参考答案:B46. 图结构中如果任意两个顶点之间都存在有向边,那么称之为( )A.完全图B.有向完全图C.无向图D.简单图参考答案:B47. Spark是一个( )计算框架A.快速B.分布式C.可扩展D.容错参考答案:ABCD48. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性 )T.对F.错参考答案:F49. 大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法 )A.正确B.错误参考答案:A50. 在Storm的工作流程中,对于Supervisor说法错误的是( )。

      A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Worker进程进行Task的处理参考答案:B。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.