
南开大学22春《数据科学导论》综合作业一答案参考91.docx
13页南开大学22春《数据科学导论》综合作业一答案参考1. 广播变量在广播后可以修改 )T.对F.错参考答案:F2. K-means聚类中K值选取的方法是( )A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB3. 一个HDFS集群由一个( )和( )构成此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD4. 以下选项中使Python脚本程序转变为可执行程序的第三方库的是( )A.randomB.requestsC.pyinstallerD.pygame参考答案:C5. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B6. 特征的信息增益越大,则其越不重要 )A.正确B.错误参考答案:B7. 开放云( )A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答案:ABCD8. 利用最小二乘法对多元线性回归进行参数估计时,其目标为( )。
A.最小化方差B.最小化残差平方和C.最大化信息熵D.最小化标准差参考答案:C9. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明( )A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C10. 数据分析师的任务用模型来回答具体问题,了解数据,其来源和结构 )A.正确B.错误参考答案:B11. 可信度是对关联规则的准确度的衡量 )可信度是对关联规则的准确度的衡量 )A.正确B.错误参考答案:A12. 给定关联规则A→B,意味着:若A发生,B也会发生 )A.正确B.错误参考答案:B13. 下列选项是BFR的对象是( )A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD14. 对于k近邻法,下列说法错误的是( )对于k近邻法,下列说法错误的是( )A.不具有显式的学习过程B.适用于多分类任务C.k值越大,分类效果越好D.通常采用多数表决的分类决策规则参考答案:C15. 在多分支结构中,Python是通过( )来判断语句是否属于一个分支结构中。
A.花括号B.冒号C.括号D.缩进参考答案:D16. 云存储中用户需要按需付费并使用存储服务 )T.对F.错参考答案:T17. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C18. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A19. 梦幻西游手游普陀用什么法宝好?梦幻西游手游普陀用什么法宝好?普陀作为一个治疗门派,不仅要考虑治疗量而且出手速度也是比较重要的此外抗性也必须要考虑乾坤玄火塔:祭起后让己方人物一定回合内增加愤怒普陀的必备主动法宝,有了乾坤玄火塔普陀可以有稳定的愤怒值来放技能或特技四象属性选择少阳,多一个回合就是多20多愤怒无魂傀儡:对敌方单人使用,持续一定回合被无魂傀儡影响的目标,出手时有一定几率随机使用门派法术四象属性选择少阳,50%几率增加无魂傀儡一回合持续时间碧玉葫芦:战斗中提升佩戴者的治疗强度普陀的标配法宝,直接增加治疗强度四象属性一般是选择少阳,提升1级法宝等级就相当于直接提升治疗量也会有玩家选择太阴属性,2%几率触发治疗暴击。
降魔斗篷:佩戴者受到法术攻击时,有几率降低部分伤害现在耐加点的普陀都怕大龙的法伤,降魔斗篷可以降低所承受的伤害四象属性建议选择少阳,触发法宝效果时临时提高10%法术防御2回合,这样会使得喜欢使用龙卷的龙宫更难打出致命伤害风袋:战斗中提升佩戴者的速度提高普陀的出手速度四象属性建议选择少阴,提升佩戴者1%的法术躲避,普陀并不追求出手速度的极致,能躲避法术是增强普陀的生存能力金甲仙衣:佩戴者受到物理攻击时,有几率降低部分伤害增强普陀的生存能力,防止被点杀四象属性建议选择太阴,佩戴者的宠物也受金甲仙衣的庇护,宠物被金甲仙衣保护的几率是主人的1/420. PaaS是( )的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务参考答案:B21. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC22. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集 )A.正确B.错误参考答案:B23. 《怪物猎人OL》我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?《怪物猎人OL》我在游戏中发现身边有许多不同的小箭头指向不同的地方,这个代表什么?这是《怪物猎人OL》的任务指示器,箭头所指示的方向为你所接取的任务的完成地点,如果你同时接取了多个任务,那么会有多个箭头指向不同的区域,所以新手猎人跟着指示器走即可到达目标区域。
24. 层次聚类适合规模较( )的数据集A.大B.中C.小D.所有参考答案:C25. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A26. 下面例子属于分类的是( )A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC27. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点28. 关于Python语言的注释,以下描述错误的是( )A.Python语言的多行注释以‘‘‘(三个单引号)开头和结尾B.Python语言的单行注释以#开头C.Python语言有两种注释方式:单行注释和多行注释D.Python语言的单行注释以单引号‘开头参考答案:D29. 赤池信息准则是衡量统计模型拟合优良性的一种标准 )A.正确B.错误参考答案:A30. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:B31. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C32. 哪一项不属于规范化的方法?( )A.最小—最大规范化B.零—均值规范化C.小数定标规范化D.中位数规范化参考答案:D33. Internet 中的IP地址是( )A.就是联网主机的网络号B.可由用户任意指定C.是由主机名和域名组成D.由32个二进制位组成参考答案:D34. 事件是Flume的基本数据单位。
)T.对F.错参考答案:T35. 阶跃函数具有不光滑、不连续的特点 )A.正确B.错误参考答案:A36. 聚类的主要方法有( )聚类的主要方法有( )A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC37. 借助于大数据提供的( )和( ),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费A.消费能力B.趋势报告C.购物结果参考答案:AB38. 广义的Spark是指Spark生态系统,采用了四层架构 )T.对F.错参考答案:T39. 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式 )T.对F.错参考答案:T40. 不满足给定评价度量的关联规则是无趣的 )A.正确B.错误参考答案:B41. 梦幻西游手游出师奖励有哪些?梦幻西游手游出师奖励有哪些?徒弟获得经验奖励、师傅获得经验和良师值奖励特别说明:1、若徒弟等级≥69级,出师只有少量奖励2、师傅历史收徒数量(包括解除关系的)≥3时,只有教学成绩达到一定条件,才有奖励42. 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。
)T.对F.错参考答案:T43. 列表是一个灵活的数据结构,数字、字符串、列表、字典都可以作为其中的元素 )A.正确B.错误参考答案:A44. uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同 )A.正确B.错误参考答案:A45. 以下选项中不是Python关键字的是( )A.whileB.exceptC.inD.do参考答案:D46. 以下哪个关键字不是异常处理语句的关键字?( )A.elifB.exceptC.tryD.finally参考答案:A47. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC48. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合 )A.正确B.错误参考答案:A49. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC50. 数据变换的常用方法有( ),( ),( ),( )A.中心化变换B.极差规格化变换C.标准化变换D.对数变换参考答案:ABCD51. 一元回归参数估计的参数求解方法有( )。
A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC52. Extranet有哪些功能?Extranet有哪。