好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

南开大学21秋《数据科学导论》平时作业2-001答案参考26.docx

12页
  • 卖家[上传人]:pu****.1
  • 文档编号:481933888
  • 上传时间:2023-04-30
  • 文档格式:DOCX
  • 文档大小:14.94KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 南开大学21秋《数据科学导论》平时作业2-001答案参考1. Python中,字典是一个键值对的集合,字典以键为索引,一个键只对应一个值 )A.正确B.错误参考答案:A2. 聚类是一种( )A.有监督学习B.无监督学习C.强化学习D.半监督学习参考答案:B3. R语言是S语言的实现,是一种B编译语言 )T.对F.错参考答案:F4. 标准BP算法是在读取全部数据集后,对参数进行统一更新的算法 )A.正确B.错误参考答案:B5. 下面变量名称命名合法的是( )A._tempStrB.isC.2018pythonD.123Python参考答案:A6. PPPoE协议共包括( )个阶段,即( )A、四;PADI、PADO、PADR、PADSB、两;PPPoE的发现阶段(PPPoE Discovery Stage)和PPPoE的会话阶段(PPPoE Session Stage)C、两; LCP和NCP阶段D、三;建链、认证、上网参考答案:B7. 全局变量一定不能和局部变量同名 )A.正确B.错误参考答案:B8. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D9. 下列不属于Google云计算平台技术架构的是( )A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2参考答案:D10. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。

      )A.正确B.错误参考答案:A11. K-means聚类中K值选取的方法是( )K-means聚类中K值选取的方法是( )A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB12. 函数可以看作是一段具有名字的子程序,在需要的地方调用执行,不需要在每个执行地方重复编写这些语句 )A.正确B.错误参考答案:A13. 非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值 )T.对F.错参考答案:T14. 多层感知机的学习过程包含( )多层感知机的学习过程包含( )A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD15. 以下哪一项不是特征选择常见的方法?( )A.过滤式B.封装式C.嵌入式D.开放式参考答案:D16. 组合数据类型中的序列类型元素之间存在先后关系,可以通过序号访问 )A.正确B.错误参考答案:A17. Apriori算法的计算复杂度受( )影响A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD18. 《怪物猎人OL》游戏中的武器防具都是哪里来的?打怪掉落吗?《怪物猎人OL》游戏中的武器防具都是哪里来的?打怪掉落吗?在《怪物猎人OL》中,大部分武器和防具都只能通过收集相应的素材,在铁匠处进行制作,怪物不会掉落任何武器或者防具。

      19. 网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销网络营销环境及企业的经营环境都在不断的发展演变中,因此也没有一成不变、永远有效的互联网营销方法,这说明了网络营销发展趋势中的( )A:网络营销将从封闭式向开放式转变B:从企业自有网站为核心到多平台的综合利用C:行业内企业网络营销竞争加剧D:网络营销方法不断调整适应互联网环境发展答案:D20. 统计图表的可视化方法主要包括( )A.散点图B.折线图C.条形图D.饼图参考答案:ABCD21. 简述数据可视化的流程和步骤参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤  1)数据获取  数据获取的形式多种多样,大致可以分为主动式和被动式两种主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等  2)数据处理  数据处理是指对原始的数据进行分析、预处理和计算等步骤数据处理的目标是保证数据的准确性、可用性等  3)可视化模式  可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。

      可视化模式的选取决定了可视化方案的雏形  4)可视化应用  可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果22. 商业智能(BI)可以被描述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具” )T.对F.错参考答案:T23. 关于R语言扩展包下列正确的是( )A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具参考答案:AB24. 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的( )等A.用户行为数据B.日志式的活动数据C.事件信息参考答案:ABC25. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。

      )A.正确B.错误参考答案:A26. 事件是Flume的基本数据单位 )T.对F.错参考答案:T27. 一元线性回归中,真实值与预测值的差称为样本的( )A.误差B.方差C.测差D.残差参考答案:D28. 下面哪一项不是中国发展大数据产业的基础( )A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱参考答案:D29. 美国《自然》(Nature)杂志专刊——The next google,第一次正式提出“大数据”概念 )T.对F.错参考答案:T30. BFR聚类用于在( )欧氏空间中对数据进行聚类A.高维B.中维C.低维D.中高维参考答案:A31. 层次聚类适合规模较( )的数据集A.大B.中C.小D.所有参考答案:C32. 以下选项中用来捕获特定类型异常的关键字是( )A.doB.passC.whileD.except参考答案:D33. KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台该平台包括了( )、( )、( )、( )A.数据集成B.数据处理C.数据分析D.数据挖掘参考答案:ABCD34. 给定关联规则A→B,意味着若A发生,B也会发生。

      )A.正确B.错误参考答案:B35. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C36. 关于函数,以下描述错误的是( )A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D37. 在Python3.5中,集合类型的各个元素之间存在先后顺序 )A.正确B.错误参考答案:B38. K-means聚类中K值选取的方法是( )A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB39. 决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布 )决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。

      )A.正确B.错误参考答案:A40. 数据会吸引更多的潜在攻击者,成为更具吸引力的目标 )T.对F.错参考答案:T41. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集 )给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集 )A.正确B.错误参考答案:B42. Internet Explorer不能识别的格式是( )A.cssB.scriptingC.datD.htm参考答案:C43. 决策树内部结点表示一个类,叶结点表示一个特征或属性 )A.正确B.错误参考答案:B44. 关于Python中异常处理,以下描述错误的是( )A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D45. 利用K近邻法进行分类时,k值过小容易发生过拟合现象 )利用K近邻法进行分类时,k值过小容易发生过拟合现象。

      )A.正确B.错误参考答案:A46. 关于import引用,下列选项中描述错误的是( )A.使用import turtle可引入turtle库B.使用from turtle import setup可引入turtle库C.使用import turtle as t可引入turtle库,取别名为tD.import关键字用于导入模块或者模块中的对象参考答案:B47. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.