电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

《数据科学导论》20春期末考核答卷

  • 资源ID:144152826       资源大小:289KB        全文页数:6页
  • 资源格式: DOC        下载积分:20金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要20金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

《数据科学导论》20春期末考核答卷

数据科学导论20春期末考核-00001试卷总分:100 得分:95一、单选题 (共 15 道试题,共 30 分)1.下面不是分类的常用方法的有()A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场答案:D2.BFR聚类用于在()欧氏空间中对数据进行聚类A.高维B.中维C.低维D.中高维答案:A3.聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习答案:B4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A.异常值B.缺失值C.不一致的值D.重复值答案:C5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元答案:C6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A.减小,减小B.减小,增大C.增大,减小D.增大,增大答案:B7.在回归分析中,自变量为(),因变量为()。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量答案:D8.手肘法的核心指标是()。A.SESB.SSEC.RMSED.MSE答案:B9.特征选择的四个步骤中不包括()A.子集产生B.子集评估C.子集搜索D.子集验证答案:C10.一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差答案:D11.K-means聚类适用的数据类型是()。A.数值型数据B.字符型数据C.语音数据D.所有数据答案:A12.以下哪些不是缺失值的影响()A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出答案:C13.下列两个变量之间的关系中,哪个是函数关系()。A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度答案:C14.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5答案:C15.单层感知机模型属于()模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型答案:A二、多选题 (共 5 道试题,共 10 分)16.系统日志收集的基本特征有()A.高可用性B.高可靠性C.可扩展性D.高效率答案:ABC17.距离度量中的距离可以是()A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离答案:ABCD18.K-means聚类中K值选取的方法是()。A.密度分类法B.手肘法C.大腿法D.随机选取答案:AB19.多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播答案:AD20.一元回归参数估计的参数求解方法有()。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法答案:ABC三、判断题 (共 15 道试题,共 30 分)21.Jaccard系数只关心个体间共同具有的特征是否一致这个问题。答案:正确22.标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。答案:错误23.使用SVD方法进行图像压缩不可以保留图像的重要特征。答案:错误24.特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。答案:正确25.一个人的身高与体重之间具有函数关系。答案:错误26.K均值(K-Means)算法是密度聚类。答案:错误27.数据科学可以回答复杂的问题,发现世界中隐藏的联系并预测和指导未来。答案:正确28.选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。答案:正确29.利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。答案:错误30.对于项集来说,置信度没有意义。答案:正确31.每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。答案:正确32.当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。答案:错误33.利用K近邻法进行分类时,k值过小容易发生过拟合现象。答案:正确34.聚合方法是自底向上的方法。答案:正确35.平均减少的不纯度越大,则特征重要度越高。答案:正确四、主观填空题 (共 5 道试题,共 10 分)36.#感知机足以解决任何复杂的分类问题。答案:双隐层判定系数取值范围为0,1,判定系数越接近#,表明变量之间的相关性越强。答案:138.在线性回归分析中,当输入特征的维度从一维增加到d维(d>1),则该问题为#问题。答案:多元线性回归39.多元线性回归中,在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用#。答案:越大40.在k近邻法中,通常采用#来选取最优的k值。答案:交叉验证法五、简答题 (共 2 道试题,共 20 分)41.单层感知机和多层感知机分别解决的是哪类问题?答案:1).单层感知机只能解决线性可分的问题;2).多层感知机可以解决非线性可分的问题。<br><br>42.为什么某些属性可能会降低朴素贝叶斯分类器的性能?答案:因为对这些属性,条件独立的假设已不成立<br><br>

注意事项

本文(《数据科学导论》20春期末考核答卷)为本站会员(安静)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.