好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

CPDA考试真题与答案2.docx

25页
  • 卖家[上传人]:人***
  • 文档编号:475490690
  • 上传时间:2023-02-08
  • 文档格式:DOCX
  • 文档大小:82.45KB
  • / 25 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 一、判断题1.数据根据计量尺度不同可以分为分类数据和数值型数据正确答案: ×2.屡次抛一枚硬币,正面朝上的频率是1/2 正确答案: ×3.归纳法是一种从个别到一般的推理方法正确答案: √4.datahoop中输入的数据必须是数值型的正确答案: ×5.置信水平是假设检验中犯第一类错误的概率正确答案: ×--------6.当两种产品为互补品时,其穿插弹性小于零正确答案: √7.时间序列分解法可以有乘法模型和加法模型两种表示方式,其中乘法模型都是相对值来表示预测值的,加法模型都是用绝对值来表示预测值的正确答案: ×8.需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时那么收取较高价格正确答案: ×9.盈亏平衡分析是静态分析,不考虑资金的时间价值和工程寿命周期内的现金流量的变化正确答案: √10. 决策树算法易于理解好实现,且对缺失值、异常值和共线性都不敏感,是做分类预测的首选算法正确答案: ×--------11. 随机森林中的每棵树都不进展剪枝,因此过拟合的风险很高正确答案: ×12. 当倒传递神经网络〔 BP 神经网络〕无隐藏层,输出层个数只有一个的时候,也可以看做是逻辑回归模型。

      正确答案: √13. 维规约即事先规定所取模型的维数,可以认为是降维的一种正确答案: ×14. 标准差越小,表示离散程度越小,风险越大;反之离散程度越大,风险越小正确答案: ×15. 离群点是一个实际观测值,它与其他观测值的差异如此之大,以至于疑心它是由不同的机制产生的正确答案: √--------二、单项选择题1.SQL 语言中,删除一个表中所有数据,但保存表构造的命令是〔〕A、 DELETEB、 DROPC、 CLEARD、 REMORE正确答案:A2.数据库系统是由〔〕组成的A、数据库、数据库管理系统和用户B、数据文件、命令文件和报表C、数据库文件构造和数据D、常量、变量和函数正确答案:A3.假设学生考试成绩以“优〞. “良〞 . “及格〞和“不及格〞来记录,为了说明全班同学考试成绩的水--------平上下,其集中趋势的测度〔〕--------A、可以采用算术平均数B、可以采用众数或中位数C、只能采用众数D、只能采用四分位数正确答案:C4.以下哪个变量可以反映客户的忠诚度?〔〕A、购置频次B、购置金额C、最后一次购置时间D、购置金额波动率正确答案:A5.以下哪个类型的变量在作预测客户流失的模型中最有解释力度?A、人口根本数据,比方年龄和性别B、根本社会状态数据,比方收入和职业C、业务数据,比方消费频次--------D、业务数据的衍生变量,比方最近3 个月消费频次的变化情况--------正确答案:D6.下面关于聚类分析说法错误的选项是〔〕A、一定存在一个最优的分类B、聚类分析是无监视学习C、聚类分析可以用于判断异常值D、聚类分析即 :物以类聚 ,人以群分正确答案:A7.某小区 60 %居民订晚报, 45 %订青年报, 30%两报均订,随机抽一户。

      那么至少订一种报的概率为〔〕A、 0.82B、 0.85C、 0.80D、 0.75--------正确答案:D--------8.在 Excel工作表中,在某单元格内输入数值123,不正确的输入形式是〔〕A、 123B、 =123C、 +123D、 *123正确答案:D9.在对历史数据集进展分区之前进展数据清洗〔缺失值填补等〕的缺点是什么A、违反了建模的假设条件B、加大了处理的难度C、无法针对分区后各个数据集的特征分别做数据清洗D、无法对不同数据清理的方法进展比拟,以选择最优方法正确答案:D10. 当一个连续变量的缺失值占比在85% 左右时,以下哪种方式最合理〔〕A、直接使用该变量--------B、根据是否缺失,生成指示变量,仅使用指示变量作为解释变量--------C、使用多重插补的方法进展缺失值填补D、直接删除该变量正确答案:B11.Naive Bayes是属于数据挖掘中的什么方法?A、聚类B、分类C、时间序列D、关联规那么正确答案:B12. 有一条关联规那么为 A → B ,此规那么的信心水平 (confidence) 为 60% ,那么代表〔〕A、买 B 商品的顾客中,有 60% 的顾客会同时购置AB、同时购置 A,B 两商品的顾客,占所有顾客的60%C、买 A 商品的顾客中,有 60% 的顾客会同时购置BD、两商品 A,B 在交易数据库中同时被购置的机率为60%--------正确答案:C--------13. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的选项是〔〕A、数据越多越好B、尽可能多的适合的数据C、数据越少越好D、以上三条都不正确正确答案:B14. 在有指导的数据挖掘中,有关测试集的说法错误的选项是〔〕A、测试集和训练集是相互联系的B、测试集是用以测试模型的数据集C、通常测试集大约占总样本的三分之一D、 K- 次穿插验证中,测试集只有1 个,训练集有 K-1 个正确答案:A15. 用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%, 那么样本容量需--------要扩大到原来的〔〕--------A、2 倍B、3 倍C、4 倍D、5 倍正确答案:C16. 回归分析的第一步是〔〕A、确定解释量和被解释变量B、确定回归模型C、建立回归方程D、进展检验正确答案:A17. 关于主成分数目的选取,正确的选项是〔〕A、保存多少个主成分取决于累计方差在方差总和中所占百分比B、一般选择50% 以上C、选择前两个就可以--------D、选择的数目和变量的个数一致--------正确答案:A18. 以下四项中,不属于数据库特点的是〔〕A、数据共享B、数据完整性C、数据冗余很高D、数据独立性高正确答案:C19. 将复杂的地址简化成北、中、南、东四区,是在进展?A、数据正规化B、数据一般化C、数据离散化D、数据整合正确答案:B--------20. 以下哪个指标不能用于线性回归中的模型比拟〔〕--------A、R 方B、调整 R 方C、 AICD、 BIC正确答案:A21.RFM方法中的F说明客户的〔〕A、兴趣度B、粘性C、当前价值D、未来价值正确答案:A22. 数据挖掘技术包括三个主要的局部〔〕A、数据、模型、技术B、算法、技术、领域知识--------C、数据、建模能力、算法与技术--------D、建模能力、算法与技术、领域知识正确答案:C23. 下面关于因子分析的说法正确的选项是〔〕A、因子分析就是主成分分析B、因子之间可相关也可不相关C、因子受量纲的影响D、可以对因子进展旋转,使其意义更明显正确答案:D24. 以下表达正确的选项是〔〕A、极差较少受异常值的影响B、四分位差较少受异常值的影响C、方差较少受异常值的影响D、标准差较少受异常值的影响--------正确答案:B--------25. 以下关于人工神经网络〔 ANN 〕的描述错误的有〔〕A、神经网络对训练数据中的噪声非常鲁棒B、可以处理冗余特征C、训练 ANN 是一个很耗时的过程D、至少含有一个隐藏层的多层神经网络正确答案:A26. 当时间序列的环比增长速度大体一样时,适宜拟合〔〕A、指数曲线B、抛物线C、直线D、对数曲线正确答案:A27. 某家长为了使孩子在第3-6 年上大学的 4 年中,每年年初得到 10000 元助学基金,他应在 2 年前在银行存入多少钱?〔年利率按5% 计算〕〔〕--------A、 33771--------B、 30291C、 32163D、 45256正确答案:A28. 苹果公司对 IPHONE的降价行为属于〔〕A、地域性差异定价B、时间性差异定价C、非线性定价或数量折扣定价D、其他形式的定价正确答案:B29. 设 X={1 , 2, 3} 是频繁项集,那么可由 X 可产生〔〕个关联规那么。

      A、 3B、 4C、 5--------D、 6--------正确答案:D30. 以下哪些分类方法可以较好地防止样本的不平衡问题?〔〕A、 KNNB、 SVMC、 BayesD、神经网络正确答案:A三、多项选择题1.以下哪个聚类分析的方法是利用统计学定义的距离进展度量〔〕A、层次聚类法B、快速聚类法〔K-Means 〕C、基于密度的聚类法D、基于网格的聚类法正确答案:AB2.天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进--------行 ()--------A、对变量进展标准化B、对变量进展百分位秩或Turkey 正态性转换C、对变量进展因子分析或聚类分析D、对变量进展分箱处理正确答案:BD3.如下表 student 中, 如何筛选 type 为包含数学或语文的记录?IDtypescoreA01 数学 78A02 语文 76A03 英语 90A04 数学 68A05 英语 84A、 select * from student where type=〞数学〞and type=〞语文〞B、 select * from student where type=〞数学〞type=or〞语文〞C、 select * from student where type in (〞数学〞,〞语文〞)D、 select * from student where type in (?〞〞数语学文〞〞 )--------正确答案:BC--------4.以下哪个分布是右偏分布〔〕A、均匀分布B、卡方分布C、F 分布D、对数正态分布正确答案:BCD5.在假设检验中 ,当我们做出拒绝原假设而承受备择假设的结论时,表示 ( )A、有充足的理由否认原假设B、原假设必定是错误的C、犯错误的概率不大于aD、犯错误的概率不大于bE、在 H。

      成立的情况下发生了小概率事件正确答案:ACE--------6.假设检验统计量 F 近似等于 1 ,说明〔〕--------A、组间方差中不包含系统因素的影响B、组内方差中不包含系统因素的影响C、组间方差中包含系统因素的影响D、方差分析中不应拒绝原假设正确答案:AD7.以下何种算法可以帮助我们做数值的预测(Prediction) ?A、 AprioriB、 Decision TreeC、 Naive BayesD、 Linear。

      点击阅读更多内容
      相关文档
      2025年教师招聘考试教育理论综合知识考试题库(单项选择题763题).docx 2025年教师招聘考试必考的面试考试题库.docx 2025年江苏生禁毒知识网络竞赛考试题库(280题).docx 2025年教师招聘考试公共基础知识模拟题库.docx 2025年江苏省第十届大学生就业创业知识竞赛考试题库(200题).docx 2025年煤矿安全监测监控证考试必刷题库附答案.docx 2025年教师资格证考试公共基础知识考试复习题库.docx 2025年江苏生禁毒知识网络竞赛考试题库(210题).docx 2025年江苏生禁毒知识网络竞赛考试题库(270题).docx 2025年教师资格证(教育公共基础知识)考试题库(500题).docx 2025年江苏生禁毒知识网络竞赛考试题库(260题).docx 2025年教师招聘考试中学教育理论综合知识考试模拟试题(五套).docx 2025年教师资格证考试教育公共基础知识考试题库(400题).docx 2025年教师招聘考试(教育综合基础知识)复习题库.docx 2025年江苏生禁毒知识网络竞赛考试题库(220题).docx 2025年江苏生禁毒知识网络竞赛考试题库(290题).docx 2025年教师招聘考试最新教育理论基础知识考试复习题库.docx 2025年教师编制考试教育教学公共基础知识考试复习题库(350题).docx 2025年江苏生禁毒知识网络竞赛考试题库(250题).docx 2025年江苏省大学生就业创业知识竞赛考试题库(200题).docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.