好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

CDA数据分析师Level Ⅱ考试题库(含答案).docx

95页
  • 卖家[上传人]:hs****ma
  • 文档编号:401869813
  • 上传时间:2023-09-11
  • 文档格式:DOCX
  • 文档大小:2.61MB
  • / 95 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • CDA数据分析师LevelⅡ考试题库(含答案)一、单选题1.单因素方差分析中,计算F统计量,其分子与分母的自由度各为A、r-n,n-rB、n-r,r-1C、r,nD、r-1,n-r答案:D2.研究性别与是否失眠的相关性,可以用A、偏度B、卡方检验C、F检验D、T检验答案:B3.下面关于回归分析,说法错误的是?A、按照自变量和因变量的函数关系来分类,可以分为线性回归分析和非线性回归分析B、非线性回归问题可以转化为线性回归C、线性回归对异常值不敏感D、按照自变量和因变量的个数来分类,可分为一元回归分析和多元回归分析答案:C4.主成分分析法的主要作用是A、剔除异常值B、控制变量C、正则化D、降维答案:D5.在推导线性回归参数时,我们会做出以下哪些假设?(1)因变量y和预测变量x之间的真实关系是线性的;(2)模型的误差在统计意义上是独立的;(3)误差通常分布是均值为0,且标准差为常数;(4)预测变量x是非随机的,而且不存在测量误差A、1,2,3,4B、1,2,3C、1,3,4D、1,2答案:A6.以下哪种情境更适合使用线性回归?A、考察广告费对产品销售量的影响B、考察目标客户的行为规则,做出用户画像C、考察五个城市居民的有效收入的差异是否显著D、考察哪些客户最终是否购买产品答案:A7.以下哪个不是分群标签的用途?A、服务于产品和服务匹配策略B、定位客户的需求C、建立对客户的洞察D、解决工作的效率问题答案:D8.主成分分析的前提条件是各变量之间应该满足A、低度相关B、相互独立C、完全相关D、高度相关答案:A9.某电商的年销售量呈现Xt=0.72Xt-1+0.81Xt-2+εt,则xt为()A、ARIMA(n,m)B、AR(n)C、MA(m)D、ARMA(n,m)答案:B10.用户分层是在用户管理时最常被使用的标签类型,其中RFM模型是指()A、投入、效率、产出B、成交率、客流、客单价C、首次购买时间、消费频率、消费金额D、最近购买时间、消费频次、消费金额答案:D11.将原始数据进行整合、变换、特征降维、缺失值处理是在以下哪个步骤的任务A、数据预处理B、数据挖掘C、分类和预测D、模式发掘答案:A12.问卷测量通常可以从态度测量、能力测量等角度测试用户评分,一般来说态度测量经常使用的量表是哪一类?A、哥特曼(guttman)量表B、李克特5点测量量表C、李克特3点测量量表D、李克特9点测量量表答案:B13.假设我们使用LogistiC.回归模型分析n类分类问题,在这种情况下,我们可以使用留一法(One-vs-rentmothoD.)。

      关于这个问题,下面哪个选项是正确的A、我们需要在n类分类问题中拟合n+1个模型B、我们需要在n类分类问题中拟合1个模型C、我们需要在n类分类问题中拟合n个模型D、我们需要在n类分类问题中拟合n-1个模型答案:D14.针对该公式y(t)=3xy(t-1)+2xy(t-3)是()阶的时间序列A、1B、3C、2D、4答案:B15.在逻辑回归输出与目标对比的情况下,以下评估指标中哪一项不适用?A、均方误差B、AUC-ROCC、LoglossD、准确度答案:A16.能够用于总体估计的是A、自愿抽样B、滚雪球抽样C、方便抽样D、系统抽样答案:D17.某分析师希望通过聚类算法进行欺诈分析,发现结果不是很理想下列方法中哪项不能为聚类效果带来提升?A、对变量进行主成分分析B、对变量进行变量聚类C、对变量进行分箱处理D、对变量进行标准化答案:C18.在因子分析中,为了帮助解释因子,可以使用()A、因子负载B、因子得分C、因子旋转D、主成分分析答案:C19.以下哪种方法可以用于仓析面板数据A、自回归法(A.R)B、移动平均值法(MA.)C、随机效应法(RM)D、差分法答案:C20.多元线性回归中,检验异方差的方法是?A、如果回归拟合值与自变量相关则存在异方差B、如果回归残差与因变量相关则存在异方差C、如果回归因变量与自变量相关则存在异方差D、如果回归残差与自变量相关则存在异方差答案:B21.从两个总体中独立选取两个样本,两个总体的方差未知,但是样本为大样本,则两个总体的平均值之差的估计需要用到A、正态分布B、卡方分布C、F分布D、t分布答案:C22.在方差分析中,多重比较的目的是通过配对比较来进一步检验A、哪两个样本均值之间有差异B、哪两个样本方差之间有差异C、哪两个总体方差之间有差异D、哪两个总体均值之间有差异答案:D23.以下哪个不属于根据麦肯锡问题分析方法中的分类:A、问题解决型问题B、追求理想型问题C、恢复原状型问题D、防范潜在型问题答案:A24.时间序列MA(q)模型,其中q指的是()A、时间序列的偏自相关系数是q阶截尾的B、时间序列的自相关系数是q阶拖尾的C、时间序列的偏自相关系数是q阶拖尾的D、时间序列的自相关系数是q阶截尾的答案:D25.为了估计北京市使用华为品牌的市场占有率,在收集数据时,最有可能采用的数据搜集方法是?A、方便抽样B、配额抽样C、实验D、随机抽样答案:D26.以下哪个不属于根据麦肯锡问题分析方法中的分类:A、恢复原状型问题B、防范潜在型问题C、问题解决型问题D、追求理想型问题答案:C27.回归模型犹如一列火车,引擎牵引的列车节箱数受速度、动力等因素所限,并不能无限增加,否则这列火车会存在安全隐患,回归也存在这类由维度(列车节箱)所引起的安全问题,因此,在数据挖掘的场景中,认为自变量的维度最好不要超出15个,那么控制自变量个数的方法主要是哪种?A、因子分析B、卡方分析C、方差分析D、相关分析答案:A28.关于K-MeA.ns算法,正确的描述是?A、不能使用核函数B、能找到任意形状的聚类C、初始值不同,最终结果可能不同D、每次迭代的时间复杂度是0(n2),其中n是样本数量答案:C29.一个一元线性回归模型的判定系数R2=0.8,那么下列解释中错误的是()A、在训练集中,因变量的估计精度上限为80%B、自变量与因变量之间有着较强的线性关系C、在因变量的变动中有80%是由自变量所决定的D、因变量的变差中有80%的概率可以由自变量与因变量之间的线性关系来解释答案:A30.多元线性回归中F检验的原假设是A、所有回归系数都等于预估值B、所有回归系数都不等于预估值C、所有回归系数都不等于0D、所有回归系数都等于0答案:D31.以下哪种方法可以用于分析面板数据A、自回归法(AR)B、差分法C、随机效应法(RM)D、移动平均值法(MA)答案:C32.以下关于一元线性回归分析y=bo+bix+s描述错误的是?A、一元线性回归中F检验的检验统计量与t检验是一致的B、若用于预测的x数值与样本中的自变量偏差很大,那么预测得到y的可靠性也会降低C、即便建立了一元线性回归,也不能直接认为x是y的原因D、一元线性回归中F检验的作用与t检验是一致的答案:A33.假设我们使用Logistic回归模型分析类分类问题。

      在这种情况下,我们可以使用留一法(One-vs-restmethod).关于这个问题,下面哪个选项是正确的A、我们需要在n类分类问题中拟合1个模型B、我们需要在n类分类问题中拟合n-1个模型C、我们需要在n类分类问题中拟合n+1个模型D、我们需要在n类分类问题中拟合n个模型答案:B34.对于一元线性回归,回归系数显著性检验需要用到A、Z检验B、t检验C、卡方检验D、F检验答案:B35.有一款产品的重量标准为10克,现在分别用A和B两个厂家来生产这一产品,分别各随机抽取50个样品,A厂生产的样本重量的标准差为0.01,B厂生产的样本重量的标准差为0.1,现在需要比较两家广商在产品重量指标是否有显著差异,我们应该选择A、单侧t检验B、双侧t检验C、单侧F检验D、双侧F检验答案:B36.应用回归分析应注意的问题,下面说法错误的是?A、回归分析的自变量选取要符合业务需要,选择合适的数据资料B、回归分析的自变量必须是连续型数据C、应用回归分析时,要注意时间窗口的一致性D、因为回归分析是研究自变量与因变量的因果关系,所以要注意孰因孰果答案:B37.在进行多元线性回归分析时,对于变量较多的情况下,可以选择变量筛选方法,下列不正确的是A、交叉验证法B、向后剔除法C、向前选择法D、逐步法答案:A38.回归分析中定义的A、解释变量和被解释变量都为非随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都是随机变量D、解释变量为随机变量,被解释变量为非随机变量答案:B39.若线性规划问题没有可行解,可行解集是空集,则此问题()A、没有无界解B、没有无穷多最优解C、有无界解D、没有最优解答案:D40.主成分分析的前提条件是各变量之间应该满足A、低度相关B、完全相关C、相互独立D、高度相关答案:A41.在时间序列分析中,指数平滑法的平滑系数A.的取值A、越小越好B、取值范围在-1到1之间C、取值范围在0到1之间D、越大越好答案:C42.以下关于系统聚类的描述中,错误的是()A、系统聚类也叫层次聚类B、系统聚类适用于数据量非常大或者变量非常多的项目C、系统聚类法通常分为自底向上和自顶向下D、系统聚类的过程非常清楚,会形成类似树状的聚类图谱,便于理解和检查答案:B43.下列关于主成分分析的表述不正确的有()A、所确定的几个主成分之间是高度相关的B、所确定的几个主成分之间是互不相关的C、使用主成分分析方法的前提是原来的多个指标之间是相关的D、主成分分析的目的是寻找少数几个主成分代表原来的多个指标答案:A44.在系统聚类中,我们需要定义两个类之间的距离,下列哪种方法能够缓解异常值对计算距离造成的影响?A、离差平方和法B、最短距离法C、最长距离法D、以上都不是答案:A45.多元线性回归中,检验异方差的方法是?A、如果回归拟合值与自变量相关则存在异方差B、如果回归残差与因变量相关则存在异方差C、如果回归残差与自变量相关则存在异方差D、如果回归因变量与自变量相关则存在异方差答案:C46.多元线性回归中检验的原假设是A、对应单个回归系数等于0B、对应单个回归系数不等于0C、对应单个回归系数等于预估值D、对应单个回归系数不等于预估值答案:A47.如果时间序列的各期增长量相等,A、各期环比增长速度有升有降B、环比增长速度逐期上升C、各期的环比增长速度保持不变D、环比增长速度逐期下降答案:D48.某电商的年销售量呈现Xt=0.72Xt-1+0.81Xt-εt,则xt为()A、RIMA(n,m)B、MA(m)C、ARMA(n,m)D、AR(n)答案:D49.方差分析的主要目的是判断()A、各样本数据之间是否有显著差异B、分类型因变量对数值型自变量的影响是否显著C、分类型自变量。

      点击阅读更多内容
      相关文档
      25秋国家开放大学《0-3岁婴幼儿的保育与教育》形考任务1-4参考答案.docx 25秋国家开放大学《0-3岁婴幼儿卫生与保育》形考任务1-3+期末大作业参考答案.docx 25秋国家开放大学《0-3岁婴幼儿教育学》期末大作业参考答案.docx 25秋国家开放大学《Android核心开发技术》形考任务1-7参考答案.docx 国开2025年秋季《形势与政策》大作业答案.docx 国开2025年秋季《形势与政策》专题测验1-5答案.docx 2025年辽宁普通高中学业水平选择性考试语文试卷(原卷+答案).doc 2025年广西普通高中学业水平选择性考试英语试卷(原卷+答案).doc 2025年6月浙江普通高中学业水平选择性考试地理试卷(原卷+答案).doc 2025年江西普通高中学业水平选择性考试英语试卷(原卷+答案).doc 2025年广东普通高中学业水平选择性考试数学试卷(原卷+答案).doc 2025年内蒙古普通高中学业水平选择性考试语文试卷(原卷+答案).doc 2025年贵州普通高中学业水平选择性考试英语试卷(原卷+答案).doc 2025年安徽普通高中学业水平选择性考试生物试卷(原卷+答案).doc 2025年辽宁普通高中学业水平选择性考试数学试卷(原卷+答案).doc 2025年广东普通高中学业水平选择性考试语文试卷(原卷+答案).doc 2025年1月云南省高考适应性测试物理试卷(原卷+答案).doc 2025年江苏普通高中学业水平选择性考试语文试卷(原卷+答案).doc 2025年甘肃普通高中学业水平选择性考试语文试卷(原卷+答案).doc 2025年陕西普通高中学业水平选择性考试生物试卷1(原卷+答案).doc
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.