
探索大数据和人工智能最全试题.docx
27页探索大数据和人工智能最全试题1、 2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责 全面推进“数据分享平台”战略,并推出大型的数据分享平台A首席数据官B. 首席科学家C. 首席执行官D. 首席架构师2、 整个 MapReduce 的过程大致分为 Map Shuffle、Combine、()?A. ReduceB. HashC. Clea nD. Loadi ng3、 在Spak的软件栈中,用于交互式查询的是A. SparkSQLB. MllibC. GraphXD. Spark Stream ing4、 在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量 与 处()理时间是什么关系?A数量越多处理时间越长B. 数量越多处理时间越短C. 数量越小处理时间越短D. 没什么关系5、 下列选项中,不是kafka适合的应用场景是?A. 日志收集B. 消息系统C. 业务系统D. 流式处理6大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一 的是A. 结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据7、 下列选项中,不是人工智能的算法中的学习方法的是?A. 重复学习B. 深度学习C. 迁移学习D. 对抗学习8、 自然语言处理难点目前有四大类,下列选项中不是其中之一的是A. 机器性能B. 语言歧义性C. 知识依赖D・语境9、 传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习 是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型称 为什么?A. 给定标签B. 离散C. 分类D. 回归10、 中国移动自主研发、发布的首个人工智能平台叫做()A. 九天B. On eNETC. 移娃D. 大云11、 HDFS八 Namenodef 的 Metadata 的作用是?A. 描述数据的存储位置等属性B. 存储数据C. 调度数据D.12、 电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问 是用的什么技术实现的?A大数据技术B. 互联网技术C. 游戏技术D. 影像技术13、 随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模 式,向着什么靠拢?A・闭源B. 开源C. 独立D. 封闭14、 以下不是非结构化数据的项是?A. 图片B. 音频C. 数据库二维表数据D. 视频15、 以下数据单位换算错误的是?A. 1KB=1024BB. 1GB=1024MBC. 仃 B=1000GBD. 1MB=1024KB16、 下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性17、 BP神经网络模型拓扑结构不包括A. 输入层B. 隐层C. 翰出层D. 显层18、 以下哪个不是语音识别的范畴?A. 语音听写B. 语音台成C. 语音转写D・语音唤醒19、 以下哪个场景可以称为大数据场景?A. 故宫游客人B. 故宫门票收入C. 美团APP的定位信息D. 文章内容20、 2011年5月是哪家全球知名咨询公司在 《Big data: The next frontier for innovation, competition and productivity》研究报告中指出,数据已经 渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A. 比尔恩门B. 麦肯锡C. 扎克伯格D. 乔图斯21、 下列选项中,哪项是分布式文件存储系统?A. HDFSB. FlumeC. KafkaD. Zookeeper22、 下列选项中,正确描述Flume对数据源的支持的是A. 只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式23、 机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机 器学习利用数据训练出什么?A. 模型B. 表结构C. 结果D. 报表24、 下列选项中,不是人工智能的算法中的学习方法的是A. 重复学习B. 深度学习C. 迁移学习D. 对抗学习25、 语音识别产品体系有四部分,下列哪项不是体系之一 ?A. 语音合成B. 语音播放C. 语音识别D・语义理解26、 今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会 产生理论级别的突破。
而哪项技术将继续成为大数据智能分析的核心技术A机器学习B. 智能物流C・脑科学D. 智能终端27、 以下哪个不属于大数据在电信行业的数据商业化方面的应用A. 精准广告B. 网络管理C. 营销洞察D. 大数据检测和决策28、 RDD是由多个什么组成?A. partiti onB. computerC. Actio nD. Tran sformatio n29、 下列选项中,不是大数据的一部分的是?A. 海量计算B. 大量数据管理C. 数据分析D. 单机计算30、 属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能31、 map reduce计算模型适用于哪种任务?A. 多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理32、 当前世界产生的数据总量的单位是?A. KBB. ZBC. GBD. TB33、 IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多Variety)、更值钱(Value)和()A. 更有效B. 更充分C. 更真实(Veracity)D. 更直观34、 Spark.是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用 场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是 计算密集度较大的场合,受益就相对较小A. 内存B. 硬盘C. 磁带D. 显卡35、 下列选项中,不是kafka适合的应用场景是?A. 日志收集B. 消息系统C. 业务系统D. 流式处理36、 数据采集的基本步骤(ETL)中不包括哪项?A・抽取转换B. 加载C. 计算D.37、 以下哪种学习方法不属于人工智能算法?A. 迁移学习B. 对抗学习C. 强化学习D. 自由学习38、 语音识别常用的应用有四个,下列不是常用应用的是?A聊天B. 拨号C. 导航D. 设备控制39、 下列选项中,哪项是由谷歌开发的人工能算法框架?A. KafkaB. Ten sorflowC. CaffeD. Torch40、 “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优 化 能力来适应()、高增长率和多样化的信息资产A. 海量B. 少数C. 小量D. 结构化41、 MPP是指A. 大规模并行处理系统B. 受限的分布式计算模型C. 集群计算资源管理框架D. 分布式计算编程框架42、 Hadoop是()年诞生的?A. 1985-1985B. 1995-1996C. 2005-2006D. 2015-201643、 在Spark的软件栈中,用于流计算的是?A. GraphXB. MllibC. Spark Stream ingD. SparkSQL44、 以下数据量可以称为大数据的是A. 100MBB. 100KBC. 100PBD. 100MB45、 人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A. 图片识别B. 语音识别C. 自动驾驶D. 消费金融46、 IBM的()是第一个在国际象棋上战胜人类人工智能计算机。
A. AlphagoB. 深蓝C. 图灵机模型D. 深度学习机器人47、 下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPUi艮务器C. 专用芯片D. 游戏显卡48、 以下哪个不属于大数据在电信行业的应用?A数据商业化B・物流网络C. 企业运营管理D. 客户关系管理49、 客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服 中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案A. 大数据技术B. 客户画像C. 客户状态D. 客户心情50、 IBM提出的大数据5V特征包括()、更快(velocity)、更多(Variety)、更 值 钱(Value)和更真实(Veracity)A. 更有效B. 更大(Volume)C. 更充分D. 更直观51、 Fume采用了三层架构,分别为age nt, collector和()A. M apB. storageC. ShuffleD. Hash52、 Hadoop2系列版本中默认的HDFS勺block是多大?A32MBB. 64MBC. 128MBD. 16MB53、 工信部官网正式发布大数据产业“一二五“发展规划是在哪一年A. 1987B. 1997C. 2007D. 201754、 BP神经网络的学习规则是?A. 梯度上升法B. 梯度下降法C. 梯度提升法D. 梯度曲线法55、 中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回 答用户解决业务咨询、业务办理、流量查询等问题。
A. 精灵B. 阿尔法蛋C. 小度D. 移娃56、 对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?A. 判别样本B. 计算样本C. 统计样本D. 生成样本57、 以下应用没有使用你的地理位置信息的是?A. 美团B. 滴滴C. 高德地图D. word58、 下列选项中,不是大数据发展趋势的是A. 大数据分析的革命性方法出现B. 大数据与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰59、 在Spark的软件栈中,用于图计算的是A. Spark Stream ingB. MIlibC. GraphXD. SparkSQL60、 HBASE勺特点不包括哪些?A. 面向行B. 稀疏性C. 多版本D. 高可靠性61、 总体来说,人工智能发展的未来趋势是?A. 上升B. 下降C. 不动D. 大幅度下降62、 以下数据单位从小到大排列的顺序是?A. GB B、 KBB. B、 KB MBC. KB ZB PBD. B、MB KB63、 最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之 类 的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A. 谷歌B. 百度C. 360D. bi ng64、 下列选项中,哪个不是HBASE的特点?A面向行B. 多版本C. 扩展性D. 稀疏性65、 下列选项中,不是。





![河南新冠肺炎文件-豫建科[2020]63号+豫建科〔2019〕282号](http://img.jinchutou.com/static_www/Images/s.gif)






