好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

2020年上海市高等学校信息技术水平考试试卷四级人工智能自然语言处理与识别方向模拟卷.docx

8页
  • 卖家[上传人]:奇异
  • 文档编号:234249637
  • 上传时间:2022-01-03
  • 文档格式:DOCX
  • 文档大小:19.40KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 2020年上海市高等学校信息技术水平考试试卷四级人工智能(自然语言处理与识别方向模拟卷)(本试卷考试时间150分钟)一、单选题(本大趣15道小题,每小题1分,共15分),从下面题目给出的A、B、C、D四个 可供选择的答案中选择一个正确答案1 .在回归模型中,下列一在权衡欠拟合和过拟合中影响最大扎多项式阶数B.更新权重w时,使用的是矩阵求逆还是梯度下降C.使用常数项D.增加数据量2 . A和B分别代表两个事件,如果P(A, B)降低,同时P(A)上升,一是正确的A. P(B|A)降低B. P(A|B)降低C. P(B)降低D. P(B)上升3.癌症检查数据样本有10000个,苴中10个数据样本是有癌症,其它是无癌症假设分类模 型在无癌症数据9990中预测正确了 9980个,在10个癌症数拯中预测正确了 9个,此时 真阳 二9,真阴=9980,假阳二10,假阴二1则该分类模型的Fl-score为一扎 62. 07%B. 99. 89%C. 47. 36%D. 76. 27%4 .在测试一假设h时,发现在一包含n二1000个随机抽取样例的样本s上,它出现仁300个 错误,计算errors (h)的标准差为一。

      A. 0. 0145B. 0. 145C. 1.45D. 14.55 .下表为某训练集数据,其中XI, X2为特征,Y为分类标记,则使用该训练集学习到的朴素贝 叶斯分类器对x = (1, M)的分类结果为一XL0.0.LL(LLLX2LLL葡LY.0.0.LL0「0.0.LA.OB. 1c.不确宦D. 0和1都有可能6 .关于主成分分析算法,以下步骤一是错误的扎对所有样本进行去中心化B.计算样本的协方差矩阵C.对协方差矩阵做特征值分解D.取最大的低维空间维数特征值所对应的特征向量输出投影矩阵7 .四个点坐标为(1, 1), (-1,0),用SVM分类的决策边界是一A. x = 0B. y = xC ・ y 二一xD. y = 08 .在大数据集上训练决策树,为减少训练时间,可使用以下 方法扎减少树的深度B.增加树的深度C.增加学习率D.减少树的数量9 .关于偏差和方差,以下说法不正确的是一扎如果能保证或验证一批训练集来自同一个分布,算法在这批训练集上的学习结果会是一致的B.偏差一方差分解试图对学习算法的期望泛化错误率进行拆解C.泛化误差可以分解为偏差、方差和噪声之和D.方差与偏差通常是有冲突的,其中方差刻画数据扰动造成的影响,偏差刻画的是学习算法本 身的拟合能力10 .下列哪个神经网络结构会发生权重共享 0A.卷积神经网络和循环神经网络B.卷积神经网络C.循环神经网络D.全连接神经网络11 . Shanghai和Beijing的编辑:距离是。

      A. 7B. 8C. 11D. 1512 .在自然语言处理中,实体关系学习是指一扎发现文本中的有效实体B.实体识别与链接C•研究如何从文本中抽取事件信息并以结构化的形式呈现出来D.检测文本中的实体是否具有某种预左义的关系13 .在文本挖掘中,可以使用一命令完成将文本转换为tokens,然后将其转换为整数或浮点向量的 操作A. CountVectorizerB. TF-IDFC.词袋模型(Bag of Words)D. NERs14 .主题模型是自然语言处理中的常见的一类统汁模型对于常用的两类主题模型BTM、LDA,下 列一不是BTM相较于LDA模型的优点A.计算速度快B.适用于短文本C.占用空间少D.解决稀疏性问题15 .以下关于神经网络自然语言模型的评述,错误的是 o扎BERT模型可用作特征提取B.神经网络语言模型可解决维数灾难的问题C. GPT和ELM使用整个模型的全部参数来表示词向量D. BERT是一个双向注意力模型二、多选题(本大题6道小题,每小题2分,共12分),从下面题目给出的A、B、C、D四个可供选择的答案中选择所有正确答案1.关于朴素贝叶斯分类方法描述正确的有一扎需要计算先验概率B.对缺失数据敏感0.对小规模的数据表现很好D.算法成立的前提是假设各属性之间互相独立2 .正则化能处理过拟合的原因是 o扎惩罚了模型的复杂度,避免模型过度学习训练集,提高泛化能力B.正则项降低了每一次系数w更新的步伐,使参数更小,模型更简单C.正则化使得训练集和测试集数据分布更为接近,因而避免了在训练集上过拟合D.贝叶斯学派的观点,认为加入了先验分布(11拉普拉斯分布,12高斯分布),减少参数的选 择空间3 .通过监督学习进行二分类模型训练过程中,可能会遇到正负样本分布不均的情况(比如正样 本有50万但是负样本有100万),下列一方法可以进行恰当处理。

      扎将所有的数据加入训练集,充分利用所有数据B.从100万负样本中随机抽取50万C.正样本权重设置为2,负样本权重设为1D.复制两份正样本参与到训练中去4 .可以实现关键词提取任务的常见算法包括()oA. TF/IDFB. SVMC. TextRankD.最短编借距离5 . 对语义关系进行分类可以帮助我们更好理解语义关系的含义及特性,语义关系包括()O扎因果关系B.上下位关系C.部分整体D.实体来源6 .评价一个推荐系统输出的Top-N推荐列表的好坏,常见的指标有:()o 扎准确率PrecisionB.召回率RecallC. F1 值D.转化率三、是非题(本大题15道小题,每小题1分,共15分),从下面题目给出的两个可 供选择的答 案中选择一个正确答案1 .如果决策树对训练集拟合不足,通过缩放输入特征可以有效改善A.正确B.错误2 . Boosting和Bagging都是组合多个分类器投票的方法,二者都是根据单个分类器的正确 率决迤 其权重A.正确B.错误3 .如果两个变量的Pearson相关性系数为零,则它们不相关A.正确B.错误4 .当不知道数据所带标签时,可以使用分类技术促使带同类标签的数据与带其他标签的数据相 分离。

      扎正确B.错误5 .回归问题和分类问题都有可能发生过拟合扎正确B.错误6 .向量 x 二[1,2, 3, 4,-9,0]的 L1 范数是 1A.正确B.错误7 .神经网络中激活函数引入了非线性A.正确8 .错误8 .参数化的方法可以使得类条件概率估计简化,但是估计结果的准确性严重依赖于所假设的概 率分布形式是否符合真实数据分布A.正确B.正确9 .假设我们有三个簇中心ul=[l;2],u2=[3;0];,u3=[4;2]此外,我们还有一个训 练示例x⑴=12用则在一个集群分配步骤之后,c(i)将会是2A.正确B.错误10 .评价规则优劣的标准应该优先考虑规则准确率,同时考虑覆盖样例数和属性次序扎正确B.错误11 .逆文档频率(IDF)的作用是减少常用词的权重,增加文档中不常用词的权重A.正确B.错误12 .将词表示成向量被称为神经词嵌入(Neural Word Embeddings)0扎正确B.错误13 .信息抽取是指对源语言的长文本进行压缩,提取出关键句子的短文本的技术A.正确B.错误14 .在给到任何神经网络之前,Tokens都会被转换成数字A.正确B.错误15 . Word2Vec包含CBOW和Skip-gram这两个模型,其中CBOW模型是输入当前词的词向虽:, 输出周围词的词向量,而Skip-gram模型正好相反。

      A.正确B.错误四.操作题素材、样张、KS目录均在Zip文件中,可双击此图标打开以下第(一)题(案例应用题)题目请在文件“C:\KS\人工智能•自然语言处理与理解•答题 纸.docx”中作答案例应用题(共20分)虽然近年办智能对话系统取得了长足的进展,但是针对专业性较强的问答系统,如何准确的判别 用户的输入是否为给定问题的语义等价问法仍然是智能问答系统的关键举例而言,“请问什么 是公益诉讼? 〃和“什么是公益诉讼? 〃可以认为是语义上等价的问题,而“请问什么是公益诉 讼? ”和”检察机关发起公益诉讼是什么意思?'’则为不等价的问题针对问题等价性判别 而言,除去系统的准确性外,系统的鲁棒性也是很重要问题:现有某人工智能公司开发的口动问答系统用r某市法院的服务号,口动回答市艮关于 法律方面的常见问题假设收集的提问数据集格式如下,数据以问题组的形式提供,每组问句乂 分为等价部分和不等价部分,等价问句之间互相组合可以生成正样本,等价问句和不等价问句之 间互相组合可以生成负样本请设计一个方案,用于预测一组文本是否为等价问法提示:这道题可能会有多种思路,建议使用基于BERT预训练的文本相似度预测思路。

      请在答题 纸作答,此处答题一律无效!〈question,哪些情形下,不予受理民事诉讼申请? 〈question〉民事诉讼中对哪些情形的起诉法院不予受理< /question>〈question〉人民法院不予 受理的民事案件有哪些情形? "question) v正quivalenceQuestions>〈question〉民事诉讼什么情况下不能立案〈/question,〈question〉哪些案件会给开具民事诉讼不予立案通知书〈/question,〈question〉法院对于哪些案件再审申请不予受理v /question>v/NotEquivale nceQuesti ons>vQuesti ons number 二〈question,我被车撞了,肇事车是借的,我能找车主索赔吗? v/question,〈question,借车撞人了,被撞者能找车主去索赔吗?v/question〉〈question,我被人家车撞了,可以去找原车主索要赔偿呢〈/question〉vNotEquivale nceQuesti ons>〈question〉交通事故未划分责任允许放车吗〈/question〉〈question〉人被车撞了,对方车是借的,对方全责,我怎么起诉v/question〉〈question〉我的亲人被车撞如何索赔? v/question>〈question〉对方借车给我车撞了对方全责v/question>v/NotEquivale nceQuestions>

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.