电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

题库深度学习面试题型介绍及解析

7页
  • 卖家[上传人]:ni****g
  • 文档编号:495709455
  • 上传时间:2023-04-28
  • 文档格式:DOCX
  • 文档大小:24.68KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、1简述激活函数的作用使用激活函数的目的是为了向网络中加入非线性因素;加强网络的表示能 力,解决线性模型无法解决的问题为什么加入非线性因素能够加强网络的表示能力?一一 神经网络的万能近 似定理神经网络的万能近似定理认为主要神经网络具有至少一个非线性隐藏 层,那么只要给予网络足够数量的隐藏单元,它就可以以任意的精度来 近似任何从一个有限维空间到另一个有限维空间的函数。如果不使用非线性激活函数,那么每一层输出都是上层输入的线性组 合;此时无论网络有多少层,其整体也将是线性的,这会导致失去万能 近似的性质但仅部分层是纯线性是可以接受的,这有助于减少网络中的参数。3如何解决训练样本少的问题?1利用预训练模型进行迁移微调(fine-tuning ),预训练模型通常在特 征上拥有很好的语义表达。此时,只需将模型在小数据集上进行微调就 能取得不错的效果。CV有ImageNet , NLP有BERT等。2数据集进行下采样操作,使得符合数据同分布。3数据集增强、正则或者半监督学习等方式来解决小样本数据集的训练 问题。4如何提升模型的稳定性?1正则化(L2, L1, dropout ):模型方差大,很可能来

      2、自于过拟合。正 则化能有效的降低模型的复杂度,增加对更多分布的适应性。2前停止训练:提前停止是指模型在验证集上取得不错的性能时停止训 练。这种方式本质和正则化是一道理,能减少方差的同时增加的偏 差。目的为了平衡训练集和未知数据之间在模型的表现差异。3扩充训练集:正则化通过控制模型复杂度,来增加更多样本的适应 性。4特征选择:过高的特征维度会使模型过拟合,减少特征维度和正则一 样可能会处理好方差问题,但是同时会增大偏差。5你有哪些改善模型的思路?1数据角度增强数据集。无论是有监督还是无监督学习,数据永远是最重要的驱动 力。更多的类型数据对良好的模型能带来更好的稳定性和对未知数据的 可预见性。对模型来说,“看到过的总比没看到的更具有判别的信 心”。2模型角度模型的容限能力决定着模型可优化的空间。在数据量充足的前提下,对同类型的模型,增大模型规模来提升容限无疑是最直接和有效的手段。3调参优化角度如果你知道模型的性能为什么不再提高了,那已经向提升性能跨出了一 大步。超参数调整本身是一个比较大的问题。一般可以包含模型初始化 的配置,优化算法的选取、学习率的策略以及如何配置正则和损失函数4训练角度

      3、在越大规模的数据集或者模型上,诚然一个好的优化算法总能加速收 敛。但你在未探索到模型的上限之前,永远不知道训练多久算训练完 成。所以在改善模型上充分训练永远是最必要的过程。充分训练的含义 不仅仅只是增大训练轮数。有效的学习率衰减和正则同样是充分训练中 非常必要的手段。6.LSTM可以使用别的激活函数吗?关于激活函数的选取,在LSTM中,遗忘门、输入门和输出门使用 Sigmoid函数作为激活函数;在生成候选记忆时,使用双曲正切函数 Tanh作为激活函数。值得注意的是,这两个激活函数都是饱和的,也就是说在输入达到一定值 的情况下,输出就不会发生明显变化了。如果是用非饱和的激活函数,例 如ReLU,那么将难以实现门控的效果。Sigmoid函数的输出在01之间,符合门控的物理定义。且当输入较大 或较小时,其输出会非常接近1或0,从而保证该门开或关。在生成候选 记忆时,使用Tanh函数,是因为其输出在- 11之间,这与大多数场景 下特征分布是0中心的吻合。此外,Tanh函数在输入为0附近相比 Sigmoid函数有更大的梯度,通常使模型收敛更快。激活函数的选择也不是一成不变的,但要选择合理的激活函

      4、数。7如何提高深度学习系统的性能1. 提高模型的结构。2. 改进模型的初始化方式,保证早期梯度具有某些有益的性质,或者具 备大量的稀疏性,或者利用线性代数原理的优势。3. 择更强大的学习算法。8为什么需要激活函数?1激活函数对模型学习、理解非常复杂和非线性的函数具有重要作用。2激活函数可以引入非线性因素。如果不使用激活函数,则输出信号仅 是一个简单的线性函数。线性函数一个一级多项式,线性方程的复杂 度有限,从数据中学习复杂函数映射的能力很小。没有激活函数,神 经网络将无法学习和模拟其他复杂类型的数据,例如图像、视频、音 频、语音等。3激活函数可以把当前特征空间通过一定的线性映射转换到另一个空 间,让数据能够更好的被分类。1. 假若网络中全部是线性部件,那么线性的组合还是线性,与单独一个 线性分类器无异。这样就做不到用非线性来逼近任意函数。2. 使用非线性激活函数,以便使网络更加强大,增加它的能力,使它可 以学习复杂的事物,复杂的表单数据,以及表示输入输出之间非线性 的复杂的任意函数映射。使用非线性激活函数,能够从输入输出之间 生成非线性映射。10.对fine-tuning (微调模型的

      5、理解),为什么要修改最后几层 神经网络权值?使用预训练模型的好处,在于利用训练好的SOTA模型权重去做特征提取,可以节省我们训练模型和调参的时间。至于为什么只微调最后几层神经网络权重,是因为:(1). CNN中更靠近底部的层(定义模型时先添加到模型中的层)编码的是 更加通用的可复用特征,而更靠近顶部的层(最后添加到模型中的层)编码的是更专业业化的特征。微调这些更专业化的特征更加有用,它更代表 了新数据集上的有用特征。(2).训练的参数越多,过拟合的风险越大。很 多SOTA模型拥有超过千万的参数,在一个不大的数据集上训练这么多参 数是有过拟合风险的,除非你的数据集像Image net那样大。11移动端深度学习框架你知道哪些,你用过哪些?各大公司开源了自己的移动端深度学习框架,其中包括: TensorFlow Lite (谷歌) Caffe2( Facebook) MACE (小米) paddle-mobile (百度) FeatherCNN (腾讯 AI lab) NCN N (腾讯优图) Core ML(苹果) PocketFlow (腾讯AI lab )与其他不同,属于模型压缩框架 xNN (阿里) PPL (商汤) SNPE (高通) TVM (亚马逊)12描述一下LSTM与GRU的区别?LSTM与GRU二者结构十分相似,不同在于:1. 新的记忆都是根据之前状态及输入进行计算,但是 GRU中有一个重 置门控制之前状态的进入量,而在LSTM里没有类似门;2. 产生新的状态方式不同,LSTM有两个不同的门,分别是遗忘门 (forget gate)和输入门(input gate),而GRU只有一种更新门 (update gate);3. LSTM对新产生的状态可以通过输出门(output gate)进行调节,而 GRU对输出无任何调节。4. GRU的优点是这是个更加简单的模型,所以更容易创建一个更大的网 络,而且它只有两个门,在计算性上也运行得更快,然后它可以扩大 模型的规模。5. LSTM更加强大和灵活,因为它有三个门而不是两个。欢迎大家留言谈谈自己对每个框架的看法公众号改版,时间线被打乱,一些精彩文章大家可能错过了。如果感觉这里的文章对你有帮助,赶紧给AI职通车加一个星标吧,第一时间阅读文章。

      《题库深度学习面试题型介绍及解析》由会员ni****g分享,可在线阅读,更多相关《题库深度学习面试题型介绍及解析》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.