电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

机器学习的试验设计初探

29页
  • 卖家[上传人]:d****y
  • 文档编号:98241319
  • 上传时间:2019-09-09
  • 文档格式:PPTX
  • 文档大小:248.88KB
  • / 29 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、简介 两个基于R的模拟例子,机器学习的试验设计初探,China R Conference,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,1,简介 试验设计简明介绍 试验设计如何应用到机器学习中? 基于R的模拟例子,2 两个基于R的模拟例子 例1 例2,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,试验设计简明介绍 试验设计如何应用到机器学习中? 基于R的模拟例子,什么是试验设计?,R. A. Fisher最初在农田试验方面的工作奠定了因子设计的发 展. 二战后,随着化工行业的发展,试验设计也迅速发展。期间 提出的序贯设计思想用以控制试验数量,以控制成本。 随着回归模型的发展,基于模型的最优设计和响应曲面设计 也逐渐发展起来。 超饱和设计的发展,满足了工业中用少量试验来探索从大量 因子中筛选重要因子的需求。 计算机试验的发展,推动了空间填充设计(包括均匀设计和 拉丁超立方体设计)的发展。,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,试验设计简明介绍 试验设

      2、计如何应用到机器学习中? 基于R的模拟例子,什么是试验设计? 如下的目的可以通过试验设计达到,比较试验 变量筛选 响应曲面探索 系统优化 系统稳健 More about experimental design, please refer to Wu and Hamada (2009) and Fang, Li and Sudjianto (2006).,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,试验设计简明介绍 试验设计如何应用到机器学习中? 基于R的模拟例子,R中比较核心的试验设计的包: Package AlgDesign Package FrF2 Package rsm Package lhs,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,试验设计简明介绍 试验设计如何应用到机器学习中? 基于R的模拟例子,把机器学习看成做试验,机器学习中使用的数据,往往不是从试验中得到的。 但是,数据需要分为训练集和检测集。 我们可以利用试验设计来寻找到一个更好的训练集。如果我 们设计的好,那么机器学习也会

      3、更有效或者更准确。 另外,在很多实际的情况下,训练数据响应值的获取是要付 出高昂成本的。,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,试验设计简明介绍 试验设计如何应用到机器学习中? 基于R的模拟例子,接下来的部分,将使用两个基于R的模拟例子来验证上述的想 法。 为什么用R? 在R里,我能找到几乎我所需要的全部。 非常感谢COS论坛,让我学到了很多。,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,Deng et al. (2009) JASA,令X = (X1, . . . , Xp )T 为因子向量. 响应记为Y . Y 服从二项分 布. P(Y = 1|x0) = F (x0) 是x0 点处的Y = 1的概率. 我们可以定 义水平为的分类边界:,(1),l(x ) = x : F (x ) = 我们希望能通过训练数据来估计l .,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,为简单记, 令p = 2, 定义z = wx1 +

      4、(1 w )x2, 其中w 是一个取 值0, 1之间的位置的权重. 此时,有 e(z)/,F (x|) = 1 + e(zu)/ ,(2),其中 = (, , w )T . 则我们可以推导出水平的分类边界为:,l(x1, x2) = (x1, x2) :,wx1 + (1 w )x2 ,= log(, 1 ,). (3),China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,1 2,假设训练数据记为(x 1, Y1), . . . , (xn, Yn), 其中xi = (xi , xi ). 我们,给出每一个参数一个先验分布:,0,2,0 0 0, N( , ), Exp( ), w Beta( , ).,(4),我们便可以推导出后验分布为:,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,f (|Y ) ,n,rr,i =1,e,i,1,(wx +(1,i,2,w )x )/,1 + e,i,(wx +(1,i,1 2,w )x )/,Yi,(,1,1 + e,i,1,(wx +(1

      5、,i,2,w )x )/,1Y,i,(0)2,2,2,0,0 0, 1,e e w (1 w ),0, 1,.,(5),此时, 便可以通过极大似然方法来估计了, = arg max logf (|Y ),(6),China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,ALSD,在迭代n次后, 我们巳经估计出来了当时的分类边界如下: l,n = wnx1 + (1 wn)x2 = + log( 1 ), (7) Tkn = (x 1, Y1), . . . , (xn, Yn). 接下来,我们希望在Tun选择下一 个点放入训练集. 我们从Tun 选出k0 个数据作为候选,这些候选 数据的选取以靠近l,n为标准.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,我们将这些候选的数据记为x1, . . . , xk0 . 然后按照如下方法从中 选择一个数据:,1 k,xx ,.,x 0 ,xn+1 = arg max det(I (n, x ),(8),其中I (, x ) 是在点x 处的系数

      6、的Fisher信息阵.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,模拟例子,exp( z ),1+exp( z ),数据产生自分布F (x ) = 加上服从N(0, 0.1)的随机误, 差. 产生100个随机数. 我们设定闽值 = 0.7, 则满足F (x ) 的x 被标记为类别1,否则被标记为类别2.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,需要的包:numDeriv The complete code will not share here. If you are interested, you can contact me later.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,模拟结果,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,模拟结果,C

      7、hina R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,模拟结果,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,Deng, Lin and Qian (2012),The Lasso (Tibshirani,1996) 因其收缩性,是一种非常流行的变 量选择方法. 考虑如下模型 Y = XT + (9) 其中X = (X1, . . . , Xp )T 是一个p 维随机向量, Y 是响应, 是回 归系数, 服从零均值,方差为2的正态分布的随机误差. 给 定n p 的设计阵X 和响应值y, Lasso的拉格朗日解可以写成: = arg min (y X)T (y X) + |l (10) 1,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,变量选择的精确度可以用错选率来衡量, 记为. 令A() = j : j /= 0, j = 1, . . . , p, 则 p = j : j A() but j A() + j : j A() bu

      8、t j A() (11),China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,之前X 都是简单随机抽样得到的. 分层抽样可以改进估计精度是 众所周知的. McKay et al. (1979) 拉丁超立方体抽样(LHS), 该策 略可以视作在所有变量上同时进行分层抽样.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,Owen (1992) showed that when using the LHS for Monte-Carlo integration, the estimator is less variate than the estimator from IID sampling. So we expect that using the LHS for Lasso can improve the solution. Also, when running a variable selection procedure, it is better the variables ar

      9、e less correlated so that the active variables are less correlated to the inactive variables. Orthogonal Latin hypercube design (OLHD) or nearly orthogonal latin hypercube design (NOLHD) would be a good choice. We are also motivated by Fang, Ge and Liu (2002), their result of the connection between discrepancy and E (fNOD ) in supersaturated designs maybe helpful here. Supersaturated designs are usually used for screening designs.,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,所需包: lars,lhs Gendex software is also needed Also refer to http:/www.math.hkbu.edu.hk/UniformDesign/,China R Conference,机器学习的试验设计初探,简介 两个基于R的模拟例子,例1 例2,模拟,China R Conferen

      《机器学习的试验设计初探》由会员d****y分享,可在线阅读,更多相关《机器学习的试验设计初探》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.