机器学习的试验设计初探

资源ID：98241319 资源大小：248.88KB 全文页数：29页
资源格式： PPTX 下载积分：1.5金贝

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要1.5金贝

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

1、金锄头文库是“C2C”交易模式，即卖家上传的文档直接由买家下载，本站只是中间服务平台，本站所有文档下载所得的收益全部归上传人（卖家）所有，作为网络服务商，若您的权利被侵害请及时联系右侧客服；
2、如你看到网页展示的文档有jinchutou.com水印，是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有jinchutou.com水印标识，下载后原文更清晰；
3、所有的PPT和DOC文档都被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；下载前须认真查看，确认无误后再购买；
4、文档大部份都是可以预览的，金锄头文库作为内容存储提供商，无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证，请慎重购买；
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据；
6、如果您还有什么不清楚的或需要我们协助，可以点击右侧栏的客服。

下载须知 | 常见问题汇总

1、会员注册 2、如何支付与充值 3、个人资料信息修改 4、我的收藏和“收藏文件夹” 5、我的读者群和加入读者群 6、我的书签 7、金锄头文库批量上传工具（绿色版）V1.0 8、下载文档（资源）相关问题整理 9、解决下载文档时，自动弹出迅雷的问题 10、下载时为什么支付不成功？

机器学习的试验设计初探

简介两个基于R的模拟例子,机器学习的试验设计初探,China R Conference,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,1,简介试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,2 两个基于R的模拟例子例1 例2,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,什么是试验设计?,R. A. Fisher最初在农田试验方面的工作奠定了因子设计的发展. 二战后，随着化工行业的发展，试验设计也迅速发展。期间提出的序贯设计思想用以控制试验数量，以控制成本。随着回归模型的发展，基于模型的最优设计和响应曲面设计也逐渐发展起来。超饱和设计的发展，满足了工业中用少量试验来探索从大量因子中筛选重要因子的需求。计算机试验的发展，推动了空间填充设计（包括均匀设计和拉丁超立方体设计）的发展。,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,什么是试验设计? 如下的目的可以通过试验设计达到,比较试验变量筛选响应曲面探索系统优化系统稳健 More about experimental design, please refer to Wu and Hamada (2009) and Fang, Li and Sudjianto (2006).,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,R中比较核心的试验设计的包： Package AlgDesign Package FrF2 Package rsm Package lhs,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,把机器学习看成做试验,机器学习中使用的数据，往往不是从试验中得到的。但是，数据需要分为训练集和检测集。我们可以利用试验设计来寻找到一个更好的训练集。如果我们设计的好，那么机器学习也会更有效或者更准确。另外，在很多实际的情况下，训练数据响应值的获取是要付出高昂成本的。,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,试验设计简明介绍试验设计如何应用到机器学习中？基于R的模拟例子,接下来的部分，将使用两个基于R的模拟例子来验证上述的想法。为什么用R？在R里，我能找到几乎我所需要的全部。非常感谢COS论坛，让我学到了很多。,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,Deng et al. (2009) JASA,令X = (X1, . . . , Xp )T 为因子向量. 响应记为Y . Y 服从二项分布. P(Y = 1|x0) = F (x0) 是x0 点处的Y = 1的概率. 我们可以定义水平为的分类边界:,(1),l(x ) = x : F (x ) = 我们希望能通过训练数据来估计l .,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,为简单记, 令p = 2, 定义z = wx1 + (1 w )x2, 其中w 是一个取值0, 1之间的位置的权重. 此时，有 e(zµ)/,F (x|) = 1 + e(zu)/ ,(2),其中 = (µ, , w )T . 则我们可以推导出水平的分类边界为:,l(x1, x2) = (x1, x2) :,wx1 + (1 w )x2 µ,= log(, 1 ,). (3),China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,1 2,假设训练数据记为(x 1, Y1), . . . , (xn, Yn), 其中xi = (xi , xi ). 我们,给出每一个参数一个先验分布：,0,2,µ,0 0 0,µ N(µ , ), Exp( ), w Beta( , ).,(4),我们便可以推导出后验分布为：,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,f (|Y ) ,n,rr,i =1,e,i,1,(wx +(1,i,2,w )x µ)/,1 + e,i,(wx +(1,i,1 2,w )x µ)/,Yi,（,1,1 + e,i,1,(wx +(1,i,2,w )x µ)/,1Y,i,(µµ0)2,2,2,µ,0,0 0, 1,×e e w (1 w ),0, 1,.,(5),此时，便可以通过极大似然方法来估计了, = arg max logf (|Y ),(6),China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,ALSD,在迭代n次后, 我们巳经估计出来了当时的分类边界如下: l,n = wnx1 + (1 wn)x2 = µ + log( 1 ), (7) Tkn = (x 1, Y1), . . . , (xn, Yn). 接下来，我们希望在Tun选择下一个点放入训练集. 我们从Tun 选出k0 个数据作为候选，这些候选数据的选取以靠近l,n为标准.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,我们将这些候选的数据记为x1, . . . , xk0 . 然后按照如下方法从中选择一个数据:,1 k,xx ,.,x 0 ,xn+1 = arg max det(I (n, x ),(8),其中I (, x ) 是在点x 处的系数的Fisher信息阵.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,模拟例子,exp( zµ ),1+exp( zµ ),数据产生自分布F (x ) = 加上服从N(0, 0.1)的随机误, 差. 产生100个随机数. 我们设定闽值 = 0.7, 则满足F (x ) 的x 被标记为类别1，否则被标记为类别2.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,需要的包:numDeriv The complete code will not share here. If you are interested, you can contact me later.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,模拟结果,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,模拟结果,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,模拟结果,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,Deng, Lin and Qian (2012),The Lasso (Tibshirani,1996) 因其收缩性，是一种非常流行的变量选择方法. 考虑如下模型 Y = XT + (9) 其中X = (X1, . . . , Xp )T 是一个p 维随机向量, Y 是响应, 是回归系数, 服从零均值，方差为2的正态分布的随机误差. 给定n × p 的设计阵X 和响应值y, Lasso的拉格朗日解可以写成： = arg min (y X)T (y X) + |l (10) 1,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,变量选择的精确度可以用错选率来衡量, 记为. 令A() = j : j /= 0, j = 1, . . . , p, 则 p × = j : j A() but j ¯A() + j : j A() but j ¯A() (11),China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,之前X 都是简单随机抽样得到的. 分层抽样可以改进估计精度是众所周知的. McKay et al. (1979) 拉丁超立方体抽样(LHS), 该策略可以视作在所有变量上同时进行分层抽样.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,Owen (1992) showed that when using the LHS for Monte-Carlo integration, the estimator is less variate than the estimator from IID sampling. So we expect that using the LHS for Lasso can improve the solution. Also, when running a variable selection procedure, it is better the variables are less correlated so that the active variables are less correlated to the inactive variables. Orthogonal Latin hypercube design (OLHD) or nearly orthogonal latin hypercube design (NOLHD) would be a good choice. We are also motivated by Fang, Ge and Liu (2002), their result of the connection between discrepancy and E (fNOD ) in supersaturated designs maybe helpful here. Supersaturated designs are usually used for screening designs.,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,所需包: lars,lhs Gendex software is also needed Also refer to http:/www.math.hkbu.edu.hk/UniformDesign/,China R Conference,机器学习的试验设计初探,简介两个基于R的模拟例子,例1 例2,模拟,China R Conferen

注意事项

本文（机器学习的试验设计初探）为本站会员（d****y）主动上传，金锄头文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】，按提示上传提交保证函及证明材料，经审查核实后我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。