好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

随机森林算法.docx

3页
  • 卖家[上传人]:pu****.1
  • 文档编号:490795571
  • 上传时间:2024-01-09
  • 文档格式:DOCX
  • 文档大小:55.80KB
  • / 3 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 随机森林算法1. 算法简介随机森林由LeoBreiman (2001)提出,它通过自助法(bootstrap)重采样技 术, 从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然 后根据自助样本集生成 k 个分类树组成随机森林,新数据的分类结果按 分类树投票 多少形成的分数而定其实质是对决策树算法的一种改进,将多个决 策树合并在一 起,每棵树的建立依赖于一个独立抽取的样品, 森林中的每棵树具有相同的分布,分类误差取决于每一棵树的分类能力和它们之间的相关性 特征 选择采用随机的方法去分裂每一个节点, 然后比较不同情况下产生的误差能够 检测到的内在估计误差、分类能力和相关性决定选择特征的数目 单棵树的分类 能力可能很小,但在随机产生大量的决策树后,一个测试样品可以通过每一棵树 的 分类结果经统计后选择最可能的分类2. 算法原理决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)其每个 非叶 节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上 的输 出,而每个叶节点存放一个类别使用决策树进行决策的过程就是从根节点 开始, 测试待分类项中相应的特征属性, 并按照其值选择输出分支,直到到达叶 子节点, 将叶子节点存放的类别作为决策结果。

      随机森林模型的基本思想是:首先,利用bootstrap抽样从原始训练集抽取k个 样本,且每个样本的样本容量都与原始训练集一样; 其次,对k个样本分别建立k个决策树模型,得到k种分类结果;最后,根据k种分类结果对每个记录进行 投票表决决定其最终分类,如下图所示在建立每一棵决策树的过程中,有两点需要注意采样与完全分裂首先是两 个 随机采样的过程,ran dom forest对输入的数据要进行行、列的采样对于行采样, 采用有放回的方式,也就是在采样得到的样本集合中,可能有重复的样本假设输入样本为N个,那么采样的样本也为N个这样使得在训练的时候,每一棵 树的输入样本都不是全部的样本,使得相对不容易出现 over-fitting然后进行列采样,从m个feature中,选择m个(m << M )之后就是对采样之后的数据使 用完全分裂的方式建立出决策树,这样决策树的某一个叶子节点要么是无法 继续分 裂的,要么里面的所有样本的都是指向的同一个分类 一般很多的决策树算法都一个重要的步骤一一剪枝,但是这里不这样干,由于之前的两个随机采样 的 过程保证了随机性,所以就算不剪枝,也不会出现 over-fitting。

      分裂特征点的选择:1) 信息增益2) 信息增益比3) 基尼指数3. 算法流程随机森林的具体实现过程如下:⑴给定训练集S,测试集T,特征维数F确定参数:决策树的数量t,每棵树 的深度d,每个节点使用到的特征数量f,终止条件:节点上最少样本数s,节点上最少 的信息增益m对于第 i 棵树, i=1 : t:(2)从S中有放回的抽取大小和S —样的训练集S(i),作为根节点的样本,从根 节点开始训练(3)如果当前节点上达到终止条件,则设置当前节点为叶子节点,如果是分 类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那—类 c(j),概率p为c(j)占当前样本集的比例;如果是回归问题,预测输出为当前节点样本集各 个样本值的平均值然后继续训练其他节点如果当前节点没有达到终止条 件,则 从F维特征中随机选取f维特征(f << F )利用这f维特征,寻找分类效果最好的一 维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点, 其余的被划分到右节点继续训练其他节点⑷)重复⑵(3)直到所有节点都训练过了或者被标记为叶子节点 (5)重复(2),(3),(4)直到所有决策树都被训练过。

      利用随机森林的预测过程如下:对于第 i 棵树, i=1 : t(1) 从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(=th),直到到达,某个叶子节点,并输出预测值2) 重复执行(1)直到所有t棵树都输出了预测值如果是分类问题,则输出 为所有树中预测概率总和最大的那一个类,即对每个回c(j)的p进行累计;如果是归问题,贝U输出为所有树的输出的平均值。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.