决策树和随机森林实验
6页1、实验 算法 决策树和随机森林实验【实验名称】决策树和随机森林实验【实验目的】 掌握决策树和随机森林实验模型应用过程,根据模型要求进行数据预处理,建模,评价与应用; 【背景描述】决策树与随机森林,属于监督学习,通过纯化指标的计算,确定分支方式,逐步构建成树形结 构。决策树由节点(node)和有向边(directed edge )组成。节点的类型有两种:内部节点和叶 子节点。其中,内部节点表示一个特征或属性的测试条件(用于分开具有不同特性的记录),叶子节 点表示一个分类。随机森林顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林 的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森 林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看 哪一类被选择最多,就预测这个样本为那一类。【知识准备】了解决策树与随机森林模型的使用场景,数据标准。了解Python/Spark数据处理一般方法。 了解spark模型调用,训练以及应用方法【实验要求】完成决策树和随机森林实验【实验设备】Wi ndows或Lin ux
2、操作系统的计算机。部署Spark, Pytho n,本实验提供ce ntos6.8环境。【实验说明】采用UCI机器学习库中的wine数据集作为算法数据,训练决策树与随机森林模型,对样本进 行聚类。【实验环境】Spark 2.3.1,Pyrhon3.X,实验在命令行pyspark中进行,或者把代码写在py脚本,由于本 次为实验,以学习模型为主,所以在命令行中逐步执行代码,以便更加清晰地了解整个建模流程。【实验步骤】第一步:启动pyspark:命令行中键入pyspark -master local4本地模式启动spark与python :GCC 44J7 2DI2Q313 jiFLed Hatnn linuxTyp& help 匚口pyright 匚厂edits or litense for in口infonnationSLF4J! class pth contains: multiple 5LF4J bindings.SLF4Js Found binding in | j a n: file ; /o pt pa rk -2.3.1/ j rs /si f 4)- lo g4 j 12
3、-1 ;7116. j r I /o rg /si f 4 j / ii pl /StaticLo gg erBinder. cl as s 1SLF+J: Found binding in jars file : /o pt ad oa p -3.1. G/s hia na/hada op fflimo n/lib/slf 4j -1 oq 4j 12 -1.7m25. j a r I /o rg zslf 4j /impl/sta t icLogge rflind er c lassSLF4J: See httpM/w-srfaj.cifgfcoclM.htnilLJltjLplEtiiLnciings for an explanation.SLF4J; Actuiial binding isi of type lorg.slMj.l叩Q ,L叩4jLoggisrF日cto”】2019-01-25 1D;41:16 WARM NativeCodeLoader;62 - Unable to load native-hadoop library for your platform,.,
4、 using builtin-j Btra 匚lasses *dieri? applicable-Setting default log level toTo adjust logging level us:$ sc tsetLogLevel (newLevel . For SparkR. lis& sstLogLeve-KnewLevel .Welcome toUsing Python version 3.5.2 (default Jul 2 2016 I.?!:53-:06) SparkSession available as spark.4 |第二步:导入用到的包,并读取数据:将所需导入的包键入Spark Shell中,具体命令:from pyspark import SparkC onf, SparkC on textfrom pyspark.mllib.evaluation import MulticlassMetrics from pyspark.mllib.tree import Decisi on Tree, Ran domForestfrom pyspark.mlli
《决策树和随机森林实验》由会员re****.1分享,可在线阅读,更多相关《决策树和随机森林实验》请在金锄头文库上搜索。
4爱莲说教案 (2).doc
一年级下学期同步综合复习数学期末试卷.docx
2023年企业外出员工培训总结
《角的画法和角的巩固练习》教学设计.doc
2023年大学机电专业学生求职信.docx
具有抗合谋攻击能力的自治愈组密钥管理方案.doc
A2O污水处理工艺中除磷脱氮过程控制实现方法的探索
小学一年级学期教学计划范文(四篇)
9#井塌方原因及整改措施.doc
2023年三年级教学计划77.docx
化妆品、菜单英文.doc
光伏发电与节能技术
副市长全市农业和农村经济工作会议上的发言.doc
安全生产教育培训制度官方版(五篇).doc
《体积与容积》教案
对幼儿自信心不足的分析与对策.doc
种在阳台上榨汁喝的.doc
一面五星红旗
2022关爱空巢老人心得作文
组态王6.5使用手册 第14章 控件(共101页 1~33页).doc
2024-02-16 22页
2022-11-13 16页
2023-07-19 7页
2022-12-24 4页
2022-07-21 4页
2023-12-05 5页
2024-03-09 17页
2023-10-29 4页
2023-02-10 11页
2023-02-15 10页