电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

教你用R实现第一个机器学习项目_光环大数据推出AI智客计划送2000助学金

29页
  • 卖家[上传人]:gua****an
  • 文档编号:51485529
  • 上传时间:2018-08-14
  • 文档格式:DOCX
  • 文档大小:57.43KB
  • / 29 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/教你用教你用 R R 实现第一个机器学习项目实现第一个机器学习项目_ _光环大数据推出光环大数据推出 AIAI 智客计划送智客计划送 20002000 助学金助学金你是否想要用 R 做机器学习,但又苦恼于怎么开始做?在这篇文章里你将会用 R 完成你的第一个机器学习项目。在这个逐步教程里,你需要做:1 下载和安装 R 并且获取用做机器学习非常有用的 R 包。2 导入一个数据集并且用统计分析和数据可视化来理解它的结构。3 创建 5 个机器学习模型,选择最好和建立精度是可靠的置信。如果你是一个机器学习新手,而且还在找一个你最终会选择的方案来学习机器学习的话,这个教程就是针对你设计的。让我们现在开始吧。怎样用 R 开始你的机器学习?学习机器学习最好的方法就是设计并实现一系列小项目。初学 R 的时候你可能回觉得这有点可怕R 在编写脚本时所提供的语法结构是比较奇怪的。这里有几百个 R 包和几千个函数让你选择,给每个任务提供了多种解决方法,所以这会让你感到有点

      2、光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/吃不消。所以说,在 R 上开始机器学习最好的方法就是要完成一个项目。1 这需要你安装并开始学习使用 R(至少会一点点) 。2 它能给你更开阔的视角来理解如何一步步进行机器学习。3 它会给你自信,来源于你完成一个小项目的成就感。入门的人需要完成一个端对端的项目光看书或课程会让你觉得很吃不消,它们给你提供的是一系列的解决方法和代码段,但是,你永远都不知道怎样把他们综合起来使用。当你要把机器学习运用到你的数据集的时候,其实你就是在做一个项目。一个机器学习项目可能不是线性的,但是,有些有用的方法你可以按顺序的遵循:1 定义问题2 准备好数据3 评估算法4 改良结果光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/5 展示最终结果如果你想要了解更多关于机器学习的步骤,你可以查阅这一清单,这一清单对这个过程讲的更详细。与一个新的平台或工具达成协议的最好方法就是完成端对端的

      3、机器学习项目,并按照之前给的步骤执行。也就是说,从载入数据开始,然后汇总你的数据,接下来评估你的算法,同时改良你的结果,并在最后作适当的展示。如果你是这么做的话,你就会在你处理完数据以后,有了一个模板来对新的数据集进行研究。你甚至还可以通过数据展示和改良相关的结果来填补你先前做任务的时候留下来的空缺。一旦你这么做了,你就会有信心了。机器学习的 Hello World利用新的工具进行小项目的最好方法就是首先从 iris 的分类数据集开始。这是一个好的项目,因为它简单明了。1 里面的属性是数字,所以,你会觉得导入和处理数据会非常上手。2 这是一个分类问题,或许能允许你使用简单的监督学习算法进行练习。3 这是一个多级分类问题(多含义) ,而它需要一些特别的方法来处理。4 它只有 4 个属性和 150 行数据,说明这对于内存来说很小,而且处理起来很快(一张 A4 纸大小那样) 。光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/5 所有的数字属性都在同一个单元,它们的规模也相同,它不需要转化成特别的形式或

      4、者使用特殊的定位。在 R 中让我们开始您的 Helloworld 机器学习项目。R 中做机器学习:逐步学习的教程(在这里开始)在这一部分的内容中,我们要完成一个小的端到端机器学习项目。这里,我们浏览一下我们接下来要干什么:1 安装 R 平台2 载入数据3 汇总数据集4 对数据集进行可视化操作5 评估一些算法6 做一些相关预测慢慢来,认真的落实好每一步。你可以尝试自己写代码,或者从别的地方复制相关的代码来提高工作效率。光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/如果有什么问题,你可以在文章的最后的地方留言。1 下载安装并开始使用 R如果你的系统还没有 R 平台,那就现在安装一个吧。更新:这个教程是根据 R 3.2.3 版写的,所以,如果你的版本比较旧,那么,你就需要更新一下了。我不想在这里讲太多的细节,其他文章已经讲的很清楚了。这已经讲的直接明了,尤其你是一名开发人员的时候。如果你需要求助,你可以在留言板写出你的问题。这里,你要遵循几个步骤:1 下载 R2 安装 R3 开始使用 R4 下载相关

      5、 R 包1.1 下载 R你可以从 The R Project webpage 下载 R。光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/当你点击这个下载链接时,你需要选择镜像。你可以根据你的操作系统选择 R,如 Windows、OSX 或者 Linux。1.2 安装 R安装 R 很容易的,而且我也相信你可以解决。这里没有其它特别的要求。如果你在安装 R 的时候遇到什么问题需要求助的话,你可以看一下 R Installation and Administration。1.3 开始使用 R你可以在操作系统上看到的选择任意菜单系统使用 R。对于我而已,我更喜欢命令行。打开你的命令行,改变(或者创建)你的项目目录,并且在命令行输入以下代码:R您应该在一个新的窗口或者您的终端上看到一个像如下的屏幕截图:1.4 安装 R 包安装我们今天要使用的 R 包。这些包是第三方附加组件或者可以在 R 使用的库。光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光

      6、环大数据光环大数据 http:/install.packages(“caret“)更新:我们也许需要其它包,但是 caret 会问到我们是否要安装它。如果你对于这些包有什么疑问的话,你可以先安装 caret 包,然后你可以输入下面的代码来看一下你需要什么包:install.packages(“caret“, dependencies=c(“Depends“, “Suggests“)现在,我们加载一下 caret 包,然后开始在我们的教程里使用这个包。library(caret)caret 包给上百个机器学习算法提供了相应接口,并给数据可视化、数据采样、模型调整以模型比较这些功能提供了便利的方法。我们必须要在 R 里有进行机器学习的工具。如果你想要了解更多关于 caret 这个 R 包的内容,查阅一下 caret package homepage 这篇文章。2 载入数据我们将要使用 iris 这个数据集。这个数据集是非常有名的,因为这是机器学习和统计学里的”hello world”类数据集,这对于每个人来说都非常实用。这个数据集含有 150 个观测值,而且这个数据集有 4 列,这些列表示

      7、花的直径的测量。而这个数据集的第五列就是花的类型,而所有的观测值则是 3 种光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/花里的其中一种。关于这个数据集的更多细节,你可以上维基百科寻找,网址:https:/en.wikipedia.org/wiki/Iris_flower_data_set。接下来,我们要对这个数据集进行如下操作:1 以一个简单的方式导入 iris 数据集2 以 CSV 格式(其它格式也可以)导入 iris 数据集3 把这个数据集分解成训练数据集和验证数据集你可以自行选择方法导入这些数据,或者直接按照上面的步骤执行。2.1 以一个简单的方式导入 iris 数据集幸运的是,iris 这个数据集是系统自带的,也就是说安装好 R 以后就有。现在,按照以下操作导入数据:# attach the iris dataset to the environmentdata(iris)# rename the datasetdataset - iris光环大数据光环大数据-大数据培训大数据培训&

      8、人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/这时你已经完成了 iris 数据集的导入,现在,你需要检验这个数据集了。我喜欢把载入的数据称为“数据集” 。如果你想对你的项目和数据集(它们之间总是名字相同)之间进行代码的粘贴,那么,这里确实会给到你帮助。2.2 载入 CSV 格式数据也许,你是一个纯粹主义者,而且,你是想以你自己的方式导入 CSV 格式的数据集到你的机器学习项目的话,可以参照下面的做法:从 UCI Machine Learning Repository (这里有一个直接找到这个数据集的链接)这里下载 iris 数据集。把文件以 iris.csv 的形式保存的你的工作目录中。载入 CSV 格式数据详细操作如下:# define the filenamefilename - “iris.csv“# load the CSV file from the local directorydataset - read.csv(filename, header=FALSE)# set the column names in the datasetcolnames(dataset)光环大数据光环大数据-大数据培训大数据培训&人工智能培训人工智能培训http:/hadoop.aura- 光环大数据光环大数据 http:/- c(“Sepal.Length“,“Sepal.Width“,“Petal.Length“,“Petal.Width“,“Species“)你现在已经载入好 iris 数据集,同时也可以使用里面的变量了。2.3 创建一个验证数据集我们需要知道我们现在所建立的模型足够好。然后,我们会在那些未知的数据中运用相关统计方法建模以预测这些模型的精度。我们还需要进行更多高质量的模型精度测试以估计出这个模型是否在这些未知的数据中是最好的,这样我们要通过对真实的未知的数据进行估计。这时,我们需要看

      《教你用R实现第一个机器学习项目_光环大数据推出AI智客计划送2000助学金》由会员gua****an分享,可在线阅读,更多相关《教你用R实现第一个机器学习项目_光环大数据推出AI智客计划送2000助学金》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.