电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

Hadoop 集群搭建_光环大数据培训

7页
  • 卖家[上传人]:gua****an
  • 文档编号:49596464
  • 上传时间:2018-07-31
  • 文档格式:DOCX
  • 文档大小:42.20KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/HadoopHadoop 集群搭建集群搭建_ _光环大数据培训光环大数据培训在图书馆看到关于 hadoop 的书,刚好有空,就借回来了看看。然后在寝室尝试搭建环境,用了一天才弄好。Hadoop 的运行模式有 单机模式、伪分布式模式、完全分布式模式。我选择的时完全分布式模式安装。因此需要多台机器。但哪来的多台机器呢,当然是虚拟机啦。因为 Hadoop 只能运行在 *nix 环境中,因此我在 Ubuntu 中又用 VirtualBox 安装了两台虚拟机。一台作为 master, 一台作为 slave1.因为怕搞坏宿主机器,因此没在物理机上折腾。集群,通常是有好多台机器的,但我内存才 6G 还是就开两台吧。首先安装虚拟机都很容易,就不说了。需要注意的就是用户名、机器名和网络配置。据说 Hadoop 需要集群中机器的 用户名一致 ,因此安装时用统一的用户名密码即满足有求又好记。主机名,master 就设置为 master, slave 就设置为 slave1. 如果有更多 slave,数

      2、字递增即可。主机名只是助记用的,不用太在意这些细节。然后就是网络配置。我们需要实现的目标有:1. 各虚拟机间可互相访问光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/2. 虚拟机和主机可互相访问3. 虚拟机可上外网为了实现第三点,最方便的方法就是使用“ 网络地址转换(NAT) ”这种方式。为了实现第一点和第二点,还需要增加 “ 仅主机(HostOnly) ”方式。VirtualBox 的虚拟机有多种网络配置模式,包括:桥接、网络地址转换(NAT)、NAT、仅主机等。桥接方式是虚拟出一块网卡,虚拟机内使用这个虚拟网卡,相当于一台物理机配置网络。但我们学校一人一个 IP 地址,网络也需要认证登录,因此并不适用。网络地址转换(NAT)是默认的网络配置,这样可以使虚拟机上网,也不要配置 IP,动态分配 DHCP 的 IP 地址,相当于虚拟机是宿主的一个程序。NAT 方式,据说是上一个模式的升级版,没试过(需要在 VB 全局设置里配置网卡)。仅主机模式,虚拟出一个网卡,宿主和虚拟机都可以连接,这样宿主和虚拟机就在同一个网络中可互相访问了。

      3、我使用的方式是,在虚拟机的管理-全局设置-网络中,选择仅主机网络 ,没有配置就添加一个,有就双击查看详情,记下 IP 地址。默认是 192.168.56.1 你也可以改为 192.168.1.1 这种。DHCP 选项卡不勾选。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/然后这样宿主就自动连接上这个虚拟网卡了,Ubuntu 菜单栏会有一项显示设备未托管的网络就是这个。因为你的 IP 就是刚刚记下的,不需要再在编辑连接里配置了。在虚拟机关闭状态或刚新建还没启动时,配置他的网络。选择要配置的虚拟机, 设置-网络:网卡一:启用网络连接,选择网络地址转换(NAT) 。网卡二:启用网络连接,选择仅主机(HostOnly)适配器 ,界面选择刚刚全局添加的那个名称。启动虚拟机后,在其中可以看到两个网络连接,在右上角的菜单栏中点击选择编辑连接以太网选项卡选择网络接口,新版本的 Ubuntu 不是 eth0/eth1 这种名称了,是 enp0s3/enp0s8 类似的名称,数字小的一个是网卡一,另一个是网卡二。在网卡一中,我们选择的是 NAT

      4、模式,那么,在 IPv4 选项卡,就只需要选择 DHCP 就行了,不用配置 IP 地址(自动分配 10.0.2.x) 。这个是虚拟机上外网的网络。在网卡二中,我们选择的时仅主机模式,在 IPv4 选项卡中,需要配置静态 IP(网关可以不用配置) ,用于各个机器间互相访问。这个是宿主和虚拟机之间的局域网。还需要在 IPv4 选项卡中的路由按钮中 勾选仅将连接用于相应的网络上的资源 这样当两个网络同时启用时,访问外网就不会用网卡二的网关了。否则可能访问外网使用网卡二的网关 192.168.56.1,那么将不能访问外网。虚拟机配置网络光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/现在,你可以在虚拟机(192.168.56.2)中 ping 通外网(如 )、其他配置好的虚拟机(192.168.56.3)、宿主机(192.168.56.1)。然后就是准备安装 Hadoop 了。Open-SSHJDK7+Hadoop2.7.3ssh 就是配置免密码登录。ssh-keygen -t rsa生成公钥私钥密钥对,把公钥 id_rsa.pub 导

      5、入目标主机的 authorized_keys 文件中,那么本机就可以免密码登录目标主机。Hadoop 2.7 需要 JDK7+ 版本,我是在 Oracle 网站上下载 JDK 然后解压的。只需在 /etc/profile 要配置 JAVA_HOME 就可以了。Hadoop 我下载的是当前 2.7.3 版本,解压在 /opt/ 文件夹下。chown -R xxx /optxxx 为你需要的用户名,意思是把 /opt 文件夹授权给 xxx 用户。配置文件全在 $HADOOP_HOME/etc/hadoop 下光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/exportJAVA_HOME=xxxexportHADOOP_HOME=xxxexportHADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop这三个环境变量在 profile 里也要配置一下,把 $JAVA_HOME/bin、$HADOOP_HOME/bin 加入 PATH,注销再登录生效。core-site.xmlhdfs-site.xmlmapred

      6、-site.xml.templateslaves这几个文件具体配置自行搜索吧,我也不太确定咋配。可看下方参考链接。先在 HADOOP_HOME 下新建了 tmp、name、data 文件夹, hadoop.tmp.dir 设为 tmp, dfs.namenode.name.dir 设为 name 的路径, dfs.datanode.data.dir 设为 data 的路径。暂时没有用到 yarn.xml 等以后搞明白了在研究所有机器都这样配置。然后就算配置好了环境准备启动之前需要先格式化 HDFS. 这是 Hadoop 用的分布式文件系统,理解为 NTFS、ext4 之类的就行了,只不过 HDFS 里的文件时存在多台机器上的。hdfsnamenode -formatExiting with status 0 就表示执行成功了。光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/启动使用的命令在 $HADOOP_HOME/sbin 下,用 start-dfs.sh 和 start-yarn.sh 启动 Hadoophdfs dfs -

      7、lshdfs dfs -puthdfs dfs -cat用于列出 HDFS 里文件、上传本地文件到 HDFS、输出 HDFS 里文件内容。HadoopHadoop 自带的网络界面测试安装是否成功用 WordCount 检测。 (此时可以访问 http:/master:50070/ 为了方便可以把 master/slave1 的 IP 放在/etc/hosts 里)首先在 master 里随便准备一个文本文件,比如叫做 words,内容就是几个单词。然后再hdfs -dfs -put /path/to/words /test/words这样就把 words 文件放入 HDFS 文件系统了。在 HADOOP_HOME 执行:hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount 光环大数据光环大数据-大数据培训知名品牌大数据培训知名品牌http:/ 光环大数据光环大数据 http:/ /test/out记执行单词计数统计程序,/test/words 为输入文件,/test/out 为输出目录,其中输出目录的父目录必须存在,否则报异常,slave 里 hadoop-env.sh 没配置 JAVA_HOME 也会报异常。退出码为 0 表示执行成功。运行结果这样就算安装成功启动成功了,jps 命令可以看到运行中的 Java 进程。下一步有空的话再看书学习为什么大家选择为什么大家选择光环大数据光环大数据!大数据培训、人工智能培训、Python 培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。【报名方式、详情咨询报名方式、详情咨询】光环大数据官方网站报名:光环大数据官方网站报名:http:/ /mobile/mobile/

      《Hadoop 集群搭建_光环大数据培训》由会员gua****an分享,可在线阅读,更多相关《Hadoop 集群搭建_光环大数据培训》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.