
《大数据平台应用技术》实验指导书(含实验报告模板)模板
16页1、实验一 HDFS操作方法和编程实践一、实验目的l 理解HDFS在Hadoop体系结构中的角色;l 熟练使用HDFS操作常用的Shell命令;l 熟悉HDFS操作常用的Java API。二、实验平台l 操作系统:Linux(建议Ubuntu16.04);l Hadoop版本:2.7.1;l JDK版本:1.7或以上版本;l Java IDE:Eclipse。三、实验内容(一)熟悉HDFS操作常用的Shell命令(1)使用hadoop用户登录Linux系统,启动Hadoop(Hadoop的安装目录为“/usr/local/hadoop”),为hadoop用户在HDFS中创建用户目录“/user/Hadoop”。(2)接着在HDFS的目录“/user/hadoop”下,创建test文件夹,并查看文件列表。(3)将Linux系统本地的“/.bashrc”文件上传到HDFS的test文件夹中,并查看test。(4)将HDFS文件夹test复制到Linux系统本地文件系统的“/usr/local/hadoop”目录下。(二)编程实现以下功能:(1)向HDFS中上传任意文本文件,如果指定的文件在HD
2、FS中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件;(2)从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;(3)将HDFS中指定文件的内容输出到终端中;(4)提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;(5)删除HDFS中指定的文件; 实验二 HBase Shell命令和编程实践一、实验目的l 理解HBase在Hadoop体系结构中的角色;l 熟练使用HBase操作常用的Shell命令;l 熟悉HBase操作常用的Java API。二、实验平台l 操作系统:Linux(建议Ubuntu16.04);l Hadoop版本:2.7.1;l HBase版本:1.1.5;l JDK版本:1.7或以上版本;l Java IDE:Eclipse。三、实验内容(一)编程实现以下指定功能,并用Hadoop提供的HBase Shell命令完成相同任务:(1) 列出HBase所有的表的相关信息,例如表名;(2) 在终端打印出指定的表的所有记录数据; (3) 向已经创建好的表添加和删除指定的列族
3、或列;(4) 清空指定的表的所有记录数据;(5) 统计表的行数。(二)HBase数据库操作1. 现有以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据:学生表(Student)学号(S_No)姓名(S_Name)性别(S_Sex)年龄(S_Age)2015001Zhangsanmale232015003Maryfemale222015003Lisimale24课程表(Course)课程号(C_No)课程名(C_Name)学分(C_Credit)123001Math2.0123002Computer Science5.0123003English3.0 选课表(SC)学号(SC_Sno)课程号(SC_Cno)成绩(SC_Score)201500112300186201500112300369201500212300277201500212300399201500312300198201500312300295 2. 请编程实现以下功能接口,并在主程序中调用这些功能接口进行测试:(1)createTable(String tableName, String fi
4、elds)创建表,参数tableName为表的名称,字符串数组fields为存储记录各个字段名称的数组。要求当HBase已经存在名为tableName的表的时候,先删除原有的表,然后再创建新的表。(2)addRecord(String tableName, String row, String fields, String values)向表tableName、行row和字符串数组fields指定的单元格中添加对应的数据values。其中,fields中每个元素如果对应的列族下还有相应的列限定符的话,用“columnFamily:column”表示。例如,同时向“Math”、“Computer Science”、“English”三列添加成绩时,字符串数组fields为“Score:Math”, ”Score:Computer Science”, ”Score:English”,数组values存储这三门课的成绩。(3)scanColumn(String tableName, String column)浏览表tableName某一列的数据,如果某一行记录中该列数据不存在,则返回nul
《《大数据平台应用技术》实验指导书(含实验报告模板)模板》由会员全****分享,可在线阅读,更多相关《《大数据平台应用技术》实验指导书(含实验报告模板)模板》请在金锄头文库上搜索。