国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案

2024年6月1917:59:18发布者:江开学习小虫 238 views 举报
总字数:约819字
第1页

第2页

第3页

“大数据技术导论”课程实验报告

实验名称:大数据去重

教师评语

教师签字 日期:

成绩

学生姓名

学号

一、实验目标

通过 Hadoop 数据去重实验,学生可以掌握准备数据、伪分布式文件系统配置方法,以及在集成开发环

境 Eclipse 中实现 Hadoop 数据去重方法。

二、实验环境

操作系统: Mac os

三、实验内容

(1)制订实验计划。

(2)进入“/usr/local/hadoop”目录。

(3)准备数据。

(4)修改“/usr/local/hadoop/etc/hadoop/”目录下的Hadoop配置文件。

(5)NameNode格式化。

(6)在集成开发环境 Eclipse 中实现 Hadoop 数据去重

四、实验成果

1 、 创建文件 file1.txt file2.txt

国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案 国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案

国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案

打开 eclipse 、新建 map/reduce project

国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案

国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案 国家开发大学2024春《大数据技术导论》实验4 大数据去重参考答案
总页数:10
提示:下载前请核对题目。客服微信:diandahome
标题含“答案”文字,下载的文档就有答案
特别声明:以上内容(如有图片或文件亦包括在内)为“电大之家”用户上传并发布,仅代表该用户观点,本平台仅提供信息发布。