大数据生态Hadoop(三):实现官方自带wordcount案例

Hadoop官方wordcount示例

前面的安装准备工作准备好之后,当然要实现下大数据之入门wordcount案例
提供版本JDK1.8+Hadoop2.7.2

在hadoop-2.7.2文件下面创建一个input文件夹

1
[root@hadoop101 hadoop-2.7.2]$mkdir input

在wcinput文件下创建一个wc.input文件

1
2
[root@hadoop101 hadoop-2.7.2]cd input
[root@hadoop101 input]touch wc.input

编辑wc.input文件

1
2
3
4
5
6
[root@hadoop01 input]vim wc.input
# 文件内容
hadoop
mapreduce
yarn
yarn

wc.input文件加载到hdfs

1
[root@hadoop101 hadoop-2.7.2]hadoop fs -put input/ /tmp/

运行官方jar包

1
[root@hadoop101 hadoop-2.7.2]hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /tmp/input/  /tmp/output/

查看wordcount统计词频

1
2
3
4
5
[root@hadoop101 hadoop-2.7.2]hadoop fs -cat /tmp/output//part-r-00000
# 统计内容
hadoop 1
mapreduce 1
yarn 2

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!