고흐의 연구실/etc..

[Hadoop] wordcount 실습하기(초간단)

전고흐 2020. 8. 12. 01:48
728x90
- OS : VMware Ubuntu 18.04
- Hadoop 2.10.0

 

1. 폴더를 만든다

$hdfs dfs -mkdir /input

 

2. wordcount할 파일을 /input에 넣는다.

   (나는 /usr/local/hadoop 에 있는 LICENSE.txt 파일을 이용했다.)

$hdfs dfs -copyFromLocal /usr/local/hadoop/LICENSE.txt /input              (/input으로 이동)

 

3. 잘 들어가있는지 확인

$hdfs dfs -ls /input

LICENSE.txt가 보이면 됨

 

4. wordcount 실행

$hdfs jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.0.jar wordcount /input/LICENSE.txt /output

  (wordcount 결과를 /output 파일에 넣어줌)

 

5. 확인하기

$hdfs dfs -ls /output

 ( 결과가 2개나옴 - _SUCCESS랑 part-r-0000)

 

6. 열어주기

$hdfs dfs -cat /output/part-r-0000

 

 

 

-끝-

 

**만약에 명령어 hdfs가 안된다면 hadoop으로 바꿔서 실행

 

728x90