본문 바로가기
💻Tech/🐘hadoop

[Hadoop] Number of Under Replicated Blocks 해결방법

by _viper_ 2020. 4. 5.
반응형

테스트 용도로 DataNode를 2대로 구성했는데,  초기 설치 때 기본 replication 설정이 3이기 때문에 발생한 내용으로

설치 후 replication을 2로 변경했습니다.

## Under replicated 파일 경로 목록 저장
$ hdfs fsck / | grep 'Under replicated' | awk -F':' '{print $1}' > /tmp/under_replicated_files

## 중복 행 제거
$ sort -u /tmp/under_replicated_files > /tmp/under_replicated_files_sort

## shell 스크립트 생성
$ vi run_set_replication.sh
--------------------------------------------------------
for hdfsfile in `cat /tmp/under_replicated_files_sort`
do echo "Fixing $hdfsfile :"
	hadoop fs -setrep 2 $hdfsfile
done
--------------------------------------------------------

## 실행
$ sh run_set_replication.sh