반응형
테스트 용도로 DataNode를 2대로 구성했는데, 초기 설치 때 기본 replication 설정이 3이기 때문에 발생한 내용으로
설치 후 replication을 2로 변경했습니다.
## Under replicated 파일 경로 목록 저장
$ hdfs fsck / | grep 'Under replicated' | awk -F':' '{print $1}' > /tmp/under_replicated_files
## 중복 행 제거
$ sort -u /tmp/under_replicated_files > /tmp/under_replicated_files_sort
## shell 스크립트 생성
$ vi run_set_replication.sh
--------------------------------------------------------
for hdfsfile in `cat /tmp/under_replicated_files_sort`
do echo "Fixing $hdfsfile :"
hadoop fs -setrep 2 $hdfsfile
done
--------------------------------------------------------
## 실행
$ sh run_set_replication.sh