(Hadoop)하둡 서비스 서버 장애처리
작성 일시: 2024년 5월 27일 오후 4:04 태그: TMS[장애대처], 데일리
작업 순서
섹션 제목: “작업 순서”- 요청 확인

요청 온 하둡 서버는 -dn(datanode) 서버로, 티켓 레이어 보다 우선시 하여 확인해야 할 서비스(트리)가 모았다가 한꺼번에 장애대처를 하는 프로세스를 갖고 있다. 해서 이렇게 모아놨다가 처리한다.
-
그 중 하나 장애처리 진행해보았다.
-
장애티켓 확인

adb 영역에 장애가 났다고 알려준다.
서비스 확인해야한다.
티켓 레이어 확인해야 한다.
-
위치 파악.
- 큐베에게 .dci [호스트네임] 으로 검색해봐도 좋고, 서버 원격접속하여 ims [호스트네임] 으로 검색해봐도 좋다.
- 확인한 상면 위치로 이동 후 디스크 위치를 파악해야 한다.
- dct run led
- storcli
- megaraid
-
물리교체.
parted /dev/sd [영역] 파티션 생성할 영역 지정
mklabel gpt gpt로 파티셔닝
p 파티션 확인
mkpart primary 2048s 100% 2048 용량 부터 100% 끝까지 전부 사용하겠다.
p 파티션 확인
나가서
cat /etc/fstab 파일 시스템 확인
mkfs.xfs -f /dev/sd[영역] 파일 시스템 생성
blkid uuid 확인
df -Th 어떤 data의 uuid를 변경해야할지 확인
vi /etc/fstab 편집기로 입장
[uuid 변경]
mount /dev/sd[영역] 마운트
안되면
systemctl daemon-reload 데몬 재실행
mount /dev/sd[영역]
완료RMA 남아있는 장비에 한해서 스티커 부착 및 RMA 신청 및 장애처리 상세등록.
RMA 끝난 디스크는 전부 파쇄 및 장애처리 상세등록.
있었던 일
섹션 제목: “있었던 일”해야할 일
섹션 제목: “해야할 일”- [ ]