(Hadoop)하둡 서비스 서버 장애처리

작성 일시: 2024년 5월 27일 오후 4:04 태그: TMS[장애대처], 데일리

작업 순서

요청 확인

스크린샷 2024-05-27 오후 4.05.39.png

요청 온 하둡 서버는 -dn(datanode) 서버로, 티켓 레이어 보다 우선시 하여 확인해야 할 서비스(트리)가 모았다가 한꺼번에 장애대처를 하는 프로세스를 갖고 있다. 해서 이렇게 모아놨다가 처리한다.

그 중 하나 장애처리 진행해보았다.
장애티켓 확인

스크린샷 2024-05-27 오후 6.48.56 1.png

adb 영역에 장애가 났다고 알려준다.

서비스 확인해야한다.

티켓 레이어 확인해야 한다.

위치 파악.
1. 큐베에게 .dci [호스트네임] 으로 검색해봐도 좋고, 서버 원격접속하여 ims [호스트네임] 으로 검색해봐도 좋다.
2. 확인한 상면 위치로 이동 후 디스크 위치를 파악해야 한다.
3. dct run led
4. storcli
5. megaraid
물리교체.

parted /dev/sd [영역]                              파티션 생성할 영역 지정

mklabel gpt                                       gpt로 파티셔닝

p                                                 파티션 확인

mkpart primary 2048s 100%                         2048 용량 부터 100% 끝까지 전부 사용하겠다.

p                                                 파티션 확인

나가서

cat /etc/fstab                                    파일 시스템 확인

mkfs.xfs -f /dev/sd[영역]                          파일 시스템 생성

blkid                                             uuid 확인

df -Th                                            어떤 data의 uuid를 변경해야할지 확인

vi /etc/fstab                                     편집기로 입장

[uuid 변경]

mount /dev/sd[영역]                                마운트

안되면

systemctl daemon-reload                           데몬 재실행

mount /dev/sd[영역]

완료

RMA 남아있는 장비에 한해서 스티커 부착 및 RMA 신청 및 장애처리 상세등록.

RMA 끝난 디스크는 전부 파쇄 및 장애처리 상세등록.

(Hadoop)하둡 서비스 서버 장애처리

작업 순서

있었던 일

해야할 일