콘텐츠로 이동

(Hadoop)하둡 서비스 서버 장애처리

작성 일시: 2024년 5월 27일 오후 4:04 태그: TMS[장애대처], 데일리

  1. 요청 확인

스크린샷 2024-05-27 오후 4.05.39.png

요청 온 하둡 서버는 -dn(datanode) 서버로, 티켓 레이어 보다 우선시 하여 확인해야 할 서비스(트리)가 모았다가 한꺼번에 장애대처를 하는 프로세스를 갖고 있다. 해서 이렇게 모아놨다가 처리한다.

  1. 그 중 하나 장애처리 진행해보았다.

  2. 장애티켓 확인

스크린샷 2024-05-27 오후 6.48.56 1.png

adb 영역에 장애가 났다고 알려준다.

서비스 확인해야한다.

티켓 레이어 확인해야 한다.

  1. 위치 파악.

    1. 큐베에게 .dci [호스트네임] 으로 검색해봐도 좋고, 서버 원격접속하여 ims [호스트네임] 으로 검색해봐도 좋다.
    2. 확인한 상면 위치로 이동 후 디스크 위치를 파악해야 한다.
    3. dct run led
    4. storcli
    5. megaraid
  2. 물리교체.

parted /dev/sd [영역] 파티션 생성할 영역 지정
mklabel gpt gpt로 파티셔닝
p 파티션 확인
mkpart primary 2048s 100% 2048 용량 부터 100% 끝까지 전부 사용하겠다.
p 파티션 확인
나가서
cat /etc/fstab 파일 시스템 확인
mkfs.xfs -f /dev/sd[영역] 파일 시스템 생성
blkid uuid 확인
df -Th 어떤 data의 uuid를 변경해야할지 확인
vi /etc/fstab 편집기로 입장
[uuid 변경]
mount /dev/sd[영역] 마운트
안되면
systemctl daemon-reload 데몬 재실행
mount /dev/sd[영역]
완료

RMA 남아있는 장비에 한해서 스티커 부착 및 RMA 신청 및 장애처리 상세등록.

RMA 끝난 디스크는 전부 파쇄 및 장애처리 상세등록.

  • [ ]