콘텐츠로 이동

OS 디스크 장애로 인한 장애처리 및 교체

작성 일시: 2024년 5월 27일 오후 5:25 태그: KARAS, TMS[장애대처], 데일리

  1. 티켓

스크린샷 2024-05-27 오후 5.45.52.png

  1. 서비스 확인

스크린샷 2024-05-27 오후 5.47.32.png

일반 서버였음

  1. 티켓 레이어 확인

스크린샷 2024-05-27 오후 5.47.59.png

오렌지

  1. 오류 확인

스크린샷 2024-05-27 오후 5.48.30.png

장애티켓이 HW-BUS-ERROR, SYS_IO_ERROR, SYS_FS_ERR, PING_FAIL 이 발생.

BUS, IO, FS 에러가 동시에 발생한 뒤 PING_FAIL 로 리붓이 됬다면 보통은 OS 에러일 가능성이 있음

  1. 실사 장비 확인

실제 장애처리 가능한 장비가 없는데 장애처리 하겠다고 SE한테 연락했다가 뒤늦게 없는걸 확인하면 낭패임.

미리미리 확인.

  1. SE 연락

스크린샷 2024-05-27 오후 5.50.43.png

  1. 피드백

스크린샷 2024-05-27 오후 5.51.16.png

바로 교체를 진행할 수도 있고 아닐수도 있음.

교체 한다고 하면 다음 단계 이어서 진행하면 됨.

  1. KARAS 등록

스크린샷 2024-05-27 오후 5.52.11.png

지금은 작업 생성만 해놓은 상태.

교체작업 진행한다고 하면 작업등록 후 진행하면 됨.

  1. 작업(장애처리)
  • 해당 서버에 맞는 OS디스크(SSD) 챙겨서 상면 위치로 이동.
  • SE가 전원 OFF 해주었다고 하면 바로 교체 진행
  • 안해놨으면 내가 연락해서 OFF 해달라고 전달
  • 전원 OFF 확인 후 물리 디스크 교체
  • 교체 후 전원 ON
  • 부팅 중 F12 연타 - PXE 모드
  • 부팅 되는거 확인 후 사무실 이동
  1. 완료
  • 부팅 후(약 2~30분) 원격 접속하여 OS 재설치 잘 됬는지 확인.
  • ping
  • ifconfig
  • KARAS 의 내용 IMS 의 내용과 대조
  • 장애처리 상세등록
  • 티켓 완료처리
  • SE 연락
  • 기본 확인 명령어 외에 다양한 확인 명령어 습득
  • 래이드 생성 방법 찾아보기