2024 07 01~02 (첫 당직 교육)
작성 일시: 2024년 7월 3일 오전 11:31 태그: 데일리
작업 순서
섹션 제목: “작업 순서”PING_FAIL
섹션 제목: “PING_FAIL”- 티켓
- 장애 코드 : PING_FAIL
- 레 벨 : GREEN
- 서 비 스 : 인프라서비스 > 서비스 > HBase > chatbotlog-gs > Worker
- 호 스 트 : chatbotlog-gs-hbw002
- 티켓 번호 : 981297

-
장애 확인
- SSH 접속이 불가한 상태 (PING_FAIL)
- 콘솔 접속 또는 IPMI 접속 시도.
- IPMI 접속 시 바로 보이는 화면에 로그 확인.
- “bnx” 로그로 보아 NIC 장애일 가능성 인지.
- ethtool eth0 명령어로 속도값 및 상태 확인.
-
HBase 메뉴얼 대로 진행.
- worker 서비스 트리일 경우 PING_FAIL 나면 일단 shutdown 진행

- 당직 교대로 인해 직접 처리하지는 못했지만, NIC 교체 후 정상화 확인.

HANG_UP
섹션 제목: “HANG_UP”- 티켓
- 장애 코드 : SYS_HANG_UP
- 레 벨 : GREEN
- 서 비 스 : 사내서비스 > GitHub_신규 > 공동체_GitHub > Backup
- 호 스 트 : github-community-backup1
- 티켓 번호 : 981310

- 일시적 오류 확인 후 삭제 처리.

있었던 일
섹션 제목: “있었던 일”- 쇼티지
- 핑페일 (PING_FAIL)
- 행업 (HANG_UP)
해야할 일
섹션 제목: “해야할 일”- 장애처리 프로세스 파악
- 당직 시 장애처리 순서 및 처리 방법 숙지