콘텐츠로 이동

2024 07 01~02 (첫 당직 교육)

작성 일시: 2024년 7월 3일 오전 11:31 태그: 데일리

  1. 티켓
    1. 장애 코드 : PING_FAIL 
    2. 레 벨 : GREEN
    3. 서 비 스 : 인프라서비스 > 서비스 > HBase > chatbotlog-gs > Worker
    4. 호 스 트 : chatbotlog-gs-hbw002 
    5. 티켓 번호 : 981297

스크린샷 2024-07-03 오전 11.35.47.png

  1. 장애 확인

    1. SSH 접속이 불가한 상태 (PING_FAIL)
    2. 콘솔 접속 또는 IPMI 접속 시도.
    3. IPMI 접속 시 바로 보이는 화면에 로그 확인.
    4. “bnx” 로그로 보아 NIC 장애일 가능성 인지.
    5. ethtool eth0 명령어로 속도값 및 상태 확인.
  2. HBase 메뉴얼 대로 진행.

    1. worker 서비스 트리일 경우 PING_FAIL 나면 일단 shutdown 진행

스크린샷 2024-07-03 오전 11.38.09.png

  1. 당직 교대로 인해 직접 처리하지는 못했지만, NIC 교체 후 정상화 확인.

스크린샷 2024-07-03 오전 11.42.07.png


  1. 티켓
    1. 장애 코드 : SYS_HANG_UP 
    2. 레 벨 : GREEN
    3. 서 비 스 : 사내서비스 > GitHub_신규 > 공동체_GitHub > Backup
    4. 호 스 트 : github-community-backup1 
    5. 티켓 번호 : 981310

스크린샷 2024-07-03 오전 11.43.58.png

  1. 일시적 오류 확인 후 삭제 처리.

스크린샷 2024-07-03 오전 11.44.19.png

  • 쇼티지
  • 핑페일 (PING_FAIL)
  • 행업 (HANG_UP)
  • 장애처리 프로세스 파악
  • 당직 시 장애처리 순서 및 처리 방법 숙지